Podwójne pobieranie próbek

Podwójne pobieranie próbek

Wyjaśniamy, co to jest podwójne pobieranie próbek, przykłady, zalety i wady i umieszczamy rozwiązane ćwiczenia

Podczas podwójnego pobierania próbek chcesz głębiej wiedzieć, zmienną populacji

Co to jest podwójne próbkowanie?

On Podwójne pobieranie próbek Jest to technika stosowana w statystykach wnioskowania, gdy chcesz wiedzieć więcej szczegółów i pewności co do konkretnej zmiennej, która charakteryzuje określoną populację.

Druga próbka populacji jest zwykle przeprowadzana po pierwszej próbie, której analiza nie wykazała statystycznie istotnego wniosku na temat żadnej ze zmiennych badań.

Z tego powodu pobieranie próbek podwójnych statystyk jest również znane jako Pobieranie próbek dwóch faz. Przydatność drugiej próbki leży, w której pomaga dokładniej określić szacowanie przyczyn i regresje pewnej zmiennej pomocniczej, która powstaje w świetle analizy pierwszej próbki.

Kolejnym zastosowaniem podwójnym próbkowaniem jest zebranie informacji do realizacji pobierania próbek warstwy.

Przykłady

Poniżej znajdują się różne sytuacje, w których podwójne pobieranie próbek jest uzasadnione.

Kontrola jakości w opracowywaniu kawałków

Metoda podwójnego próbkowania jest często stosowana w kontroli jakości przemysłowej i zwykle odbywa się w dwóch fazach.

Załóżmy na przykład maszynę przemysłową, która przygotowuje niektóre elementy. Mimo że maszyna jest dostosowywana, żaden kawałek nie jest identyczny z innym, ponieważ w jego wymiarach i ciężarach może wystąpić małe warianty. Chodzi o określenie, czy wiele części wyprodukowanych przez wspomnianą maszynę spełnia kryteria tolerancji, aby została zaakceptowana lub odrzucona.

Po pierwsze, pobierana jest losowa próbka kawałków, z którą należy sprawdzić jedną ze zmiennych, na przykład długość kawałka jest wewnątrz tolerancji.

W przypadku, gdy średnia długość jest poniżej lub powyżej pożądanego stopnia tolerancji dla wspomnianej zmiennej, w tej pierwszej próbce, wówczas wywnioskowane jest, że działka jest wadliwa i należy ją odrzucić. W takim przypadku nie wymaga przyjmowania nowych próbek.

Może ci służyć: współczynnik korelacji: wzory, obliczenia, interpretacja, przykład

Przeciwnie, jeśli średnia wartość znajduje się w zakresie tolerancji, ale odchylenie standardowe próbki jest wystarczająco duże, aby suma lub odejmowanie średniej wartości jest poza marginesem, konieczne będzie zebranie drugiej głównej próbki.

Ta druga próbka musi zawierać pierwotną próbkę do ponownego przetworzenia obliczeń, a tym samym być w stanie podjąć ostateczną decyzję dotyczącą zbadanej zmiennej. W ten sposób można wiedzieć, czy działka jest wadliwa, czy nie.

Zmniejszenie kosztów pobierania próbek

W wielu przypadkach trudno jest uzyskać informacje o jednej ze zmiennych, które chcesz się uczyć. Ale może być łatwiejsza zmienna pomocnicza do gromadzenia danych.

W takim przypadku pobrane są dwie próbki, duża dla zmiennej pomocniczej, tańsza i niewielka próbka, zawarta w głównej próbce najdroższej zmiennej.

Ta metoda ma zastosowanie za każdym razem, gdy określa się, że istnieje korelacja między obiema zmiennymi, co jest ogólnie zależnością proporcjonalności.

Przykład tej sytuacji pojawia się w naukach leśnych, gdzie pożądane jest ustalenie odsetka drzew dotkniętych przez roślinę pasożytów (La Tiña).

Ponieważ są one bardzo obszerne i trudne do dostępu, pełna populacja drzew jest niewykonalna w czasie i kosztach. Te kroki są następnie śledzone:

Krok 1: Próbkowanie

Wstępne pobieranie próbek polegałoby na zastosowaniu fotografii lotniczej, a las jest podzielony na działki. Kilka partii jest wybieranych losowo i szacowane, poprzez analizę obrazów wybranych działek, ile drzew wpływa na robak, ponieważ na kolor drzew wpływa pasożyt.

Może ci służyć: twierdzenie o euklidzie

Krok 2: Praca w terenie

Ale analiza fotograficzna może nie być precyzyjna, dlatego przystępujemy do wyboru, najlepiej losowo, kilka pierwszych próbek, aby wykonać pracę w terenie.

Krok 3: Porównanie

Następnie wynik terenowy jest porównywany z fotografią w celu przechwytywania dwóch wielu partii. To porównanie można przeprowadzić, na przykład, tworząc wykres, na którym osi pozioma jest wartością uzyskaną dla każdej partii przez fotografię, a na osi pionowej wartość uzyskana przez działkę przez działkę w terenie.

Ta metoda graficzna umożliwia wizualne określenie, czy istnieje korelacja między dwoma wynikami i określona, ​​poprzez analizę regresji, proporcjonalność lub współczynnik współczynnika między dwiema próbkami.

Po głównej próbce, to znaczy próbka fotograficzna, wykonana jest średnia wartość zainfekowanych drzew i jej odchylenie standardowe. Ale w miarę ustalenia współczynnika proporcjonalności i jego błędu z próbkami pola możliwe jest poprawienie wyniku głównej próbki (fotografii).

Wówczas wynik ten można ekstrapolować do pełnej populacji drzew.

Zalety i wady podwójnego pobierania próbek

W opisanych przykładach przewaga kosztowa jest dowodem.

Wadą jest to, że w przypadku podwójnego pobierania próbek w celu kontroli jakości istnieje ryzyko przejścia przez wiele produktów, które są poza tolerancją.

Ćwiczenia

Chcesz oszacować liczbę chorych drzew w lesie 162 hektarów. Ponieważ las jest bardzo obszerny, jest podzielony na 100 działek tego samego obszaru. 18 działek jest wybieranych losowo i poprzez badanie fotograficzne szacuje się, że na tych 18 działkach jest 8 chorych drzew o standardowym błędzie około 4,5 drzew.

Może ci służyć: jakie są części ułamka? (Przykłady)

Spośród tych 18 wykresów wybiera się 8 działek. Dla tych ośmiu działek badanie fotograficzne powoduje 10 chorych drzew z błędem mniej więcej 5,3 drzew.

Z drugiej strony dla tych samych ośmiu działek badanie terenowe rzuca 12,4 chorych drzew z błędem ponad 6,3 drzew.

Jest to żądane:

  • a) Określ współczynnik proporcjonalności między badaniem terenowym według regresji liniowej.
  • b) oszacuj liczbę chorych drzew za pomocą metody fotograficznej na stu działkach.
  • c) Zastosuj korektę z uzyskanym współczynnikiem proporcjonalności, aby oszacować rzeczywistą liczbę chorych drzew w całym lesie.

Rozwiązanie

Wykres liczby drzew na liczbę fotograficzną vs. liczba pola dla ośmiu działek wybranych do obu badań.

Liczba fotograficzna kontra liczba pola. Źródło: f. Zapata.

Linia trendu jest dostosowywana, a jej nachylenie jest określane. W takim przypadku uzyskuje się, że współczynnik proporcjonalności wynosi 1,23. To znaczy, jeśli x jest liczbą liczby fotografii, szacuje się, że liczba pola wyniesie y = 1,23 x.

Liczba chorych drzew zgodnie z liczbą fotograficzną w 18 wybranych działkach będzie:

18 x 8,5 = 153

Ale ponieważ cały las został podzielony na 100 działek tego samego obszaru, liczba chorych drzew oszacowanych metodą fotograficzną wynosi: (100/18) x 153 = 850.

Obecnie stosowany jest współczynnik korekty uzyskany z porównania pola i badania fotograficznego:

Szacowana rzeczywistość chorych drzew w lesie = 1,23 x 850 = 1046.

Bibliografia

  1. Podwójna próbka do oszacowania wskaźników, Pennstate College. Pobrano z PSU.Edu
  2. Podwójne, wielokrotne i segwencjonalne próbkowanie, NC State University. Odzyskane z NCSU.Edu
  3. Proste losowe pobieranie próbek. Odzyskane z Investopedia.com
  4. Co to jest podwójne próbkowanie? Odzyskane z: NIST.Gov
  5. Próbka. Źródło: w:.Wikipedia.org
  6. Próbka wielostopniowa. Źródło: w:.Wikipedia.org