Często zastanawiamy się jak długo prowadzić badania, healing jak duża musi być próba? Czasami pojawia się też liczba 30. Jaki jest głębszy jej sens? Można ją potraktować jako „gwaranta”, że z prawdopodobieństwem mniejszym niż 5% nie pominiemy zjawiska, które występuje w populacji z częstością 10%.

Jak to obliczyłem? Prawdobpodobieństwo, że nie wylosujemy z populacji do próby osoby z ważnymi cechami na poziomie 10% wynosi 90% – inaczej 0,9. Prawdopodobieństwo, że wylosujemy 30 takich osób wynosi 0,9 do potęgi 30, czyli 0,9^30 = 0,04239 < 5%

Poniżej zamieszczam tabelę, z której można skorzystać świadomie decydując się na wielkość próby w zależności od dokładności zakładanego badania.

Wielkość dotyczy oczywiście każdej sub grupy. Jeśli mamy w planach porównywać osoby np. z grupy biorącej udział w badaniu i eksperymentalnej, to dla zjawiska występującego w populacji u 10% i pewności 0,05, musimy wziąć po 30 osób w każdej.

Podejście obliczeniowe, które pozwala określić wielkość grup potrzebnych dla wykrycia danego zjawiska opiera się na mocy testu (prawdopodobieństwo odrzucenia przez test fałszywej hipotezy zerowej). Poniżej zamieszczam wykres pokazujący, jak wielkość grupy zależy od mocy testu, gdy chcemy wykryć różnicę wielkości 0,2 odchylenia standardowego:

Im większą chcemy mieć pewność, tym większa liczebność grupy. 650 osób wygląda strasznie, prawda?
Ale jeśli oczekiwana różnica między grupami jest większa, np. 1 odchylenie standardowe, to wystarczy 27 osób:

Powyższe wykresy dotyczą tylko testu t-Studenta dla danych niezależnych.

Tutaj jest prosty kalkulator, który za pomocą suwaków pozwala znaleźć optymalną liczebność próby.