Wolna encyklopedia
Weryfikacja hipotez statystycznych – sprawdzanie sądów o populacji przez badanie jej wycinka (próby statystycznej).
Spis treści |
Definicje formalne
Niech
będzie rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby
, indeksowaną parametrem
(w szczególności może to być wektor parametrów rzeczywistych).
opisuje wielowymiarowy łączny rozkład wszystkich obserwacji w próbie
.
Hipotezą statystyczną
jest zdanie postaci
gdzie
koduje własność rozkładu, którą chcemy testować.
Problem weryfikacji hipotezy statystycznej polega na takim podziale przestrzeni próby
na rozłączne zbiory
i
, żeby prawdopodobieństwo warunkowe hipotezy
było możliwie małe (w pewnym ustalonym sensie) dla
i możliwie duże dla
.
Zwykle wybiera się pewną statystykę
i buduje zbiór
gdzie:
jest tzw. obszarem krytycznym testu, wybranym tak, aby 
jest wybranym prawdopodobieństwem, tzw. poziomem istotności testu, zwykle 0,05 lub 0,01.
Jednostronny obszar krytyczny to obszar postaci
, gdzie
jest tzw. wartością krytyczną testu. Jest to najmniejsza liczba, dla której 
Dwustronny obszar krytyczny to obszar postaci
gdzie
jest największą liczbą dla której 
jest najmniejszą liczbą dla której 
Standardowy przebieg procedury weryfikacyjnej
Sformułowanie hipotezy zerowej i alternatywnej
Hipoteza zerowa (H0) - Jest to hipoteza poddana procedurze weryfikacyjnej, w której zakładamy, że różnica między analizowanymi parametrami lub rozkładami wynosi zero. Przykładowo wnioskując o parametrach hipotezę zerową zapiszemy jako:
Hipoteza alternatywna (H1) - hipoteza przeciwstawna do weryfikowanej. Możemy ją zapisać na trzy sposoby w zależności od sformułowania badanego problemu:
Wybór statystyki testowej
Budujemy pewną statystykę W, która jest funkcją wyników z próby losowej
i wyznaczamy jej rozkład przy założeniu, że hipoteza zerowa jest prawdziwa. Funkcję W nazywa się statystyką testową lub funkcją testową.
Określenie poziomu istotności α
Na tym etapie procedury weryfikacyjnej przyjmujemy maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju, który polega na odrzuceniu hipotezy zerowej wtedy, gdy jest ona prawdziwa. Prawdopodobieństwo to jest oznaczane symbolem α i nazywane poziomem istotności. Na ogół przyjmujemy prawdopodobieństwo bliskie zeru, ponieważ chcemy aby ryzyko popełnienia błędu było jak najmniejsze. Najczęściej zakładamy poziom istotności α=0.05, czasem przyjmuje się np. α=0.01 ; α=0.1
Wyznaczenie obszaru krytycznego testu
Obszar krytyczny - obszar znajdujący się zawsze na krańcach rozkładu. Jeżeli obliczona przez nas wartość statystyki testowej znajdzie się w tym obszarze, to weryfikowaną przez nas hipotezę H0 odrzucamy. Wielkość obszaru krytycznego wyznacza dowolnie mały poziom istotności α, natomiast jego położenie określane jest przez hipotezę alternatywną.
Obszar krytyczny od pozostałej części rozkładu statystyki oddzielony jest przez tzw. wartości krytyczne testu (wα), czyli wartości odczytane z rozkładu statystyki przy danym α, tak aby spełniona była relacja zależna od sposobu sformułowania H1.
Obliczenie statystyki na podstawie próby
Wyniki próby opracowujemy w odpowiedni sposób, zgodnie z procedurą wybranego testu i są one podstawą do obliczenia statystyki testowej. Większość statystyk testowych, mających dokładny rozkład normalny, t-Studenta lub graniczny rozkład normalny, obliczamy w następujący sposób:
gdzie:
– Statystyka testowa
– Statystyka obliczona z próby
– Hipotetyczna wartość parametru(ów)
– Odchylenie standardowe rozkładu statystyki
Podjęcie decyzji
Wyznaczoną na podstawie próby wartość statystyki porównujemy z wartością krytyczną testu.
- Jeżeli wartość ta znajdzie się w obszarze krytycznym, to hipotezę zerową należy odrzucić jako nieprawdziwą. Stąd wniosek, że prawdziwa jest hipoteza alternatywna.
- Jeżeli natomiast wartość ta znajdzie się poza obszarem krytycznym, oznacza to, że brak jest podstaw do odrzucenia hipotezy zerowej. Stąd wniosek, że hipoteza zerowa może, ale nie musi, być prawdziwa, a postępowanie nie dało żadnych dodatkowych informacji uprawniających do podjęcia decyzji o przyjęciu lub odrzuceniu hipotezy zerowej.
Reguły postępowania przy weryfikacji hipotez są określane mianem testów statystycznych.
Alternatywne podejście
Powyższa standardowa procedura wymaga przyjęcia arbitralnego poziomu istotności α a wynikiem weryfikacji jest odpowiedź binarna – albo statystyka testowa mieści się w przedziale ufności, albo nie.
Alternatywnym i nowocześniejszym, choć mniej popularnym podejściem jest obliczenie zamiast tego surowej p-wartości (prawdopodobieństwa popełnienia błędu I rodzaju) i podawanie jej jako wyników weryfikacji. Dzięki temu nie ma potrzeby przyjmowania a priori żadnych wartości α, pozwala to również na porównywanie istotności różnych konkurencyjnych hipotez statystycznych.
Związane pojęcia
| Niektóre informacje zawarte w artykule wymagają weryfikacji. Zajrzyj na stronę dyskusji, by dowiedzieć się, jakie informacje budzą wątpliwości. |
- Rozmiar testu (α)
- Rozmiar testu (poziom istotności) jest to założone maksymalne prawdopodobieństwo nieprawidłowego odrzucenia hipotezy zerowej.
- Test najsilniejszy
- Test najsilniejszy, to test, który przy danym poziomie istotności na największą moc.
- Test najsilniejszy jednoznacznie
- Test najsilniejszy jednoznacznie, to test, który ma największą moc dla wszytkich poziomów istotności.
- Test nieobciążony
- Test jest nieobciążony, gdy jego moc przewyższa poziom istotności.
Bibliografia
- Ryszard Zieliński: Siedem wykładów wprowadzających do statystyki matematycznej. Warszawa: 2004. http://www.impan.gov.pl/~rziel/7ALL.pdf (dostęp: 21 maja 2008)
- Lesław Gajek: Wnioskowanie statystyczne dla studentów. Modele i metody. Warszawa: 1998. ISBN 8320424895.






