Testy statystycznej istotności

Slides:



Advertisements
Podobne prezentacje
Testy statystycznej istotności
Advertisements

Proces doboru próby. Badana populacja – (zbiorowość generalna, populacja generalna) ogół rzeczywistych jednostek, o których chcemy uzyskać informacje.
Tworzenie odwołania zewnętrznego (łącza) do zakresu komórek w innym skoroszycie Możliwości efektywnego stosowania odwołań zewnętrznych Odwołania zewnętrzne.
Stężenia Określają wzajemne ilości substancji wymieszanych ze sobą. Gdy substancje tworzą jednolite fazy to nazywa się je roztworami (np. roztwór cukru.
Excel 2007 dla średniozaawansowanych zajęcia z dnia
Ekonometria stosowana Autokorelacja Piotr Ciżkowicz Katedra Międzynarodowych Studiów Porównawczych.
Niepewności pomiarowe. Pomiary fizyczne. Pomiar fizyczny polega na porównywaniu wielkości mierzonej z przyjętym wzorcem, czyli jednostką. Rodzaje pomiarów.
Ćwiczenia Zarządzanie Ryzykiem Renata Karkowska, ćwiczenia „Zarządzanie ryzykiem” 1.
Cel analizy statystycznej. „Człowiek –najlepsza inwestycja”
Poczta elektroniczna – e- mail Gmail zakładanie konta. Wysyłanie wiadomości.
Klasyczny model regresji liniowej (KMRL) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa.
Analiza wariancji (ANOVA) Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych Szkoła Główna Handlowa w Warszawie.
Zmienne losowe Zmienne losowe oznacza się dużymi literami alfabetu łacińskiego, na przykład X, Y, Z. Natomiast wartości jakie one przyjmują odpowiednio.
Analiza tendencji centralnej „Człowiek – najlepsza inwestycja”
Radosław Stefańczyk 3 FA. Fotony mogą oddziaływać z atomami na drodze czterech różnych procesów. Są to: zjawisko fotoelektryczne, efekt tworzenie par,
© Prof. Antoni Kozioł, Wydział Chemiczny Politechniki Wrocławskiej MATEMATYCZNE MODELOWANIE PROCESÓW BIOTECHNOLOGICZNYCH Prezentacja – 4 Matematyczne opracowywanie.
STATYSTYKA – kurs podstawowy wykład 10 dr Dorota Węziak-Białowolska Instytut Statystyki i Demografii.
W KRAINIE TRAPEZÓW. W "Szkole Myślenia" stawiamy na umiejętność rozumowania, zadawania pytań badawczych, rozwiązywania problemów oraz wykorzystania wiedzy.
1 Organizacje a kontrakt psychologiczny We współczesnym świecie człowiek otoczony jest szeregiem kontraktowych zobowiązań. To pewien rodzaj powiązań, zależności,
RAPORT Z BADAŃ opartych na analizie wyników testów kompetencyjnych przeprowadzonych wśród uczestników szkoleń w związku z realizacją.
Metody Analizy Danych Doświadczalnych Wykład 9 ”Estymacja parametryczna”
„Jak zwiększyć bezpieczeństwo uczestników ruchu drogowego?” Co nam dała realizacja projektu?
Instalacja nienadzorowana windows xp Jakub klafta.
Definiowanie i planowanie zadań typu P 1.  Planowanie zadań typu P  Zadania typu P to zadania unikalne służące zwykle dokonaniu jednorazowej, konkretnej.
Zmienna losowa dwuwymiarowa Dwuwymiarowy rozkład empiryczny Zakład Statystyki Stosowanej Instytut Statystyki i Demografii Kolegium Analiz Ekonomicznych.
ZASTOSOWANIE  Programowanie  Ułatwianie pracy  Szybkie obliczanie  Spisywanie kosztów  Tworzenie tabel i wykresów  Obliczanie średniej, sumy,
Regresja. Termin regresja oznacza badanie wpływu jednej lub kilku zmiennych tzw. objaśniających na zmienną, której kształtowanie się najbardziej nas interesuje,
Budżetowanie kapitałowe cz. III. NIEPEWNOŚĆ senesu lago NIEPEWNOŚĆ NIEMIERZALNA senesu strice RYZYKO (niepewność mierzalna)
O PARADOKSIE BRAESSA Zbigniew Świtalski Paweł Skałecki Wydział Matematyki, Informatyki i Ekonometrii Uniwersytet Zielonogórski Zakopane 2016.
Estymacja parametrów statystycznych – podstawowe pojęcia
BADANIE KRYTERIÓW POZACENOWYCH W PRZETARGACH PUBLICZNYCH
Test analizy wariancji dla wielu średnich – klasyfikacja pojedyncza
Kluczowe elementy skutecznej strategii analizy danych internetowych
mutacyjnego algorytmu ewolucyjnego
Katedra Międzynarodowych Studiów Porównawczych
SYSTEM KWALIFIKACJI, AWANSÓW I SPADKÓW
System wspomagania decyzji DSS do wyznaczania matematycznego modelu zmiennej nieobserwowalnej dr inż. Tomasz Janiczek.
terminologia, skale pomiarowe, przykłady
Przywiązanie partnerów a ich kompetencje społeczne
Rachunki zdań Tautologiczność funkcji
Liczby pierwsze.
Rachunek prawdopodobieństwa i statystyka
Modele SEM założenia formalne
Moje szczęście.
Wstęp do Informatyki - Wykład 3
Pojedyńczy element, mała grupa
Selekcja zmiennych w trybie zaawansowanym -
Ekonometria stosowana
Hipotezy statystyczne
TESTOWANIE I TESTY W BADANIACH PEDAGOGICZNYCH Opracowanie : Prof
Selekcja zmiennych w trybie zaawansowanym -
Własności statystyczne regresji liniowej
Weryfikacja hipotez statystycznych
Wpływ wybranych czynników na występowanie zaburzeń snu w chorobie Parkinsona Weronika Urbaś1, Anna Grażyńska1, Magdalena Doręgowska2, Joanna Siuda2, Monika.
Porównywanie średnich prób o rozkładach normalnych (testy t-studenta)
Selekcja danych Analiza widmowa FFT.
FORMUŁOWANIE HIPOTEZ STATYSTYCZNYCH
Znajdowanie liczb pierwszych w zbiorze
Doskonalenie rachunku pamięciowego u uczniów
REGRESJA WIELORAKA.
Wyrównanie sieci swobodnych
ROZKŁADY STATYSTYCZNE ZMIENNYCH MIERZALNYCH
Prawa ruchu ośrodków ciągłych c. d.
TESTY NIEPARAMETRYCZNE
Program na dziś Wprowadzenie Logika prezentacji i artykułu
TESTY NOMINALNE Warunki egzaminu.
WYBRANE ZAGADNIENIA PROBABILISTYKI
Andrzej Majkowski informatyka + 1.
Własności asymptotyczne metody najmniejszych kwadratów
Zapis prezentacji:

Testy statystycznej istotności Moduł Testy statystycznej istotności Testowanie przy użyciu oprogramowania SPSS Mgr Krzysztof Jurek

Sposoby doboru próby Próby niezależne – porównujemy ze sobą w tym samym czasie dwie zbiorowości, różniące się poziomem zmiennej niezależnej (np. klienci sklepu, mężczyźni i kobiety itp.) Obie próby są odzwierciedleniem dwóch różnych populacji a struktura jednej z nich nie ma żadnego wpływu na strukturę drugiej Próby zależne –należą do tej samej grupy obiektów badanych, badane są wielokrotnie w kolejnych jednostkach czasu lub w tym samym czasie gdy dokonujemy pomiaru wielu zmiennych (np. ta sama grupa przed i po eksperymencie)

Testy statystycznej istotności Przypuśćmy że dobraliśmy próbę losowo, nie martwimy się że jest ona skrzywiona. Innym problemem jest błąd z próby – oznacza on odchylenie charakterystyk próby w stosunku do populacji (np. średniej, odchylenia standardowego) Badamy studentów socjologii pewnej uczelni, jest ich 70% (mężczyzn), zaś w naszej próbie znalazło się ich 58% i to jest właśnie błąd z próby (70% - 58%). Statystki z populacji są niezmienne, statystyki dla każdej wylosowanej próby są różne. Testy statystycznej istotności pozwolą nam określić, czy różnica ta wynika z błędu z próby.

Zadaniem testów istotności jest wykrycie istnienia istotnej różnicy lub jej braku między wartościami parametrów (np. wartościami średnimi, wariancjami) charakteryzującymi różne próbki, wzorce, metody analityczne. Testowanie hipotez to systematyczna procedura służąca do oceny, czy rezultaty eksperymentu (przeprowadzonego na próbie) popierają określoną teorię lub praktyczną innowację (które będą odnosić się do całej populacji).

Do czego służą testy t – użycie SPSS Testy t służą do porównywania średnich. Różnice istotne statystycznie - górną, akceptowalną wartość przyjmuje się zazwyczaj 5% (5 na 100 przypadków), a zatem otrzymaną w raporcie SPSSa istotność statystyczną musimy porównać z poziomem równym 0,05 Jeśli otrzymana istotność jest niższa od tej wartości, to znaczy, iż otrzymaliśmy różnice istotne statystycznie!!!.

Istotność zależy od dwóch czynników: Różnica jest bardziej istotna, gdy zbadamy więcej osób (bo im więcej obserwacji, tym większa szansa, że nasze przewidywania są trafne) Różnica jest mniej istotna, im większe rozproszenie (odchylenie standardowe) wyników w każdej z porównywanych grup (bo im bardziej zróżnicowane są grupy, tym mniejsza możliwość przewidywania wyniku kolejnej osoby w grupie).

Rodzaje testów t Test t dla prób niezależnych: Służy do porównywania średnich uzyskanych w zmiennej zależnej przez dwie niezależne od siebie grupy np. możemy porównać kobiety i mężczyzn pod względem średniej długości życia. Test t dla prób zależnych: W tym przypadku porównujemy dwa wyniki uzyskane przez te same osoby – przykładem może być klasyczny przypadek powtarzanego w czasie pomiaru: badamy zdolność logicznego rozumowania przed studiami i po studiach – w badaniu biorą udział te same osoby. Przy tym teście t możemy porównać też średnie na podstawie informacji uzyskanych od jednej osoby. Test t dla jednej próby: Porównujemy średnią z jakiejś zmiennej z konkretną liczbą: np. chcemy sprawdzić, czy średnie zarobki naszych badanych różnią się istotnie od 2000.

Test t dla dwóch prób niezależnych Większość hipotez badawczych głosi, że dwie populacje różnią się między sobą. Przetestowanie tego typu twierdzeń wymaga odpowiedniej procedury statystycznej

Ćwiczenie 1 1. Otwórz w programie SPSS plik GSS93podzbiór.sav 2. Interesować nas będzie porównanie kobiet i mężczyzn pod względem wieku zawarcia związku małżeńskiego, zatem nasze pytanie badawcze będzie brzmiało: czy kobiety i mężczyźni różnią się wiekiem w momencie zawierania małżeństwa?

Przyjęcie hipotez badawczych: (Przykłady - „Do biegu gotowi , start Przyjęcie hipotez badawczych: (Przykłady - „Do biegu gotowi , start! Wprowadzenie do spss dla Windows”) Mężczyźni i kobiety różnią się wiekiem zawarcia małżeństwa – hipoteza badawcza, alternatywna Mężczyźni i kobiety nie różnią się wiekiem zawarcia małżeństwa – hipoteza zerowa

Po wyborze testu pojawi się okno zawierające listę zmiennych 1) testowanych (zmiennej lub zmiennych zależnych) – Test Variable(s) 2) zmiennej grupującej (zmienna niezależna) – Grouping Variable Z racji postawionych hipotez wybieramy zmienną Płeć respondenta i czynimy ją zmienną grupującą, zaś Wiek zawarcia związku małżeńskiego zmienną testowaną

UWAGA!!! Zmienna testowana powinna być zmierzona na skali interwałowej albo ilorazowej (wiek w tym przypadku jest mierzony na skali interwałowej) 3) Przygotowanie analizy dopełniamy zdefiniowaniem grupy - Define groups – dzięki temu określamy, które grupy zostaną porównane Zmienna płeć zdefiniowana jest następująco 1 – mężczyzna, 2 – kobieta, grupę pierwszą tworzą osoby z kodem 1 , grupę druga osoby z kodem 2

4) Klikamy OK, pojawia się Edytor raportów SPSS 5) Najważniejszy etap – Interpretacja wyników

Raport: I część raportu to statystyki ogólne Syntax dla statystyk opisowych i tabel krzyżowych Wszystkie nasze analizy jesteśmy w stanie zrobić bez okienek, dzięki zastosowaniu specjalnego języka poleceń Syntax.

Syntax dla Testu T dla prób niezależnych

UWAGA DWA POZIOMY INTERPRETACJI: Pierwszy etap interpretacji to ocena homogeniczności wariancji w obu populacjach Standardowa wersja testu zakłada, że wariancja jest taka sama w obu populacjach. Test t dla prób niezależnych sprawdza to założenie za pomocą statystki F i testu Leven’a, poziom prawdopodobieństwa p czyli prawdopodobieństwo popełnienia błędu pierwszego rodzaju.

Odczytujemy istotność dla testu F: jeśli p jest mniejsze od 0 Odczytujemy istotność dla testu F: jeśli p jest mniejsze od 0.05 to przyjmujemy, że populacje mają różne wariancje (Equal variances assumed) jeśli p jest większe od 0.05 to założenie równości da się utrzymać (Equal variances not assumed) – innymi słowy jeśli p> 0.05 to należy oprzeć się na wynikach w pierwszym wierszu , jeśli p<0.05 w drugim Nasz wynik to ,559 a więc jest >0.05, opieramy się na wynikach w pierwszym wierszu

Interpretacja testu t ZAPIS: t(1200) = 8,06; p < 0,01 Spoglądamy na poziom p (dwustronny), pozwala on ocenić prawdopodobieństwo popełnienia błędu pierwszego rodzaju Jeśli p jest mniejsze od założonego poziomu alfa zwykle 0.05 lub bardziej rygorystycznie 0.01, to powinniśmy odrzucić hipotezę zerową W naszym przypadku wynosi on 0.000 co powinniśmy zapisać p<0.001, przyjmujemy hipotezę, że kobiety i mężczyźni różnią się pod względem wieku zawarcia związku małżeńskiego a różnica ta jest istotna statystycznie. ZAPIS: t(1200) = 8,06; p < 0,01 Df = 1202 - 2

Test dla dwóch prób zależnych Procedura ta służy do oszacowania, czy średnie pochodzące z dwóch powiązanych ze sobą populacji różnią się między sobą. Badacze formułują często pytania typu: Czy uczestnicy badania po otrzymaniu określonego oddziaływania eksperymentalnego będą zachowywali się inaczej niż przed poddaniem ich oddziaływaniu? Schemat ten określa się jako test/retest

Test t-Studenta dla dwóch prób zależnych Czy µ1= µ2? Dwie próby zależne!!! Czyli dwa razy te same osoby, np. przed manipulacją i po lub w jakimś odstępie czasu µ1 µ2

Ćwiczenie: Wyobraźmy sobie, że wprowadzamy na rynek reklamę, przeprowadzamy eksperyment, interesuje nas czy reklama ma wpływ na odbiorców pokazujemy więc produkt i pytamy o jego cechy, ilość cech zapisujemy, to samo czynimy po emisji reklamy (po upływie jakiegoś czas) , pytamy o cechy i zapisujemy ich liczbę. Czy jakiś czas emisji reklamy zwiększa ilość cech przypisywanych produktowi? Otwórzmy zbiór reklama.sav Mamy tutaj do czynienia z dwoma etapami eksperymentu Hipotezy badawcze jakie możemy postawić mogą być dwie: Średnie przed i po emisji różnią się między sobą (test dwustronny) Średnie różnią się między sobą, tak, że jedna jest większa od drugiej (test jednostronny). Uwaga: Zmienne muszą być na skali interwałowej lub ilorazowej

Procedura Zmienna grupująca jest nam niepotrzebna Syntax dla naszej procedury

Pierwsza tabela to statystyki opisowe Druga tabela zawiera informacje o korelacji pomiędzy zmiennymi w tym przypadku zależność jest duża i istotna statystycznie, r=0,82, p<0,001 Syntax dla korelacji

Interpretacja testu t: najważniejsze komórki to t, df, oraz istotność t= -2,29 (minus dlatego, że średnia pierwszego pomiaru jest mniejsza od średniej drugiego pomiaru Df=39 (liczba par pomiarów minus 1 tj. 40-1) Poziom istotności (dwustronny) = 0,028 odrzucamy hipotezę zerową bezkierunkową mówiącą że brak jest różnic pomiędzy „przed i po” Gdybyśmy postawili kierunkową hipotezę uzyskany wynik 0,028/2 = 0,014 i dopiero wtedy porównujemy z p. W obu przypadkach należy odrzucić hipotezy zerowe.

W przypadku testu jednostronnego całe 5% kumuluje nam się na jednej stronie rozkładu stąd łatwiej odrzucić hipotezę zerową - stąd konieczność rozsądnego stawiania hipotez kierunkowych Z dla 0,05 = 1,64 W teście dwustronnym 5% rozkłada się po obu stronach rozkładu po 2,5 %, to bezpieczniejsza „droga”. Test jednostronny stosujemy wtedy, gdy mamy pewność, że hipotezy zerowa i alternatywna wyczerpują wszystkie możliwe hipotezy, tzn. prawdopodobieństwo, że prawdziwa jest hipoteza zerowa lub alternatywna jest równe 1. Użycie testu jednostronnego w innym przypadku zwiększa prawdopodobieństwo przyjęcia hipotezy fałszywej, a więc zwiększa błąd drugiego rodzaju. Z dla 0,05 = 1,96

Podsumowanie Każdy test statystyczny ma swoje założenia. Bez ich spełnienia nie powinniśmy go przeprowadzać. W przypadku testów t, założenia są takie: Równoliczne grupy Rozkład normalny zmiennej zależnej w każdej grupie Jednorodne wariancje Ilościowa zmienna zależna

Testy t są dosyć odporne na złamanie założeń Testy t są dosyć odporne na złamanie założeń. Przyjmuje się, że jeśli grupy są równoliczne, zaburzenie rozkładu oraz jednorodności wariancji nie wpływa negatywnie na wyniki. Jednak jeśli mamy istotnie nierównoliczne grupy (np. liczebność jednej 1,5x przekracza liczebność drugiej, lub otrzymamy istotny test chi2), powinniśmy zamiast testu t wybrać jego nieparametryczny odpowiednik. W psychologii dosyć często stosuje się także quasi-ilościowe zmienne zależne (skale Likerta itd.). W przypadku zmiennych typowo porządkowych, jak poziom wykształcenia, czy stopień w wojsku, lepiej stosować testy nieparametryczne.

Aby sprawdzić założenia testów parametrycznych należy dokonać kilku analiz. Otwórzmy plik kwiat.sav Wykorzystując zbiór „kwiaty”, możemy sprawdzić, czy badane grupy są równoliczne: na skali 1-10 mierzono szerokość uśmiechu kobiet, którym 8 marca wręczono tulipana, lub różę. Okazało się, że tulipany są mniej popularne i zbadano 17 kobiet z tulipanem i 27 z różą. Sprawdźmy równoliczność grup testem chi - kwadrat

Syntax dla testu chi-kwadrat Zmienną niezależną (grupującą) przerzucamy do okienka po prawej stronie. Domyślnie zaznaczona jest opcja „wszystkie kategorie są równe”, zatem SPSS będzie oczekiwał, że każda kategoria będzie miała taką samą liczebność. Można jednak wpisać procentowe wartości dla każdej kategorii i np. testować założenie, że jednak kategoria jest dwukrotnie liczniejsza od drugiej. Syntax dla testu chi-kwadrat

Po wykonaniu analizy otrzymujemy raport: Mieliśmy 44 badane kobiety, więc przy równych kategoriach SPSS oczekuje 22 kobiet w każdej grupie. Rozkład otrzymany różni się jednak od oczekiwanego. Im większe są reszty, tym większe różnice. Mimo sporej różnicy kobiet w grupach test chi2 okazał się nieistotny. Możemy założyć, że grupy są równoliczne. Otrzymany wynik możemy zapisać: 2(1) = 2,27; p > 0,05

Rozkład normalny Syntax podziel grupy W przypadku testu t dla prób niezależnych, powinniśmy sprawdzić, czy zmienna zależna ma rozkład normalny w obu grupach, przy teście t dla prób zależnych, obie zmienne powinny mieć rozkład normalny. Normalność rozkładu sprawdzamy np. testem Kołmogorowa-Smirnowa. W naszym przypadku musimy posłużyć się podziałem na podzbiory, by wykonać test K-S oddzielnie dla kobiet z różą i tulipanem (dane-podziel na podzbiory-porównaj grupy i wrzucamy zmienną „kwiat”) Rozkład normalny Syntax podziel grupy

Przerzucamy zmienną „uśmiech” na prawo i naciskamy OK. Przeprowadzamy test K-S: Analiza – testy nieparametryczne – K-S dla jednej próby Przerzucamy zmienną „uśmiech” na prawo i naciskamy OK. W naszym przypadku w grupie tulipanowej nie ma żadnego problemu z rozkładem normalnym: Z = 0,67; p>0,05. W grupie różanej istotność wynosi Z=0,73: p>0,05. Pamiętajmy, że im mniej osób, tym trudniej odrzucić H0, a zatem stosowanie testu K-S, tak jak przy innych testach statystycznych ma sens, gdy badamy minimum 20-30 osób w jednym warunku.