Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Ocenianie szkolne Teoria budowy testów osiągnięć szkolnych

Podobne prezentacje


Prezentacja na temat: "Ocenianie szkolne Teoria budowy testów osiągnięć szkolnych"— Zapis prezentacji:

1 Ocenianie szkolne Teoria budowy testów osiągnięć szkolnych
Roman Dolata Wydział Pedagogiczny UW

2 Kontakt Roman Dolata Dyżury Poczta Piątki od 16 do 17, s. 314

3 Literatura, zaliczenie
M. Jakubowski, A. Pokropek (2009) Badając egzaminy. Podejście ilościowe w badaniach edukacyjnych. Centralna Komisja Egzaminacyjna. Str (do pobrania ze strony A. Anastasi, S. Urbina, (1999) Testy psychologiczne. Pracowania testów psychologicznych PTP. Rozdziały: 8,11, 13, 14. Zaliczenie Opracowanie, przeprowadzenie i przeanalizowanie wyników testu osiągnięć edukacyjnych

4 Co to jest test? (Daniel Koretz)
Mała próbka zadań, której używamy do oszacowania opanowania przez uczniów szerokiego wachlarza wiadomości i umiejętności (Daniel Koretz) Cechy formalne testu: - obiektywność standaryzacja liczbowa postać wyniku

5 Aspekty oceniania Wynik testu Perspektywa programowa
Perspektywa ewaluacyjna Perspektywa diagnostyczna

6 Podstawowe pojęcia statystyczne przydatne przy konstrukcji testów i analizie ich wyników

7 Rozkład liczebności Wyniki sprawdzianu 2009, rozkład dla kraju, n=400887

8 Rozkład procentowy Wyniki sprawdzianu 2009, rozkład dla kraju, n=400887

9 Rozkład skumulowany, procentowy Wyniki sprawdzianu 2009, rozkład dla kraju, n=400887

10 Podstawowe parametry rozkładu 1
Podstawowe parametry rozkładu 1. Miary tendencji centralnej i inne miary pozycji Wyniki sprawdzianu 2009, rozkład dla kraju, n=400887 Średnia arytmetyczna x: 22,6 Mediana Me: 23 Pierwszy kwartyl (25 percentyl): 17 Drugi kwartyl (mediana, 50 percentyl): 23 Trzeci kwartyl (75 percentyl): 28

11 Jak wyznaczamy medianę i kwartyle
Porządkujemy wszystkie uzyskane wyniki od najmniejszego do największego ( wyników, najpierw zera, potem jedynki itd.) Poczynając od wyników najniższych szukamy takiego wyniku, że: a) 25% wyników jest od niego niższych, a 75% wyższych – pierwszy kwartyl b) 50% wyników jest od niego niższych, a 50% wyższych – drugi kwartyl, mediana c) 75% wyników jest od niego niższych, a 25% wyższych – trzeci kwartyl minimum 1. kwartyl mediana 3.kwartyl maksimum 25% wyników 25% wyników 25% wyników 25% wyników

12 Podstawowe parametry rozkładu 2
Podstawowe parametry rozkładu 2. Miary zmienności wyników Wyniki sprawdzianu 2009, rozkład dla kraju, n=400887 średnia 3. kwartyl 1. kwartyl Wariancja: 58,2 Odchylenie standardowe: 7,6 Odchylenie kwartylowe (ćwiartkowe): 11

13 Porównanie dwóch rozkładów Sprawdzian 2009, szkoły publiczne i niepubliczne
miara Publiczne n=393982 Niepubliczne n=6905 Średnia 22,6 27,4 Mediana 23 29 1. kwartyl 17 22 3. kwartyl 28 34 Wariancja 57,7 60,4 Odchylenie standardowe 7,6 7,8 Roztęp ćwiartkowy 11 12

14 Porównanie dwóch rozkładów Sprawdzian 2009, dwie szkoły
miara SP A n=132 SP B n=143 Średnia 28,9 24,9 Mediana 29 25 1. kwartyl 18 3. kwartyl 33 Wariancja 26,0 83 Odchylenie standardowe 5,1 9,1 Roztęp ćwiartkowy 8 15

15 Badanie współzmienności wyników dwóch testów
Czy zmianom jednej zmiennej towarzyszą zmiany drugiej zmiennej? Analiza graficzna: wykresy rozrzutu Możliwe do zastosowania statystyki: - współczynnik korelacji r Pearsona - współczyniki regresji

16 Korelacja dodatnia (pozytywna) współczynnik korelacji wyższy od zera

17 Korelacja ujemna (negatywna) współczynnik korelacji niższy od zera

18 Brak korelacji (zerowa) współczynnik korelacji bliski zeru

19 Korelacja nieliniowa

20 Konstruowanie testów osiągnięć szkolnych

21 Testy osiągnięć a testy zdolności
testy poznawcze testy osiągnięć związane z określonymi kursami testy osiągnięć szeroko zorientowane słowne testy inteligencji bezsłowne i wykonaniowe testy inteligencji testy inteligencji wolne od wpływów kulturowych

22 Typy testów osiągnięć szkolnych
Przesiewowe (minimum kompetencji), szerokiego stosowania, selekcyjne Testy różnicujące i testy kryterialne Testy mocy i testy szybkości

23 Schemat konstrukcyjny testów osiągnięć szkolnych
Cele kształcenia Zadania testowe Badania pilotażowe – wybór zadań, określenie rzetelności testu Ostateczna postać testu Wynik surowy Skalowanie Wynik testu Normy wykonania

24 Elementy składowe testu
1. Lista celów edukacyjnych 2. Plan testu 3. Zadania testowe 4. Schematy punktacji 5. Kwestionariusz testu i instrukcja testowania 6. Normy wykonania testu: ilościowe i treściowe

25 Lista celów edukacyjnych
Fundament budowy testu Cele dotyczą wiadomości i umiejętności, które mają opanowywać uczniowie, a nie czynności nauczyciela Cele muszą być sformułowane w sposób jasny i jednoznaczny Lista celów nie powinna być zbyt długa; gdy zbyt długa: łączenie celów w ogólniejsze wyznaczenie priorytetów

26 W najprostszej postaci tabela o postaci:
Plan testu W najprostszej postaci tabela o postaci: Cel edukacyjny Liczba zadań Typy zadań Nr w kwestionariuszu 1. Umie przedstawić geometryczną interpretację mnożenia 4 2 WW, 2 KO 1,2,7,8 2. Potrafi przedstawić mnożenie jako dodawanie i odwrotnie 4 WW 3,4,5,6 3. Rozwiązuje zadania tekstowe, jednodziałaniowe na mnożenie 4 KO 9,10,11,12

27 Plan testu taksonomia ABC na podstawie B. Blooma
Cele Materiał Wiadomości Umiejętności Zastosowanie Razem dodawanie 2 zadania 6 odejmowanie mnożenie razem 18

28 Plan testu: przykład kursu statystyki

29 Zadania testowe Zadanie testowe to wskaźnik opanowania celu edukacyjnego By rzetelnie wypowiadać się o opanowaniu celu potrzebujemy wielu wskaźników W wypadku szczegółowego celu wystarczy kilka zadań testowych W wypadku ogólnych celów potrzeba znacznie więcej zadań testowych

30 Zadania testowe: klasyfikacja
Praktyczne W sytuacji naturalnej Prowokowane „Papier ołówek” Otwarte Krótkiej odpowiedzi Rozbudowanej odpowiedzi Zamknięte Prawda-fałsz Na dobieranie Wielokrotnego wyboru Porządkowanie listy

31 Schematy punktacji do zadań zamkniętych
Schemat punktacji Schematy punktacji do zadań zamkniętych Problem tzw. punktów ujemnych Schematy punktacji do zadań otwartych Problem rzetelności oceny wykonania zadań otwartych

32 Kwestionariusz testu i instrukcja przeprowadzenia testowania
Szata graficzna testu Problem praw autorskich Kolejność zadań Od najłatwiejszych do najtrudniejszych Instrukcja przeprowadzenia testu Standaryzacja sytuacji testowej Limit czasu: testy mocy vs testy szybkości

33 Norma ilościowa wykonania testu
Interpretacja ilościowa wyniku testu: wynik testu na tle rozkładu wyników w grupie odniesienia Najprostsza norma: odniesienie wyniku do średniej w grupie odniesienia Standaryzacja wyniku: skala staninowa skale o zadanej średniej i odchyleniu standardowym skale pozycyjne: centyle

34 Norma treściowa Wynik testu jako miara opanowania celów edukacyjnych
Najprostsza norma treściowa: wskazanie od jakiego wyniku można uznać, że cel został opanowany w stopniu pozwalającym na dalsze uczenie się Złożone normy treściowe: zdefiniowanie kilku poziomów opanowania celu Problem kumulatywności testu

35 Trafność testu

36 Trafność w testach osiągnięć
Test jest trafny, gdy: uczniowie wykonują, te operacje umysłowe, na których nam zależy możemy dostać na to dowód

37 Trafność zadania testowego
Treść celu edukacyjnego Procesy umysłowe zachodzące „w głowie” rozwiązującego

38 Trafność zadania - problemy
Przykład: Badana umiejętność: zasób słownikowy dziecka

39 Trafność zadania - problemy
Przykład: Badana umiejętność: zasób słownikowy dziecka, rozpoznawanie błędnego użycia słowa.

40 Trafność zadania - problemy
Czy prawidłowa odpowiedź jest na pewno poprawna, a dystraktory błędne? Jakość dystraktorów: Czy są prawdopodobne? Czy zawierają typowe błędne przekonania uczniów? Czy wykorzystują prawdziwe stwierdzenia, które nie są poprawną odpowiedzią?

41 Trafność zadania - problemy
Czy treść zadania (polecenie, pytanie, możliwe odpowiedzi, rysunki i schematy) jest jednoznaczna, jasna i zrozumiała? Język odpowiedni do wieku ucznia. Główna myśl w pytaniu, nie w odpowiedziach. Czy w zadaniu nie ma nadmiaru słów? Czy w pytaniu i możliwych odpowiedziach nie ma negacji? Jeśli musi być, czy jest wyróżniona?

42 Trafność zadania - problemy
Poprawna odpowiedź dłuższa od innych. Niejednorodność pod względem treści i formy gramatycznej. Powtarzanie się zwrotów prawidłowej odpowiedzi w dystraktorach. Duże kwantyfikatory: zawsze, nigdy, całkowicie, absolutnie. Brak poprawności gramatycznej, interpunkcyjnej, ortograficznej treści zadania

43 Metody analizy trafności
Analiza treściowa zadań - jw Analiza jakościowa rozwiązywania zadań przez uczniów (Jak rozwiązywałeś ten test? – technika głośnego myślenia) Analiza statystyczna: związek z innymi miarami odniesienia

44 Rzetelność testu

45 wynik empiryczny = wynik prawdziwy + błąd pomiaru
Rzetelność testu Każdy pomiar obarczony jest niepewnością pomiarową Klasyczne ujęcie niepewności pomiarowej wynik empiryczny = wynik prawdziwy + błąd pomiaru Wynik prawdziwy: średni wynik z nieskończonej liczby powtórzeń testu

46 Błąd pomiaru Wynik ucznia w teście Uczeń Wyniki Niskie Wysokie
Mierzymy umiejętność ucznia i otrzymujemy jakiś wynik. Niskie Wysokie Wyniki 46

47 Błąd pomiaru Wynik ucznia w teście Uczeń Wynik prawdziwy Wyniki Niskie
Wynik uzyskany na teście nie musi być tożsamy z wynikiem „prawdziwie” charakteryzującym ucznia. Empiryczny wynik testu reprezentujący poziom umiejętności może być niespójny z prawdziwym poziomem umiejętności ucznia, z jego prawdziwą wiedzą i umiejętnościami. Testy nie są idealne, warunki testowania są różne, egzaminatorzy różnie reagują na dane prace i różnie je oceniają; w pewnych warunkach o wyniku (jeżeli mamy do czynienia z zadaniami zamkniętymi o poprawnej odpowiedzi) może przesądzić los. Niskie Wysokie Wyniki 47

48 Błąd pomiaru Wynik ucznia w teście Wynik prawdziwy Uczeń Błąd pomiaru
Różnica między wynikiem prawdziwym a wynikiem pomiaru nazywana jest błędem pomiaru. Błąd pomiaru Niskie Wysokie Wyniki 48

49 Główne źródła błędu pomiaru w testach osiągnięć szkolnych
Arbitralność doboru zadań testowych Niedostatki standaryzacji procedury testowej Zgadywanie w zadaniach zamkniętych Ocenianie zadań otwartych Ściąganie Losowe wahania dyspozycji intelektualnych ucznia Błędy systematyczne: stronniczość testu

50 Rzetelność punktacji – opis eksperymentu Na podstawie: R. Dolata, E
Rzetelność punktacji – opis eksperymentu Na podstawie: R. Dolata, E. Putkiewicz, A. Wiłkomirska Reforma egzaminu maturalnego: oceny i rekomendacje Instytut Spraw Publicznych, badanie sfinansowane przez MENiS

51 Analiza rzetelności systemów punktacji
Przedmiotem analiz były systemy punktacji przygotowane na maturę 2002: Język polski - wypracowania (arkusz I i III), rozumienie czytanego tekstu (arkusz II). Historia – test i interpretacja źródeł (arkusz I i II). Matematyka – poziom podstawowy i rozszerzony (arkusz I i II).

52 Procedura badania rzetelności
Dobór prac. Przygotowanie prac do ponownego sprawdzania. Dobór egzaminatorów.

53 Problem trafności ekologicznej eksperymentu
Czynniki mogące zawyżać oszacowanie rzetelności: - dobór egzaminatorów (posługiwanie się dobrze znanym schematem punktacji), - pominięcie opcji (polski, historia). Czynniki mogące zaniżać oszacowanie rzetelności: - upływ czasu, - brak procedur oceniania grupowego

54 Metoda badania rzetelności systemów punktacji
Każda praca była niezależnie sprawdzana przez ośmiu egzaminatorów. Problem wielkości próbki. Zbiór danych (dla każdego kryterium): Lp E1 E2 E3 E4 E5 E6 E7 E8 1. 31 25 35 36 21 27 2. 55 41 59 26 54 3. 48 49 51 50 47 52 50. 18 19 20

55 Model analizy statystycznej

56 Wyniki analizy rzetelności punktacji dla wypracowania, arkusz III
Efekt jakości pracy Prosty efekt egzaminatora Interakcyjny efekt egzaminatora

57 Efekt egzaminatora dla przykładowych wypracowań
Lp. Średnia ocena Rozrzut ocen (SD) Minimalna Maksymalna 39 60,3 18,9 29 86 48 46,9 18,5 11 67 18 43,4 18,2 24 72 28 57,5 17,1 33 80 06 46,0 16,6 19 77

58 Co odpowiada za niską rzetelności systemu punktacji arkusza III?
Zawiodła przede wszystkim kryterialna skala rozwinięcia tematu (rzetelność=54%). Zła budowa skal szacunkowych: skala kompozycji (rzetelność=33%), skala stylu (rzetelność=31%), skala poprawności językowej (rzetelność=34%). Użyto z założenia subiektywnej skali szczególnych walorów pracy (rzetelność=23%).

59 Najmniej i najbardziej rzetelne kryterium skali rozwinięcia tematu, arkusz III
Dostrzeżenie roli puenty w Lekcji łaciny (przeciwstawienie poezji łacińskiej i wkroczenia barbarzyńców) Kryterium 15.1.: 14% Za pogłębione wnioski Ogólna prawidłowość: im wyższy poziom taksonomiczny, tym niższa rzetelność kryterium.

60 Przykład wadliwie skonstruowanej skali szacunkowej
Skala poprawności językowej wypracowania Na skali wyróżniono 4 punkty: 0, 5, 10 i 21 pkt. Oto ich opis: 0 – brak opisu, 5 – w większości poprawna składnia i frazeologia, zgodna z normą fleksja, nieliczne usterki leksykalne oraz nieliczne błędy ortograficzne i interpunkcyjne, 10 – poprawna, urozmaicona składnia i frazeologia, zgodna z normą fleksja, sporadycznie pojawiają się błędy ortograficzne i interpunkcyjne, 21 – poprawna, urozmaicona składnia i frazeologia, zgodna z normą fleksja i ortografia, rzadko pojawiające się błędy interpunkcyjne.

61 Zestawienie wyników analizy rzetelności systemów punktacji
Arkusz Rzetelność Prosty efekt egzaminatora Interakcyjny efekt egzaminatora Polski, arkusz I 55% 16% 29% Polski, arkusz III 49% 22% Polski, arkusz II 80% 7% 13% Historia, arkusz I 95% 2% 3% Historia, arkusz II 58% Matematyka, arkusz I 99% 1% 0% arkusz II 97%

62 Koniec opisu eksperymentu

63 Zapewnianie rzetelności testu: analiza mocy różnicującej zadań testowych Krzywe charakterystyczne dla trzech zadań ze Sprawdzianu 2010

64 Zadanie X Zadanie 7

65 Zadanie Y

66 Zadanie Z

67 Metody określania rzetelności wyniku testu
Dwukrotne testowanie Korelacja między wynikami dwóch testów Metoda połówkowa Korelacja między wynikami dwóch połówek Wewnętrzna spójność testu Wsp. rzetelności Alfa Cronbacha

68 Współczynnik rzetelności Alfa Cronbacha
Rzetelność jest to stosunek zróżnicowania wyniku prawdziwego do zróżnicowania wyniku uzyskanego na podstawie testowania (będącego sumą zróżnicowania wyniku prawdziwego oraz zróżnicowania błędu pomiaru)

69 Intertretacja ws. Alfa Cronbacha

70 Wykorzystanie wsp. rzetelności w interpretacji wyniku testu
Wyznaczanie przedziału ufności dla wyniku indywidualnego

71 Przykład Przykładowa informacja o wyniku ucznia dla rodziców, Massachusets, MCSA 2002 Prawdopodobieństwo, że wynik ucznia znajduje się w przedziale wyznaczonym przez prostokąt wynosi 95%

72 Idea szacowania przedziału ufności
Wynik ucznia w teście Uczeń Wyniki prawdziwe mogą być różne. My niestety obserwujemy nie wynik prawdziwy, ale wynik testowania. Niskie Wyniki Wysokie 72

73 Idea szacowania przedziału ufności
Uczeń Niskie Wyniki Wysokie

74 Idea szacowania przedziału ufności
Uczeń Niskie Wyniki Wysokie

75 Idea szacowania przedziału ufności
Uczeń Który z nich jest prawdziwy? Nie wiemy bo to co jest nam dane to tylko wynik uzyskany na tescie Niskie Wyniki Wysokie 75

76 Idea szacowania przedziału ufności
Przedział ufności Uczeń Dlatego konstruujemy przedziały ufności, które pokazują przedział, w którym wyniki prawdziwe mogą się znaleźć. Niskie Wyniki Wysokie 76

77 Idea szacowania przedziału ufności
Rzetelność testu Wyniki Wysokie Niskie Wynik mało prawdopodobny (2,5%) Funkcja prawdopodobieństwa Wynik prawdopodobny (95%) 77

78 Skalowanie wyniku testu
Jaki rozkład ma wynik testu w populacji docelowej? Surowe wyniki testów nie są porównywalne Normalizacja wyniku Standaryzacja wyniku

79 Przykład: średnie wyniki w punktach ze sprawdzianu w latach 2002-2010

80 Rozkład wyników sprawdzianu
Mediana 25 Średnia 24,3 2010 Mediana 23 Średnia 22,6 2009 Mediana 27 Średnia 25,7 2008

81 Normalizacja i standaryzacja skala o średniej 100 i odchyleniu standardowym 15
Egzamin 1 Egzamin 2 Egzamin 3 Wyniki pierwotne Rysunkowe przedstawienie zrównywania wyników. Jest chyba na tyle przedstawiona sugestywnie przedstawiona, że nie wymaga ode mnie wyjaśnień.

82 Normalizacja i standaryzacja skala o średniej 100 i odchyleniu standardowym 15
Egzamin 1 Egzamin 2 Egzamin 3 Wyniki pierwotne Wyniki znormalizowane

83 Normalizacja i standaryzacja skala o średniej 100 i odchyleniu standardowym 15
Test 1 Test 2 Test 3 Wyniki pierwotne Wyniki znormalizowane Wyniki po przejściach

84 Rozkład normalny Odgrywa ważną rolę w statystycznym opisie zagadnień egzaminacyjnych, socjalnych, przyrodniczych, itp Często występuje w naturze Ma interesujące właściwości matematyczne, dzięki którym oparte na nim metody statystyczne są dość proste obliczeniowo

85 Skala wyników standaryzowanych z
Uzyskane w ten sposób wartości wyników standaryzowanych przyjmują wartości dodatnie lub ujemne, w zależności od tego, czy odchylają się w górę, czy w dół od wartości średniej. 85

86 Relacje pomiędzy pięcioma skalami standardowymi
Autor, dr H. Szaleniec Relacje pomiędzy pięcioma skalami standardowymi

87 Skala staninowa Skala 9 stopniowa (9 rang) Skala normalizuje wyniki

88 Skala staninowa

89 Skala centylowa, przykład

90 Skala centylowa, wyznaczanie pozycji

91 Prosta analiza wyników testu

92 Analiza wyników dla grupy
Klasa IIIa, 20 uczniów Cel edukacyjny Norma treściowa Procent uzyskanych przez klasę pkt Procent uczniów, którzy opanowali cel 1. Umie przedstawić geometryczną interpretację mnożenia 60% 55% 40% 2. Potrafi przedstawić mnożenie jako dodawanie i odwrotnie 70% 80% 75% 3. Rozwiązuje zadania tekstowe, jednodziałaniowe na mnożenie 50% Wyniki interpretujemy z perspektywy programowej i ewaluacyjnej

93 Analiza wyników dla poszczególnych uczniów
Janek K. Cel edukacyjny Procent uzyskanych pkt Czy opanował cel? Wynik na tle klasy 1. Umie przedstawić geometryczną interpretację mnożenia 40% nie -15pp 2. Potrafi przedstawić mnożenie jako dodawanie i odwrotnie 85% tak +5pp 3. Rozwiązuje zadania tekstowe, jednodziałaniowe na mnożenie 60% 0pp Wyniki interpretujemy z perspektywy programowej i diagnostycznej Sprawy techniczne: pojęcie punktów procentowych, dokładność przedstawiania wyników (do części całkowitych

94 Wprowadzenie do IRT (probabilistyczna teoria odpowiedzi na zadanie testowe)

95 Schemat konstrukcyjny testów osiągnięć szkolnych Item Response Theory
Cele kształcenia Zadania testowe Badania pilotażowe – wybór zadań do banku i określenie ich parametrów Bank zadań Wiele możliwych wersji testu Pilotaż wersji przeznaczonych do danego zastosowania Skalowanie Wynik testu Normy wykonania

96 Podstawowe założenia i cechy IRT
Wykonanie zadania testowego zależy od poziomu ukrytej (bezpośrednio nieobserwowalnej) dyspozycji umysłowej Skala pomiarowa jest kumulatywna Poziom ukrytej dyspozycji wyznacza prawdopodobieństwo poradzenia sobie z danym zadaniem testowym (uwzględnienie czynników losowych) Jedno- lub wielowymiarowość danego testu Model zależności ukryta dyspozycja - radzenie sobie z zadaniem podlega empirycznemu testowi (zgodność modelu z danymi) Trudność zadań i poziom ukrytej dyspozycji umysłowej ucznia można lokować na jednej skali

97 Jak rozumieć pojęcie ukrytej dyspozycji?

98 Interpretacja związku między poziomem wykonania dwóch zadań
Analiza dla zadań 0-1 zadanie 2 wykonał nie wykonał zadanie 1 a b a+b c d c+d a+c b+d a+b+c+d

99 Korelacja negatywna między dwoma zadaniami
Φ=-1,0 zad.1 zad. 2 zad. 2 1 zad. 1 50 dysp. x dysp. y Wykluczające się dyspozycje

100 Brak korelacji między dwoma zadaniami
Φ=0,0 zad.1 zad. 2 zad. 2 1 zad. 1 25 dysp. x dysp. y niezależne dyspozycje

101 Korelacja pozytywna między dwoma zadaniami
Φ=1,0 zad.1 zad. 2 zad. 2 1 zad. 1 50 dysp. x wspólna dyspozycja

102 Odkrywanie ukrytych wymiarów
Analizując empiryczne powiązania między zadaniami odkrywamy ukryte dyspozycje umysłowe mierzone przez dany test Do wyjaśnienia radzenia sobie z danym zbiorem zadań może wystarczyć jedna (test jednowymiarowy) lub kilka (wielowymiarowy) ukrytych dyspozycji umysłowych W praktyce stosuje się jednowymiarowe modele IRT

103 Jak rozumieć kumulatywność skali pomiarowej?

104 Zależności kierunkowe między zadaniami
zad. 1 / zad. 2 zad. 2  zad. 1 zad.1 zad. 2 zad. 2 1 zad. 1 50 20 30 wspólna dyspozycja

105 Trzy wiązka trzech zadań tworzy kumulatywną skalę?
wspólna dyspozycja

106 Sprawdzanie, czy wiązka trzech zadań spełnia warunek kumulatywności (skalogram Guttmana)
Wzorzec odpowiedzi Liczba przypadków Wynik surowy Wynik skalowy Wzorce zgodne 000 15 100 25 1 110 30 2 111 20 3 Wzorce niezgodne 101 5 010 011 001 razem

107 Jak uwzględniamy działanie czynników losowych?

108 Prosty determinizm poziom dyspozycji  radzenie sobie z zadaniem
radzi sobie z zadaniem 1 prawdopodobieństwo poradzenia sobie z zadaniem nie radzi sobie z zadaniem niski poziom dyspozycji umysłowej wysoki

109 Związek probabilistyczny – model prostoliniowy
1 prawdopodobieństwo poradzenia sobie z zadaniem niski poziom dyspozycji umysłowej wysoki

110 Związek probabilistyczny – model logistyczny
1 prawdopodobieństwo poradzenia sobie z zadaniem niski poziom dyspozycji umysłowej wysoki

111 Jak empirycznie testujemy teorię związku poziomu dyspozycji umysłowej z radzeniem sobie z danym zadaniem?

112 Przykład modelu dobrze dopasowanego do danych
1 prawdopodobieństwo poradzenia sobie z zadaniem niski poziom dyspozycji umysłowej wysoki

113 Przykład modelu źle dopasowanego do danych
1 prawdopodobieństwo poradzenia sobie z zadaniem niski poziom dyspozycji umysłowej wysoki

114 Lokowanie zadania na skali 
Zadanie x 1,0 0,5 prawdopodobieństwo poradzenia sobie z zadaniem niski poziom dyspozycji umysłowej wysoki

115 Zestaw 5 zadań tworzących skalę
niski poziom dyspozycji umysłowej wysoki

116 Określanie trudności tych zadań
niski poziom dyspozycji umysłowej wysoki

117 Lokowanie ucznia na skali  Metoda największej wiarygodności
Warunkowe prawdopodobieństwo poradzenia sobie z zadaniem Jaś: 110-- Małgosia: --110 Zad. 1 Zad. 2 Zad. 3 Zad. 4 Zad. 5 -3 0,15 0,05 0,01 0,007 0,001 -2 0,50 0,070 -1 0,90 0,383 0,95 0,428 0,074 1 0,99 0,094 2 0,049 3 0,010


Pobierz ppt "Ocenianie szkolne Teoria budowy testów osiągnięć szkolnych"

Podobne prezentacje


Reklamy Google