Pobieranie prezentacji. Proszę czekać

Pobieranie prezentacji. Proszę czekać

Wykład 13 Neuropsychologia komputerowa Pamięć II Włodzisław Duch UMK Toruń Google: W Duch.

Podobne prezentacje


Prezentacja na temat: "Wykład 13 Neuropsychologia komputerowa Pamięć II Włodzisław Duch UMK Toruń Google: W Duch."— Zapis prezentacji:

1 Wykład 13 Neuropsychologia komputerowa Pamięć II Włodzisław Duch UMK Toruń Google: W Duch

2 Pamięć aktywna krótkotrwała Torowanie krótko trwające: uwaga i wpływ na szybkość reakcji. Poza czasem trwania treść pamięci i efekty wynikające z podobieństwa podobne są do torowania długotrwałego. Projekt act_priming.proj. Dopełnianie rdzeni lub homofonia, ale bez uczenia, tylko wpływ pozostałości po ostatniej aktywacji. Sieć nauczona jest kojarzenia i_a=i_b z o_a i z o_b. Test ma serię wzorców i odpowiedzi A i B, pokazujemy jej A na wejściu, sieć ma odpowiadać A; teraz pokazujemy wzorzec dla B, ale włączona jest tylko faza wprzód, odpowiedź sieci to raz A, raz B, co pozwala ocenić tendencje do odpowiedzi A/B po nauczeniu. Korelacje poprzednich odpowiedzi A z B zależą od szybkości zaniku aktywacji; jeśli act_decay 1 => 0 to aktywacja nie zanika i pojawia się tendencja do zostawiania A, jeśli szybko zanika to na zmianę. Przeanalizować wpływ na wyniki w test_log.

3 Aktywne podtrzymywanie Projekt act_maint.proj.gz: aktywne podtrzymywanie informacji w pamięci roboczej pomimo zakłóceń, szybko dostępna, nie wymaga zmian synaptycznych. Konieczna jest rekurencja, sieć atraktorowa z dużym basenem atrakcji, odpornym na szum. Procesy analizy danych ze środowiska nie wymagają takich sieci, bo są sterowane przez napływające informacje. Aktywacja powinna się rozpływać umożliwiając skojarzenia i wnioskowanie, dopóki mamy zewnętrzne sygnały to wystarczy, np. jeśli zapisujemy rezultaty pośrednich operacji na kartce. Przy braku zewnętrznych aktywacji musimy polegać na aktywnie utrzymywanej reprezentacji w pamięci roboczej, która ma poważne ograniczenia (słynne 7 2 Millera, a nawet 4 2 dla złożonych obiektów). Najpierw pamięć bez atraktorów, wymagająca zewnętrznych sygnałów, potem rozproszone reprezentacje, ale płytkie atraktory, mało odporne na szum; w końcu głębokie ale zlokalizowane, co uniemożliwia skojarzenia.

4 Model podtrzymywania Projekt act_maint.proj. 3 obiekty, 3 elementy (cechy) Chcemy porównać różne sytuacje obserwując stan sieci po prezentacji bodźca: czy uda się jej zapamiętać jeśli pobudzenie zniknie? Są tu 3 sieci: rozproszona, z warstwą wejściową i wyjściową o wewnętrznych sprzężeniach między elementami; sieć z dodatkową warstwą ukrytą (na rysunku), oraz sieć z izolowanymi reprezentacjami.

5 Aktywne podtrzymywanie DistributedNet: sprzężenia między ukrytymi jednostkami. 3 obiekty, 3 elementy (cechy). Jeśli jest wejściowy sygnał to aktywacja się utrzymuje, ale po jego usunięciu rozpływa się (sieć się rozmarzyła...). CycleOutputData pokazuje wszystkie próby. Sprawdzić wpływ wt_mean =0.5, wt_var = 0.1, 0.25, 0.4 (wariancja wag) przedłuża aktywacje ale utrzymuje się ona rzadko w dobrych jednostkach … w takiej sieci brak atraktorów. Net_Type Higher_order - kombinacja par cech pozwala tworzyć atraktory; (monitor, głośnik) TV, powstaje podtrzymująca się pętla. Nawet mały szum noise_var=0.01 prowadzi jednak do zapominania. Osłabienie połączeń rekurencyjnych przyspiesza zapominanie, ale dalsze ich wzmacnianie nie pomaga – konieczne są odizolowane jednostki z wewnętrznym dodatnim sprzężeniem => silne atraktory.

6 Izolowane reprezentacje Default by wrócić do początkowych parametrów. Net_type = isolated Brak połączeń między ukrytymi jednostkami, ale jest rekurencja, aktywacja się nie rozpływa. Szum = 0.01 nie przeszkadza, ale dla 0.02 już czasami się psuje. Warto uczyć się skupiać pomimo szumu? Inne zadanie WM: czy bodziec S(t) = S(t+2)? Parametry: env_type = Maint_updt, sieć Isolated, szum 0.01 Grid_log, Run: są dwa wejścia, Input 1 i 2, wt_scale 1=>2, zmienia siłę połączeń lokalnych; ten parametr pozwala przełączyć sieć od szybkiej aktualizacji do trwałego utrzymywania. Ale jak to zrobić automatycznie? Dopamina i dynamiczna regulacja nagrody w PFC.

7 Pamięć robocza Kora przedczołowa gra centralną rolę w utrzymywaniu aktywnej pamięci roboczej i ma własności, o które chodzi: izolowane samopobudzające się sieci atraktorowe o rozległych basenach. Neuroanatomia, połączenia i mikrokolumny PFC => specjalizowany obszar dla aktywnej pamięci. A. PR – przestrzenna. B. PR - przestrzenna, działania zależne od woli (self-ordered tasks). C. PR - przestrzenna, obiektów i werbalna, działania zależne od woli i myślenie analityczne. D. PR - obiektów, myślenie analityczne. Typowe eksperymenty wymagają opóźnionego wyboru i pokazują różnicę pomiędzy PC, IT, które mają tylko chwilowe reprezentacje bodźców, i PFC, która utrzymuje je dłużej.

8 Rola dopaminy Blokowanie dopaminy ma zły wpływ na pamięć roboczą, a jej wspomaganie ma wpływ pozytywny. Dopamina dochodzi z VTA (środmózgowie). DA wzmacnia siłę pobudzeń zewnętrznych, regulując dostęp do pamięci roboczej. VTA wykazuje taką skokową aktywność. Jądra podstawy mogą również regulować działanie PFC.

9 Jądra podstawy mózgu Pętlę wzgórze – prążkowie – kora. Czerwone linie – hamowanie, głownie GABA. Niebieskie linie: pobudzanie, głównie glutaminianem. Czarne linie: dopamina, głównie hamowanie. Zaburzenia działania tych pętli prowadzą do choroby Parkinsona, Huntingtona i wielu innych. GP – Globus Pallidus, czyli gałka blada; Putamen – skorupa; Substantia Nigra – istota czarna

10 Pamięć robocza Projekt pfc_maint_updt.proj Dynamiczna bramka dodana do sieci z rekurencją i uczenie w oparciu o różnice czasowe (TD). Matrix=matrisomy w grzbietowym prążkowiu; komórki Go/NoGo SNrThal – bramkujący sygnał z jąder podstawy, przez matrix. PV* - nagroda, LV* - antycypacja Ignore, Store, Recall decyduje co z nimi robić, randomizowane. PFC jest pamięcią roboczą, adaptujący się krytyk jest teraz biologicznym systemem nagrody (dopaminowym) kontrolującym odnawianie informacji w PFC, warstwa ukryta reprezentuje korę ciemieniową, w. ukryta (matrix) mapuje do wyjścia (kora PFC). AC uczy się przewidywać przyszła nagrodę, modulując siłę wewn. połączeń PFC – czy już zapomnieć?

11 Model PFC r.wt: jednoznaczne połączenia między wejściem, ukrytymi i PFC. Store, Recall, Ignore pojawiają się w przypadkowej kolejności; stymulacja A, B, C, D – elementy do zapamiętania. Jeśli SNrThal jest aktywna to zajdzie zapamiętanie S w PFC. Jeśli SNrThal nie jest aktywne (w matrix przeważa NoGo), to to PFC przechowuje infromację. SNrThal <= Matrix Go/NoGo <=dopamina z PV-LV, dzięki której uczy się co warto zapamiętać i jak kontrolować PFC). Wykresy EpochOutputData: cnt_err (czarny): liczba błędów/epokę (100 prób), głównie błędy Recall. S_da (czerwona): średnia ilość dopaminy dla Store, na początku maleje (PV/LV daje na początek dużo dopaminy dla nowych bodźców), znowu rośnie gdy system zaczyna prawidłowo działać i liczba błędów maleje. I_da (niebieska): ilość dopaminy dla Ignore, spada do 0, nie ma nagrody. R_da (zielona): dopamina w próbach Recall, duże fluktuacje, pokazuje różnicę w stosunku do oczekiwań.

12 A-nie B Interakcje pomiędzy pamięcią aktywną i synaptyczną - wagi już się zmieniły ale pamięć aktywna jest w innym stanie: co zwycięży? Takie interakcje widoczne są w rozwijającym się mózgu dzieci ~ 8 miesięcznych (Piaget 1954), doświadczenia robiono też na zwierzętach. Zabawka (jedzenie) chowana jest w pudełku A i po krótkiej przerwie dziecko (zwierzę) może ją stamtąd wyciągnąć. Po kilku powtórzeniach w A zabawka chowana jest w miejscu B; dzieci szukają nadal w A. Pamięć aktywna nie działa u dzieci równie sprawnie co synaptyczna, lezje w okolicach kory przedczołowej wywołują u dorosłych ludzi i rezusów podobne efekty. Dzieci robią mniej błędów patrząc w kierunku miejsca, gdzie schowano zabawkę, niż sięgając po nią. Jest wiele interesujących wariantów tego typu doświadczeń i wyjaśnień na różnym poziomie.

13 Projekt A-nie B Model procesu decyzyjnego: wiemy, że informacja o miejscu i obiektach jest rozdzielona, więc taką informację podjemy na wejściu: miejsce A, B, C, zabawka T1 lub T2 i przykrywka C1 lub C2. Pamięć synaptyczna realizowana za pomocą standardowego uczenia Hebbowskiego CPCA, a pamięć aktywna jak wzajemne połączenia pomiędzy reprezentacjami sieci w ukrytej warstwie. Wyjściowe warstwy: decyzje o kierunku patrzenie i sięgania. Kierunek patrzenia jest zawsze aktywowany w czasie każdego doświadczenia, sięganie rzadziej, tylko po przysunięciu całego układu do dziecka, więc te połączenia podlegać będą słabszemu uczeniu. Tendencja początkowa: zgodność patrzenia i sięgania na A (waga 0.7). Wszystkie wejścia połączone z ukrytymi neuronami, wagi 0.3. Projekt a_not_b.proj.

14 Eksperyment 1 rect_ws =0.3 decyduje o sile pobudzeń rekurencyjnych w ukrytej warstwie (pamięć robocza), zmiana tego parametru symuluje dojrzewanie dziecka. View Events: 3 rodzaje zdarzeń, wstępny pokaz 4x, potem A 2x, potem B 1 x. Zdarzenie ma 4 segmenty czasowe: 1) start, pretrial – schowki przykryte; 2) prezentacja, zabawka chowana do A; przykrywka w A 3) oczekiwanie – zabawka w A; 4) wybór – możliwe sięganie. RecurrentCons wts mean kontroluje się połączeń rekurencyjnych, czyli WM; 0.6 wystarczy by nie robić błędu. ABInput_Delay5 symuluje dłuższą przerwę, znowu jest błąd.

15 Dalsze eksperymenty Aktywność w ukrytej warstwie rozpływa się w stronę reprezentacji skojarzonej z A. rect_ws 0.3 => 0.75 dla dojrzałego dziecka. Chociaż pamięć synaptyczna się nie zmieniła to sprawniejsza pamięć robocza umożliwia podejmowanie właściwego działania. Spróbować dla rect_ws = 0.47 i 0.50 Co się dzieje? Nie ma żadnego działania – wahanie? Wyniki zależą od długości opóźnienia, dla krótszego jest mniej błędów. Delay 3=>1 Zrobić testy dla rect_ws = 0.47 i 0.50 Co się dzieje dla bardzo małego dziecka? rect_ws = 0.15, delay = 3; Słaba rekurencja, słabe uczenie dla A.

16 Inne rodzaje pamięci Tradycyjne podejście do pamięci zakłada funkcjonalne, kognitywne, monolityczne kanoniczne reprezentacje w pamięci. Z modelowania wynika, że jest wiele oddziaływujących ze sobą systemów odpowiedzialnych za pamięć, o różnej charakterystyce, odmiennych reprezentacjach i typie informacji. Pamięć rozpoznawcza: czy element listy był wcześniej widziany? Wystarczy sygnał poznaję, przypomnienie nie jest konieczne. Model hipokampa jest tu też przydatny, pozwala na przypomnienie, ale to jest za dużo – w pamięci rozpoznawczej główną rolę wydają się odgrywać okolice kory okołowęchowe (perirhinal cortex). Dopełnianie brakującej informacji (cued recall). Swobodne przypominanie – efekty położenia na liście (najlepiej na początku i końcu), oraz grupowanie (chunking) informacji.

17 Uczenie się kategorii Kategoryzacja w psychologii - wiele teorii. Klasyczne eksperymenty: Shepard et. al (1961), Nosofsky et al. (1994). Problemy o wzrastającym stopniu złożoności, podział na kategorie C 1, C 2, 3 binarne własności: kolor (czarny/biały), rozmiar (mały/duży), kształt (, ). Typ I : jedna własność określa kategorię. Typ II: dwie własności, XOR, np. Kat A: (czarny,duży) lub (biały,mały), kształt dowolny. Typ III-V: jedna własność + coraz więcej wyjątków. Typ VI: brak reguły, wyliczanka Trudności i szybkość uczenia się: Typ I < II < III ~ IV ~ V < VI

18 Dynamika kanoniczna Co dzieje się w mózgu w czasie uczenia się definicji kategorii na przykładach? Złożona neurodynamika najprostsza dynamika (kanoniczna). Dla wszystkich reguł logicznych można napisać odpowiednia równania. Dla problemów typu II, czyli XOR: Przestrzeń cech

19 Wbrew większości Lista: choroby C lub R, symptomy PC, PR, I Choroba C kojarzy się z symptomami (PC, I), choroba R z (PR, I); C występuje 3 razy częściej niż R. (PC, I) => C, PC => C, I => C. Przewidywania wbrew większości (Medin, Edelson 1988). Chociaż PC + I + PR => C (60%) to PC + PR => R (60%) Baseny atraktorów neurodynamiki? PDF w przestrzeni {C, R, I, PC, PR}. Interpretacja psychologiczna (Kruschke 1996): PR ma znaczenie ponieważ jest to symptom wyróżniający, chociaż PC jest częstszy. Aktywacja PR + PC częściej prowadzi do odpowiedzi R ponieważ gradient w kierunku R jest większy.

20 Uczenie Neurodynamika Psychologia I+PC jest częstsze => silniejsze połączenia synaptyczne, większe i głębsze baseny atrakcji. Symptomy I, PC są typowe dla C ponieważ występują częściej. Aby uniknąć atraktorów koło I+PC prowadzących do C, tworzy się głębszy i bardziej zlokalizowany atraktor koło I+PR. Dla rzadkiej choroby R symptom I nie jest jednoznaczny, więc uwaga skupia się nad PR skojarzonym z R. Punkt widzenia Wyjaśnieniom psychologicznym trudno nadać jakiś sens. Powinna być słaba zależność od kolejności prezentacji PC, PR, I.

21 Testowanie Neurodynamika Psychologia Punkt widzenia Aktywacja samego I prowadzi do C ponieważ więcej przykładów I+PC tworzy większy wspólny basen atrakcji niż I+PR. I => C, zgodnie z oczekiwaniami, częstsza kombinacja I+PC więc przypominana jest częściej. Aktywacja I+PC+PR daje częściej odpowiedź C bo I+PC umieszcza system w środku dużego basenu atrakcji C i pomimo dużego gradientu PR ciągle zostaje w C. I+PC+PR => C ponieważ są wszystkie symptomy a C jest najczęstsze. Aktywacja PR+PC prowadzi do R bo basen atrakcji R jest głębszy a gradient w (PR,PC) prowadzi do R PC+PR => R bo R jest symptomem dystynktywnym, chociaż PC jest częstsze.

22 Modele mentalne Proste konkluzje A=>B=>C to wynik pamięci skojarzeniowej, ale takie: Wszyscy akademicy to uczeni. Ż aden mędrzec nie jest akademikiem. Co można powiedzieć o mędrcach i uczonych? Wszystkie A to U, Żaden M nie jest A; Związek U M ? Co dzieje się z dynamiką neuronalną ? Czyste spekulacje … Basen U jest większy niż A, bo A jest podzbiorem U, więc musi odziedziczyć większość własności skojarzonych z U. Atraktor dla A musi być w środku U – jak to może wyglądać? Myślenie o A powoduje, że trudno jest pomyśleć o U. Baseny atraktorów dla 3 koncepcji basen dla mędrców nie jest w określonej relacji do pozostałych więc jest osobno. Interesujący temat … Uczeni Akademicy Mędrcy


Pobierz ppt "Wykład 13 Neuropsychologia komputerowa Pamięć II Włodzisław Duch UMK Toruń Google: W Duch."

Podobne prezentacje


Reklamy Google