Wykład 13 Neuropsychologia komputerowa Pamięć II Włodzisław Duch UMK Toruń Google: W Duch (c) 1999. Tralvex Yeap. All Rights Reserved
Pamięć aktywna krótkotrwała Torowanie krótko trwające: uwaga i wpływ na szybkość reakcji. Poza czasem trwania treść pamięci i efekty wynikające z podobieństwa podobne są do torowania długotrwałego. Projekt act_priming.proj. Dopełnianie rdzeni lub homofonia, ale bez uczenia, tylko wpływ pozostałości po ostatniej aktywacji. Sieć nauczona jest kojarzenia i_a=i_b z o_a i z o_b. Test ma serię wzorców i odpowiedzi A i B, pokazujemy jej A na wejściu, sieć ma odpowiadać A; teraz pokazujemy wzorzec dla B, ale włączona jest tylko faza wprzód, odpowiedź sieci to raz A, raz B, co pozwala ocenić tendencje do odpowiedzi A/B po nauczeniu. Korelacje poprzednich odpowiedzi A z B zależą od szybkości zaniku aktywacji; jeśli act_decay 1 => 0 to aktywacja nie zanika i pojawia się tendencja do zostawiania A, jeśli szybko zanika to na zmianę. Przeanalizować wpływ na wyniki w test_log. (c) 1999. Tralvex Yeap. All Rights Reserved
Aktywne podtrzymywanie Projekt act_maint.proj.gz: aktywne podtrzymywanie informacji w pamięci roboczej pomimo zakłóceń, szybko dostępna, nie wymaga zmian synaptycznych. Konieczna jest rekurencja, sieć atraktorowa z dużym basenem atrakcji, odpornym na szum. Procesy analizy danych ze środowiska nie wymagają takich sieci, bo są sterowane przez napływające informacje. Aktywacja powinna się rozpływać umożliwiając skojarzenia i wnioskowanie, dopóki mamy zewnętrzne sygnały to wystarczy, np. jeśli zapisujemy rezultaty pośrednich operacji na kartce. Przy braku zewnętrznych aktywacji musimy polegać na aktywnie utrzymywanej reprezentacji w pamięci roboczej, która ma poważne ograniczenia (słynne 72 Millera, a nawet 42 dla złożonych obiektów). Najpierw pamięć bez atraktorów, wymagająca zewnętrznych sygnałów, potem rozproszone reprezentacje, ale płytkie atraktory, mało odporne na szum; w końcu głębokie ale zlokalizowane, co uniemożliwia skojarzenia. (c) 1999. Tralvex Yeap. All Rights Reserved
Model podtrzymywania Projekt act_maint.proj. 3 obiekty, 3 elementy (cechy) Chcemy porównać różne sytuacje obserwując stan sieci po prezentacji bodźca: czy uda się jej zapamiętać jeśli pobudzenie zniknie? Są tu 3 sieci: rozproszona, z warstwą wejściową i wyjściową o wewnętrznych sprzężeniach między elementami; sieć z dodatkową warstwą ukrytą (na rysunku), oraz sieć z izolowanymi reprezentacjami. (c) 1999. Tralvex Yeap. All Rights Reserved
Aktywne podtrzymywanie DistributedNet: sprzężenia między ukrytymi jednostkami. 3 obiekty, 3 elementy (cechy). Jeśli jest wejściowy sygnał to aktywacja się utrzymuje, ale po jego usunięciu rozpływa się (sieć się rozmarzyła ...). CycleOutputData pokazuje wszystkie próby. Sprawdzić wpływ wt_mean =0.5, wt_var = 0.1, 0.25, 0.4 (wariancja wag) przedłuża aktywacje ale utrzymuje się ona rzadko w dobrych jednostkach … w takiej sieci brak atraktorów. Net_Type Higher_order - kombinacja par cech pozwala tworzyć atraktory; (monitor, głośnik) TV, powstaje podtrzymująca się pętla. Nawet mały szum noise_var=0.01 prowadzi jednak do zapominania. Osłabienie połączeń rekurencyjnych przyspiesza zapominanie, ale dalsze ich wzmacnianie nie pomaga – konieczne są odizolowane jednostki z wewnętrznym dodatnim sprzężeniem => silne atraktory. (c) 1999. Tralvex Yeap. All Rights Reserved
Izolowane reprezentacje Default by wrócić do początkowych parametrów. Net_type = isolated Brak połączeń między ukrytymi jednostkami, ale jest rekurencja, aktywacja się nie rozpływa. Szum = 0.01 nie przeszkadza, ale dla 0.02 już czasami się psuje. Warto uczyć się skupiać pomimo szumu? Inne zadanie WM: czy bodziec S(t) = S(t+2)? Parametry: env_type = Maint_updt, sieć Isolated, szum 0.01 Grid_log, Run: są dwa wejścia, Input 1 i 2, wt_scale 1=>2, zmienia siłę połączeń lokalnych; ten parametr pozwala przełączyć sieć od szybkiej aktualizacji do trwałego utrzymywania. Ale jak to zrobić automatycznie? Dopamina i dynamiczna regulacja nagrody w PFC. (c) 1999. Tralvex Yeap. All Rights Reserved
Pamięć robocza Kora przedczołowa gra centralną rolę w utrzymywaniu aktywnej pamięci roboczej i ma własności, o które chodzi: izolowane samopobudzające się sieci atraktorowe o rozległych basenach. Neuroanatomia, połączenia i mikrokolumny PFC => specjalizowany obszar dla aktywnej pamięci. A. PR – przestrzenna. B. PR - przestrzenna, działania zależne od woli (self-ordered tasks). C. PR - przestrzenna, obiektów i werbalna, działania zależne od woli i myślenie analityczne. D. PR - obiektów, myślenie analityczne. Typowe eksperymenty wymagają opóźnionego wyboru i pokazują różnicę pomiędzy PC, IT, które mają tylko chwilowe reprezentacje bodźców, i PFC, która utrzymuje je dłużej. (c) 1999. Tralvex Yeap. All Rights Reserved
Rola dopaminy Blokowanie dopaminy ma zły wpływ na pamięć roboczą, a jej wspomaganie ma wpływ pozytywny. Dopamina dochodzi z VTA (środmózgowie). DA wzmacnia siłę pobudzeń zewnętrznych, regulując dostęp do pamięci roboczej. VTA wykazuje taką skokową aktywność. Jądra podstawy mogą również regulować działanie PFC. (c) 1999. Tralvex Yeap. All Rights Reserved
Jądra podstawy mózgu Pętlę wzgórze – prążkowie – kora. Czerwone linie – hamowanie, głownie GABA. Niebieskie linie: pobudzanie, głównie glutaminianem. Czarne linie: dopamina, głównie hamowanie. Zaburzenia działania tych pętli prowadzą do choroby Parkinsona, Huntingtona i wielu innych. GP – Globus Pallidus, czyli gałka blada; Putamen – skorupa; Substantia Nigra – istota czarna (c) 1999. Tralvex Yeap. All Rights Reserved
Pamięć robocza Projekt pfc_maint_updt.proj Dynamiczna „bramka” dodana do sieci z rekurencją i uczenie w oparciu o różnice czasowe (TD). Matrix=matrisomy w grzbietowym prążkowiu; komórki Go/NoGo SNrThal – bramkujący sygnał z jąder podstawy, przez matrix. PV* - nagroda, LV* - antycypacja Ignore, Store, Recall decyduje co z nimi robić, randomizowane. PFC jest pamięcią roboczą, adaptujący się krytyk jest teraz biologicznym systemem nagrody (dopaminowym) kontrolującym odnawianie informacji w PFC, warstwa ukryta reprezentuje korę ciemieniową, w. ukryta (matrix) mapuje do wyjścia (kora PFC). AC uczy się przewidywać przyszła nagrodę, modulując siłę wewn. połączeń PFC – czy już zapomnieć? (c) 1999. Tralvex Yeap. All Rights Reserved
Model PFC r.wt: jednoznaczne połączenia między wejściem, ukrytymi i PFC. Store, Recall, Ignore pojawiają się w przypadkowej kolejności; stymulacja A, B, C, D – elementy do zapamiętania. Jeśli SNrThal jest aktywna to zajdzie zapamiętanie S w PFC. Jeśli SNrThal nie jest aktywne (w matrix przeważa NoGo), to to PFC przechowuje infromację. SNrThal <= Matrix Go/NoGo <=dopamina z PV-LV, dzięki której uczy się co warto zapamiętać i jak kontrolować PFC). Wykresy EpochOutputData: cnt_err (czarny): liczba błędów/epokę (100 prób), głównie błędy Recall. S_da (czerwona): średnia ilość dopaminy dla Store, na początku maleje (PV/LV daje na początek dużo dopaminy dla nowych bodźców), znowu rośnie gdy system zaczyna prawidłowo działać i liczba błędów maleje. I_da (niebieska): ilość dopaminy dla Ignore, spada do 0, nie ma nagrody. R_da (zielona): dopamina w próbach Recall, duże fluktuacje, pokazuje różnicę w stosunku do oczekiwań. (c) 1999. Tralvex Yeap. All Rights Reserved
A-nie B Interakcje pomiędzy pamięcią aktywną i synaptyczną - wagi już się zmieniły ale pamięć aktywna jest w innym stanie: co zwycięży? Takie interakcje widoczne są w rozwijającym się mózgu dzieci ~ 8 miesięcznych (Piaget 1954), doświadczenia robiono też na zwierzętach. Zabawka (jedzenie) chowana jest w pudełku A i po krótkiej przerwie dziecko (zwierzę) może ją stamtąd wyciągnąć. Po kilku powtórzeniach w A zabawka chowana jest w miejscu B; dzieci szukają nadal w A. Pamięć aktywna nie działa u dzieci równie sprawnie co synaptyczna, lezje w okolicach kory przedczołowej wywołują u dorosłych ludzi i rezusów podobne efekty. Dzieci robią mniej błędów patrząc w kierunku miejsca, gdzie schowano zabawkę, niż sięgając po nią. Jest wiele interesujących wariantów tego typu doświadczeń i wyjaśnień na różnym poziomie. (c) 1999. Tralvex Yeap. All Rights Reserved
Projekt A-nie B Model procesu decyzyjnego: wiemy, że informacja o miejscu i obiektach jest rozdzielona, więc taką informację podjemy na wejściu: miejsce A, B, C, zabawka T1 lub T2 i przykrywka C1 lub C2. Pamięć synaptyczna realizowana za pomocą standardowego uczenia Hebbowskiego CPCA, a pamięć aktywna jak wzajemne połączenia pomiędzy reprezentacjami sieci w ukrytej warstwie. Wyjściowe warstwy: decyzje o kierunku patrzenie i sięgania. Kierunek patrzenia jest zawsze aktywowany w czasie każdego doświadczenia, sięganie rzadziej, tylko po przysunięciu całego układu do dziecka, więc te połączenia podlegać będą słabszemu uczeniu. Tendencja początkowa: zgodność patrzenia i sięgania na A (waga 0.7). Wszystkie wejścia połączone z ukrytymi neuronami, wagi 0.3. Projekt a_not_b.proj. (c) 1999. Tralvex Yeap. All Rights Reserved
Eksperyment 1 rect_ws =0.3 decyduje o sile pobudzeń rekurencyjnych w ukrytej warstwie (pamięć robocza), zmiana tego parametru symuluje dojrzewanie dziecka. View Events: 3 rodzaje zdarzeń, wstępny pokaz 4x, potem A 2x, potem B 1 x. Zdarzenie ma 4 segmenty czasowe: 1) start, pretrial – schowki przykryte; 2) prezentacja, zabawka chowana do A; przykrywka w A 3) oczekiwanie – zabawka w A; 4) wybór – możliwe sięganie. RecurrentCons wts mean kontroluje się połączeń rekurencyjnych, czyli WM; 0.6 wystarczy by nie robić błędu. ABInput_Delay5 symuluje dłuższą przerwę, znowu jest błąd. (c) 1999. Tralvex Yeap. All Rights Reserved
Dalsze eksperymenty Aktywność w ukrytej warstwie rozpływa się w stronę reprezentacji skojarzonej z A. rect_ws 0.3 => 0.75 dla dojrzałego dziecka. Chociaż pamięć synaptyczna się nie zmieniła to sprawniejsza pamięć robocza umożliwia podejmowanie właściwego działania. Spróbować dla rect_ws = 0.47 i 0.50 Co się dzieje? Nie ma żadnego działania – wahanie? Wyniki zależą od długości opóźnienia, dla krótszego jest mniej błędów. Delay 3=>1 Zrobić testy dla rect_ws = 0.47 i 0.50 Co się dzieje dla bardzo małego dziecka? rect_ws = 0.15, delay = 3; Słaba rekurencja, słabe uczenie dla A. (c) 1999. Tralvex Yeap. All Rights Reserved
Inne rodzaje pamięci Tradycyjne podejście do pamięci zakłada funkcjonalne, kognitywne, monolityczne kanoniczne reprezentacje w pamięci. Z modelowania wynika, że jest wiele oddziaływujących ze sobą systemów odpowiedzialnych za pamięć, o różnej charakterystyce, odmiennych reprezentacjach i typie informacji. Pamięć rozpoznawcza: czy element listy był wcześniej widziany? Wystarczy sygnał „poznaję”, przypomnienie nie jest konieczne. Model hipokampa jest tu też przydatny, pozwala na przypomnienie, ale to jest za dużo – w pamięci rozpoznawczej główną rolę wydają się odgrywać okolice kory okołowęchowe (perirhinal cortex). Dopełnianie brakującej informacji (cued recall). Swobodne przypominanie – efekty położenia na liście (najlepiej na początku i końcu), oraz grupowanie (chunking) informacji. (c) 1999. Tralvex Yeap. All Rights Reserved
Uczenie się kategorii Kategoryzacja w psychologii - wiele teorii. Klasyczne eksperymenty: Shepard et. al (1961), Nosofsky et al. (1994). Problemy o wzrastającym stopniu złożoności, podział na kategorie C1, C2, 3 binarne własności: kolor (czarny/biały), rozmiar (mały/duży), kształt (,). Typ I : jedna własność określa kategorię. Typ II: dwie własności, XOR, np. Kat A: (czarny,duży) lub (biały,mały), kształt dowolny. Typ III-V: jedna własność + coraz więcej wyjątków. Typ VI: brak reguły, wyliczanka Trudności i szybkość uczenia się: Typ I < II < III ~ IV ~ V < VI (c) 1999. Tralvex Yeap. All Rights Reserved
Dynamika kanoniczna Co dzieje się w mózgu w czasie uczenia się definicji kategorii na przykładach? Złożona neurodynamika <=> najprostsza dynamika (kanoniczna). Dla wszystkich reguł logicznych można napisać odpowiednia równania. Dla problemów typu II, czyli XOR: Przestrzeń cech (c) 1999. Tralvex Yeap. All Rights Reserved
Wbrew większości Lista: choroby C lub R, symptomy PC, PR, I Choroba C kojarzy się z symptomami (PC, I), choroba R z (PR, I); C występuje 3 razy częściej niż R. (PC, I) => C, PC => C, I => C. Przewidywania „wbrew większości” (Medin, Edelson 1988). Chociaż PC + I + PR => C (60%) to PC + PR => R (60%) Baseny atraktorów neurodynamiki? PDF w przestrzeni {C, R, I, PC, PR}. Interpretacja psychologiczna (Kruschke 1996): PR ma znaczenie ponieważ jest to symptom wyróżniający, chociaż PC jest częstszy. Aktywacja PR + PC częściej prowadzi do odpowiedzi R ponieważ gradient w kierunku R jest większy. (c) 1999. Tralvex Yeap. All Rights Reserved
Uczenie Neurodynamika Psychologia Punkt widzenia I+PC jest częstsze => silniejsze połączenia synaptyczne, większe i głębsze baseny atrakcji. Symptomy I, PC są typowe dla C ponieważ występują częściej. Aby uniknąć atraktorów koło I+PC prowadzących do C, tworzy się głębszy i bardziej zlokalizowany atraktor koło I+PR. Dla rzadkiej choroby R symptom I nie jest jednoznaczny, więc uwaga skupia się nad PR skojarzonym z R. Wyjaśnieniom psychologicznym trudno nadać jakiś sens. Powinna być słaba zależność od kolejności prezentacji PC, PR, I. (c) 1999. Tralvex Yeap. All Rights Reserved
Testowanie Neurodynamika Psychologia Punkt widzenia Aktywacja samego I prowadzi do C ponieważ więcej przykładów I+PC tworzy większy wspólny basen atrakcji niż I+PR. I => C, zgodnie z oczekiwaniami, częstsza kombinacja I+PC więc przypominana jest częściej. Aktywacja I+PC+PR daje częściej odpowiedź C bo I+PC umieszcza system w środku dużego basenu atrakcji C i pomimo dużego gradientu PR ciągle zostaje w C. I+PC+PR => C ponieważ są wszystkie symptomy a C jest najczęstsze. Aktywacja PR+PC prowadzi do R bo basen atrakcji R jest głębszy a gradient w (PR,PC) prowadzi do R PC+PR => R bo R jest symptomem dystynktywnym, chociaż PC jest częstsze. (c) 1999. Tralvex Yeap. All Rights Reserved
Modele mentalne Żaden mędrzec nie jest akademikiem. Proste konkluzje A=>B=>C to wynik pamięci skojarzeniowej, ale takie: Wszyscy akademicy to uczeni. Żaden mędrzec nie jest akademikiem. Co można powiedzieć o mędrcach i uczonych? Wszystkie A to U, Żaden M nie jest A; Związek U <=> M ? Co dzieje się z dynamiką neuronalną ? Czyste spekulacje … Basen U jest większy niż A, bo A jest podzbiorem U, więc musi odziedziczyć większość własności skojarzonych z U. Atraktor dla A musi być w środku U – jak to może wyglądać? Myślenie o A powoduje, że trudno jest pomyśleć o U. Uczeni Akademicy Mędrcy Baseny atraktorów dla 3 koncepcji basen dla mędrców nie jest w określonej relacji do pozostałych więc jest osobno. Interesujący temat …