![]() |
Jak uczyć się skutecznie metoda PawłowaKategorie: Zainteresowania, Praca i kariera, Rozwój Liczba wpisów: 1, liczba wizyt: 2318 |
Nadesłane przez: kamilvanbeqnum
dnia 17-01-2021 16:24
Po dokonaniu przeglądu głównych zmiennych determinujących Pawłowowskie warunkowanie pobudzające,
możemy teraz zapytać, jakie podstawowe zasady psychologiczne (tj. mechanizmy)
wydaje się, że najdokładniej obejmują główne ustalenia, które właśnie omówiliśmy. Być
Oczywiście, w badaniu zastosowano wiele szczegółowych teorii uczenia się
Pawłowskiego uczenia się (np. Pearce i Bouton, 2001) i nie będziemy ich przeglądać
tutaj, ale raczej wskażemy na to, co uważamy za dwie raczej fundamentalne zasady, które w taki czy inny sposób są wspólne dla większości tych teoretycznych rozważań,
i określić ich zastosowanie do różnych faktów, o których teraz wiemy
krytyczne zmienne warunkujące rozwój nauki Pawłowa. Ponadto zbadamy
ograniczenia tych podstawowych zasad i przedstawiają, w stosownych przypadkach, alternatywę
ramy myślenia o wynikach.
22 Helen M. Nasser i Andrew R. Delamater
Jednoczesna aktywacja reprezentacji CS i US
Podstawowe założenie, że dwa zdarzenia będą się ze sobą kojarzyć w tym zakresie
te wydarzenia są przeżywane razem w czasie, odegrał ważną rolę w teoriach
Nauka Pawłowa. Na przykład Konorski (1948) zasugerował, że CS będzie się kojarzył
z USA w zakresie, w jakim ich przetwarzanie współwystępuje ze „wzrostem aktywacji” domeny
reprezentacja USA. Z drugiej strony Konorski spekulował również, że skojarzenia hamujące pojawią się, gdy bodziec współwystępuje z „spadkiem aktywacji”
Przedstawicielstwo w USA. Nieco nowszą wersją tego podejścia jest metoda Wagnera
czasami teoria procesu przeciwnego (SOP) Pawłowa (Wagner, 1981). Plik
Pomysł pomógł nam w zrozumieniu, dlaczego wiele z nich
krytyczne zmienne zidentyfikowane w poprzedniej sekcji są ważne dla Pavlovian
uczą się pojawiać.
Jeśli równoczesna aktywacja powoduje uczenie się, dlaczego miałby działać interwał CS – US
przybrać formę, którą najczęściej robi? Na przykład, dlaczego moglibyśmy spodziewać się hamującego lub pobudzającego uczenia się z wstecznymi interwałami US-CS, względnie słabym pobudzającym
nauka z jednoczesnymi parami, nieco coraz silniejsza nauka z
wzrasta w przedziale CS – US i stopniowo pogarsza naukę jako CS – US
interwał przekroczył optymalny poziom? Idea współbieżnej aktywacji w zasadzie
może wyjaśnić większość z tych podstawowych faktów. Należałoby przyjąć rozsądne założenie, że kiedy bodziec jest prezentowany, jego stopień przetworzenia rośnie z czasem
(np. Sutton i Barto, 1981a; Wagner, 1981). Przy takim założeniu bardzo krótkie CS – US
interwały mogą nie wspierać silnego uczenia się, ponieważ CS nie miał
możliwość pełnego przetworzenia do czasu przedstawienia USA. Wstecz US – CS
pary mogą skutkować uczeniem pobudzającym lub hamującym, w zależności od tego, czy
CS jest głównie koaktywny z USA lub czy jego aktywacja zbiega się bardziej z,
w ujęciu Konorskiego (1948) spadek aktywności w USA. Procedury kondycjonowania śladów
powinno skutkować gorszym uczeniem się w porównaniu z normalnymi procedurami warunkującymi opóźnienie, ponieważ poziomy aktywacji CS obecne w czasie prezentacji w USA tak
faworyzować procedurę opóźnienia. Ponadto liczba par CS-US powinna wynosić
ważne, ponieważ siła stowarzyszenia CS-US powinna stale rosnąć
wraz z rosnącą liczbą ich koaktywacji. Ponadto łatwo zrozumieć, dlaczego bodziec
Intensywność (CS lub US) również powinna być istotna (choć pewne dodatkowe założenia
należałoby wyjaśnić, dlaczego intensywność w USA wydaje się wpływać na szybkość i asymptotę,
podczas gdy intensywność CS wydaje się wpływać głównie na szybkość uczenia się).
Idea współbieżnego przetwarzania może nawet pomóc nam zrozumieć role przestrzenne
ciągłość i podobieństwo w zarządzaniu uczeniem się. Aby te zmienne były zrozumiałe
w takim ujęciu można by założyć, że przetwarzanie dwóch podobnych przestrzennie lub fizycznie bodźców w danej próbie warunkowania różni się od przetwarzania dla odmiennych bodźców. Na przykład Rescorla i Gillan (1980) zasugerowali, że elementy
bodźca, który jest współdzielony między dwoma podobnymi bodźcami, skutecznie staje się mniejszy
intensywny (z powodu habituacji), gdy dwa podobne bodźce są prezentowane po kolei. To
oznaczałoby to, że poszczególne cechy bodźców powinny być skuteczniej przetwarzane, a tym samym poznawane. Ten prosty mechanizm uwzględniałby powyższe wyniki podobieństwa, ale w innych okolicznościach prowadziłby również do
sprzeczne z intuicją przewidywanie, że czasami podobieństwo może utrudniać naukę. Rescorla
i Gillan (1980) oraz Grand i in. (2007) dostarczyli eksperymentalne testy na poparcie
Określenie warunków uczenia się Pawłowa 23
te podstawowe idee. Znaczenie tej analizy polega na tym, że podstawowym prymitywem dla
uczenie się nie wydaje się być podobieństwem per se. Raczej analiza jest zgodna z
zobaczyć dane współbieżne przetwarzanie
na uczenie się wpływa dwa bodźce, ale różne
należy wziąć pod uwagę czynniki (np. przyzwyczajenie), aby określić, w jaki sposób mogą
wpływają na przetwarzanie różnych cech bodźców, które mają być powiązane. Ostatecznie
odwołanie do zredukowania ważnej zmiennej, podobieństwa, do bardziej fundamentalnej zasady,
równoczesne przetwarzanie, można dalej docenić, biorąc pod uwagę, że wyjaśnienie
domena pojęcia równoczesnego przetwarzania jest dalej zwiększana, jeśli bodziec-wzmacniacz
Efekty istotności mogą być przynajmniej częściowo rozumiane jako szczególny przypadek
uczenie się przez podobieństwo.
Pomimo swojej atrakcyjności, proste pojęcie równoczesnego przetwarzania również nastręcza trudności
w uwzględnieniu wielu ważnych zmiennych. Po pierwsze, nie jest oczywiste, dlaczego w
procedury kondycjonowania z opóźnieniem (gdzie CS pozostaje włączony do dostawy w USA),
uczenie się powinno być kiedykolwiek ograniczone wraz z dalszym wydłużaniem odstępu CS – US (początek
do początku) poza optymalny poziom. Jeśli funkcja przetwarzania CS wzrośnie z
czas do osiągnięcia pewnego maksymalnego poziomu przetwarzania, CS będzie maksymalnie koaktywny z USA w dowolnym przedziale CS – US po optymalnym w normalnym
procedura opóźnienia. Po drugie, z tej perspektywy nie jest oczywiste, dlaczego jest inaczej
systemy odpowiedzi powinny pokazywać różne funkcje interwałów CS – US. Po trzecie, ten pomysł
nie w pełni ujmuje, dlaczego względna ciągłość czasowa (i stosunek C / T) powinna
być ważnym. Przypomnijmy, że dane z badania Kaplana (1984) ujawniły krótkie ZIT
powodują hamujące warunkowanie śladowe, podczas gdy długie ITI powodują warunkowanie pobudzające. Kaplan (1984) zauważył, że w przypadku krótkich ITI, Stany Zjednoczone z poprzedniego badania mogą
być przetwarzane w czasie prezentowania CS podczas następnej próby. Może to spowodować
w hamującym uczeniu się, ponieważ CS współwystępuje ze spadkiem aktywacji w USA.
Jednak bardziej ogólne spostrzeżenie, że stosunek C / T, przynajmniej u gołębi
autoshaping, odgrywa ważną rolę w szerokim zakresie czasu trwania CS i ITI
nie wypadłby oczywiście z tej perspektywy. Wreszcie wybór trzech bodźców
Efekty rozważane powyżej (przypadkowość, względna trafność wskazań, blokowanie) nie są dobre
rozumiane wyłącznie z myślą o jednoczesnym przetwarzaniu. Wszystkie te problemy wymagają
dodatkowe uwagi.
Błąd prognozy (niespodzianka w USA)
Wspomniane powyżej zjawiska selekcji bodźców przeformułowały sposób, w jaki
teoretycy uważają warunkowanie. Rescorla i Wagner (1972) sformalizowali pojęcie Kamina
że uczenie się będzie miało miejsce tylko w takim stopniu, w jakim Stany Zjednoczone są zaskakujące (tj
jakiś błąd w przewidywaniu; Rozdziały 3 i 15). Innymi słowy, przewidywana wola USA
nie będą wspierać nowej nauki, ponieważ jej przetwarzanie zostanie znacznie ograniczone (jeśli nie
całkowicie stłumione). Ten spostrzeżenie wraz z ideą, że prognozy USA zależą
na wszystkie bodźce obecne w danej próbie warunkowania (nie tylko docelowy CS w
pytanie; por. Bush i Mosteller, 1951; Mackintosh, 1975), zapewnia sposób zrozumienia trzech zjawisk selekcji bodźców opisanych powyżej, z jednym prostym mechanizmem wyjaśniającym. Na przykład w badaniach awaryjnych Rescorli eksperyment
kontekst (tj. komora kondycjonująca) może sam się kojarzyć z szokiem US podczas
24 Helen M. Nasser i Andrew R. Delamater
ITI. Kiedy zostanie zaprezentowane kolejne parowanie ton – wstrząs, wystąpi wstrząs
zostały już przewidziane przez kontekst, a zatem żadne uczenie się nie powinno mieć miejsca.
Efekty blokowania i względnej trafności cue można wyjaśnić w ten sam sposób: poprzez tworzenie
odniesienie do innych jednocześnie prezentowanych bodźców, które lepiej przewidują stan USA
niż docelowy CS. Ponadto model doprowadził do powstania wielu innych
testy, które zależały na różne sposoby od wywoływanych przez siebie zmian asocjacyjnych
pozytywne lub negatywne błędy prognoz. Krótko mówiąc, model odniósł taki sukces
po części dlatego, że pomogło teoretykowi zorganizować ogromną liczbę zjawisk
w jednej strukturze (Siegel i Allan, 1996).
Zwróć uwagę, że ten pomysł jest całkowicie zgodny z przetwarzaniem współbieżnym
pojęcie. Jak zauważył Jenkins (1984), można myśleć o modelu Rescorla – Wagner jako
czasowa teoria ciągłości. Uczenie się nadal zależy od równoczesnej aktywacji
Przedstawicielstwa CS i USA. Po prostu reprezentacja USA będzie tylko
aktywowany, a tym samym być w stanie wspierać nowe uczenie się asocjacyjne, gdy jego wystąpienie (lub brak) nie zostało w pełni przewidziane. Rzeczywiście, w SOP Wagnera
Teoretycznie założenie to zostało wyraźnie wyrażone przez twierdzenie, że przewidywane Stany Zjednoczone tak zrobią
być zagruntowany, a zatem mniej w pełni aktywowany w stanie, który wspierałby nowy
ekscytujące uczenie się. Jakkolwiek można sobie wyobrazić podstawowy mechanizm, idea błędu prognozowania znacznie zwiększa moc wyjaśniającą równoczesności
pojęcie przetwarzania.
Niemniej jednak pewne problemy pozostają. Nawet ta bardziej ozdobna idea nie może
łatwo wyjaśnić, dlaczego w przypadku zadań warunkujących opóźnienie uczenie się wydaje się zanikać w przypadku CS – US
interwały większe niż optymalne
jeden. Tutaj należałoby założyć, że z bardzo
długi czas trwania CS, następuje pewien stopień przyzwyczajenia bodźca, który może go ograniczyć
przetwarzanie (Wagner, 1981). Ponadto zależność odstępu CS – US od odpowiedzi
system pozostaje nierozwiązanym problemem. Znaczenie względnej ciągłości i
Stosunek C / T można potencjalnie wyjaśnić na podstawie różnic w warunkowaniu tła (Mackintosh, 1983). Jednak, jak argumentowali Balsam i Gallistel (2009)
(patrz także Gibbon i Balsam, 1981), nie jest oczywiste, że wszystkie ilościowe aspekty
Eksperymenty dotyczące stosunku C / T łatwo wypadną z tej perspektywy.
Dodatkowa komplikacja związana z pojęciem błędu prognozowania w USA wynika z a
zbiór badań Rescorla (2001). Krótko mówiąc, badania te wykazały, że bodźce
uwarunkowane w związku nie wykazują równoważnych zmian w sile asocjacji
na próbach warunkowania, w których istnieje pozytywna lub negatywna prognoza dla USA
błąd. Koncepcja błędu prognozowania opracowana w modelu Rescorla – Wagner
opierał się na idei, do której przyczyniają się wszystkie bodźce obecne podczas próby warunkowania
generowanie prognozy dla USA. Jednak badania Rescorla sugerują, że te
bodźce, które zyskują lub tracą siłę asocjacyjną podczas próby warunkowania, zależą od
części, na podstawie własnych indywidualnych błędów przewidywań. W szczególności zademonstrował Rescorla
te bodźce, które przewidują USA, zyskują mniejszą siłę asocjacyjną w próbie warunkowania
(w porównaniu z nieprzewidywalną wskazówką), w której przedstawiono nieoczekiwane USA, podczas gdy
bodźce, które przewidują nieobecność Stanów Zjednoczonych, tracą mniej siły asocjacyjnej, gdy plik
oczekiwane US jest pomijane. Rzeczywiście, Leung i Westbrook (2008) to wykazali
asocjacyjne zmiany spowodowane błędami przewidywania wymierania były regulowane przez oba
wspólne i indywidualne warunki błędu prognozowania (patrz także Le Pelley, 2004; Rescorla,
2000). Ważne będzie, aby pamiętać o tym rozróżnieniu w miarę rozwoju koncepcji
rozwinięty.
Określenie warunków uczenia się Pawłowa 25
Informacje czasowe
Zupełnie inne sformułowanie warunkowania Pawłowa wynika z klasy
podejścia znane jako teorie „porównawcze” (np. Gallistel i Gibbon, 2000; Gibbon
& Balsam, 1981; Stout & Miller, 2007). Zakłada się, że zgodnie z tymi podejściami
że pozorne niepowodzenia w nauce odzwierciedlają niepowodzenia w wynikach, a nie w nauce
se. W najnowszej wersji tego podejścia Balsam and Gallistel (2009; Balsam,
Drew i Gallistel, 2010; Gallistel & Balsam, 2014) podkreślają, że występujące zwierzęta
w eksperymentach warunkowania Pawłowa w rzeczywistości nie uczą się skojarzeń CS – US.
Zakłada się raczej, że zwierzę przechowuje zdarzenia, których doświadcza, w czasie
struktura pamięci, a decyzje dotyczące odpowiedzi lub nie zależą od tego, czy CS
przekazuje informacje czasowe powyżej informacji dostarczanych przez tło. A więc zwierzęta
mówi się, że przechowują w pamięci zdarzenia CS i US w czasie i obliczają
wskaźniki występowania w Stanach Zjednoczonych zarówno w obecności, jak i przy braku CS. Do
zakres, w jakim oszacowana przez USA stopa procentowa w ramach CS przekracza tę na tle,
CS przekazywałby znaczące informacje i odpowiadał w stosownym momencie
punktu w czasie.
Natomiast teorie takie jak model Rescorla – Wagner (Rescorla i Wagner, 1972) mają
najczęściej stosowano w tzw. sytuacjach „opartych na próbach” (ale zobacz Buhusi &
Schmajuk, 1999; Sutton i Barto, 1981b), takie modele nie zawsze miały do czynienia
zagadnienia związane z określoną czasową organizacją wyuczonych zachowań. Balsam
Podejście Gallistel (2009) odnosi się szczególnie do tego aspektu uczenia się. Jednak,
podczas gdy podejście to łatwo uwzględnia stwierdzenie, że przynajmniej w przypadku automatycznego tworzenia
stosunek C / T reguluje nabycie odpowiedzi, a podczas gdy niektóre aspekty
odpowiadanie w czasie jest zgodne z podejściem (np. Drew i in., 2005; ale patrz
Delamater & Holland, 2008), istnieje szereg ograniczeń
podejście. Po pierwsze, jak wspomniano powyżej, podczas gdy stosunek C / T może opisywać stopę
W przypadku niektórych preparatów czas trwania CS dokładniej opisuje różnice
w reagowaniu asymptotycznym. Po drugie, ogólność znaczenia stosunku C / T
w opisywaniu uczenia się nie zostało ustalone i istnieją sprzeczne dane (np.Davis
i wsp., 1989; Holland, 2000; Lattal, 1999). Po trzecie, ponieważ te komparatory
podejścia zakładają, że pozorne niepowodzenia w nauce (np. w blokowaniu, przypadkowości,
względna trafność wskazań) są tak naprawdę niepowodzeniami w działaniu, napotykają trudności
wyjaśnianie, dlaczego często wyraźne testy dotyczące uczenia się lub wyjaśnienia dotyczące wyników
faworyzują deficyty uczenia się w tych zadaniach (np. Delamater i in., 2014; ale patrz Cole,
Barnet i Miller, 1995; Miller, Barnet i Grahame, 1992; Urushihara i Miller,
2010). Ponadto te same problemy napotkane powyżej dotyczące reagowania
różnice systemowe będą miały również zastosowanie do tego podejścia.
Podsumowując dotychczas, zidentyfikowaliśmy wiele ważnych zmiennych, które inf
luence
przebieg pobudzającej nauki Pawłowa. W tej sekcji podjęliśmy próbę
wyjaśnić wiele z tych podstawowych ustaleń, odwołując się do ograniczonej liczby podstawowych
zasady psychologiczne. W szczególności idea, że asocjacyjne uczenie się rozwija się, kiedy
istnieje efektywne równoczesne przetwarzanie reprezentacji CS i US idzie
długa droga do zrozumienia wielu krytycznych faktów uwarunkowań.
Wydaje się, że ten prosty pomysł wymaga poprawki, aby umożliwić wystąpienie błędów przewidywań
krytyczne dla określenia, kiedy Stany Zjednoczone otrzymają dalsze przetwarzanie krytyczne dla asocjacji
formacja oraz wkład przewidywania „indywidualnego” i „wspólnego”
26 Helen M. Nasser i Andrew R. Delamater
warunki błędów będą musiały zostać odpowiednio rozwiązane. Jednak niektóre z zachowań
fakty mogą wymagać bardziej szczegółowego teoretycznego ujęcia procesów związanych z synchronizacją (zob
Delamater i in., 2014). Na razie przejdźmy do analizy niektórych podstawowych neuronów
mechanizmy okazały się kluczowe dla uczenia się Pawłowa. Nasze główne zadanie w tym wysoko
wybiórczy przegląd odpowiedniej literatury pozwoli określić, czy istnieje
rzeczywistość neuronowa do sugestii, oparta na czysto behawioralnym poziomie analizy, że
współbieżne przetwarzanie i koncepcje błędów prognozowania są w większości odpowiedzialne za uczenie się Pawłowa.
Neuronowe zasady warunkowania
Poczyniono znaczne postępy w zrozumieniu neuronalnych mechanizmów uczenia się
miejsce w ostatnich latach i kilka różnych podstawowych paradygmatów Pawłowa uczenia się
były intensywnie badane. Obejmują one naukę reakcji wycofania skrzeli ślimaka morskiego Aplysia, reakcji mrugnięcia okiem królika (lub mruczącej błony), a także
strach i warunkowanie apetytu u szczura. Celem tej sekcji jest zapewnienie
przegląd niektórych mechanizmów neuronalnych, które wspierają warunkowanie Pawłowa. W
w szczególności skupimy się na badaniach, które odnoszą się bezpośrednio do przetwarzania równoległego
a amerykańskie niespodziewane pomysły zidentyfikowane jako ważne dla tworzenia stowarzyszeń przez a
czysto analiza na poziomie zachowania. Oczywiście należy się spodziewać, że podstawowy plik neuronowy
obwody uczenia się w różnych paradygmatach będą różnić się szczegółami, ale znaczenie pracy behawioralnej polegało na pokazaniu, że podobne podstawowe zasady mogą być
zaangażowane dość wszechobecnie w całym układzie nerwowym.
Model hebrajski i przyleganie czasowe
Przedstawiliśmy dowody behawioralne, które sugerują, że równoczesna aktywacja
CS i US to podstawowa zasada uczenia się. Dowód neuronowy w
Poziom molekularny i komórkowy w dużym stopniu wspiera tę ideę współbieżnego przetwarzania.
Hipoteza Hebbian mówi, że „dowolne dwie komórki lub układy komórek, które są wielokrotnie aktywne w tym samym czasie, będą miały tendencję do„ łączenia się ”, więc aktywność w jednym
ułatwia aktywność innym ”(Hebb, 1949, s. 70). Ten model plastyczności neuronowej
bezpośrednio oddaje podstawową ideę z badań behawioralnych, którą jest równoczesna aktywacja
krytyczne dla uczenia się asocjacyjnego. Zapewnia nam również mechanizm neuronowy do zrozumienia wielu ważnych behawioralnych aspektów czasu
przyległość.
Specyficzne mechanizmy zaangażowane w tę ułatwioną komunikację synaptyczną są
złożone i zostały omówione w innym miejscu (np. Glanzman, 2010). Jednak w odniesieniu do warunkowania Pawłowa podstawową koncepcją jest to, że neurony czuciowe niezależnie przetwarzają informacje CS i US, aw niektórych przypadkach zbiegają się w
neuron odpowiedzi wyjściowej. Neuron czuciowy stymulowany przez sam CS nie jest
wystarczające do napędzania neuronu wyjściowego silnika, ale w trakcie warunkowania,
nabywa tę zdolność poprzez presynaptyczne (np.Castellucci & Kandel, 1974, 1976)
i mechanizmy postsynaptyczne (tj. Isaac, Nicoll i Malenka, 1995; Malenka i
Nicoll, 1999).
Określenie warunków uczenia się Pawłowa 27
Najsilniejszy jak dotąd dowód na tę hipotezę Hebby pochodzi z komórek
praca w Aplysia (przegląd: Kandel, 2001). Ta praca pokazuje, że jako plik
W wyniku warunkowania Pawłowa łączność synaptyczna między neuronami zostaje wzmocniona poprzez molekularną kaskadę sygnalizacyjną, co ostatecznie powoduje zmiany zdolności
neuronu czuciowego do kierowania neuronem ruchowym (aby uzyskać bardziej szczegółowy opis
ten proces, patrz Roberts i Glanzman, 2003). Ponadto badania warunkowania strachu u ssaków również potwierdzają wynikającą z niego plastyczność Hebbów
konwergencja aktywności CS – US w bocznym ciele migdałowatym (LA). Na przykład kilka
Badania elektrofizjologiczne wykazały, że warunkowanie strachowe występuje, gdy słaby wkład CS do
Komórki piramidalne LA zbiegły się z silną depolaryzacją tych komórek wywołaną przez USA
komórki (patrz Blair, Schafe, Bauer, Rodrigues i LeDoux, 2001; Ledoux, 2000; Paré,
2002; Sah, Westbrook i Lüthi, 2008). Trening ten wzmocnił efekt
Wywołane przez CS odpowiedzi neuronów LA in vivo (np. Paré & Collins, 2000; Quirk, Repa,
& LeDoux, 1995; Roga
n, Stäubli i LeDoux, 1997; Romanski, Clugnet, Bordi i
LeDoux, 1993; Rosenkranz i Grace, 2002). Co więcej, parowanie CS z direct
depolaryzacja neuronów piramidalnych LA (jako zastępcze USG) również wspiera warunkowanie strachowe (Johansen i in., 2010), a badania in vitro wykazały, że równoczesna stymulacja szlaków CS i US do LA powoduje wzmocnienie synapsy CS-to-LA.
skuteczność (logicznezagadki.pl). Morfologiczna
istnieją również dowody na podobne do hebrajskich zmiany w plastyczności synaps. Po wielokrotnym parowaniu CS z przerażającym USA, gęstość postsynaptyczna w neuronach LA była
obserwowany wzrost (Ostroff, Cain, Bedont, Monfils i Ledoux, 2010). Na poziomie molekularnym mechanizmy, za pomocą których pary CS – US indukują tę plastyczność synaps
LA może być wynikiem późniejszych wewnątrzkomórkowych kaskad związanych z tą plastycznością
(Maren i Quirk, 2004). Przegląd mechanizmów wewnątrzkomórkowych i molekularnych dla
plastyczność synaptyczna wykracza poza zakres tego artykułu, a czytelnik jest przywoływany
Kandel (2001), Orsini i Maren (2012) oraz Schafe, Nader, Blair i LeDoux
(2001) do takich dyskusji.
Jednym z możliwych mechanizmów plastyczności synaptycznej Hebbów jest długotrwałe wzmocnienie
(LTP). LTP jest indukowane przez połączenie słabej stymulacji presynaptycznej z silną depolaryzacją postsynaptyczną, co skutkuje ułatwieniem transmisji sygnału
(Sigurdsson, Doyère, Cain i LeDoux, 2007). W kontekście warunkowania Pawłowa uważa się, że presynaptyczna stymulacja aferentów czuciowych reprezentuje aktywność
spowodowane przez CS, podczas gdy depolaryzacja postsynaptyczna reprezentuje Stany Zjednoczone. Plik
wymóg synchronicznej stymulacji neuronowej sugeruje, że LTP może być opłacalny
mechanizm kondycjonowania. Lin i Glanzman (1997) wykazali wzrost
LTP ze wzrostem czasowej ciągłości między stymulacją przed- i postsynaptyczną
(patrz Rysunek 2.5). Należy jednak zauważyć, że dowody pochodzą z celi
kultury Aplysia i nie wiadomo, w jaki sposób neurofizjologicznie indukowano LTP
zmiany mogły zostać przypisane do wyników behawioralnych w tym badaniu. To jest szczególnie
istotne, ponieważ w tym badaniu jednoczesna stymulacja skutkowała optymalnym
ilość LTP, ze spadkami obserwowanymi, gdy zwięzłość zmniejszyła się w obu
kierunkach do przodu lub do tyłu. Na poziomie bardziej behawioralnym, jak omówiono powyżej, procedury symultaniczne i wsteczne zwykle nie są zbyt skuteczne we wspieraniu
warunkowa odpowiedź.
Interesujące jest to, że LTP jest wrażliwy na inne zmienne, które również okazały się krytyczne
uczą się pojawiać. W jednym badaniu Scharf i wsp. (2002) wykazali silniejsze LTP w
28 Helen M. Nasser i Andrew R. Delamater
wycinki hipokampu (i silniejsze warunkowanie behawioralne), gdy próby były rozmieszczone w odstępach
czas (5 min) w porównaniu z masą (20 s). Ponadto Bauer, LeDoux i
Nader (2001) zaobserwował, że LTP wywołane parą słabej stymulacji presynaptycznej
z silną depolaryzacją postsynaptyczną, sama została osłabiona, gdy wystąpiła ewentualność
został zdegradowany przez dodanie niesparowanych depolaryzacji postsynaptycznych. Widocznie,
niesparowane depolaryzacje postsynaptyczne skutecznie depotentowały synapsę
cofanie LTP. Chociaż jest mało prawdopodobne, aby ten efekt depotencjacji wyjaśnił wszystko
rodzaje awaryjnych skutków degradacji (np. Durlach, 1983), jest to jednak
intrygujące jest to, że efekty behawioralne na poziomie organizmu można czasami zaobserwować na
poziom indywidualnej synapsy.
Inne behawioralne cechy uczenia się nie dają się tak łatwo odwzorować na LTP w
indywidualna synapsa. Po pierwsze, LTP rozpada się dość szybko (np. Abraham, 2003), ale
uczenie się skojarzeniowe może trwać w nieskończoność. Po drugie, chociaż wykazano, że LTP tak
wrażliwy na rozstaw prób, jest mało prawdopodobne, że będzie on uwzględniał wszystkie ilościowe
aspekty wskaźnika C / T (Gallistel & Matzel, 2013). Po trzecie, chociaż znaczenie
rzędu impulsów stymulujących w LTP nie był szeroko badany (Lin i
Glanzman, 1997), kolejność prezentacji CS i US jest ogólnie przyjęta
ważne dla warunkowania na poziomie behawioralnym (np. Mackintosh, 1974, 1983).
Chociaż wsteczne parowanie US-CS może czasami skutkować warunkowaniem pobudzającym
(np. Chang, Blaisdell i Miller, 2003), bardziej powszechnym wynikiem jest warunkowanie hamujące (np. Moscovitch i LoLordo, 1968). Nie jest jasne, jak to się ma
LTP. Po czwarte, warunkowanie Pawłowa jest często wysoce specyficzne czasowo. W innych
słów, uwarunkowane reakcje często pojawiają się blisko czasu, w którym
USA mają nadejść (np. Drew i in., 2005). Jak może ten aspekt wyuczonego zachowania
zostanie przechwycony przez mechanizm LTP, dopiero się okaże. Jednak nie można oczekiwać
że wszystkie aspekty zachowania będą obserwowane na poziomie określonego mechanizmu
plastyczność obserwowana w pojedynczej synapsie. Uczenie się skojarzone prawdopodobnie pociąga za sobą zmiany
wśród całej populacji neuronów w większej sieci neuronowej. LTP jest,
być może jeden mechanizm, który opisuje c
zmiany w łączności między elementami
120
LTP jako funkcja ISI (Lin i Glanzman, 1997)
100
80
60
40
20
0
–5 –4 –3 –2 –1 012345
Interstimulus (y)
Średni EPSP
Rycina 2.5 Średnie EPSP jako funkcja interwałów między bodźcami. Przerysowano z Lin i
Glanzman (1997).
Określenie warunków uczenia się Pawłowa 29
w ramach tej większej sieci, ale z pewnością sieć jako całość musiałaby to zrobić
opisać wiele kluczowych cech charakteryzujących uczenie się na poziomie behawioralnym.
Ciekawym przykładem tego jest uwarunkowane wyczucie czasu reakcji w mgnieniu oka
obwód kondycjonujący (patrz rysunek 2.6). Wspomnieliśmy wcześniej, że warunkowanie mrugania oczu
jest bardzo wrażliwy na ISI i że CR typu „mrugnięcie okiem” jest bardzo dobrze zsynchronizowany (np.
Schneiderman i Gormezano, 1964). Obecnie wiadomo, że informacje CS i US to
przenoszone do móżdżku, odpowiednio, poprzez aktywację dwóch głównych aferentów - omszonego
włókna i włókna pnące - za które odpowiada wydatek móżdżku
ekspresja warunkowej odpowiedzi mrugnięcia oczami (Mauk, Steinmetz i Thompson,
1986; Steinmetz, Le Coq i Aymerich, 1989). Plastyczność występuje w dwóch punktach
Kora móżdżku
Purkinje
komórki
Granulka
komórki
Omszałe włókna
Pontine
jądra
Sensoryczny
jądra Jądra ruchowe
Czerwony
jądro
–Ve
–Ve
Gorsza oliwka
(Grzbietowy
akcesorium
Oliwa)
Trójdzielny
jądro
CS Eyeblink US
Włókna pnące
Równoległe włókna
Interpositus
jądro
Rysunek 2.6 Uproszczony schemat obwodów neuronowych stanowiących podstawę warunkowania mrugania oczu w programie
móżdżek. Informacje o CS (na pomarańczowo) i informacje o USA (na niebiesko)
zbiegają się w korze móżdżku w komórkach Purkinjego i jądrze międzyzębowym poprzez omszałe włókna
i włókna pnące. Informacje CS są najpierw przetwarzane przez jądra czuciowe, które rzutują do pliku
jądra mostu, podczas gdy informacje z USA są przetwarzane w jądrze trójdzielnym, do którego dochodzi
gorsza oliwka (tam, gdzie znajduje się grzbietowa oliwka dodatkowa). Ścieżka wyjściowa dla
odpowiedź warunkowa (na zielono) obejmuje projekcję jądra międzyzębowego do jądra czerwonego,
który wysyła na jądra motoryczne mrugnięcia. „–Ve” oznacza projekcje hamujące; the
pozostałe prognozy są ekscytujące.
30 Helen M. Nasser i Andrew R. Delamater
konwergencja - w obrębie kory móżdżku, a także w jądrze międzyzębowym (IPN).
Obecnie uważa się, że kora móżdżku moduluje aktywność w obrębie IPN w godz
odpowiedni czas, aby umożliwić wystąpienie CR w odpowiednim czasie (np. Krasne, 2002). W jaki sposób
dokonuje tego kora móżdżku, jest to kwestia spekulacji. Jeden pomysł to
że różne podzbiory komórek w obrębie ścieżki włókien omszonych (w szczególności z udziałem
interakcje między komórkami ziarnistymi i komórkami Golgiego) są aktywowane z różnymi opóźnieniami czasowymi
po wprowadzeniu CS (Buonomano i Mauk, 1994). Te komórki, które są najbardziej aktywne
w momencie dostawy do USA wykazywałoby największą plastyczność synaps i
rezultatem mogą być reakcje w odpowiednim czasie. Częściowo popierają te pomysły
wykazanie, że zmiany w korze móżdżku zakłócają warunkową odpowiedź mrugnięć
synchronizacja bez eliminowania uczenia się (Perrett, Ruiz i Mauk, 1993). Ogólnie rzecz biorąc, te
Rozważania sugerują, że populacje neuronów muszą współdziałać, aby to osiągnąć
przedstawię pełniejszą historię mechanizmu warunkowania.
Dowody przedstawione do tej pory sugerują, że LTP można uznać za opłacalne
mechanizm plastyczności synaptycznej i uczenia się. Jednak podczas gdy LTP jest wrażliwy na
niektóre kluczowe cechy warunkowania (ciągłość czasowa, odstępy między próbami, CS – US
przypadkowość), bardziej molowe aspekty zachowania będą prawdopodobnie wymagać interakcji z perspektywy sieci do ich analizy. Inny kluczowy aspekt uczenia się, który również wydaje się
wymaga perspektywy sieci jest to, że Stany Zjednoczone muszą być zaskakujące, aby nauka miała miejsce.
Omówione powyżej badania selekcji bodźców prowadzą do wniosku, że jest to czasowe
ciągłość nie jest wystarczająca, aby doszło do uczenia się. Tak więc robi to sam model hebrajski
nie do końca wyjaśnia, dlaczego warunkowanie zależy od błędu przewidywania.
Neuronowy dowód na znaczenie zaskoczenia w USA
Dowody rozważane powyżej sugerują, że chociaż może tak być
nie jest wystarczające, aby nastąpiło uwarunkowanie. Inną podstawową zasadą, którą omówiliśmy, jest to, że aby uczenie się miało miejsce w danej próbie warunkowania, to Stany Zjednoczone
musi być zaskakujące, lub innymi słowy, musi być błąd w jego przewidywaniu. Tam
jest bogactwem dowodów na poparcie tego pojęcia na poziomie systemów neuronowych lub neuronowych
analizy, a teraz przejdźmy do omówienia niektórych z tych dowodów.
Neurony dopaminowe śródmózgowia
Najbardziej rozpoznawalny neuronalny dowód na błędne kodowanie nagrody w plikach
mózg bierze pod uwagę fazową aktywację neuronów dopaminowych śródmózgowia (Matsumoto &
Hikosaka, 2009; Schultz, 2006, 2007, 2008; Schultz, Dayan i Montague, 1997).
Dowody korelacyjne z badań elektrofizjologicznych przeprowadzonych na naczelnych innych niż ludzie wskazują, że neurony dopaminowe śródmózgowia wykazują fazowy wzrost fi
pierścień jako
wynik nieoczekiwanych dostaw soku nagradza US i wykazuje fazowe hamowanie
aktywność neuronalna w wyniku nieoczekiwanego pominięcia nagrody US (Matsumoto &
Hikosaka, 2009; Schultz i wsp., 1997; patrz rozdział 3). Ponadto podczas kondycjonowania odpowiedź neuronów dopaminy zmienia się od dostarczania soku
nagroda za prezentację predykcyjnego CS, przy czym w pełni przewidywane USA tracą
zdolność do fazowej aktywacji tych neuronów. Te ustalenia potwierdzają zaskoczenie USA
zasada, że uczenie się występuje jako funkcja rozbieżności między tym, co rzeczywiste
Określenie warunków uczenia się Pawłowa 31
wynik i oczekiwany wynik (Rescorla i Wagner, 1972; Tobler, Dickinson,
& Schultz, 2003; Waelti, Dickinson i Schultz, 2001).
Chociaż powyższe dowody są w dużej mierze skorelowane, niedawna stymulacja optogenetyczna
badania wskazują na bardziej przyczynową rolę w kodowaniu błędów przewidywania przez dopaminę śródmózgowia
neurony. Steinberg i in. (2013) optogenetycznie stymulowane neurony dopaminowe w
brzuszny obszar nakrywki szczura podczas fazy kondycjonowania złożonego blokady
procedury i zaobserwowali, że taka stymulacja skutkowała zwiększoną kondycjonowaniem
odpowiadając na typowo blokowaną wskazówkę. Zatem wydaje się, że normalne tłumienie
aktywacja dopaminy w przypadku przewidywanego USG jest odpowiedzialna za zmniejszenie
uczenie się do dodanej wskazówki w eksperymencie blokującym. Specyficzne mechanizmy w działaniu
w tym efekcie są jednak niejasne, ale zasugerowano, że gamma-aminomasłowy
interneurony kwasowe (GABA) ergiczne mogą odgrywać kluczową rolę (Dobi, Margolis, Wang,
Harvey i Morales, 2010; Geisler & Zahm, 2005; Ji & Shepard, 2007; Matsumoto
& Hikosaka, 2007). W szczególności ostatnie dowody pokazują, że to hamujące działanie
z interneuronów GABAergicznych może przeciwdziałać pobudzającemu popędowi z nagrody
USA, kiedy oczekuje się nagrody (Cohen, Haesler, Vong, Lowell i Uchida, 2012).
Kondycjonowanie móżdżku do oczu
Najobszerniej zmapowany obwód neuronowy dla uczenia Pawłowa pochodzi z
badania uwarunkowań mrugania oczu u królików (przegląd, patrz: Christian & Thompson,
2003). W tym miejscu omówimy pokrótce główne ścieżki przetwarzania zaangażowane w kodowanie błędów przewidywania w tym obwodzie.
Gdy USG (wdech powietrza lub porażenie prądem) jest dostarczane do rogówki lub okołoczodołowej
okolicy oka, informacje sensoryczne są przenoszone do jądra trójdzielnego i przekazywane
zarówno bezpośrednio, jak i pośrednio do różnych jąder motorycznych, których wyjście steruje inaczej
mięśnie oczu, które działają synergistycznie, wywołując bezwarunkową reakcję na mrugnięcie
stymulacja rogówki (przegląd, patrz Christian i Thompson, 2003). Trójdzielny
jądro wysyła również eferentne projekcje do gorszej oliwki (IO), najbardziej krytycznej
region, w którym znajduje się grzbietowa oliwka pomocnicza (Brodal & Brodal, 1981). Włókna pnące
z tego regionu wysyłają informacje o USA do móżdżku (Brodal, Walberg,
& Hoddevik, 1975; Thompson & Steinmetz, 2009) i projektują w głąb
jądra móżdżku (z IPN) i komórki Purkinjego (PC) w korze móżdżku (patrz
Rysunek 2.6).
W kilku badaniach zmapowano przetwarzanie CS w szeregu modalności bodźców (słuchowych, wzrokowych, somatosensorycznych) i podczas gdy te bodźce projektują odpowiednio,
kory słuchowej, wzrokowej i somatosensorycznej, wszystkie te regiony zbiegają się w jądrach mostu (PN; Glickstein, May i Mercier, 1985; Schmahmann i Pandya, 1989,
1991, 1993). PN projektuje aksony z omszałych włókien, które niosą informacje związane z CS
(Lewis, LoTurco i Solomon, 1987; Steinmetz i in., 1987; Thompson, 2005) do
móżdżek kończy się zarówno w IPN, jak iw komórkach ziarnistych (GR) móżdżku
kora (Steinmetz i Sengelaub, 1992), która z kolei synchronizuje się na komputerach PC.
Tak więc istnieją dwa kluczowe miejsca konwergencji CS-US w móżdżku - komórki
IPN i komputery PC kory. Oprócz odbierania zbieżnych danych wejściowych CS i US za pośrednictwem
odpowiednio PN i 10 komórki IPN otrzymują sygnał hamujący GABA-ergiczny
PC kory móżdżku. Obecnie uważa się, że to hamująca projekcja
z kory móżdżku bierze udział w określaniu czasu warunkowej odpowiedzi
32 Helen M. Nasser i Andrew R. Delamater
(np. Mauk, Medina, Nores i Ohyama, 2000), mając na uwadze, czy uczenie się będzie
występuje zależy od IPN (Thompson, 2005). Uszkodzenia bocznego IPN i
jądra zębate przyśrodkowe były wystarczające, aby zapobiec nabyciu CR u naiwnych zwierząt
(Lincoln, McCormick i Thompson, 1982) i zniesiono CR u dobrze wytresowanych zwierząt (McCormick i Thompson, 1984). Ponadto tymczasowa dezaktywacja
IPN (poprzez agonistę GABAA muscimol lub lidokainę blokującą kanał sodowy) całkowicie zapobiegał uczeniu się CR u naiwnych zwierząt (Clark, Zhang i Lavond, 1992;
Krupa & Thompson, 1997; Krupa, Thompson i Thompson, 1993; Nordholm,
Thompson, Dersarkissian i Thompson, 1993). W przeciwieństwie do zmian w korze móżdżku
wykazano, że spowalnia uczenie się, ale nie zapobiega mu, a także prowadzi do słabego uczenia się
t
imed CRs (Thompson, 2005).
Krytycznie ważna ścieżka do zrozumienia natury błędu przewidywania
Efektem tego preparatu jest hamująca projekcja wyjściowa za pośrednictwem GABAergicznego
od IPN do OI. Kim, Krupa i Thompson (1998) zarejestrowali to komórki PC
otrzymał wkład z włókna wspinaczkowego z IO podczas kondycjonowania mrugnięcia oczami. Te komórki
zareagował bardziej na nieprzewidziane niż na przewidywane prezentacje w USA. Dodatkowo,
wprowadzenie do oliwki antagonisty GABA, pikrotoksyny, po przywróceniu kondycjonowania
normalna odpowiedź komórek PC na Stany Zjednoczone, mimo że została w pełni przewidziana. Większość
imponująco, autorzy ci stwierdzili, że pikrotoksyna podawana w IO podczas
złożona faza kondycjonowania eksperymentu blokującego wyeliminowała blokowanie
efekt. Tak więc ta GABAergiczna projekcja móżdżkowo-oliwkowa odgrywa kluczową rolę w
ograniczenie przetwarzania danych do w pełni przewidywanych Stanów Zjednoczonych i wydaje się zapewniać bezpośrednie
potwierdzenie pomysłu z modelu Rescorla – Wagner, że przetwarzanie w USA powinno
być zmniejszone, gdy jest w pełni przewidywane.
Amerykańskie błędy przewidywania w warunkowym strachu
Kolejny paradygmat uczenia się, którego mechanizmy neuronowe zostały dogłębnie zbadane
w ostatnich latach u szczurów występuje warunkowanie strachowe (patrz także rozdział 18, dla człowieka
walizka). Pomimo eksplozji zainteresowania neuronalnymi mechanizmami uczenia się strachu
w ciągu ostatniej dekady dokładnie, jak działają w tym mechanizmy błędu przewidywania
system dopiero zaczyna być rozumiany. Fanselow (1998) zasugerował, że dobrze
wytrenowane kortykosteroidy wywołuje reakcję przeciwbólową z udziałem opioidów, której konsekwencją jest
zmniejszyć wpływ szoku w USA, gdy wystąpi. Niedawno McNally,
Johansen i Blair (2011) zasugerowali, że to krytyczna witryna dla błędu przewidywania
Obliczenia to brzuszno-boczna szarość okołowodorowa (vlPAG).
PAG jest ważnym punktem zbieżności między przetwarzaniem awersyjnych
bodźce sensoryczne (np. elektryczny wstrząs stopy), a szczególnie wyjście systemu strachu
centralne jądro ciała migdałowatego (Carrive, 1993). Podczas gdy ciało migdałowate ma
większość uwagi poświęcono badaniom warunkującym strach, ponieważ jest to region
gdzie informacje CS i US są zbieżne i gdzie zachodzi plastyczność (np.
Romanski et al., 1993), ostatnie badania wykazały, że większa reaktywność
komórki do nieprzewidzianych niż przewidywano wstrząsów USA w LA zależy od takich
różnicowa aktywacja komórek w obrębie PAG (Johansen, Tarpley, LeDoux i Blair,
2010). Tak więc, chociaż powszechnie uznaje się, że plastyczność występuje w ciele migdałowatym
w warunkowaniu strachu (np. Johansen, Cain, Ostroff i LeDoux, 2011; Maren, 2005;
McNally i in., 2011; Orsini i Maren, 2012; Sah i in., 2008; Schafe i wsp., 2001;
Określenie warunków uczenia się Pawłowa 33
Sigurdsson i in., 2007), wydaje się, że obliczanie błędów prognoz zależy od
na innych strukturach (prawdopodobnie vlPAG), które przesyłają te informacje do
migdał.
Ogniskowa elektryczna stymulacja PAG służy jako skuteczne US podczas warunkowania strachu (Di Scala, Mana, Jacobs i Phillips, 1987). Ponadto poszczególne neurony PAG są bardziej wrażliwe na zaskakujące niż dobrze przewidywane USG. Ponadto opioid
receptory w vlPAG przyczyniają się do predykcyjnego uczenia się strachu poprzez regulację
skuteczność szoku w USA, ponieważ wykazano, że efekty odblokowania mogą
być wytwarzane przez podawanie antagonistów receptora opioidowego mu do vlPAG w trakcie
złożona faza warunkowania eksperymentu blokującego (np. Cole & McNally,
2007). Jednak specyficzne mechanizmy, dzięki którym receptory opioidowe vlPAG
określić różnice w skuteczności w USA pozostają nieznane, ponieważ PAG tego nie robi
projekt bezpośrednio do LA.
McNally i in. (2011) postulowali, że linia środkowa wzgórza i kora przedczołowa
(PFC) może odgrywać kluczową rolę w przekazywaniu sygnału błędu przewidywania do neuronów LA. Plik
Projekt PAG obejmuje obszernie do linii środkowej i międzywarstwowej wzgórza (Krout & Loewy,
2000), a wzgórze środkowe i PFC wykazują znacznie większą aktywność komórkową
(Furlong, Cole, Hamlin i McNally, 2010) oraz sygnały BOLD u ludzi (Dunsmoor,
Bandettini i Knight, 2008) w odpowiedzi na niespodziewany niż oczekiwany szok
NAS. Efekt ten jest szczególnie widoczny w pojedynczych neuronach wzgórza, które wystają do
grzbietowo-przyśrodkowa kora przedczołowa (Furlong i in., 2010). Tak więc, jeśli sygnały błędów były
obliczone w vlPAG, istnieją znane ścieżki przejścia takiego sygnału
na inne konstrukcje. Nie wiadomo jednak, w jaki sposób takie sygnały mogą przedostać się do ciała migdałowatego. Niemniej jednak, tak jak jest to prawdą w obwodzie kondycjonującym mruganie oczu, przewidywane USS tracą swoją skuteczność z powodu pewnego hamowania
proces informacji zwrotnej, który wydaje się ograniczać stopień, w jakim Stany Zjednoczone otrzymują dalsze korzyści
przetwarzanie niezbędne do uczenia się asocjacyjnego.
Wnioski
Do tej pory dokonaliśmy przeglądu badań ukazujących znaczenie niektórych głównych zmiennych w pobudzającym warunkowaniu Pawłowa. W szczególności takie osoby uczące się
ng jest pod wpływem
(1) liczba par CS-US, (2) intensywność i nowość bodźca, (3) bodziec
podobieństwo, (4) kolejność par CS-US, (5) przyleganie przestrzenne i czasowe, (6)
względna ciągłość czasowa, (7) kontyngent CS – US, (8) względna trafność wskazań oraz (9)
Zaskoczenie w USA. Ponadto zasugerowaliśmy, że wiele z tych zmiennych może być
ważne właśnie dlatego, że odzwierciedlają działanie dwóch podstawowych zasad
zasady psychologiczne. Pierwszym z nich jest równoczesna aktywacja. To pojęcie ma
od dawna jest uznawany za kluczowy dla uczenia się skojarzonego i stanowi jego sedno
niektóre z głównych teoretycznych podejść do uczenia się Pawłowa (np.Wagner, 1981).
Jednak w celu uwzględnienia różnych odnotowanych zjawisk selekcji bodźców
powyżej (przypadkowość, względna ważność cue, blokowanie) należy ten pomysł uzupełnić
zakładając, że przetwarzanie przekazane do Stanów Zjednoczonych jest częściowo określone przez stopień zaawansowania
co jest zaskakujące. W szczególności, jeśli zaskakujące Stany Zjednoczone są przetwarzane skuteczniej
niż oczekiwano w USA (Rescorla i Wagner, 1972), a następnie ilość równoczesnych
34 Helen M. Nasser i Andrew R. Delamater
na przetwarzanie przekazane CS i US podczas próby kondycjonowania będzie silnie wpływać
wiele zmiennych wymienionych powyżej.
Z pewnością istnieją bardziej zniuansowane kwestie, które będą wymagały pełniejszego rozwiązania.
Niektóre z nich obejmują określenie, jak najlepiej konceptualizować (1) znaczenie
procesy czasowe i porównawcze w nauce Pawłowa, (2) charakter reakcji
różnice systemowe, (3) efekty kolejności CS – US i (4) charakter znaczenia CS – US
efekty. Niemniej jednak ostatnie 50 lat badań behawioralnych przyniosło bogactwo
informacje dotyczące natury prostego warunkowania Pawłowa.
Ponadto, podczas gdy przedstawiliśmy bardzo pobieżny przegląd tego, co jest obecnie
mamy nadzieję, że znane z neurobiologii leżącej u podstaw uczenia się Pawłowa
przekonaliśmy czytelnika, że dwie główne zasady psychologiczne, które omówiliśmy, wydają się mieć wyraźne podstawy neurobiologiczne. W szczególności Hebbian
synapsa, od dawna uważana za krytyczną dla plastyczności synaps, wydaje się być powiązana z niektórymi
aspekty wyuczonego zachowania na poziomie bardziej trzonowym. Badacze wykazali, że LTP,
na przykład jest wrażliwy na odstępy między próbami, nieprzewidziane okoliczności i odstępy między bodźcami
manipulacje. Chociaż żądanie indywidualnych zmian wydaje się nierozsądne
synapsy powinny być pod każdym względem powiązane z bardziej trzonowymi aspektami zachowania, a
Wyzwaniem dla analiz neurobiologicznych pozostaje charakterystyka tych bardziej trzonowych
aspekty. Praca nad uwarunkowaniem mrugnięcia okiem jasno pokazuje, jak może wyglądać perspektywa sieci
ujawniają, jak ważne są molowe aspekty zachowania. Zmiany w USA
Wydaje się, że takie jest przetwarzanie, jak wyobrażono to na przykład w modelu Rescorla – Wagner
wyraźnie wskazane w obwodach warunkujących mrugnięcie i strach. Ponadto studia
układu dopaminowego śródmózgowia ujawniają wyraźne korelacje z tą koncepcją w zakresie apetytu
procedury uczenia się. W związku z tym wydaje się, że idea współbieżnego przetwarzania jest wymagana
zmiany synaptyczne, podczas gdy pojęcie zaskoczenia w USA ma bezpośrednie ucieleśnienie w neuronie
sieć charakteryzująca uczenie się.
Ta zbieżność dowodów między poziomem zachowania a poziomem neurobiologicznym
konta są z pewnością zachęcające i rzeczywiście ekscytujące. Niemniej jednak kilka kluczowych
kwestie, z których część wspomniano powyżej, nadal wymagają odpowiedniego zbadania. Jeden
z tych dodatkowych zagadnień dotyczy charakterystyki reguł rządzących warunkowaniem hamującym i pobudzającym. Kolejna kwestia dotyczy ustalenia, czy
krytyczne warunki wymagane do uczenia się zależą od natury uczącej się istoty
ocenione. Przejdźmy teraz do krótkiego rozważenia tych kwestii.
Warunkowanie pobudzające a hamujące
Większość omawianej tu literatury skupia się na pobudzającym warunkowaniu Pawłowa.
Nie zbadaliśmy w pełni literatury badającej krytyczne warunki wymagane
ustanowienie hamującego warunkowania Pawłowa. Na przykład zauważyliśmy powyżej
że procedury warunkowania wstecznego (US-CS) często powodują bodziec
uzyskanie hamującej kontroli behawioralnej. Istnieje jednak wiele innych procedur warunkujących, które również powodują hamujące uczenie się (w celu zapoznania się z przeglądami, zobacz LoLordo &
Fairless, 1985; Rescorla, 1969; Williams, Overmier i LoLordo, 1992). Szczególnie
Ciekawym pytaniem stawianym przez Rescorla (1968, 1969) jest to, czy rządzą reguły
warunkowanie pobudzające i hamujące może być symetrycznymi przeciwieństwami. Rzeczywiście, plik
Sugeruje to model Rescorla – Wagner (Rescorla i Wagner, 1972).
Podczas gdy nieoczekiwane prezentacje w USA (skutkujące dodatnimi błędami przewidywania) obsługują
Określenie warunków uczenia się Pawłowa 35
nowe ekscytujące uczenie się, nieoczekiwane pominięcia w USA (skutkujące negatywnymi przewidywaniami
błędy) powinny wspierać nowe hamujące uczenie się. Oto nasza lektura literatury
to podsumowanie opisu jest najlepszym curr
ent przyczyniają się do hamowania uczenia się (np.
Mackintosh, 1983). Jednak podczas gdy neurobiologia eksperymentalnego wyginięcia
zjawiska (co jest tylko jedną z metod badania negatywnych błędów przewidywania w
zmiana behawioralna) została dobrze rozwinięta (np.Delamater & Westbrook, 2014;
Maren & Quirk, 2004; Quirk i Mueller, 2008), inne metody generowania hamującego uczenia Pawłowa nie zostały dogłębnie zbadane, chociaż zainteresowanie się obecnie rozwija (Christianson i in., 2012; Davis, Falls i Gewirtz, 2000; Herry
i in., 2010; Schiller, Levy, Niv, LeDoux i Phelps, 2008; Watkins i wsp., 1998). My
spodziewaj się, że w miarę rozwoju zainteresowania tym tematem nastąpi wiele ekscytujących odkryć.
Warunki a treść nauczania
Podczas gdy ten rozdział w dużej mierze dotyczy kwestii identyfikacji krytycznych
warunki do nauki Pawłowa, kolejna kluczowa kwestia (jak zauważono w
część wprowadzająca) dotyczy podstawowych treści nauczania. Innymi słowy, idąc za Konorskim (1967; także Dickinson i Dearing, 1979), zakładamy, że kiedy CS
a USA zostaną stowarzyszone, CS prawdopodobnie wejdzie w oddzielne stowarzyszenia z
różne właściwości Stanów Zjednoczonych (np. sensoryczne, motywacyjne, czasowe, reakcje itp.).
Chociaż ten problem był tradycyjnie rozwiązywany oddzielnie od zidentyfikowania
krytyczne warunki do nauki, bardzo dobrze może się okazać, że poznawanie innych
Funkcje w USA są zgodne z różnymi typami reguł uczenia się lub że istnieją interesujące interakcje między różnymi „modułami edukacyjnymi”, które należy wziąć pod uwagę (patrz
także Bindra, 1974, 1978; Bolles i Fanselow, 1980; Konorski, 1967; Rescorla i
Salomon, 1967). Te możliwości nie zostały dokładnie zbadane, ale istnieją
to jakaś istotna praca.
Delamater (1995) wykazał, że awaryjne skutki degradacji CS-US są
Specyficzne dla USA w apetycznym zadaniu Pawłowa (patrz także Ostlund i Balleine, 2008;
Rescorla, 2000), wynik, który został zinterpretowany w kategoriach blokowania specyficznego dla USA przez
kontekst. Jednak Betts, Brandon i Wagner (1996; patrz także Rescorla, 1999)
stwierdzili specyficzne dla Stanów Zjednoczonych blokowanie odpowiedzi konsumujących (mrugnięcie okiem) u królików, ale
Amerykańskie ogólne blokowanie odpowiedzi przygotowawczych (wzmożony przestrach) u tych samych zwierząt. Podsumowując, wyniki te sugerują, że wywołują one „błędy prognozowania dla USA”
uczenie się można obliczyć, porównując oczekiwane z uzyskanych US pod względem
ich specyficzne sensoryczne lub ogólne cechy motywacyjne / wartości, a także tego, jakiego typu
błąd przewidywania rządzi uczeniem się zależy od systemu reakcji. Bardziej ogólne
Wniosek jest taki, że wydaje się, że ma do niej zastosowanie podstawowa zasada, do której rządzi uczenie się amerykańskie zaskoczenie
różnorodne formy uczenia się różniące się zawartością asocjacyjną. Niemniej jednak,
Czasami można również zaobserwować, że mechanizmy uczenia się oparte na bliskości występują w
równolegle z mechanizmami uczenia się opartymi na błędach przewidywania u tego samego gatunku w
w różnych okolicznościach (np. Funayama, Couvillon i Bitterman, 1995; Ostlund &
Balleine, 2008).
Ostatnią kwestią jest to, czy pojawiają się różne „moduły” uczenia się
brać udział w poznawaniu różnych cech Stanów Zjednoczonych, które same mogą ze sobą współdziałać
z każdym innym. Konorski (1967) zasugerował tak zwane warunkowanie „popędowe”
następowało szybciej niż warunkowanie konsumpcyjne, ale to pierwsze ułatwiało
36 Helen M. Nasser i Andrew R. Delamater
ten ostatni. W literaturze są pewne dowody, choć zaskakująco mało, na to
sugerują, że tego rodzaju interakcje mają miejsce (patrz Gewirtz, Brandon i Wagner,
1998). Będzie to oczywiście obszar wymagający dalszego rozwoju zarówno w
behawioralne i neurobiologiczne poziomy analizy.