Imej Otak Mendedahkan Bagaimana Strategi Pembelajaran Berfungsi

Satu kajian penyelidikan baru menyiasat bagaimana otak mengemas kini bank memori kita untuk meningkatkan harapan kita terhadap ganjaran masa depan.

Penyegaran itu diperlukan agar kita dapat membuat ramalan yang tepat mengenai ganjaran tersebut dalam menghadapi perubahan persekitaran.

Walaupun sebenarnya bagaimana otak mengatur proses ini tetap tidak jelas, kajian baru menunjukkan bahawa gabungan dua strategi pembelajaran yang berbeza memandu tingkah laku kita.

Makalah mengenai karya itu akan muncul di jurnal Neuron.

Satu strategi pembelajaran yang diterima, yang disebut pembelajaran bebas model, bergantung pada perbandingan percubaan-dan-kesalahan antara ganjaran yang kita harapkan dalam situasi tertentu dan ganjaran yang sebenarnya kita dapat.

Hasil perbandingan ini adalah penghasilan "ralat ramalan ganjaran", yang sesuai dengan perbezaan itu.

Sebagai contoh, kesilapan ramalan ganjaran mungkin sesuai dengan perbezaan antara unjuran pulangan monetari pelaburan kewangan dan pendapatan sebenar kami.

Dalam mekanisme kedua, yang disebut pembelajaran berdasarkan model, otak menghasilkan peta kognitif persekitaran yang menggambarkan hubungan antara situasi yang berbeza.

"Pembelajaran berdasarkan model dikaitkan dengan generasi 'ralat ramalan keadaan', yang mewakili tahap kejutan otak dalam situasi baru memandangkan anggaran persekitarannya sekarang," kata Jan Gläscher, seorang sarjana pasca doktoral di Caltech dan pemimpin pengarang kajian.

"Fikirkan situasi di mana anda selalu mengambil jalan yang sama ketika memandu pulang ke rumah selepas bekerja, tetapi pada hari tertentu cara biasa disekat kerana kerja pembinaan," kata Gläscher.

“Sistem pembelajaran bebas model akan hilang tanpa daya; ia hanya berkaitan dengan mengambil tindakan yang pada masa lalu bermanfaat, jadi jika tindakan tersebut tidak lagi tersedia, ia tidak akan dapat memutuskan ke mana seterusnya.

"Tetapi sistem berdasarkan model akan dapat menanyakan peta kognitifnya dan mengetahui jalan memutar yang efisien menggunakan rute alternatif."

"Walaupun mekanisme pembelajaran bebas model yang lebih sederhana telah dipelajari dengan baik dan mekanisme pembelajarannya yang asas - yang didorong oleh kesalahan ramalan ganjaran - cukup difahami, mekanisme yang mendasari sistem pembelajaran berasaskan model yang lebih canggih, dengan kemampuan menyesuaikan dan fleksibiliti yang kaya , kurang difahami ”kata John P. O'Doherty, profesor psikologi di Caltech.

Untuk lebih mencirikan asas-asas neurologi kedua sistem pembelajaran ini, Gläscher, O'Doherty, dan rakan-rakan mereka merancang tugas membuat keputusan berasaskan komputer yang membolehkan mereka mengukur kapan dan di mana otak mengira isyarat ralat dan ralat menyatakan keadaan, dan untuk menentukan sama ada kedua-dua jenis kesalahan itu benar-benar menghasilkan tanda tangan saraf yang berbeza.

Dalam tugas itu, mata pelajaran harus membuat pilihan antara gerakan kiri dan kanan yang memungkinkan mereka beralih antara "keadaan" yang berbeda —disebut oleh ikon grafik — dalam lingkungan maya; prosesnya serupa dengan proses menavigasi dalam permainan video yang ringkas.

Setiap pilihan kiri atau kanan yang dibuat dalam persekitaran maya ini membawa subjek ke keadaan baru. Objektif mereka adalah untuk mencapai keadaan tujuan tertentu untuk mendapatkan ganjaran wang, "dan peluang mereka untuk berakhir dalam keadaan tujuan itu sangat bergantung pada corak pilihan berurutan yang mereka buat," jelas O'Doherty.

Sistem berasaskan model dapat belajar tentang struktur persekitaran maya dan kemudian menggunakan maklumat ini untuk menghitung tindakan yang diperlukan untuk sampai ke keadaan ganjaran, dengan cara yang serupa dengan bagaimana pemain catur mungkin cuba memikirkan langkah catur berurutan yang diperlukan untuk memenangi pertandingan.

Sebaliknya, sistem bebas model, hanya akan belajar untuk memilih tindakan yang membabi buta pada masa lalu, tanpa menilai akibatnya dalam keadaan sekarang.

Lapan belas peserta diimbas menggunakan pengimejan resonans magnetik yang berfungsi semasa mereka mengetahui tugas tersebut. Imbasan otak menunjukkan tanda khas neural tanda ralat kesalahan yang diramalkan sebelumnya - yang dihasilkan semasa pembelajaran bebas model - di kawasan di tengah otak yang disebut ventral striatum.

Walau bagaimanapun, semasa pembelajaran berdasarkan model, tanda neural dari kesalahan ramalan keadaan muncul di dua kawasan yang berlainan di permukaan otak di korteks serebrum: sulcus intraparietal dan korteks prefrontal lateral.

Pemerhatian ini menunjukkan bahawa dua jenis isyarat ralat yang unik dikira di otak manusia, berlaku di kawasan otak yang berlainan, dan mungkin mewakili strategi pengiraan yang berasingan untuk memandu tingkah laku.

"Sistem bebas model beroperasi dengan sangat berkesan dalam situasi yang sangat automatik dan berulang-ulang. Contohnya, jika saya kerap mengambil jalan yang sama pulang dari tempat kerja," kata Gläscher, "sedangkan sistem berasaskan model, walaupun memerlukan otak yang jauh lebih besar- daya pemprosesan, dapat menyesuaikan diri secara fleksibel dengan situasi baru, seperti perlu mencari jalan baru setelah sekatan jalan raya. "

Kedua-dua mekanisme pembelajaran yang berbeza ini berfungsi sebagai pelengkap dalam mengawal tingkah laku manusia, kata Gläscher.

"Oleh kerana daya pemprosesan otak kita terhad, tidak masuk akal untuk menggunakan sistem berasaskan model yang lebih intensif untuk mengawal semua yang kita lakukan. Sebaliknya, lebih baik bergantung pada sistem bebas model untuk banyak tingkah laku kita sehari-hari dan menggunakan sistem berasaskan model hanya untuk situasi baru atau kompleks. Bidang penting untuk penyelidikan lebih lanjut adalah untuk mencoba memahami faktor-faktor yang mengatur bagaimana sistem ini berinteraksi bersama untuk mengawal tingkah laku, dan untuk menentukan bagaimana ini dilaksanakan di otak. "

Sumber: Institut Teknologi California

!-- GDPR -->