Bolehkah Komputer Mengajar Sendiri Akal?

Pada masa lalu yang tidak terlalu jauh, menunjukkan bahawa komputer dapat menunjukkan "akal sehat" akan dianggap sebagai oksimoron. Tetapi superkomputer seperti IBM Watson mungkin menggambarkan peranan baru untuk komputer.

Pada masa ini, para penyelidik di Universiti Carnegie Mellon menjalankan program komputer 24/7 dalam usaha untuk menangkap data dan mengajar akal sehat secara besar-besaran.

Program ini dipanggil Never Ending Image Learner (NEIL) kerana perisian mencari di Web untuk mencari gambar, melakukan yang terbaik untuk memahaminya sendiri dan, kerana ia membina pangkalan data visual yang berkembang, mengumpulkan akal sehat secara besar-besaran.

NEIL memanfaatkan kemajuan terkini dalam penglihatan komputer yang membolehkan program komputer mengenal pasti dan melabel objek dalam gambar, untuk mencirikan pemandangan dan mengenali atribut, seperti warna, pencahayaan dan bahan, semuanya dengan pengawasan manusia minimum.

Sebaliknya, data yang dihasilkannya akan meningkatkan lagi kemampuan komputer untuk memahami dunia visual.

NEIL mempunyai kemajuan yang signifikan terhadap peranti robotik sebelumnya kerana dapat membuat perkaitan antara perkara-perkara untuk mendapatkan maklumat akal sehat. Maklumat yang diketahui orang hampir secara intuitif - bahawa kereta sering dijumpai di jalan raya, bahawa bangunan cenderung menegak dan itik kelihatan seperti angsa.

Berdasarkan rujukan teks, nampaknya warna yang berkaitan dengan biri-biri berwarna hitam, tetapi orang - dan sekarang NEIL - bagaimanapun tahu bahawa biri-biri biasanya berwarna putih.

"Imej adalah cara terbaik untuk mempelajari sifat visual," kata Abhinav Gupta, Ph.D., penolong profesor penyelidikan di Institut Robotik Carnegie Mellon.

"Gambar juga merangkumi banyak maklumat akal sehat tentang dunia. Orang belajar ini sendiri dan, dengan NEIL, kami berharap komputer juga dapat melakukannya. "

Sebuah kluster komputer telah menjalankan program NEIL sejak akhir bulan Julai dan telah menganalisis tiga juta gambar, mengenal pasti 1,500 jenis objek dalam setengah juta gambar dan 1,200 jenis pemandangan dalam ratusan ribu gambar.

Ia telah menghubungkan titik-titik untuk mempelajari 2,500 persatuan dari ribuan kejadian.

Salah satu motivasi untuk projek NEIL adalah untuk mewujudkan pangkalan pengetahuan berstruktur visual terbesar di dunia, di mana objek, pemandangan, tindakan, atribut dan hubungan kontekstual dilabel dan dikatalogkan.

"Apa yang telah kami pelajari dalam penyelidikan penglihatan komputer 5-10 tahun terakhir adalah bahawa semakin banyak data yang anda miliki, semakin baik penglihatan komputer," kata Gupta.

Beberapa projek, seperti ImageNet dan Visipedia, telah berusaha menyusun data berstruktur ini dengan bantuan manusia.

Tetapi skala Internet begitu luas - Facebook sahaja menyimpan lebih dari 200 bilion gambar - bahawa satu-satunya harapan untuk menganalisis semuanya adalah untuk mengajar komputer untuk melakukannya dengan sendirinya.

Orang juga memberitahu NEIL kategori objek, pemandangan, dll untuk mencari dan menganalisis. Tetapi kadang-kadang, apa yang ditemui NEIL dapat mengejutkan para penyelidik.

Misalnya, pencarian "apple" dapat mengembalikan gambar buah dan juga komputer riba. Tetapi Gupta dan pasukannya, pemilik tanah, tidak tahu bahawa pencarian untuk F-18 akan mengenal pasti bukan sahaja gambar jet pejuang, tetapi juga katamar kelas F18.

Semasa pencariannya diteruskan, NEIL mengembangkan subkategori objek - roda tiga boleh untuk anak-anak, untuk orang dewasa dan dapat bermotor, atau kereta datang dalam pelbagai jenama dan model.

Dan ia mula memperhatikan hubungan - bahawa zebra cenderung terdapat di savana, misalnya, dan lantai perdagangan saham biasanya sesak.

Sebelum NEIL dapat menjadi nama rumah tangga, skala perlu dikurangkan kerana NEIL sangat intensif, dengan program yang dijalankan pada dua kelompok komputer yang mencakup 200 inti pemprosesan.

Sumber: Universiti Carnegie Mellon

!-- GDPR -->