Aplikasi Suara Baru Boleh Membantu Mengawal Berat

Penyewa utama penurunan berat badan adalah mengira setiap kalori yang dimakan. Walaupun tugasnya terdengar mudah, mendokumentasikan semua kalori menjadi tugas yang sukar ketika makan di restoran, snek dalam perjalanan, atau bahkan ketika duduk untuk makan di rumah.

Teknik ini memerlukan ketekalan dan ketepatan, dan apabila gagal, biasanya kerana orang tidak mempunyai masa atau cara untuk mencari dan mencatat semua maklumat yang mereka perlukan.

Kini, para penyelidik dari Massachusetts Institute of Technology (MIT) telah membangunkan aplikasi yang membolehkan orang masuk ke dalam makanan dan minuman yang mereka makan menggunakan sistem kawalan ucapan.

Konsep ini muncul beberapa tahun yang lalu ketika sekumpulan pakar pemakanan dari Universiti Tufts mendekati para penyelidik MIT dengan idea aplikasi berbahasa lisan yang akan memudahkan pembalakan makanan.

Minggu ini, di Persidangan Antarabangsa mengenai Akustik, Ucapan, dan Pemprosesan Isyarat di Shanghai, para penyelidik MIT mempersembahkan prototaip berasaskan web mereka dari sistem pembalakan pemakanan yang dikendalikan oleh pertuturan.

Dengan itu, pengguna menerangkan secara lisan isi makanan, dan sistem menguraikan keterangan dan secara automatik mengambil data pemakanan yang berkaitan dari pangkalan data dalam talian yang dikendalikan oleh Jabatan Pertanian A.S. (USDA).

Data dipaparkan bersama gambar makanan yang sesuai dan menu tarik-turun yang membolehkan pengguna memperincikan keterangannya - memilih, misalnya, jumlah makanan yang tepat. Tetapi penambahbaikan itu juga dapat dibuat secara lisan.

Seorang pengguna yang memulakan dengan mengatakan, "Untuk sarapan pagi, saya mempunyai semangkuk oatmeal, pisang, dan segelas jus oren" kemudian dapat membuat perubahan, "Saya mempunyai setengah pisang," dan sistem akan mengemas kini data yang dipaparkannya mengenai pisang sambil membiarkan selebihnya tidak berubah.

"Apa yang dialami oleh [pakar pemakanan Tufts] ialah aplikasi yang ada di luar sana untuk menolong orang mencuba makanan cenderung sedikit membosankan, dan oleh itu orang tidak mengikuti mereka," kata James Glass, seorang penyelidik kanan .

"Jadi mereka mencari cara yang tepat dan mudah memasukkan maklumat."

Pengarang pertama dalam makalah baru itu ialah Mandy Korpusik, seorang pelajar siswazah MIT dalam bidang kejuruteraan elektrik dan sains komputer. Dia disertai oleh Glass, yang merupakan penasihat tesisnya; rakan siswazahnya Michael Price; dan oleh Calvin Huang, seorang penyelidik sarjana dalam kumpulan Glass.

Dalam makalah tersebut, para penyelidik melaporkan hasil eksperimen dengan sistem pengecaman pertuturan yang mereka kembangkan secara khusus untuk menangani terminologi yang berkaitan dengan makanan.

Namun, itu bukan fokus utama kerja mereka kerana demo dalam talian sistem pembalakan makanan mereka sebaliknya menggunakan aplikasi pengecaman pertuturan percuma Google.

Penyelidikan mereka tertumpu pada dua masalah lain. Salah satunya adalah mengenal pasti fungsi fungsi kata: Sistem perlu menyedari bahawa jika pengguna mencatat frasa "semangkuk oatmeal", maklumat pemakanan mengenai oatmeal adalah relevan, tetapi jika frasa itu adalah "cookie oatmeal," tidak.

Masalah lain adalah mendamaikan frasa pengguna dengan entri dalam pangkalan data USDA. Sebagai contoh, data USDA mengenai oatmeal dicatat di bawah tajuk "oat"; perkataan "oatmeal" tidak muncul di entri.

Untuk mengatasi masalah pertama, para penyelidik menggunakan pembelajaran mesin.

Melalui platform crowdsourcing Amazon Mechanical Turk, mereka merekrut pekerja yang hanya menggambarkan apa yang mereka makan semasa makan baru-baru ini. Mereka kemudian melabelkan kata-kata yang sesuai dalam keterangan itu sebagai nama makanan, kuantiti, nama jenama, atau pengubah nama makanan.

Dalam "mangkuk oatmeal", "mangkuk" adalah kuantitas dan "oatmeal" adalah makanan, tetapi dalam "cookie oatmeal", oatmeal adalah pengubah.

Setelah mereka mempunyai kira-kira 10,000 deskripsi makanan berlabel, para penyelidik menggunakan algoritma pembelajaran mesin untuk mencari corak dalam hubungan sintaksis antara kata-kata yang akan mengenal pasti peranan fungsinya.

Penyelidik kemudian menggunakan pangkalan data sumber terbuka yang disebut Freebase untuk menterjemahkan antara keterangan pengguna dan label dalam pangkalan data USDA. Pangkalan data itu sendiri, mempunyai entri di lebih daripada 8.000 item makanan biasa, yang kebanyakannya merangkumi sinonim.

Di mana kekurangan sinonim, mereka sekali lagi merekrut pekerja Turk Mekanikal untuk membekalkannya.

Versi sistem yang dibentangkan pada persidangan ini bertujuan untuk menunjukkan keberlangsungan pendekatannya terhadap pemprosesan bahasa semula jadi. Sistem melaporkan jumlah kalori tetapi belum menghitungnya secara automatik.

Walau bagaimanapun, versi yang ada masih dalam proses, dan apabila selesai, para penyelidik Tufts merancang untuk menjalankan kajian pengguna untuk menentukan sama ada ia menjadikan log pemakanan lebih mudah.

Sumber: MIT