BAGAIMANA KAMI MENGETAHUI TWEET YANG BOLEH DIPERCAYAI

Bagaimana Kami Mengetahui Tweet Yang Boleh Dipercayai

Penyelidik di Institut Teknologi Georgia telah mengembangkan model bahasa baru yang menunjukkan perkataan dan frasa mana yang mempengaruhi positif atau negatif kredibiliti peristiwa dunia yang dilaporkan di Twitter.

Kajian itu, yang mengimbas 66 juta tweet mengenai hampir 1.400 peristiwa di dunia nyata, menunjukkan bahawa kata-kata berjuta-juta orang di media sosial mungkin menawarkan banyak maklumat mengenai kredibiliti acara, walaupun ketika acara masih berlangsung.

"Terdapat banyak kajian mengenai kredibiliti media sosial dalam beberapa tahun kebelakangan ini, tetapi sangat sedikit yang diketahui mengenai jenis kata atau frasa apa yang menimbulkan persepsi kredibiliti semasa acara berlangsung dengan cepat," kata Tanushree Mitra, Georgia Tech Ph.D. calon yang mengetuai penyelidikan.

Pasukan ini mengkaji tweet mengenai peristiwa dunia pada tahun 2014 dan 2015, termasuk kemunculan Ebola di Afrika Barat, serangan Charlie Hebdo di Paris dan kematian Eric Garner di New York City.

Para penyelidik meminta orang menilai penilaian mengenai kredibiliti mereka (dari "pasti tepat" hingga "pasti tidak tepat"). Kemudian pasukan memasukkan kata-kata itu ke dalam model yang membahagikannya kepada 15 kategori linguistik yang berbeza. Klasifikasi termasuk emosi positif dan negatif, lindung nilai dan penggalak, dan kegelisahan.

Komputer Georgia Tech kemudian memeriksa kata-kata untuk menilai sama ada tweet itu boleh dipercayai atau tidak. Ini sesuai dengan pendapat manusia sekitar 68 persen pada waktu itu, peratusannya jauh lebih tinggi daripada garis dasar acak 25 persen.

"Tweet dengan kata penguat, seperti 'tidak dapat dinafikan', dan istilah emosi positif, seperti 'bersemangat' dan 'hebat,' dipandang sebagai sangat dipercayai," kata Mitra. "Kata-kata yang menunjukkan sentimen positif tetapi mengejek tidak praktikalnya peristiwa itu, seperti 'ha,' 'menyeringai' atau 'bergurau,' dilihat kurang dipercayai. Begitu juga kata-kata lindung nilai, termasuk 'tahap tertentu' dan 'suspek.' "

Jumlah retweet yang lebih tinggi dikaitkan dengan skor kredibiliti yang lebih rendah.Balasan dan retweet dengan panjang mesej yang lebih panjang dipercayai lebih dipercayai.

"Mungkin panjang mesej yang lebih panjang memberikan lebih banyak maklumat atau penaakulan, sehingga mereka dilihat lebih dapat dipercaya," katanya. "Sebaliknya, jumlah retweet yang lebih tinggi, yang dinilai lebih rendah pada kredibiliti, mungkin mewakili usaha untuk mendapatkan penalaran kolektif pada masa krisis atau ketidakpastian."

Walaupun modelnya belum dapat digunakan, para penyelidik mengatakan mereka akhirnya dapat mengembangkan aplikasi yang dapat menghitung kepercayaan yang dapat dipercayai dari suatu peristiwa ketika ia terungkap di media sosial.

"Apabila digabungkan dengan isyarat lain, seperti topik acara atau maklumat struktur, hasil linguistik kami boleh menjadi blok penting sistem automatik," kata Dr Eric Gilbert, penasihat Mitra dan penolong profesor di Georgia Tech's School of Interactive Computing.

"Twitter adalah sebahagian daripada masalah menyebarkan berita tidak benar dalam talian. Tetapi ia juga boleh menjadi sebahagian daripada penyelesaiannya. "

Sumber: Institut Teknologi Georgia