Suasana A.S. Diukur Melalui Twitter, 2006-2009

Sekumpulan penyelidik telah menerbitkan analisis kata sederhana sebanyak 300 juta tweet (anda tahu, yang pendek, 140 status maksimum watak dari individu) dari Twitter dan menemui sesuatu yang luar biasa - orang lebih gembira pada hujung minggu, dan sebelum dan selepas bekerja. Ya, itu betul - orang lebih gembira apabila mereka tidak bekerja!

Diperlukan tiga penyelidik dari Northeastern University dan dua dari Harvard Medical School untuk mencapai kesimpulan yang menakjubkan ini.

Sekarang, kerana para penyelidik tidak benar-benar melihat 300 juta tweet secara individu, suasana setiap tweet adalah disimpulkan menggunakan senarai perkataan ANEW - Norma Afektif untuk Perkataan Inggeris - sistem pemeringkatan perkataan yang memberikan penilaian emosi normatif untuk perkataan bahasa Inggeris. Jenis analisis ini adalah pengukuran tidak langsung dan kasar - mereka hanya dapat melihat trend yang sangat besar kerana tidak semestinya boleh dipercayai.

Klik untuk menonton video dan baca lebih lanjut.

Contohnya, analisis seperti itu tidak dapat mengambil kira perkara seperti sarkasme, dua-negatif, atau makna yang berlawanan dalam bahasa manusia (yang mungkin lazim berlaku dalam perkhidmatan rangkaian sosial tidak rasmi seperti Twitter). "Saya benci hari yang cerah ini 🙂" misalnya dapat dinilai negatif oleh para penyelidik, padahal sebenarnya itu adalah tweet positif. Oleh kerana para penyelidik tidak mengatakan, kami tidak mempunyai cara untuk mengetahui berapa banyak tweet jenis ini yang mungkin salah diklasifikasikan.

Batasan data yang lain (dan sangat menarik untuk diperhatikan bahawa kerana ini tidak diterbitkan dalam jurnal yang dikaji oleh rakan sebaya, para penyelidik tidak menyebutkan batasan data atau metodologi mereka) adalah bahawa ia juga mengganggu lokasi hanya dari pengguna yang telah membolehkan Twitter menyiarkan lokasi geografi mereka. Jadi adakah orang di A.S. barat daya lebih banyak tweet? Atau adakah mereka lebih terbuka untuk menghidupkan ciri ini di Twitter? Sepertinya penjelasan alternatif yang jelas.

Cukup untuk membuat video keren yang saya yakin akan membuat putaran di Internet (video yang juga menunjukkan bahawa kita nampaknya tidak begitu gembira semasa kita tidur). Grafik juga menunjukkan bahawa "suasana hati" Pantai Barat kira-kira 3 jam di belakang suasana Pantai Timur - korelasi yang luar biasa dengan perbezaan masa yang sebenarnya antara kedua pantai negara kita.

Maaf, tetapi apabila saya melihat data seperti ini yang menyatakan yang jelas, saya tidak dapat menahan geli dan tertanya-tanya mengapa lima penyelidik menghabiskan puluhan (ratusan?) Jam untuk menganalisis 300 juta tweet. Apakah mereka dengan jujur ​​menganggap mereka akan menemui sesuatu yang mengejutkan dalam "data" tersebut? Terdapat begitu banyak bidang kesihatan mental dan pekerjaan epidemiologi yang benar-benar memerlukan perhatian penyelidikan, sepertinya pembaziran beberapa penyelidik yang berfikiran maju dan pintar.

!-- GDPR -->