Mencari Kelemahan dalam Penyelidikan Media Sosial

Para penyelidik perlu berhati-hati dengan masalah serius dalam bekerja dengan kumpulan data media sosial yang besar, menurut saintis komputer di McGill University di Montreal dan Carnegie Mellon University di Pittsburgh.

Hasil yang cacat dapat memberi implikasi besar: Ribuan makalah penyelidikan setiap tahun sekarang berdasarkan data yang dikumpulkan dari media sosial.

"Sebilangan besar makalah ini digunakan untuk memberi maklumat dan membenarkan keputusan dan pelaburan di kalangan masyarakat dan industri dan kerajaan," kata Dr Derek Ruths, penolong profesor di McGill's School of Computer Science.

Bagi saintis tingkah laku, pertumbuhan media sosial nampaknya merupakan peluang yang belum pernah terjadi sebelumnya untuk menangkap, dan kemudian menganalisis, sejumlah besar maklumat mengenai tingkah laku manusia.

Ramai saintis percaya bahawa set data yang matang seperti itu dapat membantu meramalkan tingkah laku manusia pada tahap yang belum pernah dibayangkan. Dalam beberapa tahun kebelakangan ini, kajian telah membuktikan kemampuan untuk meramalkan segala-galanya dari blockbusters musim panas hingga turun naik di pasaran saham.

Tetapi dalam artikel yang diterbitkan dalam jurnal Sains, Ruths dan Dr. Jürgen Pfeffer dari Institut Penyelidikan Perisian Carnegie Mellon menyoroti beberapa masalah yang terlibat dalam penggunaan set data media sosial, bersama dengan strategi untuk mengatasinya. Antara cabarannya:

  • Platform media sosial yang berbeza menarik pengguna yang berbeza - Pinterest, misalnya, dikuasai oleh wanita berusia 25-34 tahun - namun penyelidik jarang memperbetulkan gambaran yang boleh diputarbelitkan oleh populasi ini;
  • Suapan data yang tersedia secara terbuka yang digunakan dalam penyelidikan media sosial tidak selalu memberikan gambaran yang tepat mengenai keseluruhan data platform - dan para penyelidik secara amnya dalam masa gelap tentang kapan dan bagaimana penyedia media sosial menyaring aliran data mereka;
  • Reka bentuk platform media sosial dapat menentukan bagaimana tingkah laku pengguna dan, oleh itu, tingkah laku apa yang dapat diukur. Sebagai contoh, di Facebook ketiadaan butang "tidak suka" menjadikan tindak balas negatif terhadap kandungan lebih sukar dikesan daripada "suka" yang positif.
  • Sebilangan besar spammer dan bot, yang menyamar sebagai pengguna biasa di media sosial, tersilap dimasukkan ke dalam banyak pengukuran dan ramalan tingkah laku manusia;
  • Penyelidik sering melaporkan hasil untuk kumpulan pengguna, topik, dan peristiwa yang mudah diklasifikasikan, menjadikan kaedah baru kelihatan lebih tepat daripada yang sebenarnya. Sebagai contoh, usaha untuk menyimpulkan orientasi politik pengguna Twitter mencapai ketepatan hampir 65 persen untuk pengguna biasa - walaupun kajian (yang berfokus pada pengguna yang aktif secara politik) telah menuntut ketepatan 90 persen. Pengguna Twitter mencapai ketepatan hampir 65 peratus untuk pengguna biasa - walaupun kajian (memberi tumpuan kepada pengguna yang aktif secara politik) telah menuntut ketepatan 90 peratus.

Penyiasat mengatakan banyak masalah juga sering berlaku untuk bidang lain seperti epidemiologi, statistik, dan pembelajaran mesin.

"Benang umum dalam semua masalah ini adalah perlunya para penyelidik untuk lebih peka mengetahui apa yang sebenarnya mereka analisis ketika bekerja dengan data media sosial," kata Ruths.

Para saintis sosial telah mengasah teknik dan standard mereka untuk menghadapi cabaran seperti ini sebelumnya.

"Judul Dewey Mengalahkan Truman yang terkenal pada tahun 1948 berpunca dari tinjauan telefon yang kurang memberi contoh kepada penyokong Truman dalam populasi umum," catatan Ruths.

"Daripada menjatuhkan amalan pengundian secara kekal, kesalahan yang mencolok menyebabkan teknik hari ini lebih canggih, standard yang lebih tinggi, dan tinjauan pendapat yang lebih tepat. Sekarang, kita berada pada titik perubahan teknologi yang serupa. Dengan menangani masalah yang kita hadapi, kita akan dapat merealisasikan potensi besar untuk kebaikan yang dijanjikan oleh penyelidikan berdasarkan media sosial. "

Sumber: Universiti McGill

!-- GDPR -->