Data Besar: Bolehkah Kita Meramalkan Trend Penduduk (Seperti Kebahagiaan) melalui Aplikasi Kesihatan?

Lebih dari lima tahun yang lalu, saya menulis sebuah karya berjudul Kebolehpercayaan dan Kesahan dalam Dunia Web 2.0. Ia membicarakan masalah pengumpulan data dari sampel berat sebelah - tanpa memahami terlebih dahulu dengan cara apa, tepatnya, sampel tersebut mungkin berat sebelah.

Sekarang, dengan adanya aplikasi di mana-mana - program yang boleh dimuat turun untuk telefon pintar orang - saya melihat masalah yang sama timbul. Pemaju dan pengusaha mencari data dari aplikasi ini tanpa memahami asas pengumpulan data saintifik yang baik, boleh dipercayai. Dan mengapa itu penting - terutamanya apabila anda mula ingin menganalisis semua "data besar" ini (istilah yang agak konyol ... dalam epidemiologi, misalnya, para saintis menyebutnya "data").

Bolehkah data kesihatan peribadi dikumpulkan oleh aplikasi ini tanpa berat sebelah, dan entah bagaimana dapat diubah menjadi ukuran sesuatu yang lebih besar?

Jawapan ringkas: tidak, tidak mudah.

Tentu, ada orang yang merupakan bagian dari gerakan "diri yang dikuantifikasi" - yang ingin melacak dan mengukur setiap aspek kesihatan diri mereka (dan diasumsikan, kesihatan mental). Tetapi orang-orang pada masa ini adalah 1 orang luar, dan sama sekali tidak mewakili penduduk secara umum.

Golongan minoriti semacam itu dapat dengan cepat membentuk sebagian besar upaya untuk mengumpulkan set data yang lebih besar untuk menganalisis trend kesihatan atau kesejahteraan. Walaupun analisis yang dihasilkan dapat memberitahu anda sesuatu tentang kumpulan orang ini, tidak wajar untuk menyarankannya membuat generalisasi kepada seluruh populasi (yang, secara demografi dan tingkah laku, mungkin melihat dan bertindak sangat berbeza).

Ini tidak akan berubah dalam masa terdekat, kerana kebanyakan aplikasi kesihatan dimuat turun oleh orang, digunakan sekali atau dua kali, dan kemudian ditinggalkan. Ada sebab kebanyakan orang berhenti menggunakan aplikasi kesihatan - terutama yang dimaksudkan untuk bertindak sebagai buku harian data. Mereka membosankan! Mengumpulkan data mengenai diri anda adalah tugas yang sangat membosankan bagi kebanyakan kita untuk berkomitmen untuk melakukan secara aktif setiap hari (atau bahkan setiap minggu).

Jawapan yang rumit: Aplikasi Perlu Lebih Pintar, Bersambung

Aplikasi kesihatan yang dimaksudkan untuk mengumpulkan data akhirnya gagal kerana memerlukan input aktif oleh pengguna. Inilah sebabnya mengapa rekod kesihatan peribadi tidak pernah dilupuskan dengan cara yang bermakna.2 Orang terlalu sibuk menjalani kehidupan mereka sehingga tidak terganggu untuk memberitahu aplikasi3 apakah metrik harian mereka.

Agar aplikasi kesihatan akhirnya berjaya di mana kebanyakan percubaan lain dalam perisian pengesanan kesihatan peribadi gagal adalah mereka mengumpulkan data mereka secara pasif. Ini bermaksud bahawa tidak diperlukan input dari pengguna.

Sudah tentu, kita jauh dari metrik seperti memberikan data yang bermakna.Pasti, ada peranti yang berjalan yang mengesan berapa banyak yang anda jalankan (tentu saja dari Nike). Tetapi aplikasi yang sedang berjalan tidak berguna jika tidak bercakap dengan aplikasi diet saya, atau aplikasi pemakanan saya, atau aplikasi senaman saya. Atau aplikasi kesedaran saya. Ini adalah satu aplikasi yang mengukur satu metrik di kompleks itu ialah saya. Tidak banyak yang perlu dilakukan.

Kepercayaan adalah Tunjang Utama

Penerapan aplikasi rangkaian seperti itu yang berkongsi semua data kesihatan anda mempunyai halangan lain yang kurang teknikal. Syarikat seperti Facebook dan Nike akhirnya menjawab hanya satu kumpulan orang - pemegang saham mereka. Ini bermakna bahawa jika mereka menganalisis data anda untuk mengetahui perkara yang dapat mereka hasilkan, mereka akan melakukannya.

Permulaan tidak lebih baik, kerana bukannya pemegang saham, mereka hanya menjawab kepada kapitalis teroka - pemberi pinjaman wang yang hanya mencari pulangan pelaburan terbaik dan cepat.

Mengapa saya ingin mempercayai maklumat kesihatan saya - data yang dapat digunakan terhadap saya untuk penolakan insurans di masa depan atau penetapan kadar insurans saya - kepada syarikat yang tidak berminat melindungi privasi saya?

Yang membawa kita kembali ke titik pertama - contoh yang berat sebelah. Orang yang dengan senang hati memberikan semua maklumat kesihatan mereka kepada syarikat untung untuk menganalisis, mengumpulkan, dan akhirnya mengaitkannya dengan anda (walaupun data tersebut pada mulanya tidak dikenali) tidak seperti kebanyakan orang. Sebilangan besar daripada kita masih menjaga maklumat kesihatan kita kepada diri kita sendiri, seperti kebanyakan kita masih mahu menyimpan maklumat kewangan kita kepada diri kita sendiri.

Ke Mana Kita Pergi Dari sini

Mencuba mengumpulkan data berdasarkan populasi (mis., Melakukan penyelidikan epidemiologi) dari aplikasi kesihatan mempunyai beberapa masalah dan peluang yang telah saya kenal pasti:

  • Pensampelan berat sebelah kerana sebilangan kecil orang yang menggunakan aplikasi kesihatan secara aktif dan berterusan
  • Persampelan dan penggunaan berterusan dapat diperbaiki dengan pasif lawan aktif pengumpulan data
  • Persampelan dan penggunaan dapat ditingkatkan lebih jauh dengan menggunakan pihak berkuasa yang dapat dipercaya untuk mengumpulkan dan menyimpan data (bukan syarikat atau syarikat permulaan yang untung)
  • Aplikasi yang saling memahami dan bertukar data kesihatan yang berkaitan dengan saya adalah generasi akan datang - bukannya banyak aplikasi semasa yang diam, tidak sedar (bodoh?)

Saya rasa sangat baik apabila pembangun melihat masalah kesihatan, mengembangkan aplikasi untuknya, dan membebaskannya ke seluruh dunia. Tetapi terlalu kerap aplikasi ini tidak ke mana-mana, tanpa khalayak. Atau mereka yatim oleh pemaju asal kerana kurang berminat. Beberapa aplikasi kesihatan popular yang mendapat khalayak yang hebat adalah pengecualian, bukan peraturan. Dan walaupun mereka mendapat penerimaan yang meluas, sama seperti sistem rekod perubatan elektronik negara kita, mereka tidak bercakap antara satu sama lain.

Sekiranya anda ingin dapat mengatakan sesuatu yang berwibawa atau bermakna mengenai data yang dikumpulkan dari aplikasi, anda harus menunjukkan bahawa data tersebut berasal dari sampel populasi yang mewakili. Kekurangannya, data anda hanya memberitahu kami tentang satu kumpulan kecil dalam populasi - satu kumpulan yang tidak seperti kebanyakan kami.

Nota kaki:

  1. Dan akan untuk masa yang akan datang [↩]
  2. Dan mengapa Google akhirnya akan menutup rekod kesihatan peribadinya esok. [↩]
  3. Atau lebih teruk - dan lebih biasa - a keseluruhan aplikasi yang tidak menyedari yang lain dan tidak dapat bertukar data antara satu sama lain [↩]

!-- GDPR -->