Menguji AI dalam Praktik

Pertanyaan tentang apakah kecerdasan buatan dapat benar-benar menggantikan atau meningkatkan keahlian manusia dalam penelitian medis telah bergeser dari debat teoritis ke penyelidikan empiris. Studi baru yang dilakukan oleh peneliti di University of California, San Francisco dan Wayne State University telah memberikan beberapa bukti paling konkret sejauh ini bahwa sistem generative AI dapat menangani analisis data medis yang canggih dengan kecepatan yang jauh melampaui pendekatan manusia tradisional.

Tim penelitian merancang perbandingan langsung, mempitkan delapan chatbot AI yang tersedia secara komersial terhadap tim peneliti manusia pada tugas-tugas analitik yang identik. Kumpulan data melibatkan informasi klinis dari lebih dari 1000 wanita hamil, dan tujuannya cukup substansial: memprediksi risiko kelahiran prematur dan memperkirakan usia gestasi menggunakan sampel darah dan data jaringan plasenta.

Ini bukan masalah analitik sederhana. Mereka memerlukan pemahaman tentang hubungan biologis yang kompleks, menangani data dunia nyata yang berantakan dengan nilai yang hilang dan variabel yang membingungkan, dan menghasilkan kode yang dapat memproses kumpulan data melalui pipeline pembelajaran mesin. Ini adalah jenis pekerjaan yang secara tradisional memerlukan biostatistik berpengalaman dan ilmuwan data bekerja selama periode yang lama.

Hasil yang Mengejutkan Bahkan Para Peneliti

Dari delapan sistem AI yang diuji, empat menghasilkan kode yang fungsional dan dapat digunakan untuk tugas-tugas yang ditugaskan. Meskipun tingkat keberhasilan lima puluh persen mungkin tampak kurang mengesankan, kinerja keempat sistem itu luar biasa. Analisis yang dihasilkan AI cocok dengan atau melampaui kualitas hasil yang dihasilkan oleh tim penelitian manusia berpengalaman.

Mungkin temuan paling mencolok melibatkan pasangan peneliti junior: mahasiswa master yang bekerja bersama siswa sekolah menengah. Menggunakan bantuan AI, pasangan yang relatif berpengalaman ini menyelesaikan model prediktif dalam hitungan menit yang biasanya memerlukan programmer berpengalaman untuk mengembangkan dalam hitungan jam atau bahkan hari. AI tidak hanya mempercepat pekerjaan; itu secara fundamental menurunkan hambatan untuk melakukan analisis data medis yang canggih.

Ketika diukur di seluruh garis waktu proyek, keuntungannya menjadi bahkan lebih jelas. Upaya penelitian yang didorong oleh AI diselesaikan dalam waktu kurang lebih enam bulan. Pekerjaan sebanding yang dilakukan oleh tim manusia tradisional telah memakan waktu hampir dua tahun untuk disatukan menjadi temuan serupa. Itu mewakili pengurangan sekitar tujuh puluh lima persen dalam waktu untuk hasil.

Demokratisasi Penelitian Medis

Salah satu implikasi paling signifikan dari studi ini melampaui kecepatan murni. Generative AI berpotensi untuk mendemokratisasi akses ke kemampuan sains data canggih dalam penelitian medis. Saat ini, melakukan jenis analisis yang diuji dalam studi ini memerlukan keahlian pemrograman yang luas atau akses ke tim biostatistik khusus. Kedua sumber daya langka dan mahal, terutama di institusi penelitian yang lebih kecil dan di negara berpenghasilan rendah.

Jika generative AI dapat menghasilkan kode analitik yang andal yang cocok dengan kualitas ahli, itu dapat memungkinkan jangkauan peneliti yang jauh lebih luas untuk melakukan penyelidikan yang didorong oleh data medis. Seorang dokter klinis dengan pertanyaan penelitian yang menarik dan akses ke kumpulan data yang relevan berpotensi dapat pindah dari hipotesis ke hasil tanpa perlu menyewa tim ilmu data khusus.

Para peneliti membingkai potensi ini dalam istilah mendesak, mencatat bahwa percepatan tidak dapat datang lebih cepat bagi pasien yang membutuhkan bantuan sekarang. Di bidang seperti penelitian kelahiran prematur, di mana kelahiran prematur tetap menjadi penyebab utama kematian bayi baru lahir di seluruh dunia, mempercepat laju penemuan memiliki implikasi kemanusiaan langsung.

Pertanyaan tentang Kualitas

Kecepatan tidak berarti jika datang dengan mengorbankan akurasi, dan peneliti berhati-hati dalam mengatasi kekhawatiran ini. Sistem AI yang menghasilkan kode fungsional menghasilkan hasil yang dapat dibandingkan secara statistik dengan hasil tim manusia. Dalam beberapa tugas analitik spesifik, output AI sebenarnya lebih unggul, mengidentifikasi pola atau menghasilkan model dengan akurasi prediktif yang lebih tinggi.

Namun, studi juga mengungkapkan batasan penting. Setengah dari sistem AI yang diuji gagal menghasilkan kode yang dapat digunakan sama sekali, menghasilkan output yang berisi kesalahan, menghasilkan hasil yang tidak masuk akal, atau cukup tidak dikompilasi. Inkonsistensi ini menekankan bahwa generative AI belum merupakan solusi siap pakai untuk analisis data medis.

Para peneliti menekankan bahwa pengawasan manusia tetap penting di seluruh proses. Sistem AI dapat menghasilkan hasil yang tampak masuk akal tetapi secara mendasar cacat, fenomena yang kadang-kadang disebut kepercayaan diri yang salah atau halusinasi. Tanpa tinjauan ahli, kesalahan tersebut dapat menyebar ke penelitian yang dipublikasikan dan akhirnya mempengaruhi praktik klinis.

Area kritis di mana penilaian manusia tetap sangat diperlukan termasuk:

  • Mengevaluasi apakah pendekatan analitik yang dipilih oleh AI sesuai untuk pertanyaan penelitian tertentu
  • Menilai apakah hasil dapat dipercaya secara biologis dan konsisten dengan pengetahuan medis yang ada
  • Mengidentifikasi bias potensial dalam data yang mungkin tidak diakui atau diperhitungkan AI
  • Menginterpretasikan hasil dalam konteks klinis yang tepat dan menerjemahkannya menjadi wawasan medis yang dapat ditindaklanjuti
  • Memastikan pertimbangan etis di sekitar privasi data pasien dan integritas penelitian dipertahankan

Implikasi untuk Tenaga Kerja Penelitian

Studi ini menimbulkan pertanyaan penting tentang masa depan tenaga kerja penelitian medis. Jika peneliti junior yang dilengkapi dengan alat AI dapat menghasilkan analisis yang sebanding dengan tim berpengalaman, jalur karir tradisional dalam ilmu data biomedis mungkin perlu berkembang.

Daripada menggantikan peneliti terampil, AI lebih mungkin menggeser sifat pekerjaan mereka. Alih-alih menghabiskan sebagian besar waktu mereka menulis kode dan memproses data, peneliti berpengalaman dapat fokus pada tugas tingkat tinggi: merumuskan pertanyaan penelitian, merancang studi, menginterpretasikan hasil, dan menerjemahkan temuan ke dalam aplikasi klinis. AI menangani tenaga kerja komputasional; manusia memberikan penilaian ilmiah dan pemahaman kontekstual.

Pergeseran ini juga dapat mengatasi kemacetan yang terus-menerus dalam penelitian medis. Banyak studi menjanjikan macet bukan karena data tidak ada atau pertanyaan tidak penting, tetapi karena tidak ada cukup analis terampil untuk melakukan pekerjaan komputasional. Generative AI dapat membantu menghapus keterlambatan itu, mempercepat kemajuan di berbagai domain penelitian secara bersamaan.

Apa Selanjutnya

Para peneliti berencana memperluas penyelidikan mereka ke domain medis tambahan dan tugas analitik yang lebih kompleks. Mereka juga bertujuan untuk mengembangkan praktik terbaik untuk mengintegrasikan generative AI ke dalam alur kerja penelitian, termasuk pedoman kontrol kualitas, protokol validasi, dan pengungkapan AI yang sesuai dalam penelitian yang dipublikasikan.

Ketika kemampuan AI terus meningkat dan alat menjadi lebih andal, keseimbangan antara analisis yang dihasilkan AI dan analisis yang dihasilkan manusia dalam penelitian medis kemungkinan akan bergeser lebih jauh. Studi saat ini memberikan bukti kuat bahwa pergeseran ini tidak hanya memungkinkan tetapi sudah berlangsung, dengan manfaat signifikan untuk kecepatan dan aksesibilitas penemuan medis.

Bagi pasien yang menunggu terobosan penelitian, akselerasi tidak bisa datang cukup cepat. Kemampuan untuk mengompresi dua tahun pekerjaan analitik menjadi enam bulan berarti bahwa wawasan yang mencapai praktik klinis dapat tiba secara signifikan lebih cepat, berpotensi menyelamatkan nyawa yang sebaliknya akan hilang karena lambannya jadwal penelitian tradisional.

Artikel ini didasarkan pada laporan dari Science Daily. Baca artikel asli.