Chatbot AI Tidak Lebih Efektif Daripada Carian Internet untuk Diagnosis Kesihatan
Kajian terbaharu yang diterbitkan dalam jurnal Nature Medicine pada hari Isnin mendedahkan bahawa chatbot kecerdasan buatan (AI) tidak memberikan nasihat kesihatan yang lebih baik berbanding kaedah carian internet tradisional. Penemuan ini menimbulkan persoalan tentang kemampuan sebenar teknologi AI dalam bidang perubatan, terutamanya dalam membantu orang ramai mengenal pasti masalah kesihatan mereka.
Prestasi Mengecewakan dalam Senario Dunia Nyata
Pasukan penyelidik dari United Kingdom yang diketuai oleh Universiti Oxford menjalankan kajian terhadap hampir 1,300 peserta yang berpangkalan di UK. Mereka diberikan 10 senario kesihatan yang berbeza, termasuk sakit kepala selepas minum alkohol, keletihan dalam kalangan ibu baru, dan simptom batu karang. Peserta kemudiannya dibahagikan secara rawak kepada tiga kumpulan yang menggunakan chatbot AI berbeza: GPT-4o dari OpenAI, Llama 3 dari Meta, dan Command R+. Satu kumpulan kawalan pula menggunakan enjin carian internet biasa.
Keputusan kajian menunjukkan bahawa peserta yang menggunakan chatbot AI hanya dapat mengenal pasti masalah kesihatan mereka sekitar satu pertiga daripada masa. Lebih membimbangkan, hanya kira-kira 45 peratus daripada mereka yang berjaya menentukan tindakan yang betul untuk diambil. Prestasi ini ternyata tidak lebih baik berbanding kumpulan kawalan yang menggunakan carian internet.
Jurang Antara Ujian dan Realiti
Rebecca Payne, pengarang bersama kajian dari Universiti Oxford, menegaskan bahawa "walaupun terdapat banyak hype, AI masih belum bersedia untuk mengambil peranan sebagai doktor." Beliau menambah bahawa pesakit perlu sedar bahawa bertanya kepada model bahasa besar tentang simptom mereka boleh menjadi berbahaya, kerana ia mungkin memberikan diagnosis yang salah dan gagal mengenal pasti ketika bantuan segera diperlukan.
Para penyelidik turut menekankan perbezaan ketara antara keputusan yang mengecewakan ini dengan pencapaian cemerlang chatbot AI dalam ujian penanda aras dan peperiksaan perubatan. Jurang ini dikaitkan dengan kerosakan komunikasi antara manusia dan mesin. Berbeza dengan interaksi pesakit simulasi yang sering digunakan untuk menguji AI, manusia sebenar sering kali tidak memberikan semua maklumat relevan kepada chatbot.
Cabaran dalam Interpretasi dan Pematuhan
Kajian tersebut mendedahkan beberapa cabaran praktikal dalam penggunaan chatbot AI untuk tujuan kesihatan. Kadangkala, manusia menghadapi kesukaran untuk mentafsir pilihan yang ditawarkan oleh chatbot, atau mereka salah faham dan mengabaikan nasihat yang diberikan. Situasi ini menunjukkan bahawa keupayaan teknikal AI tidak semestinya diterjemahkan kepada keberkesanan praktikal dalam konteks dunia nyata.
David Shaw, seorang bioetika dari Universiti Maastricht di Belanda yang tidak terlibat dalam penyelidikan ini, mengulas bahawa "ini adalah kajian yang sangat penting kerana ia menyerlahkan risiko perubatan sebenar yang dihadapi oleh orang ramai melalui chatbot." Beliau menasihati orang ramai untuk hanya mempercayai maklumat perubatan dari sumber yang boleh dipercayai, seperti Perkhidmatan Kesihatan Kebangsaan UK.
Implikasi untuk Pengguna dan Masa Depan
Statistik menunjukkan bahawa satu daripada setiap enam orang dewasa di Amerika Syarikat bertanya kepada chatbot AI tentang maklumat kesihatan sekurang-kurangnya sekali sebulan. Angka ini dijangka meningkat apabila lebih ramai orang menggunakan teknologi baharu ini. Penemuan kajian ini berfungsi sebagai amaran penting tentang had teknologi AI dalam bidang kesihatan dan keperluan untuk pendekatan yang lebih berhati-hati.
Walaupun chatbot AI telah menunjukkan prestasi cemerlang dalam peperiksaan perlesenan perubatan, kemampuan mereka untuk memberikan nasihat praktikal dan tepat dalam situasi kehidupan sebenar masih terhad. Kajian ini menekankan kepentingan untuk tidak terlalu bergantung pada teknologi AI untuk diagnosis kesihatan dan sentiasa merujuk kepada profesional perubatan yang berkelayakan.