Pendekatan ‘Masyarakat Multiagen’ dapat mengurangi kesalahan dan meningkatkan hasil model AI
Tim peneliti MIT menemukan bahwa dengan melibatkan beberapa sistem AI dalam sebuah debat untuk menjawab pertanyaan, akurasi dapat ditingkatkan dibandingkan hanya menggunakan satu sistem AI. Dalam makalah berjudul “Meningkatkan Faktualitas dan Penalaran dalam Model Bahasa melalui Debat Multiagen”, para peneliti menemukan bahwa penggunaan beberapa sistem AI membantu memperbaiki kesalahan faktual dan meningkatkan penalaran logis. Para ilmuwan MIT, bersama dengan peneliti Google DeepMind Igor Mordatch, menyebut proses ini sebagai “Masyarakat Multiagen” dan menemukan bahwa hal ini mengurangi kesalahan dalam hasil yang dihasilkan. Pendekatan ini bahkan dapat diterapkan pada model kotak hitam yang sudah ada seperti ChatGPT dari OpenAI. Tetap terupdate dengan newsletter AI Business.
Proses ini melibatkan beberapa putaran respons yang dihasilkan dan dikritik. Model menghasilkan jawaban untuk pertanyaan yang diberikan dan kemudian menggabungkan umpan balik dari agen lain untuk memperbarui responsnya sendiri. Para peneliti menemukan bahwa proses ini meningkatkan hasil akhir karena mirip dengan hasil dari diskusi kelompok di mana individu berkontribusi untuk mencapai kesimpulan yang seragam. Metode ini juga dapat digunakan untuk menggabungkan model bahasa yang berbeda, dengan penelitian membandingkan ChatGPT dengan Google Bard. Meskipun kedua model menghasilkan respons yang salah terhadap contoh permintaan, di antara keduanya, mereka dapat menghasilkan jawaban akhir yang benar.
Terkait: Dengan menggunakan pendekatan Masyarakat Multiagen, tim MIT berhasil mencapai hasil yang lebih baik pada berbagai benchmark untuk pemrosesan bahasa alami, matematika, dan pemecahan teka-teki. Sebagai contoh, pada benchmark MMLU populer, menggunakan beberapa agen memberikan skor akurasi model sebesar 71, sedangkan hanya menggunakan satu agen memberikan skor 64. “Proses kami melibatkan banyak model AI, masing-masing memberikan wawasan unik untuk menangani sebuah pertanyaan. Meskipun respons awal mereka mungkin terpotong atau mengandung kesalahan, model-model ini dapat mempertajam dan memperbaiki jawaban mereka sendiri dengan memeriksa respons yang ditawarkan oleh rekan mereka,” kata Yilun Du, seorang mahasiswa MIT dan penulis utama makalah tersebut. “Ketika model-model AI ini terlibat dalam diskusi dan musyawarah, mereka lebih mampu mengenali dan memperbaiki masalah, meningkatkan kemampuan pemecahan masalah mereka, dan lebih memverifikasi keakuratan jawaban mereka.”
Anda dapat mengakses kode yang digunakan dalam proyek multiagen di GitHub.