Falcon 180B: Model Kecerdasan Buatan Open Source yang Kuat Namun Kurang Memiliki Pembatas

September 11, 2023 | by Luna

Falcon 180B mengalahkan GPT Llama 2 dan pesaingnya, PaLM-2 dari Google. Tim di balik model open source Falcon 40B telah merilis versi yang lebih canggih, dengan ukuran lebih dari empat kali lipat namun kurang memiliki pembatasan. Technology Innovation Institute (TII) menerbitkan Falcon 180B di Hugging Face minggu ini. Model ini dilatih menggunakan triliunan token dari dataset RefinedWeb milik TII. Falcon 180B mencapai hasil terbaik dalam tugas bahasa alami, bahkan melebihi model eksklusif seperti PaLM-2 milik Google. Anda dapat menggunakan Falcon 180B untuk aplikasi komersial, namun dengan kondisi yang sangat terbatas. Lisensi lengkap dapat ditemukan di sini. TII merilis versi dasar dan versi yang disesuaikan dengan data percakapan dan instruksi. Anda dapat mencoba model ini melalui Falcon Chat Demo Space. Namun, Falcon 180B memiliki satu kekurangan utama, yaitu kurangnya pembatasan penyesuaian. Falcon 180B tidak mengalami penyesuaian atau penyetelan lanjutan sehingga dapat menghasilkan output yang TII sebut sebagai “output bermasalah”, terutama jika diminta untuk melakukannya. Versi dasar juga tidak memiliki format permintaan, yang berarti Falcon 180B dasar tidak akan menghasilkan respons percakapan.

Terkait: Bagaimana Performa Falcon 180B?

Falcon 180B berhasil mengungguli Meta Llama 2 dan GPT dari OpenAI dalam uji benchmark MMLU. Model ini sebanding dengan PaLM 2-Large milik Google dalam berbagai pengujian, termasuk HellaSwag, WebQuestions, dan Winogrande. Namun, Falcon 180B bersinar di Hugging Face Leaderboard, menjadi model bahasa besar yang dirilis secara terbuka dengan skor tertinggi. Sebelumnya, Meta’s Llama 2 menduduki posisi teratas dengan skor

ai, Falcon 180B berhasil mengungguli Meta Llama 2 dan GPT dari OpenAI dalam uji benchmark MMLU. Model ini sebanding dengan PaLM 2-Large milik Google dalam berbagai pengujian, termasuk HellaSwag, WebQuestions, dan Winogrande. Namun, Falcon 180B bersinar di Hugging Face Leaderboard, menjadi model bahasa besar yang dirilis secara terbuka dengan skor tertinggi. Sebelumnya, Meta’s Llama 2 menduduki posisi teratas dengan skor

Recommended Article
thumbnail post

AI-nya">Google Akan Menggunakan Postingan Reddit untuk Melatih Model AI-nya

thumbnail post

AI Canggih dengan Microsoft di NVIDIA GTC">Jelajahi Solusi AI Canggih dengan Microsoft di NVIDIA GTC