IBM Meluncurkan Model AI Lebih Kecil dengan Kemampuan Penalaran yang Ditingkatkan

March 6, 2025 | by Luna

Generasi Terbaru Model Bahasa Granite dari IBM

IBM telah memperkenalkan generasi terbaru dari keluarga model bahasa besar Granite, yang menawarkan AI multi-model dan penalaran dengan fleksibilitas yang lebih baik untuk efisiensi biaya. Model yang diperbarui ini bertujuan untuk menyediakan AI perusahaan yang lebih kecil, efisien, praktis, mudah diadopsi, dan hemat biaya bagi bisnis dan komunitas open-source.

Aplikasi baru dalam Granite mencakup model bahasa visual untuk memproses dokumen, mengklasifikasikan, dan mengekstraksi data. Menurut IBM, model bahasa visual ini sebanding atau bahkan melebihi model yang lebih besar seperti Llama 11B dan Pixtral 12B dalam tolok ukur penting. Selain itu, teknik penalaran baru seperti penskalaan inferensi menunjukkan bahwa model Granite 8B dapat menyamai atau melebihi kinerja model yang lebih besar dalam tolok ukur penalaran matematika standar. Beberapa model dalam Granite juga mencakup kemampuan rantai pemikiran untuk penalaran yang lebih baik, di mana langkah-langkah penalaran menengah dijelaskan.

Sebagai bagian dari upaya IBM untuk meningkatkan efisiensi biaya, fitur yang memerlukan daya komputasi substansial ini dapat dihidupkan atau dimatikan sesuai kebutuhan untuk mengoptimalkan efisiensi dan mengurangi biaya keseluruhan. “Era berikutnya dari AI adalah tentang efisiensi, integrasi, dan dampak dunia nyata, di mana perusahaan dapat mencapai hasil yang kuat tanpa pengeluaran berlebihan untuk komputasi,” kata VP Penelitian AI IBM, Sriram Raghavan.

Granite juga menawarkan opsi ukuran yang dikurangi untuk model keamanan Granite Guardian yang mempertahankan kinerja Granite sebelumnya dengan pengurangan 30%. Selain itu, kemampuan yang disebut IBM sebagai kepercayaan verbal memberikan penilaian risiko yang lebih bernuansa yang mengakui ambiguitas dalam pemantauan keamanan.

Model yang diperbarui ini dilatih menggunakan toolkit open-source Docling IBM yang memungkinkan pengembang mengonversi dokumen menjadi data khusus untuk menyesuaikan model AI perusahaan. Model ini memproses 85 juta PDF dan 26 juta pasangan pertanyaan-jawaban sintetis yang dihasilkan untuk meningkatkan kemampuan VLM dalam menangani alur kerja yang kompleks dan berat dokumen. “Granite membawanya lebih jauh dengan kemampuan penalaran baru, dan kami bersemangat untuk mengeksplorasinya dalam membangun solusi agen baru,” kata kepala teknologi CrushBank, mitra yang mendukung pengembangannya.

Semua model tersedia di bawah lisensi Apache yang permisif di Hugging Face, dan model tertentu tersedia sekarang di IBM Ollama, Replicate, dan LM Studio, serta diharapkan segera hadir di RHEL AI. Selain pembaruan Granite, IBM juga merilis generasi terbaru dari model TinyTimeMixers (TTM), model pra-latih kompak untuk Peramalan Deret Waktu Multivariat, dengan kemampuan termasuk peramalan jangka panjang hingga dua tahun ke depan.

Recommended Article