Daftar Isi
Cerebras Mendapatkan Kesepakatan AI Besar: Monster 36 Exaflop
Perusahaan Wafer-Scale Engine telah bekerja selama 8 tahun untuk masuk ke tingkat teratas komputasi AI. Kesepakatan ini mungkin saja menjamin kesuksesannya. Kami telah mengamati Cerebras untuk waktu yang lama, mulai dari peluncuran mesin wafer-scale pertama untuk AI hingga kontribusinya baru-baru ini dalam pelatihan model bahasa besar terbuka dan bahkan membangun superkomputer sendiri, Andromeda. Tetapi dengan harga sekitar $2,5 juta per unit, kesuksesan dalam bisnis server AI sulit dicapai. Tentu saja, ada beberapa kemenangan kecil di sini, beberapa node di sana, tetapi kesuksesan dalam hal kemenangan pusat data utama masih kurang.
Perusahaan Kecerdasan Buatan mengumumkan kemitraan strategis
Semua itu baru saja berubah. Cerebras dan G42 (Group42), perusahaan kecerdasan buatan dan komputasi awan, telah mengumumkan kemitraan strategis. Dalam pengiriman pertama dari kolaborasi ini, mereka telah menerapkan superkomputer 4 Exaflop. G42 didirikan di Abu Dhabi, Uni Emirat Arab pada tahun 2018. Cerebras Cloud akan menghosting dan mengelola infrastruktur yang dimiliki G42 untuk aplikasi internal G42. Kedua perusahaan akan menjual kapasitas berlebih kepada pengembang dan pengguna AI lainnya. Fase pertama sudah terpasang dan menyediakan 2 exaflop AI, didukung oleh 32 sistem CS-2 di Sunnyvale, CA. Cerebras mengklaim bahwa hanya membutuhkan 10 hari untuk mengatur perangkat keras dan perangkat lunak untuk memungkinkan pelatihan pertama, sebuah bukti dari kemudahan implementasi yang selalu menjadi kekuatan platform Cerebras.
Carebras cuma membutuhkan 1200 baris kode
AI Besar, Dilakukan dengan Cepat, Dilakukan dengan Mudah Poin mudahnya implementasi, Cerebras membagikan bahwa hanya membutuhkan 1200 baris kode untuk mendistribusikan model AI di berbagai sistem CS-2. Ini berbeda dengan klaim Cerebras bahwa dibutuhkan lebih dari 28.000 baris kode untuk mendistribusikan model yang sama di 1000 GPU. Meskipun kami belum dapat memverifikasi klaim ini, intinya adalah bahwa pekerjaan komputasi terdistribusi dilakukan secara otomatis oleh perangkat lunak dan perangkat keras perusahaan, bukan dengan kode tangan ke konfigurasi tertentu. Sistem awal akan berlipat ganda dalam 10 minggu menjadi 4-Exaflop dan 54 juta inti komputasi. Dua sistem 4-Exaflop tambahan berbasis AS telah dikontrak, dan akan dihubungkan bersama dengan instansi pertama (CG-1) untuk total 12-Exaflop. Kemudian enam CG tambahan akan ditambahkan tahun depan untuk menciptakan apa yang Cerebras yakini akan menjadi superkomputer AI terbesar di dunia.
Alasan G42 memilih Carebras
Mengapa G42 memilih Cerebras? Sebagian besar, kemenangan ini didasarkan pada perangkat keras Cerebras yang cepat, dukungan untuk ratusan model dasar sumber terbuka, dan kemudahan implementasi model terdistribusi tambahan, dengan skala yang besar. Tetapi kami juga curiga bahwa ketersediaan perangkat keras mungkin juga memainkan peran di sini, karena NVIDIA H100 dikabarkan habis terjual selama setahun. Kesimpulan Cerebras akhirnya memenangkan kesepakatan awan besar. Kesepakatan awan yang sangat besar. Kami curiga bahwa kesepakatan ini bernilai ratusan juta dolar, dengan 256 sistem CS-2 mungkin mendekati $0,5 miliar adalah perkiraan yang baik. Kemungkinan jauh lebih besar dari jumlah pendapatan yang dihasilkan oleh semua startup AI hingga saat ini. Sekarang pertanyaan yang muncul jelas: apakah penyedia awan lain yang lebih umum akan mengikuti jejak ini, memilih untuk memperoleh kluster berbasis CS-2 daripada menunggu backlog NVIDIA selesai? Menunggu memakan biaya, dan kesempatan yang terlewat, dalam perburuan tanah LLM yang sedang berlangsung. Kami belum pernah mendengar tentang G42, dan kami curiga bahwa Anda juga belum pernah mendengarnya. Tetapi bahkan jika Super 7 hyper-scalers memutuskan untuk tetap menggunakan apa yang mereka miliki, kemungkinan ada beberapa penyedia global yang lebih tidak sabar seperti G42 di belakang layar.