Transformasi Pusat Data Menjadi Pabrik AI
Pabrik AI kini menjadi sorotan utama dalam dunia teknologi, mendukung seluruh siklus hidup kecerdasan buatan dan menghasilkan output berharga yang berkelanjutan. Sementara itu, pusat data telah mengalami evolusi pesat. Dimulai dari ruang komputer, berkembang menjadi peternakan server, dan kemudian menjadi kolokasi serta pusat data hotel telco. Pada pertengahan hingga akhir 2000-an, komputasi awan mulai merajai, dan pusat data terbesar saat ini dikenal sebagai hyperscale. Semua istilah ini merujuk pada bentuk pusat data yang didefinisikan oleh IBM sebagai fasilitas yang menampung infrastruktur TI untuk membangun, menjalankan, dan menyampaikan aplikasi serta layanan, sekaligus mengelola data terkait.
Munculnya Konsep Pabrik AI
Namun, istilah baru kini muncul. Sebanyak 65% pusat data saat ini dibangun untuk aplikasi AI. Hal ini membuat pusat data tersebut dikenal sebagai pabrik AI. Pabrik AI adalah pusat data yang didedikasikan untuk siklus hidup aplikasi AI. Prosesnya mencakup pelatihan hingga inferensi. Menurut Nvidia, pabrik AI tidak hanya menyimpan dan memproses data, melainkan juga memproduksi kecerdasan dalam skala besar. Dengan demikian, data mentah diubah menjadi wawasan yang dapat diakses secara waktu nyata.
Siklus Kerja Pabrik AI
Pabrik AI menjalankan seluruh siklus hidup AI. Prosesnya dimulai dengan pelatihan model. Setelah itu, model disetel, lalu dilakukan inferensi. Inferensi menjadi tahap penting. Di sinilah nilai AI benar-benar diwujudkan. AI menjadi lebih otonom, mampu membuat prediksi, dan menyelesaikan kueri kompleks. Beban kerja inferensi yang dioptimalkan adalah gelombang berikutnya dari AI. Di tahap ini, perusahaan berharap bisa mengembalikan investasi mereka. AI kini bergerak dari model satu kali ke model yang lebih maju. Model baru ini membutuhkan komputasi yang jauh lebih besar. Misalnya, penskalaan pasca-pelatihan memerlukan hingga 30 kali lebih banyak komputasi dibandingkan model tradisional. Sementara itu, penskalaan waktu uji bisa mengonsumsi hingga 100 kali lebih banyak.
Dengan munculnya model ini, perusahaan berusaha agar pabrik AI mereka berkinerja tinggi dan tahan masa depan untuk pertumbuhan AI yang eksponensial. Pabrik AI awalnya akan menjadi bagian dari pusat data milik raksasa internet dan penyedia neo-cloud, kemudian menyebar ke fasilitas kolokasi dan perusahaan. Namun, pusat data tradisional menghadapi tantangan dalam mendukung pabrik AI, terutama dalam hal kepadatan daya dan persyaratan pendinginan. Desain referensi yang memberikan detail tentang bahan, skema, tata letak, dan spesifikasi kinerja akan memberikan wawasan lebih besar tentang kebutuhan daya dan pendinginan pabrik AI ini.