Mempercepat Waktu Pemulihan dengan AI Generatif
Sekumpulan alat baru kini menggunakan bahasa percakapan untuk membantu pengembang dengan cepat menilai dan menyelidiki masalah saat terdeteksi. Pengembang memiliki berbagai alat AI generatif yang dapat dipilih dalam pekerjaan mereka. Namun, sementara solusi seperti Google Gemini dan GitHub Copilot membantu mereka menulis kode fungsional, bisakah AI generatif membantu mempercepat waktu rata-rata pemulihan (MTTR) ketika masalah terjadi? Untungnya, sekumpulan alat baru telah muncul yang menggunakan bahasa percakapan untuk membantu pengembang dengan cepat menilai dan menyelidiki masalah saat terdeteksi dan juga berguna bagi tim keamanan untuk mendiagnosis dan mengurangi ancaman. Dengan memanfaatkan algoritma pembelajaran mesin, alat otonom ini mengidentifikasi akar penyebab insiden dan merencanakan serta melaksanakan remediasi.
Volume data yang sangat besar yang dihasilkan dari berbagai sumber yang berbeda berarti bahwa, ketika insiden terdeteksi dalam lingkungan produksi, sering kali sulit untuk menilai dan menyelidiki masalah tersebut. Melacak dan mengelola proses secara efisien untuk memastikan semua orang yang terlibat dapat mengakses informasi dan konteks terkini sangat penting, tetapi bisa memakan waktu dan sumber daya. Dengan bantuan kopilot berbasis AI generatif, proses penyelidikan peringatan dan respons terhadap insiden dapat disederhanakan. Memanfaatkan teknologi dan metode AI dan pembelajaran mesin (ML) untuk menganalisis data masuk dan historis dari berbagai sumber memungkinkan kopilot seperti ini mendeteksi anomali dan outlier, misalnya, dan memberikan opsi untuk mengatasi masalah tersebut.
Selain itu, mengkorelasikan peristiwa untuk menentukan apakah mereka saling terkait atau terhubung dapat mengurangi kebisingan peringatan dan MTTR, serta mencegah beberapa tim menduplikasi upaya yang sama. Memang, ini dapat mengarah pada efisiensi lebih lanjut dengan menetapkan tugas kepada staf untuk menerapkan solusi dan mengotomatisasi alur kerja remediasi di seluruh alat dan layanan yang relevan untuk menyelesaikan masalah. Agen otonom yang mampu melakukan tugas operasional kompleks, seperti menyelidiki peringatan dan mengoordinasikan respons insiden tanpa dorongan manusia, akan bekerja secara aktif bersama pengembang selama penyelidikan mereka, secara efektif mengarahkan mereka menuju resolusi seperti rekan manusia.
Segera setelah peringatan spesifik dipicu, AI memanfaatkan pengetahuannya yang komprehensif tentang sistem pengembang, prosedur pemecahan masalah yang terdokumentasi, dan praktik terbaik untuk mengidentifikasi kemungkinan penyebab utama, memberikan catatan penyelidikan kepada pengembang yang siap untuk ditinjau dan ditindaklanjuti. Jika mereka memilih untuk meningkatkan peringatan menjadi insiden penuh, AI akan bergabung sebagai responden tambahan, menampilkan data telemetri utama, dan terus memantau tanda-tanda pemulihan.
Mengingat kecepatan insiden dapat berkembang, sulit bagi semua orang untuk tetap terhubung. Namun, mengintegrasikan kopilot AI generatif ke dalam saluran respons insiden tim di Slack akan memberikan mereka detail yang diperlukan untuk mengidentifikasi masalah, menentukan cakupannya, dan memulai analisis akar penyebab. Kemudian, ketika responden baru bergabung dengan saluran, AI akan secara otomatis memberikan ringkasan dari semua yang telah terjadi hingga saat ini. Kemampuan untuk berbicara langsung dengan kopilot melalui saluran Slack khusus saat memecahkan masalah bisa sangat berharga bagi pengembang. Memungkinkan mereka melakukan tugas penting seperti mendapatkan wawasan dari data, menemukan masalah aktif, dan menghasilkan perbaikan kode, dapat membebaskan waktu untuk menangani masalah yang lebih kompleks.
Dengan memanfaatkan LLM canggih untuk bernalar, membuat keputusan, dan mengatur proses dan tindakan remedial, AI generatif dapat secara efektif meniru rekan manusia, memungkinkan pengembang beroperasi lebih efektif di seluruh SDLC. Namun, penting untuk dicatat bahwa AI ini tetap menjadi kopilot, dan pengembang akan selalu memiliki kendali penuh. Hanya merekomendasikan tindakan remediasi yang harus diambil, AI tidak boleh membuat perubahan apa pun pada sistem pengguna sebelum menerima konfirmasi dari pengembang, sehingga memungkinkan mereka untuk mengevaluasi risiko perubahan tersebut dan menimbangnya terhadap dampak potensialnya.
Dengan mengotomatisasi sebanyak mungkin siklus hidup DevSecOps, alat AI generatif seperti ini dapat membantu pengembang mendeteksi, menyelidiki, dan memperbaiki masalah yang muncul, bekerja seperti rekan manusia untuk membantu mengurangi MTTR. Alih-alih beberapa tim menduplikasi aktivitas dan mengejar peristiwa terpisah, satu pengembang atau tim dapat fokus pada penyelesaian masalah secara keseluruhan. Manfaat dari ini jelas terlihat. Pengurangan MTTR berarti pemecahan masalah yang lebih cepat, lebih sedikit waktu yang dihabiskan untuk mencari atau menguji perbaikan, dan pengurangan waktu henti pengguna yang semuanya berarti pengiriman lebih cepat, produk akhir berkualitas lebih tinggi, dan pada akhirnya – hasil bisnis yang lebih baik.