Rekayasa keandalan situs (bahasa Inggris: site reliability engineering) adalah sebuah disiplin yang menggabungkan aspek rekayasa perangkat lunak untuk diterapkan pada masalah infrastruktur dan juga operasi.[1] Tujuan utama dari rekayasa keandalan situs adalah untuk menciptakan sistem perangkat lunak yang scalable dan sangat andal. Menurut Ben Treynor, pendiri Tim Keandalan Situs Google, rekayasa keandalan situs adalah "apa yang terjadi ketika seorang insinyur perangkat lunak ditugaskan dengan apa yang dulu disebut operasi."
Pembagian
Seorang insinyur rekayasa keandalan situs akan menghabiskan hingga 50% dari waktu mereka melakukan pekerjaan terkait "ops" seperti masalah, on-call, dan intervensi manual. Karena sistem perangkat lunak yang diawasi rekayasa keandalan situs diharapkan sangat otomatis dan dapat menyembuhkan sendiri, rekayasa keandalan situs harus menghabiskan 50% waktunya untuk tugas-tugas pengembangan seperti fitur baru, penskalaan atau otomatisasi. Kandidat insinyur keandalan situs yang ideal adalah insinyur perangkat lunak dengan latar belakang administrasi yang baik atau sistem administrator dengan kemampuan yang sangat terampil (pengetahuan tentang pengkodean dan otomatisasi).
Referensi
- ^ "Google - Site Reliability Engineering". sre.google. Diakses tanggal 2024-01-10.