Deduplikasi data

Deduplikasi adalah menghilangkan informasi duplikat atau berlebihan dalam kumpulan data. Dengan kata lain, deduplikasi adalah proses memastikan bahwa hanya ada satu salinan data dalam kumpulan atau blok data tertentu. Proses ini meningkatkan kapasitas penyimpanan dan mengoptimalkan redundansi tanpa mengorbankan fidelitas atau integritas data. Deduplikasi data melibatkan penghapusan salinan duplikat data untuk mengoptimalkan sumber daya penyimpanan dan meningkatkan kinerja aplikasi yang dapat melakukan tugas pada kumpulan data yang lebih kecil. Dengan menghilangkan informasi yang berlebihan, sistem akan mengosongkan ruang penyimpanan dan mengurangi ukuran kumpulan data.

Prinsip kerja

Deduplikasi melibatkan analisis data untuk mengidentifikasi blok data unik sebelum menyimpannya. Jika duplikat dari masing-masing blok data ditemukan, pola tambahan akan dihapus dan diganti dengan referensi ke data unik yang disimpan.

Cara kerja deduplikasi data dalam server terbagi menjadi dua prinsip.

  • Pengoptimalan tidak boleh menghalangi penulisan ke disk. Deduplikasi data mengoptimalkan data menggunakan model pasca-pemrosesan. Semua data ditulis ke disk secara tidak optimal dan kemudian dioptimalkan dengan duplikasi data.
  • Pengoptimalan tidak boleh mengubah semantik akses Pengguna dan aplikasi yang mengakses data dari volume yang dioptimalkan sama sekali tidak menyadari bahwa file yang mereka akses diduplikasi.[1]

Misalnya, administrator mengirimkan 500 salinan file 1 MB (Megabyte) yang sama ke seluruh tim. Jika semua kotak masuk menggunakan sistem cadangan data, maka 500 salinan akan disimpan, yang akan memakan 500 MB ruang server. Namun, jika data tingkat sistem diduplikasi, hanya satu salinan laporan yang akan disimpan. Setiapcontoh lainnya hanya mengacu pada satu contoh yang disimpan. Artinya bit (bandwidth) akhir server dan beban penyimpanan hanya 1 MB data unik.[2]

Manfaat

Aplikasi dan data yang dihasilkan merupakan kekuatan analisis bisnis dan faktor penentu keberhasilan pertumbuhan. Manfaat pengelolaan pertumbuhan data dan deduplikasi tidak terbatas pada sistem penyimpanan, tetapi meluas ke seluruh infrastruktur TI dan kinerja aplikasi. Deduplikasi dan kompresi mengurangi jejak penyimpanan, sehingga mengurangi biaya penyimpanan, mengurangi beban jaringan, dan mengurangi batasan bit. Hal ini juga meningkatkan kinerja aplikasi pada titik akhir, membantu pekerja jarak jauh menjadi lebih produktif.[2]

Deduplikasi data jaringan in-line digunakan untuk mengurangi jumlah byte yang perlu ditransfer antar titik akhir, sehingga mengurangi bit yang diperlukan. Deduplikasi sumber (juga dikenal sebagai deduplikasi sisi sumber atau deduplikasi sisi klien), yang mengidentifikasi redundansi pada sumber sebelum mengirimkannya melalui jaringan, dapat menghemat biaya penyimpanan dan bit jaringan. Sebab, segmen data redundan diidentifikasi terlebih dahulu sebelum dikirim.[3]

Deduplikasi sumber berfungsi baik dengan penyimpanan cloud dan dapat meningkatkan kecepatan pencadangan. Deduplikasi menyederhanakan proses pencadangan dan pemulihan dengan mengurangi jumlah permintaan dan bit jaringan untuk proses pencadangan data. Untuk memutuskan kapan akan menggunakan deduplikasi, pertimbangkan apakah organisasi Anda dapat memperoleh manfaat dari peningkatan ini.

Referensi

  1. ^ wmgries (2023-08-25). "Memahami Deduplikasi Data". learn.microsoft.com. Diakses tanggal 2024-02-15.
  2. ^ a b "Data deduplication". Metallic (dalam bahasa American English). Diakses tanggal 2024-02-15.
  3. ^ Alif, Kurnia. "Deduplikasi Data: Arti, Contoh, Manfaat, dan Penggunaannya". Griyasis. Diakses tanggal 2024-02-15.

Content Disclaimer

Informasi ini disarikan dari Wikipedia dan disajikan kembali untuk tujuan edukasi. Konten tersedia di bawah lisensi CC BY-SA 3.0. Kami tidak bertanggung jawab atas ketidakakuratan data yang bersumber dari kontribusi publik tersebut.

  1. The information displayed on this website is sourced in part or in whole from Wikipedia and has been adapted for the purpose of restating it. We strive to provide accurate and relevant information, however:
  2. There is no guarantee of absolute accuracy. Wikipedia is an open, collaborative project that can be edited by anyone, so information is subject to change.
  3. It is not intended to constitute professional advice. The content displayed is for informational and educational purposes only. For important decisions (e.g., medical, legal, or financial), please consult a professional.
  4. Content copyright. Wikipedia is licensed under the Creative Commons Attribution-ShareAlike License (CC BY-SA). This means that content may be reused with appropriate attribution and shared under a similar license.
  5. Responsible use. Any risk arising from the use of information from this website is entirely the responsibility of the user.