Ambil Satu Langkah Lebih Maju Dalam Menghemat Kapasitas Storage Anda

Meskipun banyak drive berkapasitas besar telah diproduksi, masih banyak pelanggan yang perlu menghemat kapasitas dan mencapai tujuan 1 hingga lebih banyak kapasitas. Ada banyak cara untuk menghemat kapasitas, yang paling umum terdengar di pasaran adalah Deduplikasi. Hari ini kami akan mengirimkan kepada kita apa saja kelebihan dan kekurangannya, dan bagaimana penyimpanan setiap merek untuk menghemat kapasitas.

Apa itu Deduplikasi Data?

Deduplikasi data adalah proses yang menghilangkan salinan data yang berlebihan dan secara signifikan mengurangi persyaratan kapasitas penyimpanan.

Deduplikasi dapat dijalankan sebagai proses inline saat data sedang ditulis ke dalam sistem penyimpanan dan/atau sebagai proses latar belakang untuk menghilangkan duplikat setelah data ditulis ke disk.

Overhead kinerja minimal untuk operasi deduplikasi karena berjalan dalam domain efisiensi khusus yang terpisah dari domain baca/tulis klien. Ia berjalan di balik layar, terlepas dari aplikasi apa yang dijalankan atau bagaimana data diakses (di NAS atau SAN).

Penghematan deduplikasi dipertahankan saat data berpindah – saat data direplikasi ke situs DR, saat dicadangkan ke brankas, atau saat dipindahkan antara lokal, cloud hybrid, atau cloud publik.

Mengapa saya memerlukan deduplikasi?

Ini membantu administrator penyimpanan mengurangi biaya yang terkait dengan data duplikat. Kumpulan data besar sering kali memiliki banyak duplikasi, yang meningkatkan biaya penyimpanan data. Misalnya:

Berbagi file pengguna mungkin memiliki banyak salinan file yang sama atau serupa.
Tamu virtualisasi mungkin hampir identik dari VM ke VM.
Cuplikan cadangan mungkin memiliki sedikit perbedaan dari hari ke hari.
Penghematan kapasitas yang dapat Anda peroleh dari Deduplikasi Data bergantung pada kumpulan data atau beban kerja pada volume. Kumpulan data yang memiliki duplikasi tinggi dapat melihat rasio pengoptimalan hingga 95%, atau pengurangan 20x dalam penggunaan penyimpanan. Selain itu, ini juga dapat “Meningkatkan kinerja penulisan” dan “Menghemat bandwidth jaringan”.

Lingkungan seperti apa yang memerlukan ini?

Deduplikasi data adalah menemukan blok besar data berulang dalam rentang yang relatif besar, dan ukuran blok data berulang umumnya di atas 1KB. Teknologi ini banyak digunakan dalam hard disk jaringan, email, perangkat media cadangan disk, dll.

Ini berguna terlepas dari jenis beban kerja. Manfaat maksimal terlihat dalam lingkungan virtual tempat beberapa mesin virtual digunakan untuk pengujian/pengembangan dan penerapan aplikasi.

Infrastruktur desktop virtual (VDI) adalah kandidat lain yang sangat baik untuk deduplikasi karena data duplikat di antara desktop sangat tinggi.

Beberapa basis data relasional seperti Oracle dan SQL tidak terlalu diuntungkan dari deduplikasi, karena mereka sering memiliki kunci unik untuk setiap rekaman basis data, yang mencegah mesin deduplikasi mengidentifikasi mereka sebagai duplikat.

Keunggulan & Tantangan

blog-table-deduplication
Hemat biaya tanpa kompromi (AFA VS Hybrid)

Lihat tabel perbandingan di atas, metode deduplikasi dapat bervariasi dari vendor yang berbeda, tidak hanya menghemat ruang tetapi juga bekerja dengan SSD Cache untuk mempercepat kinerja adalah tren baru dan bisa menjadi keharusan di masa mendatang, yang sangat membantu ketika mencoba menghemat waktu saat mencadangkan atau mentransfer data bahkan ketika rasio deduplikasi tinggi. Plus, Desain Hybrid dengan menggunakan SSD Cache saat deduplikasi diaktifkan jauh lebih terjangkau daripada Desain All-Flash saat menggunakan deduplikasi di beberapa merek, membuat Anda mencapai kinerja tinggi dan latensi rendah dengan anggaran lebih rendah, dan menghemat banyak kapasitas penyimpanan melalui deduplikasi.

Namun, jika Anda membutuhkan IOPS acak tinggi dan latensi rendah, yaitu jika digunakan dalam pola IO penyimpanan, seperti sejumlah besar akses SQL atau lingkungan VDI, maka NVMe all-flash akan menjadi pilihan terbaik. Berusaha untuk tidak menggunakan Deduplikasi dalam skenario semacam ini, setiap desain produk memiliki tujuannya sendiri.

Kesimpulan

Desain deduplikasi dapat mengoptimalkan kinerja baca dengan kinerja tulis yang rendah dan juga memberikan keuntungan penghematan kapasitas menurut penelitian yang disebutkan di atas, memilih yang tepat yang paling sesuai dengan lingkungan Anda cukup penting sebelum Anda akan membeli satu penyimpanan dengan anggaran terbatas. Meskipun ukuran disk semakin besar saat ini, orang selalu ingin memaksimalkan penggunaan sumber daya. Ada teknik tambahan di pasaran untuk menghilangkan kekhawatiran tentang risiko selama proses pembangunan kembali RAID, seperti RAID2.0, Fast Rebuild, yang dapat sangat membantu Anda meminimalkan waktu pembangunan kembali saat disk berkapasitas lebih besar digunakan.

Leave a Comment

Your email address will not be published. Required fields are marked *

Scroll to Top