SERANGAN

Cadangan vs RAID

Cadangan vs RAID
Cadangan adalah bagian penting dari kehidupan digital kita. Setiap komputer dari database raksasa hingga satu komputer pribadi atau perangkat seluler memerlukan cadangan. Tempat di mana data pengguna yang paling relevan dapat disimpan untuk waktu yang lama dan juga disimpan sedemikian rupa sehingga dapat dipulihkan pada saat dibutuhkan. Kita dapat membedakan antara data pada sistem yang sedang berjalan, sebut saja data langsung, dan dicadangkan data. Yang terakhir disimpan jauh dari sistem saat ini yang menggunakan data langsung.

RAID, berkaitan dengan data langsung, ini adalah mekanisme di mana sistem yang berjalan menggabungkan beberapa disk menjadi satu entitas penyimpanan storage. Data kemudian tersebar di semua disk sedemikian rupa sehingga dapat bertahan dari kegagalan setidaknya satu (atau lebih) disk fisik. Jenis array RAID yang paling sederhana adalah RAID1, atau mirroring. Di sinilah Anda menyalin (atau mencerminkan) data yang sama di dua atau lebih disk sehingga jika salah satu disk gagal, data masih dapat bertahan dan masih digunakan secara aktif. Ada juga konfigurasi RAID lainnya, dan kami akan membahasnya seiring berjalannya waktu.

Tentang RAID

RAID, atau Redundant Array of Inexpensive Disks, adalah mekanisme untuk menyimpan data di seluruh disk. Ada banyak "array" pengaturan RAID yang dapat Anda gunakan, tetapi dua mekanisme dasar yang menjadi dasarnya adalah sebagai berikut:

1. Pencerminan:

Pencerminan menyiratkan bahwa blok data Anda disalin, dicerminkan, di beberapa disk. Jika Anda mencerminkan data Anda di tiga disk, Anda dapat bertahan hingga dua disk gagal pada waktu tertentu, disk yang gagal kemudian dapat diganti dengan yang baru tanpa banyak kesulitan. Demikian pula, jika Anda menyalin data di seluruh n+1 disk, Anda dapat bertahan hingga tidak disk gagal. Kelemahan dari ini adalah Anda hanya mendapatkan kapasitas penyimpanan yang sama dengan disk terkecil dalam array RAID Anda.

2. Keseimbangan:

Pendekatan kedua adalah membagi data Anda menjadi dua bagian, dengan menggunakan dua blok data pengguna Anda dapat membuat blok 'paritas' ketiga. Ketiga blok memiliki ukuran yang sama dan tersebar di berbagai perangkat. Diperlukan minimal tiga perangkat agar konfigurasi ini berfungsi. Jika salah satu disk gagal, Anda dapat membuat ulang blok yang disimpan di disk tersebut menggunakan dua blok lainnya. Misalnya, jika blok pengguna kedua hilang, blok pertama dan blok paritas dapat digunakan untuk menghitung blok pengguna kedua. Jika Anda tertarik dengan cara kerjanya, lihat penjelasan yang luar biasa ini.

Metode ini dapat ditingkatkan lebih lanjut untuk memiliki 2 atau bahkan 3 blok paritas. Tetapi lebih dari 3 blok paritas tidak sering terlihat di industri. Jika Anda memiliki satu blok paritas, Anda dapat bertahan dari satu kegagalan disk. Dua blok paritas berarti Anda dapat menahan dua disk yang gagal dan seterusnya.

Ini lebih efisien dalam hal pemanfaatan penyimpanan, daripada mirroring. Jika Anda memiliki satu blok paritas, Anda hanya memerlukan penyimpanan fisik 50% lebih banyak per data pengguna aktual yang Anda simpan. Ini berarti untuk menyimpan 1GB data, Anda memerlukan 1.5GB penyimpanan (ditambah ada sedikit overhead untuk metadata). Ini jauh lebih efisien daripada skema mirroring paling efisien di mana Anda memerlukan setidaknya 2GB penyimpanan untuk mencerminkan 1GB data antara dua disk.

Kelemahannya adalah bahwa operasi penulisan acak akan diperlambat, berkat sedikit tambahan perhitungan dan operasi tulis yang terkait dengan blok paritas. Keandalannya juga tidak sebagus n+1 disk cermin tempat Anda dapat mempersiapkan sejumlah disk yang gagal prepare.

Konfigurasi RAID dapat serumit atau sesederhana yang Anda inginkan, Anda dapat menggabungkan strategi paritas dan pencerminan dan memodifikasinya sesuai keinginan perusahaan Anda. Ada pengontrol RAID khusus tempat Anda menghubungkan disk fisik Anda, dan OS kemudian melihat satu disk logis seperti yang ditunjukkan oleh pengontrol. LSI adalah salah satu vendor pengontrol RAID. Anda juga dapat melakukan RAID dalam perangkat lunak OpenZFS mungkin merupakan taruhan terbaik yang Anda miliki dalam hal itu.

Salah satu jenis RAID terakhir, yang mendapat sebutan terhormat adalah RAID 0. Secara teknis, ini bukan skema RAID, karena tidak ada Redundansi yang terlibat di sini. Ide di balik RAID 0 adalah untuk menyebarkan data Anda ke beberapa perangkat penyimpanan tanpa apa saja ketahanan terhadap kegagalan disk. Keuntungannya adalah Anda mendapatkan peningkatan kinerja dengan melakukan ini. Jika Anda menulis data 1GB ke satu disk, prosesnya lambat. Disk hanya dapat melakukan sejumlah operasi tulis per detik dan OS Anda harus menunggu untuk menyelesaikan operasi itu sebelum data baru dikirim. Jika Anda menyebarkan data 1GB yang sama di dua disk tersebut, Anda dapat menulis (dan membaca) dari keduanya secara bersamaan dan mendapatkan sedikit peningkatan kinerja.

Cadangan

Konsep pencadangan dapat diperdebatkan lebih penting daripada RAID. Cadangan, dalam konteks manajemen penyimpanan, adalah salinan data yang diketahui baik, dari titik waktu tertentu, dari mana Anda dapat memulihkan file kembali ke sistem utama Anda bila diperlukan. Dalam hal implementasi, ada banyak solusi yang dihosting di cloud dan banyak juga solusi offline yang dapat digunakan.

Tarsnap dan Backblaze adalah layanan pencadangan terkelola favorit saya untuk kasus penggunaan pribadi dan bisnis. Anda juga dapat menyertakan Google Drive, iCloud, atau Dropbox dalam definisi a cadangan solusi tetapi mereka lebih ditargetkan ke pasar konsumen daripada perusahaan. Namun, prinsip dasarnya masih sama. Saat Anda masuk ke iPhone atau iPad baru, semua data, kontak, foto, perpustakaan media, dll., disinkronkan dari akun iCloud Anda dengan mulus dan saat Anda terus menggunakan perangkat, data yang lebih baru secara diam-diam dicadangkan ke Cloud dan Anda tidak tidak perlu khawatir tentang itu.

Solusi pencadangan Anda dapat sesederhana menyalin data ke hard disk eksternal atau menggunakan rsync (atau zfs send, jika Anda menggunakan OpenZFS) untuk membuat salinan semua informasi yang relevan secara berkala. Ini bisa termasuk folder Dokumen Anda, database Anda, repositori sumber Anda atau bahkan seluruh sistem file root Anda menjadi zip datar atau tarball. Kriteria penting yang harus dipenuhi oleh solusi pencadangan yang baik adalah sebagai berikut:

  1. Pencadangan harus sering dilakukan - Jika Anda mencadangkan data setiap bulan, bukan setiap minggu, Anda berisiko kehilangan data hingga satu bulan saat terjadi bencana.
  2. Cadangan Anda harus kembali ke masa lalu - Penyimpanan cadangan terbatas. Terkadang Anda harus membuang cadangan lama. Semakin banyak penyimpanan yang Anda miliki, semakin baik cadangan Anda. Misalkan Anda mencadangkan data Anda setiap minggu, tetapi membuang cadangan yang lebih lama dari 2 minggu. Jika file terhapus secara tidak sengaja, dan ini tidak diketahui selama dua minggu, Anda tidak akan memiliki cara untuk mengembalikannya.
  3. File Anda seharusnya dapat dipulihkan - Jika Anda belum pernah mencoba memulihkan data dari cadangan, Anda tidak memiliki cadangan. Anda tidak perlu mempelajari cara memulihkan data, pada saat kritis ketika Anda mengalami kehilangan data. Rencanakan ke depan dan ketahui cara memulihkan sistem dari cadangan bagus terakhir yang diketahui.
  4. Cadangan Anda harus dipisahkan dari sistem yang sedang berjalan - Saat terjadi bencana, dan semua file Anda di server produksi dienkripsi, dihapus, atau rusak, Anda perlu memastikan bahwa hal yang sama tidak terjadi pada cadangan Anda. Salah satu cara yang baik untuk memastikan hal ini adalah memastikan perangkat cadangan Anda tidak 'terhubung' ke lingkungan produksi Anda, yaitu.e, cabut hard disk USB Anda, lepaskan sistem file NFS Anda setelah Anda selesai mencadangkannya. Setidaknya, jangan berikan hak istimewa kepada sistem produksi untuk menimpa atau mengubah data cadangan Anda. Jadikan hanya baca.

Sekarang setelah kita mengetahui sedikit tentang RAID dan pencadangan, mari kita soroti beberapa perbedaan di antara keduanya.

File dan Blok

RAID selalu berkaitan dengan blok data, bukan bagaimana sistem file menyajikan data itu kepada pengguna. Baik perangkat lunak dan perangkat keras RAID menangani data sebagai blok informasi, ukuran blok dapat bervariasi dari 128 KiB hingga 1 MiB.

Cadangan di sisi lain jauh lebih fleksibel. Mereka biasanya dilakukan pada tingkat sistem file, meskipun tidak ada aturan keras dan cepat untuk hal ini. Mereka juga lebih granular. Anda dapat memulihkan satu file dari cadangan Anda, jika solusi Anda cukup fleksibel. Array RAID bukan cadangan, melainkan hanya cara untuk menyebarkan data ke beberapa disk. Jika file dihapus, semua blok cermin dan blok paritasnya dibebaskan. Akhir dari cerita.

Gunakan Kasus

Cadangan adalah untuk semua orang. Pendekatan dan jangkauannya dapat bervariasi dari kasus penggunaan pribadi ke perusahaan, tetapi setiap orang dengan kehidupan digital membutuhkan cadangan. RAID lebih merupakan fitur khusus bisnis/perusahaan. Anda melihat array RAID di server, perangkat penyimpanan seperti NAS dan SAN, hypervisor cloud, dll. Hampir semua tempat yang menyimpan data penting langsung menggunakan beberapa bentuk RAID. Bahkan server yang menjalankan pencadangan yang dihosting cloud Anda mungkin menggunakan array RAID. Ini bukan teknologi yang saling eksklusif.

Ini tidak berarti Anda tidak dapat menggunakan RAID untuk kasus penggunaan pribadi Anda, ini hanya memiliki lebih banyak utilitas di perusahaan. Sebagian alasan di balik ini adalah bahwa di perusahaan, disk ditumbuk dengan operasi IO 24/7. Dalam lingkungan produksi, seperti penyimpanan database atau layanan streaming video atau cloud hypervisor, perangkat penyimpanan server Anda akan terus-menerus mengalami beban mengerikan, data terus-menerus dibaca dan ditulis ke perangkat ini dan sering kali oleh beberapa aplikasi secara bersamaan. Dalam kondisi ini, drive Anda kemungkinan besar akan gagal. Memiliki konfigurasi RAID berarti jika drive gagal, Anda mengalami sedikit atau tidak ada waktu henti. Sebagian besar server dapat terus beroperasi bahkan setelah kegagalan disk sehingga Anda tidak kehilangan informasi dan permintaan baru yang datang setiap detik.

Komputer desktop rata-rata hampir tidak dapat menciptakan kembali kondisi stres yang sama, bahkan jika disk mati, jika Anda menggunakan solusi cadangan seperti Backblaze, Anda dapat mengambil sebagian besar data Anda yang hilang dan kehilangan pekerjaan selama beberapa jam mungkin adalah hal terburuk yang bisa terjadi. Bahkan ini menjadi langka berkat solusi yang dihosting cloud seperti Adobe Creative Cloud, Office 365, dll.

RAID bukan pengganti Cadangan

Jika ada satu hal yang Anda inginkan dari artikel ini, seharusnya ini. RAID BUKAN pengganti Cadangan. Selalu cadangkan data Anda! Ada banyak orang di luar sana yang berpikir jika Anda memiliki RAID, itu berarti data aman di beberapa disk sehingga tidak perlu mencadangkannya. Tidak ada yang lebih jauh dari kebenaran. RAID dimaksudkan untuk menangani satu masalah spesifik - disk gagal atau mengembalikan data yang salah. Memiliki RAID tidak akan melindungi Anda dari sejuta ancaman lain seperti berikut:

  1. Kesalahan pengguna dan penghapusan tidak disengaja
  2. Bug aplikasi atau OS yang menyebabkan kerusakan data yang meluas
  3. Ransomware atau malware lain yang mengenkripsi, menghapus, atau merusak data Anda
  4. Kegagalan pengontrol RAID itu sendiri

Data pada array RAID Anda aktif is. Jika OS, aplikasi (atau pengguna) rusak dan menghapus beberapa file di sana-sini maka file tersebut akan dihapus di seluruh array RAID Anda. Memiliki salinan terpisah dari data Anda, cadangan, adalah satu-satunya cara Anda dapat melindungi diri dari skenario semacam ini.

Kesimpulan

Jika Anda khawatir tentang data Anda, perhatian pertama Anda harus menjadi solusi cadangan. Sebagian besar pengguna desktop, kecuali mungkin pengguna yang kuat, harus berinvestasi lebih banyak ke dalam cadangan yang andal daripada mengutak-atik RAID1, RAID5, atau RAIDZ. Jika Anda ingin membangun server cadangan Anda sendiri, Anda perlu memikirkan kebijakan pencadangan yang layak dan backend penyimpanan yang andal. Artikel ini mungkin tempat yang baik untuk memulai. Anda dapat menggunakan rsync atau zfs send untuk mengambil salinan periode data Anda ke backend ini.

Jika Anda berada di perusahaan, dan sedang mempertimbangkan solusi RAID untuk menyimpan semua data langsung Anda. Pertimbangkan untuk menggunakan OpenZFS, ia menawarkan solusi yang sangat fleksibel, mulai dari mirroring n-disk hingga RAIDZ1 dengan satu blok paritas hingga RAIDZ2 dan RAIDZ3 dengan 2 dan 3 blok paritas. Anda perlu mempertimbangkan banyak hal tentang persyaratan aplikasi Anda sebelum membuat keputusan. Ada trade-off antara kinerja baca-tulis, ketahanan, dan efisiensi penyimpanan Anda. Namun, saya sarankan Anda hanya memikirkan RAID setelah Anda memutuskan solusi cadangan.

OpenTTD vs Simutrans
Membuat simulasi transportasi Anda sendiri bisa menyenangkan, santai, dan sangat menarik. Itulah mengapa Anda perlu memastikan bahwa Anda mencoba game...
Tutorial OpenTTD
OpenTTD adalah salah satu game simulasi bisnis paling populer di luar sana. Dalam game ini, Anda perlu membuat bisnis transportasi yang luar biasa. Na...
SuperTuxKart untuk Linux
SuperTuxKart adalah judul hebat yang dirancang untuk memberi Anda pengalaman Mario Kart gratis di sistem Linux Anda. Ini cukup menantang dan menyenang...