Anonim

Itu dimulai pada hari Sabtu malam dengan istri saya bertanya mengapa DVR kami tiba-tiba berhenti memainkan pertunjukan yang sedang ditontonnya. Saya katakan padanya itu mungkin hanya kesalahan, tapi saya akan melihatnya. Saya berjalan ke ruang keluarga untuk melihat, dan kesalahan pada dasarnya menyatakan bahwa disk yang mendasarinya tidak lagi tersedia. Tidak baik! Ini adalah awal dari kisah horor tiga hari saya …

Sedikit latar belakang

DVR saya sebenarnya hanya perangkat lunak khusus (SageTV untuk mereka yang penasaran) yang berjalan di PC. Perangkat lunak ini sangat fleksibel dan memungkinkan Anda memisahkan semua aspeknya. Saya memiliki mesin terpisah untuk kontrol terpusat, penjadwalan, dan perekaman, mesin terpisah untuk pemutaran, dan bintang kisah ini, mesin terpisah untuk penyimpanan. Untuk penyimpanan saya menggunakan server file Linux, menggunakan LVM (Logical Volume Manager) untuk menggabungkan banyak drive yang tidak identik dan terpisah menjadi satu drive logis besar (~ 6TB saat ini) yang dilihat oleh sistem operasi. Karena mencadangkan banyak TB data tidak praktis, dan karena data tersebut adalah "hanya" acara TV, filosofi cadangan saya untuk ini selalu tidak peduli. Sampai peristiwa baru-baru ini, filosofi ini belum diuji oleh peristiwa dunia nyata.

Mencoba Memulihkan Data

Setelah melihat kesalahan pada DVR, saya segera mulai melihat server penyimpanan. Sistem file sangat lamban dan lambat untuk merespons, jadi saya meminta LVM tentang keadaan drive fisik yang mendasari volume logisnya. Setelah lama tertunda, muncul dan mengatakan drive 750 GB hilang. Uh oh! Saya reboot server dan luar biasa, drive kembali. Saya mengeluarkan perintah pvmove untuk secara otomatis memigrasi semua data dari drive itu, tetapi gagal kurang dari 2% selesai.

Dihadapkan dengan drive yang sangat tidak kooperatif tentang membaca data, tetapi setidaknya muncul di BIOS, saya beralih ke alat pemulihan drive favorit saya, Spinrite. Meskipun Spinrite biasanya melakukan booting dari media yang dapat dilepas, bertahun-tahun lalu saya mengatur boot jaringan di rumah saya untuk berbagai utilitas sehingga saya tidak perlu khawatir melacak media apa pun. Biasanya saya hanya terhubung ke jaringan saya, pilih boot dari jaringan, dan saya memiliki berbagai alat yang saya miliki untuk memperbaiki banyak masalah. Masalahnya adalah mesin yang membuat semua pekerjaan ajaib ini adalah mesin yang sama yang saat ini sedang down. Bukan masalah besar saya katakan, saya hanya akan boot dari CD Spinrite. Kecuali beberapa tahun yang lalu drive optik pada server file saya menyerah hantu. Pada saat itu terjadi, saya memutuskan karena saya tidak pernah menggunakan media optik di mesin itu, saya tidak perlu menggantinya. Jangan khawatir, kataku pada diri sendiri, aku hanya akan mengambil drive optik dari komputer utama saya. Saya mematikan komputer utama saya dan mengeluarkan drive optik. Lalu saya mencari CD boot Spinrite saya. Tidak dapat menemukannya! Kami pindah ke rumah baru beberapa bulan yang lalu, jadi semuanya berantakan. Saya pikir saya hanya akan membakar salinan baru, tetapi saya bahkan tidak dapat menemukan media optik kosong! Ke paket selanjutnya, flash drive yang dapat di-boot! Setelah beberapa menit di Google untuk menyegarkan ingatan saya, saya memiliki flash drive Spinable yang dapat di-boot. Saya mem-boot kotak Linux saya dan meluncurkan Spinrite. Komputer macet dan sepertinya macet. Mencari cara untuk menghilangkan variabel, saya memindahkan bad drive dari dicolokkan ke kartu ekspansi PCI-e menjadi langsung dicolokkan ke motherboard. Sekarang Spinrite diluncurkan dengan baik, tetapi perlu waktu lama untuk menghitung drive yang terhubung dengannya. Saya mencabut secara sistematis semua drive lain kecuali yang buruk, tetapi tidak pernah menyelesaikan enumerasi drive tidak peduli berapa lama saya menunggu. Ke rencana selanjutnya! Saya mengeluarkan drive dari kotak Linux saya, menghubungkannya ke komputer utama saya, dan boot dari flash drive Spinrite baru saya yang mengkilap. Spinrite meluncurkan dan melihat drive segera, dan saya katakan untuk mulai memulihkan data, puas bahwa saya akhirnya membuat beberapa kemajuan. Saya kembali untuk memeriksanya setelah mungkin 10 menit, dan ada kesalahan pada layar, dan sepertinya drive sekali lagi menghilang. Frustrasi, saya mencoba beberapa kali lagi, dan memberi tahu Spinrite untuk memulai di berbagai bagian drive, tetapi mendapatkan hasil yang sama setiap kali. Sepertinya ini tidak akan membantuku.

Dengan harapan yang tidak masuk akal, saya memasukkan drive itu kembali ke dalam kotak Linux saya dan menyalakannya. Yang membuat saya takjub, drive muncul dan LVM membuat semuanya aktif. Lebih lanjut mencoba keberuntungan saya, saya mengeluarkan perintah pvmove lain untuk mencoba memindahkan data dari drive lagi. Sejak awal, saya melihat pesan kesalahan tentang tidak bisa membaca dari drive, tetapi luar biasa, pvmove terus membuat kemajuan, semakin dekat dan mendekati 100% selesai. Campuran kebingungan, kelegaan, dan kegembiraan menyapu saya. Apakah saya akan lolos dari ini tanpa cedera? Sedihnya, hal terakhir yang dilakukan LVM di balik selimut untuk menyelesaikan pvmove adalah menulis log yang diperbarui ke semua drive di bawah kendalinya. Ini tentu saja gagal ketika mencoba menulis ke drive yang buruk, dan dengan demikian membatalkan seluruh proses. Kekalahan disambar dari rahang kemenangan sekali lagi! Saya menyelam kembali ke Google, dan menemukan kemungkinan untuk mengontrol berapa banyak data yang dipindahkan oleh perintah pvmove alih-alih memindahkan SEMUA data dalam satu kesempatan. Saya bereksperimen dengan ini dan berhasil memindahkan sebagian kecil data saya sekaligus. Saya menjadi serakah dan drive menghilang beberapa kali, tetapi selalu kembali setelah siklus daya komputer. Dengan berteori bahwa mungkin hanya bagian tertentu dari drive yang buruk, saya mulai melompat-lompat alih-alih bekerja pada awal drive. Setelah beberapa iterasi ini, saya memiliki semua kecuali 40 GB dari 750 GB yang dipindahkan dengan aman dari drive. Untuk sisa 40 GB, gagal bergerak tidak peduli apa yang saya coba. Sekarang hari Minggu malam dan saya kelelahan, jadi saya memutuskan untuk pergi tidur dan mengatasi masalah ini lebih banyak keesokan harinya.

Keesokan harinya, setelah tidur dan setengah hari saya di tempat kerja, saya memutuskan untuk menggigit peluru karena saya tidak peduli dengan 40 GB acara TV yang direkam terakhir, dan mulai melepas drive dari konfigurasi LVM saya. . Saya sudah melakukan ini berkali-kali sebelumnya, jadi itu berjalan cukup lancar. Selanjutnya pada daftar pembersihan adalah memperbaiki lubang di tengah sistem file. Saya pikir dengan hanya 40 GB, bukannya 750 GB, tidak mungkin buruk, bukan? Salah! Setelah perbaikan, saya memiliki ruang kosong tambahan 900 GB dibandingkan sebelum dimulainya cobaan, sehingga menyengat sedikit. Oh well, aku berkata pada diriku sendiri, itu hanya TV saja. DVR saya akhirnya berfungsi kembali setelah hiatus tiga hari, dan akhirnya saya bisa berhenti memikirkan hal ini dengan setiap siklus otak cadangan.

Pelajaran yang Dipetik

Jadi apa yang saya pelajari dari semua ini? Saya seharusnya melakukan pekerjaan yang lebih baik dari apa yang sebenarnya penting. Ini terjadi beberapa minggu yang lalu, dan pada waktu itu saya bahkan belum melewatkan satu pun konten TV yang hilang. Namun, saya menyesal telah mencegah diri saya, tetapi yang lebih penting keluarga saya, karena tidak bisa menggunakan TV selama tiga hari, dan karena menempatkan diri saya dalam mode krisis stres tinggi selama tiga hari itu. Jika saya menyerah untuk memulihkan data saya di awal, fungsi akan dipulihkan dalam waktu sekitar satu jam, bukan tiga hari. Saya tahu betul bahwa sebagian besar waktu data kami sangat berharga, tetapi dalam situasi ini tidak.

Kedua, jika data Anda benar-benar berharga, dan 99% dari waktu sebenarnya, Anda perlu melindunginya! Cadangkan data Anda, tidak ada alasan. Untuk data saya yang tidak tergantikan, seperti ribuan gambar anak saya yang saya miliki di komputer saya, saya pastikan untuk mencadangkannya di tidak kurang dari tiga tempat, salah satunya adalah penyedia cadangan cloud. Mengenai penyimpanan DVR, saya masih berpikir itu tidak praktis untuk mendukungnya ke cloud, tetapi dengan harga drive hari ini, saya tidak punya alasan untuk tidak dilindungi oleh RAID, dan itulah yang saya lakukan. akan melakukan. Ketika saya pertama kali menyiapkan kluster penyimpanan saya bertahun-tahun yang lalu, saya pikir butuh 10 drive atau lebih untuk mencapai kumpulan TB ganda. Saya baru saja memeriksa harganya, dan Anda dapat membeli drive 3 TB sekarang dengan harga di bawah $ 100. Saya tidak punya alasan untuk membiarkan data saya tidak terlindungi, dan jika kehilangan data seperti ini terjadi pada saya lagi, itu benar-benar kesalahan saya sendiri.

Kisah kesedihan, frustrasi, dan kehilangan data