予想外の出来事は起きてほしくない時に起こるものです。PC立ち上げたら挙動が明らかに変で起動しない、共有サーバで保存していた資料が誰かの編集と競合したせいでデグレしてしまっている、間違ってファイル自体を消してしまった・・・などなど、いろいろあるかと思います。そうした時に備えておくためには、バックアップのデータとそれを適用できるリストア方法がしっかり定義されている事ですね。
各論にはなりますが、システム開発要求側でもバックアップについてはこうあるべき論は持っておくべきだと思い、調査してみました。
WEB+DB PRESS VOL47に、小規模・中規模におけるバックアップ要件の記事がありました。紹介されているツール類は古いですが、そもそも検討すべき上で必要な項目が参考になります。
■備忘メモ
バックアップの目的
突発故障や誤操作によるデータ削除やウイルスによるデータ汚染など、異常事態となってしまった際に、素早く正常時だった時点のデータに戻すため。
考慮すべき要素
・バックアップの取り方
許容時間(保存や復旧時間)や対象の容量から保存する媒体選択
・リストア機能
どの世代から戻せるかなど
・バックアップデータの扱い
どの程度圧縮できるのか、どの暗号化をかけるか。
・古いデータの管理指針
いつまでのデータを残しておくのか。※無限にデータ量増えるので
・ネットワークと認証
どの程度の帯域か、FTP/SSH使うのか、認証つかうのかなど
・運用や操作方法
どのような操作をすれば正常に戻せるのか手順や体制の検討
主な方式
それぞれ一長一短有
・フルバックアップ方式:バックアップ時間は長い、リストア時間は短い。
→対象データ全てを保存、リストアは1回
・差分バックアップ方式:バックアップ時間は中、リストア時間も中
→前回のフルバックアップとの差分を保存
リストアは2回(フルバックアップ適用してから差分バックアップ適用)
・増分バックアップ方式:バックアップ時間は短い、リストア時間は長い。
→前回のバックアップとの差分を保存
リストアは2回以上(フルバックアップ適用から順々に増分バックアップ適用)
参考(ツール比較表)
注目すべきは縦軸ですね。この機能が必要だから選定項目になっているので。
ツール名自体は古いので、あくまで参考に。
追加調査(オンプレvsクラウド)
今のご時世、データ保存先としてクラウドは有力候補だと思ったので頭の整理をしてみました。結論は、データの重要度ごとに分けるべきですかね。
絶対に消えてはならないデータならば、クラウド
多少のダメージで済む、処理自体の高速性を重視なら、オンプレ
●クラウドの特徴
非常に高いデータの保存性
外部との接続が必要(通信遅延が懸念、セキュリティも担保されてはいますが)
●オンプレの特徴
故障時のデータの保存性クラウドに勝つのは相当シビア※おそらく劣る
データ保管は自社に閉じる事ができる(通信遅延が少なく、セキュリティも安心)
まとめ
具体的な検討になればバックアップも、プロのベンダ側に任せる部分が多くなると思います。ただ、そんな時に全てお任せという訳でなく、上記の基本的な考え方や長短は認識したうえで、検討を進めていきたいと思います。
また、あくまでデータ保存には頭回っても、それを「復旧」させないと意味がないので、「運用方法:ドキュメント/トレーニング等」も考慮が必要ですね。基本的に出番が異常時なので、あまり手順に慣れておらず、いざ本番時にバックアップデータを削除してしまいましたというところもありえなくはないかなと思いますので・・・
※バックアップがうまくいってなく、サービス終了したソシャゲもありますしね。