|
この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。
出典を追加して記事の信頼性向上にご協力ください。(2013年3月) |
|
「Backup」はこの項目へ転送されています。Mac OS X用のソフトウェアについては「Backup (ソフトウェア)」をご覧ください。 |
|
フジテレビ系列でかつて放送されていた深夜のバラエティ番組については「BACK-UP!」を、野球におけるバックアッププレイについては「ベースカバー」をご覧ください。 |
バックアップ (backup) とは、支援や予備のことであり、このうち情報工学におけるデータやシステムのバックアップとは、これらの複製(コピー)を作成し、たとえ問題が起きてもデータを復旧できるように備えておくこと。
本項目では、データやシステムの複製技術とその目的について解説する。
目次
- 1 システム保全
- 2 データ保全
- 2.1 リスクの分類と対処法
- 2.2 バックアップ対象
- 2.3 バックアップの種類
- 2.3.1 フルバックアップの特徴
- 2.3.2 差分バックアップの特徴
- 2.3.3 増分バックアップの特徴
- 2.4 バックアップの運用
- 2.4.1 範囲
- 2.4.2 頻度
- 2.4.3 保存期間
- 2.4.4 保管場所
- 2.5 バックアップメディアの種類
- 3 脚注
- 4 関連項目
システム保全
システムのうち、一部分が故障などで機能しなくなっても利用可能な状態で稼働している(すなわち可用性の確保)ために、そのシステムの重要性に応じてバックアップ構成がとられる(リスクマネジメントを行い、システム停止の頻度(可能性)と損害を洗い出し、かけられるコストを勘案して設計・運用される)。
リスクの分類と対処法
- 装置故障 - ハードウエア部品の劣化、電源障害(瞬停など)による故障、作業ミスによる破損など
- クラスタ(フェイルオーバークラスタ)構成、サーバ内の部品の冗長構成、スタンバイ(ホットスタンバイまたはコールドスタンバイ)構成を行う
- 電源供給不足 - 停電による稼働不可能状態
- サイト(地点)の機能不全 - 大規模災害、パンデミックによるオペレータ不在、紛争、特定サイトを狙ったDoS攻撃など
データ保全
データ紛失・破損のリスクは常に存在し、データ保全のためにバックアップ処理は必要不可欠な行為である。コンピュータで扱われるデータが貴重なものであるほど、高コストとなっても十分な対策を取る必要が発生する。
リスクの分類と対処法
データ紛失のリスクとしては大きく分けると以下のものがある。
- データの論理的な破壊 - ユーザのミス、データソース自体の誤り、ソフトウェアのバグ、ウイルス感染やクラッキングなどの第三者による意図的な改ざんなど
- 媒体の物理的破壊や紛失など - ハードウェアの故障(停電を含む)や、自然災害(火災、落雷、地震など)
これらのリスク分析をし、それぞれの要因に対して必要かつ十分なデータ保全対策を取ることが重要である。
- 論理的な破壊に対しては、バックアップを数世代分に渡り取得し、時間的に遡ることが出来るようにする対策が必要。可能な限り意図的な改ざんに耐え、破壊される直前に戻れることが望ましい。データの重要度や更新頻度にあわせてバックアップを取得する期間を決定することが必要になる。
- 物理的な破壊に対しては、別の場所に保存したり、別のメディアに保存したりする対策が必要。バックアップ先が同じ理由で使えなくなることを避けるには、可能な限り離れた場所、可能な限り別のしくみのメディアを使うことが望ましい。
一般的にバックアップには論理的にも物理的にも保護を望める方法を使うが、方法によっては「論理的破壊」または「物理的破壊」の一方のみに対しての対策にしかならない方法もあり、それ単体だけでは充分な対策にはならない。例をあげると以下のようなものがある。
- 同一ドライブ内にバックアップする。操作ミスなどの論理的な破壊に対しての対処としてのみ有効、操作ミスは最大の障害理由なのでとても有用だが、そのドライブが壊れてしまった場合にはまったくの無力である。
- 別のストレージに即座に反映する。物理的な破壊に対しては最良の手段、停止できないサービスを提供する場合は必須だが、操作ミスによる誤ったデータやコンピュータウイルスによる破壊状態なども即座に反映されてしまう。RAID などのミラーリングサービスがこれに該当する。
以上のような方法は、特定の目的の場合選択されるが、他の方法も組み合わせて使う必要があるといえる。
一般的な対策の例としてはコストに応じ、以下のものがある。
- オフラインメディアの遠隔地退避
- リムーバブルメディアにバックアップを取り、別の場所に保管することにより、場所的なリスク(自然災害や犯罪など)や、オンラインにあるリスク(データの論理的な破壊など)を軽減する。なお、東日本大震災のような大規模災害に対処するために、別地域に保管する遠隔地での保管が重要視される傾向にある。
- 多重バックアップ
- 重要度とコストに応じて、2重・3重に多重バックアップ(バックアップのバックアップ)を取る。例として、1次バックアップにはハードディスクドライブなどの高速なメディアを使い、2次バックアップにはDVDや磁気テープなどの比較低速・小容量のメディアを使う。これにより、複数の異なったメディアのおのおのの特色をデータ保全に活かすことができる。
- ネットワークを通した遠隔地バックアップ
- オンラインストレージやデータセンターなどにバックアップを取る(もしくは、データセンター自体を通常使用のストレージとし、またそこから他にバックアップを取る)
- 世代バックアップ
- 誤ったデータがバックアップに反映されてもとの正しいデータがなくなってしまわぬよう、バックアップの数回前までのデータを保持しておく。その分バックアップに必要な容量は増える。
RAID は、データを複数のハードディスクドライブへ分散記録させ、物理面での耐障害性を向上させる(RAID0は、唯一耐障害性を担保しない)。即時にデータ分散されるため他の多くのバックアップ構成のような時間的乖離がなく、ハードディスク単体の物理的な破壊からデータを守れ、担保範囲内の破損であれば使用不要となる時間はゼロである点で、企業用サーバなどには頻繁に利用されている。ただし、論理的なデータ破壊や複数のディスクが同じサーバ装置に格納されている(たとえば電気系統が同じなので、電源障害があれば等しく故障のきっかけを受ける)点などに鑑みれば RAID だけではバックアップとしては不足であり、殆どの場合において他のバックアップ構成も併用される。
バックアップは通常、バックアップした時点において最新なだけのデータしか復旧できないため、定期的にバックアップを取る必要がある。
バックアップ対象
バックアップする対象は、ファイルやフォルダ単位の場合と、ディスクやパーティション単位のイメージバックアップの場合がある。それぞれの特徴は
- ファイルバックアップ
以下の要因で、次に述べるイメージバックアップに比して「バックアップは速いがリカバリ(復旧)は遅い」という傾向がある。
- ファイルシステムを経由してバックアップを行う。すなわちバックアップ対象はファイルやフォルダである。
- ファイルシステムが持つタイムスタンプを利用できるため、増分バックアップや差分バックアップを実現しやすい。
- 復旧作業にあたっては復元先にファイルシステムが構築(ないしは先に復旧)されている必要があるため、復旧完了までに手順を要することが多い。
- イメージバックアップ
以下の要因で、先に述べたファイルバックアップに比して「バックアップは遅いがリカバリ(復旧)は速い」という傾向がある。
- ハードディスクのパーティションを(ファイルシステムを用いずに)記録データそのままをバックアップする。一般にnullデータを読み飛ばすことは出来ず、全域全量をバックアップする。
- 過去のバックアップデータ全量が比較対象となるため、増分バックアップや差分バックアップを実現しにくい(或いは処理時間(すなわちバックアップ所要時間)を要する)。
- 復旧時にはパーティション全体をリストアするので、ファイルバックアップと比較して復旧作業に手順が掛からない。
定期的にバックアップする方法の他に、デフォルトの設定を保存しておく方法もある。
バックアップの種類
バックアップには大まかに、以下の3種類に区分できる。
- フルバックアップ
- 必要なデータ全てを一度にまとめて一括に複製
- 差分バックアップ
- 前回のフルバックアップ時からの変更/追加されたデータのみを複製
- 増分バックアップ
- 前回のフルバックアップ、差分バックアップ、もしくは増分バックアップ時からの変更/追加されたデータのみを複製
さらに、データベースなどではトランザクションファイルを利用したトランザクションバックアップがある。
この他、必要データに対し内容に変化(更新・追加・削除・消去)が生じる都度、補助記憶装置の内容に対しても自動的に同じ動作を完全にとらせる(逐次、リアルタイムに内容の同期をとらせることで、フルバックアップと同じ成果を持たせられる)ミラーリングという技法もある。復旧を必要とした時点で、既に全ての必要データが保管されている状態なので、すぐに復旧作業に入れる(物理的事故の場合。データ内容自体の不備が原因である論理的事故の場合、ミラーリング先の内容も同じ問題を抱えているので、この場合は当てはまらない)ばかりでなく、普段のバックアップ作業・動作時間を事実上必要としない点が、フルバックアップに比べ優れている。ただしミラーリングは最大の障害要因である操作ミスやウィルスやクラックなどによる論理的な破壊からデータを守ることはできない。
別の基準から区分すると、各個人または組織のデータを複製するデータバックアップと、データをシステムを復旧させるためのイメージバックアップとがある。
これらのうち最初の3種類の特徴を以下に挙げる。
フルバックアップの特徴
- 毎回すべてのデータを複製しなければならないためバックアップに時間がかかる
- 複製したすべてのデータが一ケ所にまとまっているので、復旧時にデータを探し回る必要がない。
- バックアップ先に充分な空きがないと行えない。
差分バックアップの特徴
詳細は「差分バックアップ」を参照
- 一回はフルバックアップを行っておかないと差分が取れない
- 最後のフルバックアップ以降に変更/追加された分をすべて複製するだけなのでバックアップにかかる時間は短い
- ツールを使わない場合は自分で変更/追加したデータを把握しなければならない
- 復旧は、最後に行なわれたフルバックアップと、最後に行なわれた差分バックアップが必要になる
増分バックアップの特徴
詳細は「増分バックアップ」を参照
- 一回はフルバックアップを行っておかないと増分が取れない
- 最後のバックアップ以降に変更/追加されたデータだけ複製するだけなのでバックアップにかかる時間は極めて短い
- ツールを使わない場合は自分で変更/追加したデータを把握しなければならない
- 復旧は、最後に行なわれたフルバックアップと、(もしあれば)最後に行なわれた差分バックアップと、それ以降のすべての増分バックアップが必要になる
- 一度フルバックアップを行っておけば、以降は前回のバックアップから変更/追加したデータだけを複製しておけば良いため、小さなデータならちょっとした場所に保存できる
- フルジャーナル・ファイルシステムとの併用で差分バックアップのメリットでフルバックアップイメージを取得できるバックアップ方式も存在する。(例 ネットアップ社のスナップショット技術)
バックアップの運用
一般的に、システムの規模や用途により、適切な範囲と頻度でバックアップの運用がなされる。どの範囲のデータをどのくらいの頻度でバックアップし、どのくらいの時間破棄しないで保存しておくかといこうとを、システムやデータの重要度、運用や維持のコスト、その他の要因から総合的に判断してバックアップの計画が立てられ、運用される。この計画には、バックアップの種類(フル・バックアップ、差分/増分バックアップなど)も含まれる。また、バックアップの範囲や種類によっては、システムを停止しなければならないこともあり、そのような事情も計画に含まれる。
範囲
どのデータをバックアップするかということ。たとえば、データベースのデータをバックアップするとか、各ユーザのホーム・ディレクトリをバックアップするとかということ。
頻度
日次(毎日決まった時間帯)でバックアップを行うか、週次(毎週決まった日)で行うか、月次(毎月決まった日)あるいは年次(毎年決まった日)で行うかということ。
保存期間
バックアップをどのくらいの期間破棄しないで保存しておくかということ。データの種類によっては、法律により保存しておかなければならない、最低の期間が定められていることもある。
保管場所
バックアップを記録したメディアが簡単に紛失するようでは意味がないばかりでなく、紛失したメディアに保存された情報が外部に漏洩したり悪用されたりする危険がある。このため、バックアップが記録されたメディアは、所定の場所に保管し管理することが通常である。保管場所には、データが重要であるほど、施錠や認証など一定のセキュリティが施され、バックアップ・メディアを取り扱うことができる人物を限定するなどの対策が重要になる。バックアップ・メディアの保管用の部屋を用意したり、地理的に離れた別の建物に保管したり、信頼できる外部の業者に保管を委託するなど、バックアップの重要性やコストにより適切な保管場所を用意することが重要である。これらの措置は、バックアップの運用だけでなく、セキュリティの方針にも関係する。
バックアップメディアの種類
- フロッピーディスク - 容量:約1MB強
- かつては主に使われていた記録メディア。安価だが今となっては非常に小容量であるうえ、読み込み速度が遅いため、細々としたファイル単位でのバックアップ程度にしか使われない。また磁気や埃、汚れにも弱い。
- 大容量磁気ディスク - 容量:約100MB〜数GB
- 100MB以上の容量を持つ大容量リムーバブルメディア。ZipやJazなどがこれにあたる。書き込み速度では光ディスクより圧倒的に速いため、米国では一時期かなり普及したが、現在では容量や経済性で優れる光ディスクに取って代わられている。フロッピーディスクと同様に磁気や埃、汚れに弱い。
- 磁気テープ(コンピュータ用) - 容量:約数十GB〜数TB
- 大規模なサーバや汎用機で伝統的に使用されているメディア。ストリーマとも言い、大規模なものではテープメディアを自動交換する装置(オートローダ)もある。ランダムアクセスができないため、細かいデータのバックアップには向かないが、容量が大きいのでシステム全体のバックアップに向く。一方で、テンション調整(たるみ除去)、帯磁、消磁、定期クリーニングなど、メンテナンスが面倒。また、容量に対して安価であるが、記録装置(テープドライブ)の方は非常に高価であるため個人向けとは言いがたい。
- カセットテープ
- フロッピーディスクが標準化される以前は、データレコーダ(もしくはテープレコーダー)を用いて、データをデータ音に変調してオーディオ用カセットテープに保存する手段が個人向けとして使われていた。
- 光ディスク - 容量:約640MB〜128GB
- 現在よく使われているのはCD規格やDVD規格、BD規格による記録メディア、あるいはこれと互換性を有する規格によるメディアである。記録用メディアにはライトワンス(一度だけ書き込み可能、消去不可)とリライタブル(書き換え可能)の2種類があり、状況によって使い分ける。光ディスクの種類によっては熱や湿気、紫外線に弱い場合がある。業務用には自動クリーニング機能を搭載したメンテナンスフリーな装置もある。
- フラッシュメモリ - 容量:約数十MB〜数GB
- 小型で持ち運びに便利。現在USB接続タイプが主流。近年はFlash SSDも普及しつつあるが、その性質上長期のバックアップ用に使用されることはほとんどない。
- 光磁気ディスク(MO) - 容量:約100MB〜数GB
- 日本では一時期普及していた記録メディア。現在は光ディスク、フラッシュメモリーにほとんど取って代わられているが、それらよりもはるかに優れる信頼性・長期保管性から現在でも使用されることがある。
- ハードディスクドライブ - 容量:約数十GB〜数TB
- 厳密には記録メディア(媒体)ではなく、メディアと一体化した記録ユニット(装置)である。コンピューターの通常の補助記憶装置として利用されており、大容量で高速にバックアップが取れる。一方でもともとが内蔵部品用途でもあり磁気や衝撃に弱い[1]。前述のとおりメディア部分と記録装置部分とで構成されており、いずれかの故障によりデータを損失する可能性があるため、ハードウェア障害に弱い記録媒体と言える。また、ハードディスクの構造上[2]、修理には高度な設備と技術及び多大なコストが必要となる。
脚注
- ^ 外付けハードディスクは、丈夫なカバーを設けたり、衝撃があると磁気ヘッドをリキャリブレートさせる仕組みをもつなどにより弱点を補い、通常可搬性に考慮されている。
- ^ ハードディスクの内部は埃を非常に嫌う。
関連項目
- 冗長化
- レプリケーション
- ミラーリング、ファイル同期
- アーカイブ (コンピュータ)
- rsync
- セーブ (コンピュータ)