ブログのバックアップをどこに保存しよう。

WEBサイトを運用しているとサイトのバックアップを取っておくのがふつうです。

でも、結構、このバックアップ先はサイトの容量が増えてくると場所に困ります。

多くのパターンとしては、
1)サイトからコンテンツをUSBのディスクやメモリカードに入れておく。
2)サイトからパソコンのハードディスクやDVDに保存しておく。
3)どこかのクラウド領域に保存しておく。
4)いつもミラーサイトを作成しておく。
5)面倒なので同じサーバ内にバックアップしておく。
6)サイトの運用は面倒だからホスティングでバックアップをオプションにつける。
7)もしデータがなくなったら最初からでいいと考えてなにもしない。

僕の場合は、部屋やパソコンを整理できないしすぐ改造してしまう性格なので、1)や2)はいつのまにかなくしてしまう可能性が高いし、4)はお金がかかります。5)はクラックされた場合やシステム障害で消えてしまうの状況を聞いたことがあるし6)も、ちょっとお値段が高い場合が多くて、7)はさすがにシステムエンジニアな僕には怖くて選択できません。

必然的に3)でデータをクラウドストレージに保存しておく形になります。

クラウドストレージサービスも最近はいっぱいあって検索してみるといろいろ出てきますが日本の会社のビジネス向けのものは数十GBで月に数万円は請求されます。だからといって狭い日本で分散バックアップを強調されてもそれほど魅力は感じません。

世界的にメジャーなもの、日本でメジャーなものは、

Amazon S3 Amazon Glacier Amazon Cloud Drive Google Drive Microsoft SkyDrive
無料 X X 5GB 5GB 7GB
有料 標準($0.130/GB)
RR($0.100 /GB)
 GB あたり
USD$0.012/月
年間1ドル/GB 25GB $2.49/月
100 GB $4.99/月
100GB $50/年
ファイルサイズ 2GB 10 GB 2GB
Linux ○ (Ubuntu)
ファイル種類
50GB 標準$6.5
RR $5
$0.60 $4.16 $4.99 $4.17
100GB 標準$13
RR $10
$1.20 $8.33 $4.99 $4.17
DropBox Apple iCloud YahooBOX BOX Never Nドライブ
無料 2GB~18GB 5GB 5GB 5GB 30GB
有料 100GB $9.99/月
100GB $99/年間
20GB $40/年間
50GB $100/年間
Yahoo!プレミアム
(月額346円/税込)
になれば50GB
25GB $9.99/月
1TB $15/月
なし
ファイルサイズ 2GB 100MBから2GB 4GB
Linux
ファイル種類
50GB $9.99 $8.33 ¥346
100GB $9.99

でしょうか。バックアップ元がLinuxのサーバで直接バックアップできて、いま使っているEC2のクラウドサーバと同じネットワークにいて、安い!という点でAmazon Glaierがぬきんでています。Googleドライブも無料の5GBを使い切るまではいい感じですがRedhat系はgriveというソフトが動作しないようです。AmazonLinuxも。。。(*_*;

でも、PC/Mobileから使う場合は個人用途では30GBまで無料のNEVER Nドライブは一体どうやって実現しているのか不思議でたまりませんが魅力的です。YahooBOXもプレミアム会員+300円で1TB提供する計画があるみたいなので今後期待できそうです。

さて、とってもやすいAmazon Glacierですが、今年の8月に一度使ったことがあります。3か月前に使ったときは、Javaで走るeclipseという開発環境で一回ごとにプログラムを作成して走らせてバックアップを行ってみました。

バックアップはできたのですが、ファイルは、ArchiveIdという形で保存されてしまいます。これが長い文字列でとてもメモったりできるものじゃありません。

ArchiveId : xXeWDgTPTSB0qw6x9pB37_b7OTQd3RSABrK7AltnBbGgdX-uHfJX2TFV
-C0NU_NEdlqmY8Ky9t6ylEqGugX9n3dTISkBqtRtawhHuj-rBxCIN0sSFD13Ws02d4m0
pmp9CqnozweoWA

こんな感じです。

また、マネジメントコンソールでもアーカイブ自体は削除できず、ボルトと呼ばれるフォルダも、ArchiveId を指定して全部のアーカイブを消せないと消せないため、ほんの少しですが($0.03-)請求が続いている状態でした。

http://aws.amazon.com/jp/glacier

せっかくですから、時間が取れたので年末のお掃除を兼ねてGlacierのアーカイブのクリアをすることにしました。

いまは、Glacierを扱いのにeclipseでわざわざ呼び出さなくとも、

https://github.com/mironal/GlacierTools

というコマンドラインツールがあって、コマンドの引数でファイルのリストや削除を指定すれば消せるようになっていました。

まずはアーカイブのリストをとってみます。

[ec2-user@ip-10-*-*-* GlacierTools-0.2]$ java -jar archive_controller.jar list –vault precure.asia –region ap-northeast-1

。。。。。。Glacierはやすいのですがバックアップデータへのアクセスが4~5時間かかるのです。午後1時に入力したのですが、下の結果が出たのは午後5時過ぎでした。

VaultArn : arn:aws:glacier:ap-northeast-1:098765432100:vaults/precure.asia
InventoryDate : 2012-08-24T22:55:59Z
ArchiveList :
ArchiveId : xXeWDgTPTSB0qw6x9pB37_b7OTQd3RSABrK7AltnBbGg
dX-uHfJX2TFV-C0NU_NEdlqmY8Ky9t6ylEqGugX9n3dTISkBqtRtawhHuj-rBxCIN0sSF
D13Ws02d4m0pmp9CqnozweoWA
ArchiveDescription : my archive Fri Aug 24 15:20:54 JST 2012
CreationDate : 2012-08-24T06:21:10Z
Size : 73053976
SHA256TreeHash : 355d3b6fec839e9e29c013371a56b9bd76e863dacd36f5877e2bd69cbdb1477e
ArchiveId : 0VQB_FWom-FdbWXB94h-O7SDCKTm6_j_VYDa0ZYtppQt
bBaY7iZIOiqJArydxzXtV1BUMmjTmpYwKRavs0v1bifEPr8phCD7aJuhwyRxVaGqSNqvq
t7UignqDfOMLSYd1KEYNaC5XA
ArchiveDescription :
CreationDate : 2012-08-24T06:54:04Z
Size : 999520
SHA256TreeHash : 311756bffa56c79442a0ca9043f1abc2f1184759c15108c631648b7abd5c8fc0
ArchiveId : bXMEHzymCTXvV8pQVPKZUkdVD75KCeY21TFwAms07WkL
MZbmRIqDIlDlqAKU3XA-LJAIRJrTrdss4bQN-goGUes6w6FrcwNDyR-6Pz0HR2aAakKVv
g-7yljAFeyx4W8QCPTEyk4P1w
。。。。。続く。。。

やっと、昔遊びでバックアップしたファイルのアーカイブIDがわかりましたので削除をしましょう。

[ec2-user@ip-10-*-*-* GlacierTools-0.2]$ java -jar archive_controller.jar delete –vault precure.asia –region ap-northeast-1 –archive ‘xXeWDgTPTSB0qw6x9pB37_b7OTQd3RSABrK7AltnBbGgdX-uHfJX2TFV-C0NU_NEdlqmY8Ky
9t6ylEqGugX9n3dTISkBqtRtawhHuj-rBxCIN0sSFD13Ws02d4m0pmp9CqnozweoWA’
delete success!
[ec2-user@ip-10-*-*-* GlacierTools-0.2]$ java -jar archive_controller.jar delete –vault precure.asia –region ap-northeast-1 –archive ‘0VQB_FWom-FdbWXB94h-O7SDCKTm6_j_VYDa0ZYtppQtbBaY7iZIOiqJArydxzXtV1BUMmjTmpYwKRavs0v1bifEPr8p
hCD7aJuhwyRxVaGqSNqvqt7UignqDfOMLSYd1KEYNaC5XA’
delete success!
。。。。。

こちらは、ほんの数秒で応答してくれてうれしいです。でも、削除がマネジメントコンソールに結果として現れたのは翌日の午後2時過ぎでした。。。。

Glacierはやすいのですが気長な性格でないと扱えないかも。。。

ふと、最近アマゾンからDMがきてS3とGlacierの連携がされたとのことでした。

http://aws.typepad.com/aws_japan/2012/11/archiving-amazon-s3-data-to-amazon-glacier.html

これなら気の短いシステムエンジニアでもGlacierをつかってコスト削減ができますです。

Amazon S3サービスはWEBページにもなるクラウドストレージサービスでAmazonのAWSではいちばん一般的に使われているサービスかもしれません。

LinuxからS3への保存には、

http://s3tools.org/s3cmd

というツールを使います。

[ec2-user@ip-10-*-*-* s3cmd-1.1.0-beta3]$ ./s3cmd put ../../20121122.tar.gz s3://backup.precure.asia
WARNING: Module python-magic is not available. Guessing MIME types based on file extensions.
../../20121122.tar.gz -> s3://backup.precure.asia/20121122.tar.gz [part 1 of 57, 15MB]
15728640 of 15728640 100% in 1s 8.65 MB/s done
../../20121122.tar.gz -> s3://backup.precure.asia/20121122.tar.gz [part 2 of 57, 15MB]
15728640 of 15728640 100% in 1s 9.08 MB/s done
。。。。。。

と簡単にAmazonのS3に保存ができます。Glacierに比べて速いのがいいです。

[ec2-user@ip-10-*-*-* s3cmd-1.1.0-beta3]$ ./s3cmd ls s3://backup.precure.asia
2012-11-21 23:42 884890879 s3://backup.precure.asia/20121122.tar.gz
[ec2-user@ip-10-*-*-* s3cmd-1.1.0-beta3]$

と内容を確認して保存作業終了です。

あとは、S3のマネジメントコンソールより保存したボルト(バックアップ保存先のニックネーム)にブログの通りライフサイクル設定すればちょっとお高いS3からとってもお安いGlacierへバックアップデータを移動して、時期が来れば削除もしてくれます。

お家にある昔からの山のような写真もZIPで固めてS3経由でGlacierへ保存すれば一気に部屋の整理もはかどれそうです。!(^^)!