ブログキャッシュ収集作業の辛さ・・・
2014/10/18
先日、記事に書いたとおり、ブログのデータを4年分消してしまいました。
WordPressにブログ変更しようと、いろいろ試しているとき、FFFTPで間違って過去ブログのディレクトリを削除しまったようで・・・
なんか、恐ろしいほどファイル消してるなーと思ったら、ガッツリ公開中のディレクトリを削除してやがったwww
気がついた時は後の祭り。
すっかり、レンタルサーバーからファイルが全消しされていましたとさw
で、今週1周間は、自宅帰ってから、夜な夜な自分の投稿がネット上に残ってないか?と探しまくり。
結果、2角サイトから、かなりの情報を吸い上げました。
・Googleキャッシュ(http://google.co.jp)
・Internet Archive(http://www.archive.org/)
Google先生なら、ある程度データ保管してるだろうと侮ってたが、いやー、検索の仕方でこれだけ変わるとは・・・
とりあえず、Google先生の方はおいておいて・・・
「Internet Archive(http://www.archive.org/)」の方がすごかった。
そんなにこまめにキャッシュ取得していない感じですが、写真まで含めてキャッシュされている。
もし、時間があって、ブログ等をやってる人がいたら、見てみるとびっくりしますよ。
いやー、キッチリ取ってあった。
直近の情報は、こちらから拝借して、まだアップしていませんが、後ほどシコシコとアップしようと思っています。
しかし、CGIで作成した動的ページは、なかなかキャッシュできてないらしく・・・
1ヶ月に30記事以上上げてると、さすがにキャッシュできないらしく欠落しまくり・・・
そして、ここからGoogle先生の登場。
さすがにすごかった・・・
動的とはいえ、CGIで作成されてたページは、1ヶ月分を全部出す機能がついていた。
それをGoogle先生はキャッシュしていてくれたのだ!
写真までは無理なものの、ページのソースを引っこ抜けば、軽い加工で文書はほぼ引っこ抜けた。
まあ「r」とか使いこなせれば、もっと簡単に引っこ抜けるのだろうが、残念ながら、その辺の技術は持ち合わせていない。。。
勉強しなきゃね。
何位せよ、4年分のデータのうち、文章で取得できなかったのは、3~4ヶ月分のみ。
その中に、ランク高い記事が含まれているかどうかは不明だが、手動でもなんとかこちらのブログに移行できそうだ。
記事にして千以上あるため、完全復旧まではかなり時間がかかるだろう。
そして、カスタマイズもまだ全部済んでおらず、チョコチョコ変更加えながら整えていこうと思います。
今後も、夜な夜な作業で眠れない夜が続きそうwww
めげないように、ボチボチやっていきます。