Let's大谷家 あんたの日記

Just another WordPress site

ブログキャッシュ収集作業の辛さ・・・

      2014/10/18

先日、記事に書いたとおり、ブログのデータを4年分消してしまいました。

WordPressにブログ変更しようと、いろいろ試しているとき、FFFTPで間違って過去ブログのディレクトリを削除しまったようで・・・
なんか、恐ろしいほどファイル消してるなーと思ったら、ガッツリ公開中のディレクトリを削除してやがったwww

気がついた時は後の祭り。
すっかり、レンタルサーバーからファイルが全消しされていましたとさw

で、今週1周間は、自宅帰ってから、夜な夜な自分の投稿がネット上に残ってないか?と探しまくり。
結果、2角サイトから、かなりの情報を吸い上げました。

・Googleキャッシュ(http://google.co.jp)
・Internet Archive(http://www.archive.org/)

Google先生なら、ある程度データ保管してるだろうと侮ってたが、いやー、検索の仕方でこれだけ変わるとは・・・
とりあえず、Google先生の方はおいておいて・・・

「Internet Archive(http://www.archive.org/)」の方がすごかった。
そんなにこまめにキャッシュ取得していない感じですが、写真まで含めてキャッシュされている。
もし、時間があって、ブログ等をやってる人がいたら、見てみるとびっくりしますよ。
いやー、キッチリ取ってあった。
直近の情報は、こちらから拝借して、まだアップしていませんが、後ほどシコシコとアップしようと思っています。

しかし、CGIで作成した動的ページは、なかなかキャッシュできてないらしく・・・
1ヶ月に30記事以上上げてると、さすがにキャッシュできないらしく欠落しまくり・・・

そして、ここからGoogle先生の登場。
さすがにすごかった・・・

動的とはいえ、CGIで作成されてたページは、1ヶ月分を全部出す機能がついていた。
それをGoogle先生はキャッシュしていてくれたのだ!
写真までは無理なものの、ページのソースを引っこ抜けば、軽い加工で文書はほぼ引っこ抜けた。
まあ「r」とか使いこなせれば、もっと簡単に引っこ抜けるのだろうが、残念ながら、その辺の技術は持ち合わせていない。。。
勉強しなきゃね。

何位せよ、4年分のデータのうち、文章で取得できなかったのは、3~4ヶ月分のみ。
その中に、ランク高い記事が含まれているかどうかは不明だが、手動でもなんとかこちらのブログに移行できそうだ。

記事にして千以上あるため、完全復旧まではかなり時間がかかるだろう。
そして、カスタマイズもまだ全部済んでおらず、チョコチョコ変更加えながら整えていこうと思います。

今後も、夜な夜な作業で眠れない夜が続きそうwww
めげないように、ボチボチやっていきます。

 - インターネット, 情報

ad

ad

Message

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

  関連記事