空を見上げて
トップページ » LiveDoorブログのダウンロード再開

LiveDoorブログのダウンロード再開

2020/04/17の調査段階からの中断を再開にあたってプロセスをレビューする。

(1) 2020_04_16の保存先 (1)-2 2020_04_16の保存先 (02) buckupテキスト
NAS上の DLファイル保存場所に15,946個の imagsと 46,732行の記事.txtが保存されていたがローカル環境で閲覧できる状態ではない。また利用ツールの WEBEXは final(0.9.9.21)から 925(0.9.9.25)に更新されていたおり起動時ににゴミが表示される。
(2) 20200416版の起動画面 (3) 認証キー警告 (4) 隠し機能とは
  final(0.9.9.21)のゴミ      925(0.9.9.25)      隠し機能  
・最初にお読みください.txtで「隠し機能」を使うための認証キーは再度有料申込み
 となった。必要になった時に申し込めばよい。
・Readme.txtで「chm ファイル 表示されない」は webex.chmのプロパティ画面で
 『ブロック解除』することで解決した。
作者のブログページの ダウンロードの秘訣が参考になる。
・探索時
 blogimgをサイトに含める調査範囲に https://livedoor.blogimg.jp/apoc_works を含めないと
 サムネール画像(-s)しか調査しない。
 「ページ内リソースをサイト内データに含める」にチェックをいれる。
 「リソースの詳細取得」のチェックを外すと時間短縮になる。

(詳細取得チェックを入れると Spectre360で 24H要したが外すと 5Hに大幅削減)

・ダウンロードの設定ウィザードの (3/5)ソースファイルの書き換え
 「ローカル環境に最適化するため、リンクを書き換える」ボタンにチェックを入れて
 PCのローカル環境で閲覧できるようにする。

テキストのダウンロード
ブログの書き出しブログの書き出しサービスで MT形式でDL出来る。
・53,834行。
・画像へのパスは
 https://livedoor.blogimg.jp/apoc_works/imgs と
 http://livedoor.blogimg.jp/apoc_works/imgs が混在しているので
 両方ともTeraPadで ./apoc_works/imgs に置換する。
・>8,000文字/行は置換処理できないので 190文字で折り返しておく。

画像のダウンロード
blogimgをサイトに含める (7) サイズが 0 bytes (7) 応答なし
画像は https://livedoor.blogimg.jp/apoc_works/imgs/ に保存されているが今回 -s(サムネール)画像しか取得できなかった。この問題は 前回(2020/04/20)の詳細設定を参考に調査範囲に https://livedoor.blogimg.jp/apoc_works を含めることで解決できたが、いざダウンロードを開始すると「応答なし」。
(8)-2 DL設定ウィザード 5of5・2023/01/12 23:00辺りから DL開始したが 2023/01/18 15:25 16,455(83%)を表示してフリーズした。
・ONU、ルーターを再起動後 DLを再渡来したが 「DL設定ウィザード 5of5」のウィザードが安定せず「完了」ボタンが効かず失敗・
・他の「ダウンロードツール」を捜した方が良いかも?!



コメントを書く




情報を記憶: 評価:  顔   星