2023年01月18日
LiveDoorブログのダウンロード再開
2020/04/17の調査段階からの中断を再開にあたってプロセスをレビューする。

NAS上の DLファイル保存場所に15,946個の imagsと 46,732行の記事.txtが保存されていたがローカル環境で閲覧できる状態ではない。また利用ツールの WEBEXは final(0.9.9.21)から 925(0.9.9.25)に更新されていたおり起動時ににゴミが表示される。

final(0.9.9.21)のゴミ 925(0.9.9.25) 隠し機能
・最初にお読みください.txtで「隠し機能」を使うための認証キーは再度有料申込み
となった。必要になった時に申し込めばよい。
・Readme.txtで「chm ファイル 表示されない」は webex.chmのプロパティ画面で
『ブロック解除』することで解決した。
・作者のブログページの ダウンロードの秘訣が参考になる。
・探索時
調査範囲に https://livedoor.blogimg.jp/apoc_works を含めないと
サムネール画像(-s)しか調査しない。
「ページ内リソースをサイト内データに含める」にチェックをいれる。
「リソースの詳細取得」のチェックを外すと時間短縮になる。
(詳細取得チェックを入れると Spectre360で 24H要したが外すと 5Hに大幅削減)
・ダウンロードの設定ウィザードの (3/5)ソースファイルの書き換え
「ローカル環境に最適化するため、リンクを書き換える」ボタンにチェックを入れて
PCのローカル環境で閲覧できるようにする。
テキストのダウンロード
ブログの書き出しサービスで MT形式でDL出来る。
・53,834行。
・画像へのパスは
https://livedoor.blogimg.jp/apoc_works/imgs と
http://livedoor.blogimg.jp/apoc_works/imgs が混在しているので
両方ともTeraPadで ./apoc_works/imgs に置換する。
・>8,000文字/行は置換処理できないので 190文字で折り返しておく。
画像のダウンロード

画像は https://livedoor.blogimg.jp/apoc_works/imgs/ に保存されているが今回 -s(サムネール)画像しか取得できなかった。この問題は 前回(2020/04/20)の詳細設定を参考に調査範囲に https://livedoor.blogimg.jp/apoc_works を含めることで解決できたが、いざダウンロードを開始すると「応答なし」。
・2023/01/12 23:00辺りから DL開始したが 2023/01/18 15:25 16,455(83%)を表示してフリーズした。
・ONU、ルーターを再起動後 DLを再渡来したが 「DL設定ウィザード 5of5」のウィザードが安定せず「完了」ボタンが効かず失敗・
・他の「ダウンロードツール」を捜した方が良いかも?!



NAS上の DLファイル保存場所に15,946個の imagsと 46,732行の記事.txtが保存されていたがローカル環境で閲覧できる状態ではない。また利用ツールの WEBEXは final(0.9.9.21)から 925(0.9.9.25)に更新されていたおり起動時ににゴミが表示される。



final(0.9.9.21)のゴミ 925(0.9.9.25) 隠し機能
・最初にお読みください.txtで「隠し機能」を使うための認証キーは再度有料申込み
となった。必要になった時に申し込めばよい。
・Readme.txtで「chm ファイル 表示されない」は webex.chmのプロパティ画面で
『ブロック解除』することで解決した。
・作者のブログページの ダウンロードの秘訣が参考になる。
・探索時

サムネール画像(-s)しか調査しない。
「ページ内リソースをサイト内データに含める」にチェックをいれる。
「リソースの詳細取得」のチェックを外すと時間短縮になる。
(詳細取得チェックを入れると Spectre360で 24H要したが外すと 5Hに大幅削減)
・ダウンロードの設定ウィザードの (3/5)ソースファイルの書き換え
「ローカル環境に最適化するため、リンクを書き換える」ボタンにチェックを入れて
PCのローカル環境で閲覧できるようにする。
テキストのダウンロード

・53,834行。
・画像へのパスは
https://livedoor.blogimg.jp/apoc_works/imgs と
http://livedoor.blogimg.jp/apoc_works/imgs が混在しているので
両方ともTeraPadで ./apoc_works/imgs に置換する。
・>8,000文字/行は置換処理できないので 190文字で折り返しておく。
画像のダウンロード



画像は https://livedoor.blogimg.jp/apoc_works/imgs/ に保存されているが今回 -s(サムネール)画像しか取得できなかった。この問題は 前回(2020/04/20)の詳細設定を参考に調査範囲に https://livedoor.blogimg.jp/apoc_works を含めることで解決できたが、いざダウンロードを開始すると「応答なし」。

・ONU、ルーターを再起動後 DLを再渡来したが 「DL設定ウィザード 5of5」のウィザードが安定せず「完了」ボタンが効かず失敗・
・他の「ダウンロードツール」を捜した方が良いかも?!
