脳卒中左片麻痺になりました

twitter http://twitter.com/#!/ti5942

カテゴリ : 初心者のWine話

Ubuntu11.04には今日初めてインストールした。
screenshot1
Betaリリースをインストールしたら、Winetricksもついてきました。
設定はまだインストール時のままです。

smoopyのために
Lzh archiverとVine Linux による日本語 True Type フォントもインストールです。
screenshot1screenshot2


まず、「読んde!!ココ」の起動
screenshot1
書き忘れていたが、「読んde!!ココ」の設定を2箇所変更しているな。
screenshot1
「読んde!!ココ」の起動時にスマートナビを起動するのチェックを外し、スマートナビは起動しないようにしたある。
もうひとつは、転送先の追加。

さて、PDFを開きましょう!
screenshot1
説明のため、Workフォルダを作り、そこに関連ファイルを集めてあります。
Foxit_J-Reader_4.pdf・・・CUPS-PDFでできたPDF
FoxitReader42_Manual.pdf・・・原本
FoxitReader42_Manual-pdfjam.pdf・・・pdfjamでできたPDF
output.pdf・・・ファイル出力でできたPDF

原本以外どれでもいいんだが、今回はFoxitReader42_Manual-pdfjam.pdfを処理しよう。
screenshot1
*****
全部で146ページあります。

※PDFファイルの取り込みには、時間がかかる場合があります。

取り込みページを指定してください。
*****

今回は「表紙」のみだから、
screenshot1

screenshot1

まずは、自動領域抽出
Screenshotscreenshot1
領域設定やら認識パラメータの変更
screenshot1

認識
screenshot1
l(エル)が認識されない。。。→l追加
丸cも→削除
FoxitがFoxttになっていたのでこれも修正
*****
User Manual
Foxit J-Reader4.2
For Windows


 2010 Foxit Corporation. All Rights Reserved.
*****

転送
screenshot1

screenshot1
張り付き方が変だな。。。
ま、いいか(´−д−;`)


本文はどうかな。。。


基本的な使い方は、簡単だ。
  1. PDFを読み込む
  2. 領域設定
  3. 認識実行
  4. 確認修正
  5. 透明テキスト付きPDFとして、PDFビューアに転送
2〜5は1ページずつ
認識率が悪くてもいいなら、2→3→5は自動で行えるみたいだ。
しかし、Wine上では自動設定が無理っぽい。。。

だから、PDFを全ページ読み込んだとしても、1ページずつしか処理できないので、予めページ単位に分割しておいてボチボチいこかと思っている。
(1ページごと読み込むのもなんだから)

とりあえず、まずは1ページだけ読み込んで処理をしてみよう!


screenshot1
*****
PDFファイルの情報を再活用「PDF OCR」機能を新搭載
PDFファイルのテキストデータとして抜き出せない画像化された文字情報をOCR処理することで、再利用できます。Web上で配布されている各種統計資料等をWordやExcelデータとして活用できます。
※セキュリティが設定されていないPDFファイルのみサポート。
*****

※セキュリティが設定されていないPDFファイルのみサポート。
ということで、「Foxit J-Reader」のマニュアルは直接扱うことはできません。
↓のメッセージが出ます。
screenshot1

セキュリティの解除方法として、(私の知っているところ)以下の方法があります。
Evinceの印刷で
(1)CUPS-PDFプリンタで印刷する。
(2)PDF形式で「ファイル出力」する。
あるいは、
コマンドラインで
(3)pdfjamを用いる。

いずれもテキスト抽出で
(1)(2)はテキストが文字化けして読めない。
screenshot1

(3)の場合、テキストはまともに出力されているようだが
screenshot1
変換の過程でエラーが出る。
screenshot1

そこで、OCR処理をしてみようというわけである。



screenshot2
HKEY_LOCAL_MACHINE\Software\Microsoft\Windows NT\CurrentVersion\FontSubstitutes
の中のMS Shell Dlgの値をTahomaに変更しました。

設定ファイルでいうと、
~/.wine/system.regにおいて
「MS Shell Dlg」を検索すればよい。
screenshot1

注意
「MS UI Gothic」が登録してあれば、変更する必要はない。


screenshot1screenshot2
日本語版で「しおり」の編集ができないのは何かのマチガイであろうと思うが。。。(印刷して、「しおり」をつければいいかな?)

ま、英語版は「しおり」の編集ができるから、「英語の学習」用?に「しおり」を付けてみようか?
screenshot1screenshot2
まず、Contentsに飛び、「しおり」を追加。名前を「目次」にする。
screenshot1screenshot2
これで、「Contents(しおり)」と同じ機能の「目次(しおり)」ができました。
なんだ、和訳するだけ?(゚Д゚)ゴルァ!!

いえ、やりたいことは「目次(しおり)」で日本語版の「目次」ページにいくことなんですが。。。


このページのトップヘ