2014年03月
2014年03月27日
【はじめに】
私は論文やその他研究関連のまとまった文章は、基本的にLaTeXで書いている。使いにくい点もあるものの、マークアップや数式をテキストだけで書けるのは強い。
ただ一つ面倒だったのがスペルチェック。
「LaTeX スペルチェック」でぐぐると、aspellコマンドを使ってLaTeXソースファイルを直接スペルチェックする方法がよく現れるのだが、これだと単語単位の間違いしか検出できない。Microsoft Wordがやってくれるような文法としての間違いの検出、例えば「The algorithms is ...」が間違いだと検出することもしたかったのである。
このために以前は、一旦PDFを生成してそれをコピーしWordに貼り付けるということを行っていたものの、見た目上の改行が貼り付け時にそのまま残るために文章の切れ目とみなされてしまう(例えば「I<改行>am Hiro.」のようになるとWordではスペルチェックに引っかかる)ためにいちいち改行を削除しないとならないこと、また文字の抜けが生じたりすることもあって使いにくかった。
その後、LaTeXで書いた文章をHTMLに変換する「TeX4ht」を使うと、比較的精度よく変換してくれることに気づき、今では基本的にこちらを使うようになったのである。
【2016.2.3追記】 Wordのスペルチェックは、Word 2007の時点ではこのような文法上の間違いを指摘してくれていたのですが、Word 2013の時点では指摘しなくなっていました。これはWord 2013での変更のようです。Word 2013 スペルチェックを強化したい - マイクロソフト コミュニティ
【TeX4htについて】
インストール方法や変換の際のコマンドについては、LaTeX をウエッブに載せように詳しい。私はUbuntuを用いているため、
### 管理者権限でとすればインストールできた。
$ sudo apt-get install tex4ht
変換時は
### 例えば mypaper.tex を変換したければとする。
$ htlatex mypaper
スペルチェックをする際は、生成されたHTMLファイルを直接Wordで開く。
【TeX4htのよいところ】
何よりも変換精度がよく、上記の改行の問題も発生しないのが強みである。特に数式を含む文章でも、そこを普通に文字として変換してくれる(複雑な数式は画像化されるが)ので、スペルチェックの妨げにならない(そこで文章が切れない)のがよい。これでかなり文章校正が楽になりました。おすすめ。