June 30, 2006

コントロールコードをテキスト文書から削除する方法

コントロールコードをテキスト文書から削除する方法を見つけました


このコントロールコードが結構悪戯をする。

コントロールコードらしきものは、
エンコードされたときのごみとして残る場合もある。

^a ^b 見たいな感じで、
見た目は2文字に見えるけど、1文字。

^a であれば

「ctrlを押しながらa」

と言う意味になります。

こういったテキストファイルを処理する場合、いろいろ問題が起こることがあります。

なので、削除したい、と言う人は結構いるはずなんですが、あまり情報が無くて苦労しました。

こういった場合

「col」コマンドを使った方法が有効です。

cat sample.txt | col > out.txt

colコマンドの
「col が認識できないコントロール文字およびエスケープシーケンスは削除される。」
って言う機能を利用したものです。







まあまあでしたらポチっとおねがいします♪
人気blogランキング
くつろぐ