kanconvit.js を使って中国簡体字を日本語漢字へ変換する

kanconvit.js は、文字列に含まれる中国簡体字を、対応する日本語の漢字へと置換してくれる、JavaScript ライブラリです。この kanconvit.js をサイトスクリプトに導入する手順の覚え書きです。

ここでは、サイトスクリプト 163music.site.js を例にして記していきます。
サイトスクリプトwiki内、
网易云音楽(music.163.com)
修正のしかた
(いずれも、@wiki(運営元、アットフリークス)上のページになります。@wikiのページには近寄りたくない()、という場合は、上記ページを開かないでください。)

手順1:kanconvit.js の入手
kanconvit.js は、
/lang/javascript/kanconvit/trunk/kanconvit.js – CodeRepos::Share – Trac
http://coderepos.org/share/browser/lang/javascript/kanconvit/trunk/kanconvit.js
から入手できます。
ページの一番下のほう、Download in other formats のところにリンクがあります。

手順2:ユニコード対応のテキストエディタを用意する
  • kanconvit.js は、文字コード UTF-8、163music.site.js は、文字コード UTF-16(LE) ですので、いずれの文字コードにも対応したテキストエディタを用意してください。
    • Windows付属のメモ帳は、ユニコード対応だろうと思います。ただし、行数表示などできないので、使いづらいかもしれません。
  • kanconvit.js をテキストエディタで開いてみて、コード内の中国簡体字部分などに文字化けのないことを確認してください。
  • 以下、このテキストエディタを用いて操作を行っていきます。

kanconvit.js は、ブラウザ上で動作させることを想定して書かれているようですが、特にコードに手を加えることなく、サイトスクリプト内でも利用できるだろうと思います。ただし、気になる方は、kanconvit.js コードの最後のほう、
if (typeof Kanconvit.onload === 'function') Kanconvit.onload();
を削除(ないしコメントアウト=文頭に //をつける)してください。(削除(ないしコメントアウト)しなくても、サイトスクリプト内での動作に支障はないと思います。)

手順3:kanconvit.js を 163music.site.js コード内へコピペ
163music.site.js のメタデータ(コード冒頭の  // ==SiteScript== から // ==/SiteScript== まで)後の空白行のあたりに、kanconvit.js の全コードをコピー&ペーストします。
  • あとは、63music.site.js コード内のどこからでも、kanconvit を利用することができるようになります。
  • 中国簡体字→日本語漢字、は、 Kanconvit.zh2ja( "中国简体字文字列" );
  • 日本語漢字→中国簡体字、は、 Kanconvit.ja2zh( "日本語漢字文字列" );

手順4:
163music.site.js コード内、中国簡体字→日本語漢字、変換をしたいところのコードを書き換えます。例えば、 163music.site.js ( version 0.1.1, date 2013/12/30 )
256行目あたり、
修正前、
objRtn[ "videoTitle" + i ] = title;
を、修正後、
objRtn[ "videoTitle" + i ] = Kanconvit.zh2ja( title );
など。
  • 行数は、163music.site.js ( version 0.1.1, date 2013/12/30 ) の行数。手順3で、kanconvit.js をコピペした後だと行数は大幅に変更になっているはずなので注意してください。

手順5:163music.site.js を保存
  • Craving Explorer のサイトスクリプトとして用いる場合は、文字コード UTF-16、ないし、UTF-8 で保存します。
  • WSH上で動作させたい場合などには、UTF-16(LE)で保存します。

以上で手順の覚え書きは終わりです。

kanconvit.js のライセンスなど、どうなっているのかよくわかりませんでした。個人で使う場合には問題ないだろうと思いますが、ご自身の責任においてご判断ください。

Kanconvit は、たつを さんが作成なされたものです。

たつをのChangeLog (http://chalow.net/)内、
簡体字と日本語漢字の相互変換ツール Kanconvit を公開
http://chalow.net/2009-06-14-1.html

Kanconvit - 簡体字と日本語漢字の相互変換ツール
http://kanconvit.ta2o.net/

小飼 さんによる、JavaScript移植版があります。

404 Blog Not Found (http://blog.livedoor.jp/dankogai/)内、
javascript - にKanconvitを移植してみた
http://blog.livedoor.jp/dankogai/archives/51224227.html

上記、手順では、この JavaScript移植版 kanconvit.js を利用させていただいております。記して、感謝の意を表します。

RuTube、Veevr など

wikiのほうに、
「Rutubeのサイトスクリプトを作ってくれ」
「Veevrのサイトスクリプトを作ってくれ」
というご要望を、ときおり、いただくことがあります。いずれのサイトも、Craving Explorerを用いての動画の保存は難しいだろうと思います。

以下、簡単に記しておきます。


Rutube
Rutube(http://rutube.ru/)は、ロシアの動画共有サイト。
現在、このサイトの動画の多くは、Adobe HDS で配信されているのではないかと思います(Craving Explorer では、この配信方式の動画の保存はできません)。

次のスクリプトは、Adobe HDS manifestfile url(f4m)、Apple HLS manifestfile url(m3u8)を取得するものです(Craving Explorerのサイトスクリプトとしては使えません)。
  • rutube.rsite.js
    • (こちら()に置いてあるものと同じものです。)
    • Windows の WSH上で動作します。64bit環境の場合は、32bit用の wscript を使ってください。
    • 動作させると、インプットボックスが表示されるので、取得したいページのURLを入力して、OK します。
    • うまくゆけば、f4m や m3u8 URLを表示します。

f4m は、Adobe HDS manifest url です。例えは、こちらのページ(→Adobe HDS Downloader)などを参照してみてください。画質は、下記、m3u8 の場合よりも高画質の場合があるかもしれません。

m3u8 は、Apple HLS manifest url です。例えば、こちらのページ(→YouTube の HLS)などを参照してみてください。m3u8 な動画は、VLCメディアプレイヤーなどを用いて、直接再生することもできるかもしれません。



Veevr
Veever の動画は、現在、Adobe HDS ないし、RTMPプロトコルを用いて配信されているのではないかと思います(Craving Explorer では、これらの配信方式の動画の保存はできません)。こちらのページ(→Adobe HDS Downloader)に簡単な説明がありますので、必要ならばご参照ください。

この記事の内容を実行するに際しては、すべて、ご自身の判断と責任において行うようにしてください。

RTMPDumpHelper v1.16

RTMPDumpHelper の version 1.16 がリリースされていましたのでご紹介しておきます。

作者の Nir Sofer さんのウェブサイト
http://www.nirsoft.net/
内、
RTMPDumpHelper のページ
http://www.nirsoft.net/utils/rtmp_dump_helper.html
からダウンロードできます。


変更点は、
  1. ブラウザの子プロセス特定に失敗した場合に、クラッシュする不具合を修正。
  2. 64bit向けビルドを追加(64bitブラウザを対象とする場合に用いる)。


version 1.16 用の日本語化ファイルです。 zip で固めてありますので、解凍してください。使い方は、以前の記事を参照してください。


この記事の内容を実行するに際しては、すべて、ご自身の判断と責任において行うようにしてください。

プロフィール

brsscl

カテゴリ別アーカイブ
QRコード
QRコード
  • ライブドアブログ