1: 一般国民 ★ 2019/07/12(金) 04:35:09.76 ID:CAP_USER

Googleは都内のオフィスにおいて、「Solve....with AI」というアジア太平洋地域の記者などを集めたイベントを開催し、Google Cloud Platform(GCP、Googleのパブリッククラウドサービス事業)などを通じて提供している各種のAIサービスやTensorFlowなどの機械学習(マシンラーニング)ベースのAIを開発するツールなどのソリューションや、その具体的な利用事例などを紹介した。

このなかで、情報・システム研究機構 データサイエンス共同利用基盤施設ROIS-DS人文学オープンデータ共同利用センター特任研究員および国立情報学研究所のタリン・カラーヌワット氏は、日本語の古文書で一般的に使われている「くずし字」を自動で読み取って現代語に翻訳(正確には翻刻)するOCR「KuroNet」を開発し、Webブラウザ上で実行可能な機械学習ライブラリとなるTensorFlow.jsとしてくずし字の文字認識が可能になるようにしたと説明した。

【お詫びと訂正】本AIの開発にはGoogleの技術も用いられていますが、AI自体をGoogleが開発したと誤解を招く表現がありましたので、お詫びして訂正させていただきます。また、このプロジェクトの作業内容は正確には翻訳ではなく翻刻と呼ぶのが正しいので、その旨付記をいたしました。

■■以下、略
AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発(記事全文は、ソースをご覧ください。) 
https://pc.watch.impress.co.jp/docs/news/1195499.html
2019年7月11日 12:12 
PC Watch,Impress,インプレス,笠原 一輝 







2: ニュースソース検討中@自治議論スレ 2019/07/12(金) 04:39:28.03 ID:taourUqC
読めないようにしてきたんじゃないかね

39: ニュースソース検討中@自治議論スレ 2019/07/12(金) 10:07:34.49 ID:Nwhtdr6Y
>>2
幕末のちゃんとした人が書いてるのはほぼ現代語で一部のくずし字がわかれば普通に読めるぞ
特に薩長の文書は読みやすい
ここの役人が明治政府を作って現代語をつくったのがよくわかるわ

3: ニュースソース検討中@自治議論スレ 2019/07/12(金) 04:54:14.32 ID:jFOmPVIq
タリン・カラーヌワット女史

タイ生まれ、若い時によんだあさきゆめみしを見て源氏物語にぞっこん
日本語学科を通して日本に留学、くずし字を勉強するも挫折するが
自分で書いてみれば習得できるのではと思いつき、実際に書くことでくずし字を習得する

11: ニュースソース検討中@自治議論スレ 2019/07/12(金) 06:24:22.78 ID:topiQE+E
>>3
ひたすら感謝だわ。ほんとありがとう。

崩し字読めないアマチュア勢も古文書から情報読み取れるようになるから、色々面白い研究成果が生まれそう。

14: ニュースソース検討中@自治議論スレ 2019/07/12(金) 06:43:20.97 ID:oFUsX1nA
>>3
タイ人→源氏物語→くずし字
こりゃ大変だったろうな
ありがとう

20: ニュースソース検討中@自治議論スレ 2019/07/12(金) 07:15:58.63 ID:MshbsGTn
>>3
素晴らしい。

4: ニュースソース検討中@自治議論スレ 2019/07/12(金) 05:22:04.40 ID:/3s2Oryf
くずし字の変体仮名は似た字が多いけどちゃんと区別できてるならすごいな

12: ニュースソース検討中@自治議論スレ 2019/07/12(金) 06:30:44.39 ID:ng+bSJdz
俺んちもそんな巻物があるんだけど解読できなくてなあ
とにかく在野の歴史マニア歓喜だろ

15: ニュースソース検討中@自治議論スレ 2019/07/12(金) 06:49:38.41 ID:wKkPQ5Nx
>>1
一般公開されれば、いずれ神田の古書街が大にぎわいになるな

24: ニュースソース検討中@自治議論スレ 2019/07/12(金) 07:54:50.06 ID:rzv8Dyz5
昔の人はよく読めてたなってほんと思う

26: ニュースソース検討中@自治議論スレ 2019/07/12(金) 08:13:30.83 ID:6RY+2KLd
これは素晴らしい
文化勲章を差し上げたい

27: ニュースソース検討中@自治議論スレ 2019/07/12(金) 08:16:17.25 ID:Rp1g37ao
これは素晴らしい、でもこれは文字を解析しただけで翻訳と言えるのだろうか
次は本当の意味での翻訳だな

30: ニュースソース検討中@自治議論スレ 2019/07/12(金) 08:44:25.36 ID:5773tsx3
古文書片っ端から解読して青空文庫に上げてほしい。
で口語訳もAIでやってできるようにして。
で、それらの成果物の著作権とかはどうなるんかな。

34: ニュースソース検討中@自治議論スレ 2019/07/12(金) 09:43:29.26 ID:KAjIdVl5
明治大正時代の外交文書なんか見てても
官僚が墨で自筆で書いたものは判読が結構厳しい
活字印刷は隔世の感があるね

38: ニュースソース検討中@自治議論スレ 2019/07/12(金) 10:00:36.69 ID:lNne9+0c
現代日本人が読めなくなったくずし字をタイ人が解決するって面白いなぁ
読めないから書くところから始めるとか
めっちゃ地味だけどほんとに好きなんだろうな
感謝

53: ニュースソース検討中@自治議論スレ 2019/07/12(金) 11:23:03.06 ID:c+QE6OO7
くずし字読む入門書買ったことあるけどすぐ挫折した
崩し方の幅がありすぎ

57: ニュースソース検討中@自治議論スレ 2019/07/12(金) 12:08:09.86 ID:WaLRWOIQ
文字を判読できるのと意味がわかるのはまた別だからな
今では使わない単語や別の意味で使っている単語があるから
現代語に翻訳する機能も必要

81: ニュースソース検討中@自治議論スレ 2019/07/12(金) 14:14:00.47 ID:xIY+ej2k
素人目に圧倒的に凄い。だって読めないもん。
むしろ素人向きな気がする。

プロにとっては稀にある読み取りミスが鬱陶しいだろなぁ。
ちょっとでも誤りがあると全部チェックするしかないしかなりしんどい。
変に文脈・単語から修正とかすると意味が正反対になったりしそう。

95: ニュースソース検討中@自治議論スレ 2019/07/12(金) 18:38:04.48 ID:gdM6P/3Z
昔の知識層は達筆すぎてなぁ
全く歯が立たん

101: ニュースソース検討中@自治議論スレ 2019/07/12(金) 21:29:09.91 ID:fcbIpJ0l
専門家の反応はどーなの?

引用元: ・【AI/画像処理/古文書】AIで日本史研究者やマニアが狂喜乱舞する「くずし字」の翻訳ツールが開発[07/12]