DTSは、ちょっと違う。 IT企業なのにパキスタンでインフラビジネスに挑戦中!

Ontology

Ontology based highly accurate URL Filtering・2

mds_2013_9_18今日のエントリーでも、DTS の新たなプロダクトである Ontology based highly accurate URL Filtering についてご紹介してみたいと思います。



Ontology based highly accurate URL Filtering は、隠れたパターンを分析します。そして、SNSでやっていることでこれは hadoop も使用します。お馴染みビッグデータの使用した hadoop でデータを取得して比較。DTS のオントロジー技術とスクリプトを使用することになり、既にモジュールの構築段階に入っています。


このモジュールにかけていただくことになります。実際にここに必要な URL を入力していただければ、モジュール側のアウトプットが出ます。

DTS 社内 Meeting でのプロジェクターより
1

















"one file is generated for each URL by name of Sentiment"

ファイルはSentimentの名前によって各URL毎に生成されます。

Sentiment とは、その時の状況で、ポジティブなのかネガティブなのか、或いはプラスで動くのかマイナスなのかを、記事であるとか、SNS のコメントをクロールしてジャッジするということです。

対象となるサイトを見ると、そのサイトで見た時のコメントなども拾ってきます。例えばこのサイトの下記のようなコメントから NLP を持ってきて、まずはカテゴリー ⇒ 株価。そして、Sentiment すると、(評価すると)基本的にポジティブなパーセンテージがゼロ。つまり、あまり大きな変化が無いということになります。


2















株価の予想ソフトウエアではありませんので、あくまでも「世間の評価」の視点から日々分析するという製品となっています。

昨日のエントリーも合わせてご一読くださいませ。


Ontology based highly accurate URL Filtering・1

Ontology based highly accurate URL Filtering・1

mds_2013_9_17今週も DTS ブログを宜しくお願いいたします。3 連休はまさかの大型台風に見舞われ、京都などでは大きな被害となってしまいました・・・


9 月は台風シーズン。そして、昨日の台風による川の氾濫、先日の竜巻など予想できない自然災害が頻発していますので、じゅうぶんお気をつけください。

さて、週頭の今日は久しぶりの(?)DTS の IT サイドのプロダクトの話題とさせていただきます。

Ontology based highly accurate URL Filteringオントロジーベースの高精度 URL フィルタリング

1












東京オリンピックの開催も決定となったこともあり、日本国内のアベノミクスに「良くも悪くも乗ってしまおう!」といった時に必要なファイナンシャルマーケットの分析を可能にするセマンテックオントロジーベースのプロダクトです。

昔で言う金融工学から考える株価予想などとはまったく異なります。投資しようとしている企業がどういう会社なのか?どういう状況なのか?こういったことをすべて読み取ることのできるシステムとお考えください。

その企業の状態が良いのか悪いのか、人気はどうなのかをすべて自動的に判読します。上場企業の状況を判別する・・・方法は複数のソース・・・例えば SNS、YouTube、ブログなどのコメント、ファイナンシャルニュース、様々なソースからジャッジメントします。証券取引所の上場企業のバリューを判読するということです。

現在はすべて英語ベースでプログラムされていますが、勿論、日本語でのプログラムも可能です。それをNLP(自然言語処理)を使用。さらに我々のオントロジー技術で精度がアップします。

このプロダクトのサンプルは既に完成していて、デモンストレーションも可能な状態です。

明日も「Ontology based highly accurate URL Filtering」の概要をお送りします。

※NLP(自然言語処理)
自然言語処理(しぜんげんごしょり、英語: natural language processing、略称:NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。(Wikipedia)

関連記事

「情報は武器。ただし、量ではなく、リアルタイム性。」

「DTS オントロジーセミナー誌上公開・初回〜最終階までまとめ

mds_kihong_2013_2_14「DTS オントロジーセミナー誌上公開」がスタートしてから今日で一ヶ月たちました。先日一応の最終回を迎えましたので、再度こちらに
まとめを記載させていただきます。




「進行役は、DTS CEO 高橋博士と、カリッド・モハマッド。マリック博士」
http://blog.livedoor.jp/dts_1/archives/1536553.html
115





「FOAF か SIOC などの技術でオントロジーの基礎を創る」〜WEB3.0
http://blog.livedoor.jp/dts_1/archives/1536712.html
116





「サービス」〜アメリカの現状
http://blog.livedoor.jp/dts_1/archives/1536926.html


「林檎は果物である。果物は林檎である。」〜 YAGO (Yet Another Great Ontology)
http://blog.livedoor.jp/dts_1/archives/1537150.html
118





「単純に容量だけの大きなビッグデータとは異なる」〜web4.0
http://blog.livedoor.jp/dts_1/archives/1537785.html
122





「番外編(動画)」
http://blog.livedoor.jp/dts_1/archives/1538020.html



「スレッド・スケジューラと自然言語処理」〜SOFIE フレームワーク
http://blog.livedoor.jp/dts_1/archives/1538197.html
124





「それぞれの意味付けを推論で確かめていく」〜パターンマッチング
http://blog.livedoor.jp/dts_1/archives/1538395.html
125





「マーケティング・オントロジー・レコメンデーション」
http://blog.livedoor.jp/dts_1/archives/1539525.html
131





ビッグデータか?オントロジーか?
http://blog.livedoor.jp/dts_1/archives/1540190.html
24





データ・オブ・インフォメーション
http://blog.livedoor.jp/dts_1/archives/1540380.html
25





「DTS オントロジーセミナー誌上公開」最終回
http://blog.livedoor.jp/dts_1/archives/1540887.html
28

「DTS オントロジーセミナー誌上公開」最終回

mds_2013_2_8今週も DTS ブログをご愛読いただきましてありがとうございました!今日は「DTS オントロジーセミナー誌上公開」のとりあえずのラストとさせていただきます。



講師・DTS CEO 高橋(工学博士)最後のご挨拶(テープから起こした文章となります)


オントロジーも徐々に浸透しはじめ、これを使用して Web開発を行いたいという方はいらっしゃるのですが、さて、オントロジーという名称は知っていても、これは我々研究者レベルでは実行されているのですが、実際の商品・・・ビジネスとして成立しているものはほとんど存在していません。

我々もそうなのですが、そのサービスを立ち上げる時にお手伝いするといった形式です。ただ、だいぶそこに関してはオントロジーのフレームといったものが今日お話をしてきましたように、標準のもの・・・ワードネット、それから独自のFACTSを入れることによって形が出来上がってきました。

あとはカテゴライズをするといったことです。

そのアプリケーションに合わせて構築することにより、FACTSを増やすことはできますので、現実的に使用可能なものになっています。

日本で我々が今日お話してきたように「URLカテゴライズ」のようなものは既に実績としてございますが、各企業様などへの落とし込みに関してはこれから様々な実績を創っていくことになると考えています。もちろん、テストレベルでは既に行われています。

さらなる詳細に関しては、社内での開発ということもあり、お話ができなく、奥歯に物が挟まったような表現・説明になってしまい恐縮ではございますが、このような形でオントロジーの開発・研究は進行しています。

最後に、昨夜までシリコンバレー(米)に滞在していましたが、米国もかなりオントロジーを使用したビジネスに関しては、かなり具体的なお話も進行しています。我々も様々な企業様のアセット、あるいは・・・米国の場合、日本と異なり既にクラウドベースのサービスにすることが主になっているので、特にオントロジーの使用が必要となってくるケースが多くなっています。

日本と米国の動きにはおよそ2年程の差があるとよく言われています。遅かれ早かれその動きは日本にもやってくると予想できます。



DTS CEO 高橋宏尚(工学博士)

1













次回のオントロジーセミナー(連休明けの12日・火曜日の開催)にぜひともご参加をお待ち申し上げております!

第5回 DTS オントロジーセミナー 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております詳細・お申込みはこちらからどうぞ

DTS オントロジーセミナー誌上公開の記事をすべて読む

データ・オブ・インフォメーション

mds_2013_2_5今日は、昨日のエントリー「ビッグ・データか?オントロジーか?」の続きをお送りします。(「第四回・DTS オントロジーセミナー」より」)


昨日のエントリーの続き)
いろいろな研究者がいます。我々のように東工大で研究している人間がこのあたりの研究をやらせていただいておりますが、彼(カリッド・マハモッド・マリック博士)がそうであるように、現在、世界中で研究されています。

ポイントとして、今後このセマンテック Web 上で、申し上げましたように、マーケティングツールとして、リアルタイム性を使って指向性がわかることが重要です。

例えば、みなさんがご自分の会社でお持ちの様々な資源、そして情報。こういったものに関しても実は大きな意味があるのです。各情報に対して、時間軸によりその情報自身の確からしさも変化します。

ある方は・・・例えば非常にベテランの方がいらっしゃるとして・・・ひとつの仕事をこなしていく時に自分は 5 年後、10 年後にベテランになったとします。その方のお話・経験をまったくの新しい社員、あるいはまったく違う部所の社員さんも同じ経験が必要なので、それが 5 年、10 年が必要だという場合、それをお話しましたようなオントロジーにより抽出する方法により、非常に短い期間でその技術伝播が可能なのです。

オントロジーは、今回のリコメンドというテーマに限らず、基本的には意味を実際に司っているものは何か?ということです。インフォメーションとデータというのはまったく別のものです。データは数字の羅列。インフォメーションはそれが意味を持つこと。実際はデータ・オブ・インフォメーションなのです。これが一番重要なわけです。


DATA










ここに根ざしているポイントは今申し上げましたように、「意味付けが理解できる」という点に集約されます。それにより、短い期間でトレーニングが可能となる。トレーニングするためのデータが多くなくても、実際は可能なのです。

最終的な Web 4.0 のインテリジェント Web は、データ量が少なくても実現可能です。

世の中が進化しています。当然、データ量も増加していくだろうと思いがちですが、実際の本質をつかむことが可能あればある程、データ・オブ・インフォメーションのデータ量は多くなくても良いのです。逆に「確からしさ」の精度が低下します。



DTS オントロジーセミナー誌上公開の記事をすべて読む

第5回 DTS オントロジーセミナー 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております!詳細・お申込みはこちらからどうぞ

「DTS オントロジーセミナー」第四回の誌上公開・途中経過まとめ

mds_2013_2_1今週も DTS ブログをご愛読いただきましてありがとうございました。さて、先月の15日より集中連載しております「DTS オントロジーセミナー」その第四回の誌上公開。今日は、今までの記事をまとめてみました。



順番に読んでいただくのが理想的ですが、興味をひかれたタイトルから読んでいただくのも良いかもしれません。

進行役は、DTS CEO 高橋博士と、カリッド・モハマッド。マリック博士
http://blog.livedoor.jp/dts_1/archives/1536553.html

FOAF か SIOC などの技術でオントロジーの基礎を創る」〜WEB3.0
http://blog.livedoor.jp/dts_1/archives/1536712.html

サービス」〜アメリカの現状
http://blog.livedoor.jp/dts_1/archives/1536926.html

林檎は果物である。果物は林檎である。」〜 YAGO (Yet Another Great Ontology)
http://blog.livedoor.jp/dts_1/archives/1537150.html

単純に容量だけの大きなビッグデータとは異なる」〜web4.0
http://blog.livedoor.jp/dts_1/archives/1537785.html

番外編(動画)
http://blog.livedoor.jp/dts_1/archives/1538020.html

スレッド・スケジューラと自然言語処理」〜SOFIE フレームワーク
http://blog.livedoor.jp/dts_1/archives/1538197.html

それぞれの意味付けを推論で確かめていく」〜パターンマッチング
http://blog.livedoor.jp/dts_1/archives/1538395.html

マーケティング・オントロジー・レコメンデーション
http://blog.livedoor.jp/dts_1/archives/1539525.html


引き続き、来週からも不定期連載となります。お楽しみに!
そして、次回のオントロジーセミナーのご参加もお待ちしております。


DTS オントロジーセミナー誌上公開の記事をすべて読む

第5回 DTS オントロジーセミナー 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております!詳細・お申込みはこちらからどうぞ

マーケティング・オントロジー・レコメンデーション

mds_2013_1_31さて、「DTS オントロジーセミナー」をブログ上で誌上再現する連載の続きです。今日は第四回セミナーのテーマでありますソーシャルWEBとオントロジー。リコメンドなどのお話もあります。まずは概略からどうぞ。


Extension of Current Architecture for social web
現在のソーシャル web のアーキテクチャーの拡張

1













実際の(オントロジーの)使われ方ということで、ソーシャル web に関しての説明になります。

現在、マーケティングオントロジーを使用してレコメンデーションという、販売活動、販売促進をするための、ユーザーの意見をキーワードに持ってくるまたはその履歴を持ってくるデータマイニングという手法は昔から行われています。

本質は、非常に力のあると言いますか、実際に SNS でユーザ(他の方々)の意見が購入者の購入志向を動かすという大きなインパクトがあるのはご存知の通りです。

そして、その部分をいかに抽出するかと言われてるのですが、単純にその、レビューを閲覧するだけではなく、レビューに対してまた自分の意見を言える、ということによりそのレビュアーから、SNS の中から様々なカタチが出来上がってくるのです。

これには、オントロジーの手法を使用することが最も重要です。マーケティングとして、こういった外部・・・第三者の製品やサービス使用後の意見、使用感などが本当にリアルな市場の声として上がっているわけですが、これほど大きなマーケティングツールは無いであろうということになっています。

これを使用して、効率化するというのがこれからの方向性となります。そこで使用されるオントロジーの手法が非常に強力なツールとなるのです。


DTS オントロジーセミナー誌上公開の記事をすべて読む

第5回 DTS オントロジーセミナー 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております!詳細・お申込みはこちらからどうぞ

ナレッジグラフ検索が実装されて・・・

mds_2013_1_30DTS オントロジーセミナー」の誌上公開連載中ということで、今日は以前にもご紹介した「Google のナレッジグラフ検索」関連について。


去年末に Googleの新たな検索方法である「ナレッジグラフ検索」をご紹介しました。概念的なものはオントロジーの入口のようなものかもしれませんということでとりあげさせていただきました。

ナレッジグラフ検索(Google) DTSブログ12/10エントリー
http://blog.livedoor.jp/dts_1/archives/1529997.html


「キーワードが実世界において何を表しているかがわかれば、ウエブでの探し物が今よりももっと楽になる」という開発チームの言葉通りのことが徐々に起こり始めているようです。

既に実際に進行しているようで、下記のように有名人の文字を入力していくと・・・

1








一瞬で、その俳優のプロフィール、出演作、画像検索結果、動画、さらに「他の人はこちらも検索」というリコメンドのようなものも表示されているのがわかります。

2
















言わば、検索結果自体がその俳優のファンサイトのようなことになっていました・・・確かに、以前はこの俳優の出演作を調べたいという場合、wiki ペディア またはオフィシャルサイトの出演作リスト、あるいはファンサイトなどを探っていく検索でしたが、文字入力の途中で一瞬でスクロールもクリックもすることなく画像付きで表示されるわけです。もちろん、検索の手間の話だけではなく、ここから様々なことが変わっていくのが予想できます。

みなさんも実際にテストしてみてください。現在連載中のオントロジーセミナーの内容も実際にこうやって検索してみると、その概念のようなものが理解できると思います。

DTS オントロジーセミナー誌上公開の記事をすべて読む



第5回 DTS オントロジーセミナー 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております!詳細・お申込みはこちらからどうぞ

スレッド・スケジューラと自然言語処理

mds_2013_1_24今日のエントリーでも「DTS オントロジーセミナー」の様子をブログ上で再現するという企画を続けます。


ここからは、在米中のカリッド モハマッド マリック(工学博士)にスピーチをバトンタッチします。

当日は、スカイプでのマリック博士のスピーチをスピーカを通してご参加のみなさまにお聞き頂きました。マリック博士の英語でのスピーチに続いて、CEO 高橋(工学博士)が日本語にまとめたものを訳してお話するといった形式とさせていただきました。

1











<スレッド・スケジューラ>

様々なリンクからスレッド・スケジューラと呼ばれるもので、スケジュールを分別します。それぞれに対するページの意味付けなり、キーワードなりを引っ張ってきて、クローリングし、これを一つのデータとしてストレージに持っていくというシステムです。これが web 上でまず行うクルーラの始めの仕事となります。

3














<自然言語処理>

SOFIE という技術は、自然言語ドキュメントを解析可能で、そこからオントロジーに関係することを抽出することができます。

SOPHIE フレームワーク。このフレームワークを使用して、一つはパターンマッチング。もうひとつが、ワードセンス DISAMBIGUATION。二重母音の定義の意味の否定・修正、それから、オントロジーのリーズニング。この3つに分けて SOPHIE フレームワークを行なっています。

2














明日もこの続きをお送りいたします!

DTS オントロジーセミナー誌上公開の記事をすべて読む

第5回 DTS オントロジーセミナー 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております!詳細・お申込みはこちらからどうぞ

第四回・DTS オントロジーセミナー

mds_2013_1_15今週も DTS ブログを宜しくお願いいたします!さて、昨日の東京は大雪・・・昨日、今日は道路や各交通機関もマヒし、ご苦労なさった方も多いかと思います。そんな状況の中ではございますが、「DTS オントロジーセミナー」を開催させていただきましした。ご来社いただきまして誠にありがとうございました。


進行役は、DTS CEO 高橋(工学博士)が努めさせて頂きました。

1













もう一人。DTS の工学博士である、カリッド・マハモッド・マリック。
マリックは、現在、アメリカ出張中のため、スカイプでの参加。現地は午前1時を過ぎたあたりなのですが、まったく問題なく、仕事中だったとのこと。スピーカを通して、オントロジーの技術を解説。

2













今回のセミナーは、「天候が悪くて残念・・・」と、ご参加を断念という方も多く、我々も残念でなりません。そして、セミナーの「効果的なレコメンド機能をオントロジーで実装する」というテーマは特にみなさんのご興味を頂戴しておりましたので、明日のエントリーから連日、重要なポイントの解説を連載させていただきます!

3












そして、来月は第5回 2013.2.12(火)17:00〜 開催予定。テーマは「URL、SNS、Twitterの内部コンテンツをOntologyでの自動分類(仮)」を予定しております!詳細・お申込みはこちらからどうぞ

DTS オントロジーセミナー誌上公開の記事をすべて読む
Archives
Categories
10524_bn


mailfフォームボタン
QRコード
QRコード