2019年03月03日

実験・計測データからモデル化、理論化、シミュレーション、を考える

日本ソーシャル・データ・サイエンス学会「データ解析がもたらすもの」

という案内が来ました。

10


ネット、スマフォは普及し、膨大なデータが取得されるようになり、ビッグデータという言葉が使われるようになって久しいのですが、

適切なデータが取得されているのか、どういう条件下で得られたデータか、どう分析すればよいか、がポイントになります。

IMG_20190302_141913


ビッグデータからパーソナルデータへ

意図しなかったビッグデータから、プロセス、結果を織り込んだデータへ


・意図しなかったビッグデータから、プロセス、結果を織り込んだデータへ

ビッグデータという言葉が最近よく使われます。

ビッグデータとは、記録の、自動化、大量化による、「意図しない」データであり、これら「眠っているデータ」を発掘すれば、もの凄い「宝の山」が埋もれているのではないか?と思われていました。

3fd0c408


しかし、結果として得られた「結果データ」と、その結果が得られたプロセスでの「プロセスデータ」がセットになるように、データ取得がデザインされていないと、せっかくのビッグデータも活用できないことが指摘されるようになってきました。

どの「結果データ」がほしくて、その「結果データ」に影響を及ぼす「プロセスデータ」は何なのか?何の可能性があるのか?

ストーリーを構築し、結果とプロセスを織り込むようにデザインする、ことが大切になってきました。

87bf999e


そろそろ、「意図せずに、大量にとれていたデータの発掘」から、「計画的に、プロセス、結果を織り込んだデータの取得」に向かう時では、と考えます。


実験とは未知の事象を解明、検証すること、得られた知見は記録し、発表する


既に得られている知見をもとに、未知の事象を解明するために行うのが実験の役割。

意図している実験を、正しく再現するよう、制御できるか、計測できるか

a42e90c2


すべての状況を実験で行うのは難しいので、シミュレーションも併用するのですが、重要なポイントは実験で検証しておくことが大切です。

実験は意図したとおりの結果が得られなかったとしても、その「ずれ」「違い」に新たなヒントがあったりします。

すなわち、上記のように、実験とは未知の事象を解明、検証するための重要な手段です。


4eacef23


このように工学、自然科学の実験も難しいのですが、社会科学では、さらに実規模での実験が難しくなります。

それゆえ、この政策を取らなかったら、どうなったか、など、別条件であればどうであったか?を理論、シミュレーションで埋めていくことになります。

9


この時のデータの分析、解析を行う際には、AI(人工知能)が有効になります。

熟練医師、カリスマ医師の手術の「神の手」をロボットが学習


人工知能では、ミスは繰り返さないよう、機械学習、強化学習することができます。

IMG_20190302_161018


この場合の、人工知能はあまり高度なもので、内容がブラックボックスになってしまうものではなく、人がトレース、修正できる程度のものがいいそうです。




stake2id at 15:20│Comments(0)このエントリーをはてなブックマークに追加

コメントする

名前
 
  絵文字
 
 
livedoor プロフィール

「TAK」さん

最新記事
Archives