今日は薄曇りで、なんとなく空気が止まっているような変な感じの我が家周辺だった。

昨日のバーベキューの疲れが残ってるみたいで、昼寝。

まあこんな時はのんびりしておくのがいいよ。

 

 

それから、プログラミングで遊んだ。

最近よく聞く、データサイエンティストのサイトを見つけたので。

その中にタイタニック号の乗客リストから、データ解析をしていくというものがあった

pythonという言語を使って、いろんなとこからコードをパクりながら書いていく。

 

 

 

おもしろい。

プログラミングのスキルがつたないんだけど、いろんなサンプルコードがインターネット上にあるので、それを使っていきます。

いい世の中。

今回のプロジェクトの趣旨です。(サイトから抜粋)

The sinking of the RMS Titanic is one of the most infamous shipwrecks in history.  On April 15, 1912, during her maiden voyage, the Titanic sank after colliding with an iceberg, killing 1502 out of 2224 passengers and crew. This sensational tragedy shocked the international community and led to better safety regulations for ships.

One of the reasons that the shipwreck led to such loss of life was that there were not enough lifeboats for the passengers and crew. Although there was some element of luck involved in surviving the sinking, some groups of people were more likely to survive than others, such as women, children, and the upper-class.

In this challenge, we ask you to complete the analysis of what sorts of people were likely to survive. In particular, we ask you to apply the tools of machine learning to predict which passengers survived the tragedy.

 

趣旨のざっくり和訳。

1912年の4月15日に起きたタイタニック号沈没は歴史に残る悲劇。

氷山への衝突により船が沈没し、乗客、客員合計2224人中1502人が、亡くなった。

その事件は世界に衝撃を与え、それ以降の船旅はより安全な規制のもとに行われるようになった。

その原因の一つは救命ボートの不足だ。しかし、あるグループ(女性や子供、高級客室の乗客)はその他に比べて、生存率が高い。

今回のプロジェクトでは、機械学習のツールを使って、どの乗客がより生き残りやすいのかを解析してほしい。

 

 

高級な客室の人の方が生存率が高いんですよねー。

優先して救命ボートに乗せられたのかも。

乗客の生存率は38.4%。6割は亡くなってるんですよね。

 

スクリーンショット 2018 04 30 22 56 40

 

 

 

いろいろやり方を調べたんですが、このpandas-profilingを使ったものが簡単でした。

CSVファイルから簡単なコードでデータをグラフ化。仕事でも使えそう。

NewImage

 

NewImage

 

 

プログラミングは広い海のようで、趣味としては最高。

わからなければ検索するとどこかに答えがあるし、サンプルコードもたくさんある。

 

 

こんなのとか最高だよ。

 

 

プログラミングを使った写真を送ると似ているAV女優を教えてくれるサービス。

機械学習、人口知能もエロに貢献。楽しんで行きたい!!