2018年11月11日

ColaboratoryでBERTの実行方法




Google Colaboratoryを使った方が良いです。  TPUが必要だからです

BERT FineTuning with Cloud TPUsの通りに実行出来るのですが、 詰まる所があるかもしれません
Using BERT in Colab
If you want to use BERT with Colab, you can get started with the notebook "BERT FineTuning with Cloud TPUs".
At the time of this writing (October 31st, 2018),
Colab users can access a Cloud TPU completely for free. Note: One per user, availability limited, requires a Google Cloud Platform account with storage (although storage may be purchased with free credit for signing up with GCP), and this capability may not longer be available in the future.
Click on the BERT Colab that was just linked for more information.
ColabでBERTを使用する場合は、ノートブック「BERT FineTuning with Cloud TPUs」を使う事が出来ます。 この記事(2018年10月31日)の時点で、ColabユーザーはCloud TPUに完全に無料でアクセスできます。
注:利用可能なユーザー数は1つで、利用可能な容量はGoogle Cloud Platformのストレージ容量を必要とします(ただし、GCPで登録する場合は無料クレジットで購入できますが、今後この機能は利用できなくなる可能性があります)。 詳細については、リンクされたばかりのBERT Colabをクリックしてください。




まず Now, let's play!
# Setup task specific model and TPU running config. のコードですが、
これは Colab TPU環境をセットアップし、TPUデバイスが正常に接続されていることを確認し、資格情報を設定します。

これは、実行すれば分かりますが、
google cloud sdk 1google cloud sdk 2

Go to the following link in your browser:
からcredentialsを取得して、
Enter verification code: に入力します。
TPU address is grpc://10.....
TPU devices:
[_DeviceAttributes(/job:tpu_worker/replica:0/task:0/device:CPU:0, CPU, -1,
_DeviceAttributes(/job:tpu_worker/replica:0/task:0/device:XLA_CPU:0, XLA_CPU,
_DeviceAttributes(/job:tpu_worker/replica:0/task:0/device:XLA_GPU:0, XLA_GPU,
_DeviceAttributes(/job:tpu_worker/replica:0/task:0/device:TPU:0, TPU, .............
と言う感じになります。

続きを読む

tak_tak0 at 13:25コメント(0)サーバ この記事をクリップ!

2018年11月05日

インスタグラムいじめの特徴と検出手法



これについて、Instagramの公式な情報がどこなのかがはっきり分からないのですが、多分Instagram Well-Beingの辺りでしょうか?

そもそもインスタグラムではどういう事をサイバーいじめと考えているのか...それを理解する事も必要です。
この、(a)(b)がなぜCyber bullyingになるのか、画像をよく見たり文脈を理解しないといけないので、非常に困難な問題に思えますが...
Content-Driven Detection of Cyberbullying on the Instagram

Content-Driven Detection of Cyberbullying on the Instagram Social Network
Haoti Zhong, Hao Li, Anna Squicciarini , Sarah Rajtmajer, David Miller Pennsylvania State University
Christopher Griffin United States Naval Academy
Cornelia Caragea University of North Texas
IJCAI. 2016.



ではInstagramには元々どれぐらいそういう事があったのかと言うと...

Analyzing labeled cyberbullying incidents on the Instagram social network
Sabrina Arredondo Mattson, Rahat Ibn Rafiq, Richard Han, Qin Lv  University of Colorado Boulder
International Conference on Social Informatics. Springer, Cham, 2015
Cyberbullying Cyberaggression

3 DataCollection
snowball samplingで、41KユーザーIDを特定しました。
そのうち61%はパブリックプロファイルを持ち、残りはプライベートプロファイルを持っていました。
この25Kのパブリックユーザーだけをデータセットに取り込みました。

収集データは、
ユーザが投稿したメディアオブジェクト(ビデオ/画像)、
・関連するコメント、
・フォローユーザID、
・フォロワーユーザID、
・コメントしたり、好きなユーザID。
メディアオブジェクトファイルとそれに関連するコメントをメディアセッションとして考えます。計3165Kのユニークなメディアセッションを収集しました。
4 Cyberbullying Labeling
サイバーいじめの定義ですが、
(1)少なくとも1つの否定的な単語/コメント、または他の人や他の人に害を及ぼす意図のあるコンテンツがある場合は「はい」
(2)投稿自体にいじめ行為があるなら、 「はい」
否定的な言葉があり、簡単に自分自身を守ることができない犠牲者に対して繰り返し否定的な意見がある場合は、「はい」

instagramでのいじめにはどういう事があるのか、分析から分かった事は...
5 Analysis and Characterization of Ground Truth Data
自信度の高いデータセットでは、メディアセッションの29%が「いじめ」グループに属し、他の71%はいじめを受けていないと見なされました。

サイバーいじめの検出のためのclassifyの設計は、画像ベースのディスカッションにおける侮蔑語の使用にのみ依存することはできず、代わりに精度を向上させるために他の特徴を考慮する必要があります

セッションのかなりの部分は、CyberbullyingとCyberaggressionの両方と分類されたり、サイバー虐めとサイバー攻撃の両方で確度が低いなどの点で強く関連します。
これは、サイバーいじめがサイバー攻撃のサブセットであるという定義に準拠しています

否定語の割合が増加するにつれて、サイバーいじめが50%、サイバー攻撃が60%まで増加する事が観測されます。
しかし、ネガティブが増加するにつれ、そのピーク後にCyberbullyingとCyberaggressionの割合が減少します。
これらは全く予期せぬ結果であり、直観に反しているようです


これらのメディアセッションでは、スポーツなどについての議論や、ただの友好的な話し合いだった事が分かりました。
そのような議論では、特に人を侮辱していないにもかかわらず、多くの冒涜語を使用する傾向があります
これは、陰性分析に関する重要な発見に繋がります。
かなり高い割合の否定語を有するメディアセッションは、典型的には、サイバーいじめが含まれる可能性が低いことを意味します

SouzaらのInstagramユーザーの分析では、典型的なInstagramユーザーのフォロワー数と好きな数の間に正の相関があることを示しています。
しかしいじめを受けたユーザーは同じパターンに従いません。
実際、サイバーいじめではない平均投稿数は、サイバーいじめの平均セッション数の4倍であり、サイバーいじめではない平均ポスト数は、平均サイバーいじめセッション数の4.5倍です。
ここでの重要な発見は、Cyberbullying/Cyberaggressionを伴うメディアセッションのユーザーは、1ポストあたりのお気に入り数が少なく、フォロワーが多いことです

この目的のために、Cyberbullying/Cyberaggressionのメディアセッションでの単語カテゴリを見つけるためのテキスト分析プログラムであるLinguistic Inquiry and Word CountLIWC)を利用しました。
............

罵声、否定語は(当然ながら)サイバーいじめの方が優位に多く...
そして興味深い発見として、
一人称代名詞の使用率は有意に少なく、
複数形一人称代名詞は差が無く
三人称代名詞は有意に多いのです

多分日本語でも同じ傾向が有りそうですが
攻撃を伴う投稿では、ユーザーは自分自身を直接参照する可能性は低く、第三者を参照する可能性は高くなります

心理的測定の結果、「負の感情」「怒り」「身体」「性的」カテゴリの比率は1より有意に高く、
「ポジティブ感情」カテゴリーの比率は1より有意に低い。
宗教、死、外見、性的を含む投稿にはcyberbullyingの可能性が高く、 通常、否定的な感情の発生頻度が高く、肯定的な感情の発生率が低い。

たとえば、「テキスト」カテゴリの場合、「テキスト」を含む画像の約1/3が、いじめ攻撃を含むメディアセッションに関連付けられていました。
「Drugs」では75%の画像がサイバー攻撃を含むメディアセッションに属しています。
ここで重要な点は、Drugなどの特定の画像コンテンツは攻撃と強く関連しているが、自転車、食糧などの他の画像コンテンツは攻撃との関係が非常に低い事です。
続きを読む

2018年10月29日

動物の鳴き声音声認識技術の詳細



笑い声の音声認識と同様に、動物の鳴き声も音声認識したいと言う話を聞いたのですが
これもほとんど取り組まれていません。 何故でしょうか? 家庭で音声認識するデバイス(Google Home,Amazon Echo等)はペットの声も聞き分けるべきであり、ニーズは結構あるはずなのですが

...様々な動物の鳴き声には性別と年齢によって有意差があったり、鳴き声で固体識別するような先行研究はあるのですが、そもそも根本的に、鳴き声とそれ以外の音の区別をするためには何が必要でしょうか?
知りたい事は動物の鳴き声にはどんな音響特性があるかという事で、学習モデルよりも特徴量の方が知りたい事です。

....................

Discrimination and retrieval of animal sounds
Dalibor Mitrovic, Matthias Zeppelzauer, Christian Breiteneder University of Vienna
Multi-Media Modelling Conference Proceedings, 2006 12th International. IEEE.
Until recently few research has been performed in the area of animal sound retrieval.
The authors identify state-of-the-art techniques in general purpose sound recognition by a broad survey of literature.
Based on the findings, this paper gives a thorough investigation of audio features and classifiers and their applicability in the domain of animal sounds.
2.1. Feature Extraction
時間領域の特徴には、Zero Crossing Rate(ZCR)とShort Time Energy(SET)を含みます。
線形予測符号化(RPC)係数、相対スペクトル予測線形符号化(RASTA PLP)、Pitclh 、Sone 、スペクトルフラックス(SF)と基本時間から周波数への変換係数(FFT、DCT、DWT、CWT、および一定のQ変換)。

ケプストラム領域の特徴は、メル周波数ケプストラム係数(MFCC)およびベーク周波数ケプストラム係数(BFCC)。

信号の波面の特性を記述する一連の新しい時間ベースの特徴も導入します。それらを、高次シーケンスの長さ(LoHAS)、低振幅シーケンスの長さ(LoLAS)、高振幅のエリア(AHA)と呼ぶ事にします。

線形予測符号化(LPC)は、信号圧縮、信号合成、音声認識で適用される信号処理で、LPCの目的は、音声信号からふぉルマントを抽出することです。
フォルマントは、線形予測器によって抽出され、その共鳴によって話者の声道(口、喉)を記述します。
LPC係数は、音声認識において音素区別するために使用されています。

ケプストラム係数(CC)は、信号のコンパクトで正確な高次表現を提供する。CCは、FFTまたはDCT係数または線形予測分析から導出されます。
MFCCの計算には、対数分解されたフーリエ係数のメルスケールへの変換が含まれる。
無相関でよりコンパクトな表現を受信するためにDCTが適用される。
BFCCは、MFCCと同様に計算される。適用されるバークスケールが異なります。
バークスケールとメルスケールは知覚的に動機付けされた音響スケールであり、信号の周波数を非線形にマッピングします。
両方の非線形スケールは、高い周波数よりも低い周波数に対して高い分解能を提供します。
MFCCとBFCCも同様に機能することが期待される。

....................
上記の機能に加えて、時間ベースの低水準機能も追加します。

高振幅シーケンス(LoHAS)の長さは、閾値より大きいか値を有する連続するサンプルの数を表す。
LoHASは、信号中の高エネルギーセグメントの長さの分布を表す。
同様に、低振幅シーケンス(LoLAS)の長さを、閾値を下回る連続サンプルの数として定義する。
LoLASは、信号中の低エネルギーセグメントの長さの分布を記述する。
高振幅のシーケンスは、波形の下の対応する領域によってさらに特徴付けることができる。
高閾値(AHA)の領域を、閾値と振幅との間の領域として、高次振幅シーケンスで計算する。
換言すれば、AHAは信号中の高エネルギーセグメントの程度を表す。
....................
2.2. Classification
この分類器を用います
  • SVM、
  • 線形ベクトル量子化(LVQ)、
  • k-Nearest Neighbor(NN)、
学習データセットは1クラス12サンプル
テストデータは、87匹鳥のサンプル  98匹猫のサンプル。 78匹牛サンプル。 72匹犬サンプル。
これらを音で区別する問題として設定します。

学習データが少なすぎるような気がしますが...



....................
SVMでの結果が一番良かったとの事ですが、それほど決定的な差にも思えません。
また、特徴量 MFCC,BFCC,LPC,AD で比較していますが、SVMではほとんど差がありません、

いくつかの特徴を1つに結合すると精度が向上しました、
このベクトルは、26の成分
LoHASのLoLASの3成分(平均、標準偏差、中央値)
4つのLPC係数
13のMFCC
平均SF
平均ピッチ、最初のRASTA PLP係数、およびSonieの平均 


....................このような通常の特徴量が、動物音声でも有効そうです。


続きを読む

tak_tak0 at 06:32コメント(0)研究 この記事をクリップ!
サイト内検索
にほんブログ村 科学ブログへ
にほんブログ村
adsense
Archives
amazon
blogchart
QRコード
QRコード
Recent Comments
o