2021年01月26日

stylegan2-adaの実装、実行方法



adaを用いれば、少量データでstylegan2のモデルを学習出来ます。
もう一つの利点として、stylegan2の事前学習モデルから転送学習する事によって、目的のモデルをとても早く学習出来るようです。

git clone https://github.com/NVlabs/stylegan2-ada.git
cd stylegan2-ada

tensorflowのバージョンは1.xxでなければ実行出来ません。

こうして、画像データをTF records形式に変換しておく必要があります。
python dataset_tool.py create_from_images ./datasets/name ./images
imagesの直下に画像ファイルがあれば良いです。 train test 等のサブディレクトリは要りません。

dataのパラメータに、./datasets/nameの方を指定して読み込ませます。

...................
...................


1024より小さい画像を対象とする場合
モデルの解像度を変える(下げる)ために、こういう事をした方が良いらしいです。
git clone https://github.com/aydao/stylegan2-surgery.git
cd stylegan2-surgery

python create_initial_network_pkl.py --width 256 --height 256
これで、network-initial-config-f-256x256-0.pklと言うモデルファイルが作られます。

python copy_weights.py stylegan2-ffhq-config-f.pkl network-initial-config-f-256x256-0.pkl --output_pkl surgery.pkl
これで、モデルの重みをコピーします。

このモデルは、resumeのパラメータにパスを指定して、学習再開の形で読み込ませます。
最初の1回だけ、そうすれば良いです。



python train.py

...これで、train.pyを実行すれば学習が始まるはずなのですが...

私が試した範囲では
Colaboratoryでも、 python train.py とするとプロセスが何故か突然 ^C で止まりました。
どうも、メモリが足りなくなるようなのですが...

全く同じパラメータで、コードの方を直接実行した場合は学習が進むのですが...
一体何が違うんでしょうか




学習経過画像のfakes000000.pngは、40MB以上にもなる巨大な画像ファイルで、それだけで要領を圧迫してくるので困るのですが
モデルファイルで340MBぐらいなので、こんな画像を出力する仕様はどうなってるんでしょうか

モデルファイルの方は、 outdir の下のパラメータを文字列にしたディレクトリの更に下に、network-snapshot-000000.pklの様な名前で保存されます。

...私は独自モデルを得る事が目的なので、ここまで良いのですが


tak_tak0 at 17:24コメント(0)サーバ この記事をクリップ!

2021年01月19日

内発報酬による強化学習エージェントの評価 


外的に報酬を与えなくても、内発的動機づけによってエージェントを学習させると、人間がやるような行動をするようになると言う所が新規性だと思います。

Evaluating Agents without Rewards
Brendon Matusch  Vector Institute
Jimmy Ba  University of Toronto
Danijar Hafner  Google Brain
arXiv preprint arXiv:2012.11538 (2020).
Evaluating Agents without Rewards


Similar to Go-Explore
計算を扱いやすく効率的にするために、データセット内の画像を離散化して前処理します。
画像のサイズを8×8ピクセルに変更し、RGBからグレースケールに変換します。各セルを4値に離散化します。

3 Method
3つのAtariゲーム(Breakout Seaquest Montezuma)と Minecraftで強化学習エージェント(random, no-op, PPO, RNDn , RNDr , ICMn , ICMr)を学習し、21億タイムステップ分の経験データセットを蓄積しました。
3.1 Preprocessing

エージェントと環境のペア毎に、画像とアクションのtensorに要約します。

X:入力画像(状態)
A:アクション
1≦i≦|X|
1≦j≦|A|
1≦k≦|X|
Nijk : 画像iからアクションjを行って画像kへ遷移する数。
Nを正規化する事で、エージェントの各遷移の確率を示す確率テンソルPが生成されます。





intrinsic objectives
R Task Reward ,S Human Similarity ,C Input Entropy,I Information Gain,E Empowerment

タスク報酬、人間との類似性、入力エントロピー、エンパワーメント、情報ゲイン


Human similarity
人間らしい行動を捉えるために、同じ環境でのエージェントと人間の行動の類似性を計算します。
人間プレイヤー画像とエージェント画像の間のジャッカード係数(intersection over union)を類似性とします。
Input entropy
エージェントの入力エントロピーは、エージェントが達する入力が多いほど大きくなる傾向があり、換言すると、入力エントロピーは、個々の入力がどの程度ありそうもないかを測定します。
これは強化学習での探索に使用されており、学習密度モデルの下での入力の負の対数確率が探索ボーナスとして使用されています。
Empowerment
環境に対するエージェントの影響を測定します
エンパワーメントは、次の入力xを観察する前と後の、前の入力xが与えられた場合のアクションのエントロピーの差として計算します。
Information gain
これは、観察とエージェントによる環境の表現との間の相互情報量です。
現在の入力xとアクションaのすべてのペアについて、後続の入力x'に対するディリクレ分布であると仮定します。
情報量の合計は、遷移行列に対する事前と事後のエントロピー差です。




4 Analysis
タスクの報酬と各評価値、人間との類似性がどう関係しているのでしょうか?
RNDとICMはすべての環境で高いタスク報酬を記録します。入力エントロピー、情報ゲイン、そして人間との類似性の値も最も高くなっています。

...intrinsic objectivesは、タスクの報酬よりも人間との類似性により強く相関します。
この相関関係はすべての環境で一貫して保持されますが、タスクの報酬と人間との類似性は、環境の半分のみでした。


人間のプレイヤーと同様に動作するエージェントを設計する場合は、タスクの報酬よりもintrinsic objectives(Input entropy 、Empowerment、Information gain )をお勧めします。

...今回は観測値をバケットに割り当てるために、単純にそれらを縮小しました。これは単純なので、将来の作業の方向性として、ディープニューラルネットワークで入力を学習するべきです。



...逆に言えば、人間はタスクの報酬よりも、入力エントロピーやエンパワーメントに基づいた行動をしていると言えるのでしょうか?
ゲームに限らず、人間は必ずしもより大きな報酬のためだけに行動している訳では無いでしょうし


tak_tak0 at 06:36コメント(0)研究 この記事をクリップ!

2021年01月17日

買い占めが生じる理由,買い溜めする心理 

...この行動は人々が利己的であるからではなく、恐怖を覚えたときに何かをコントロールして安心感を得たいという欲求に駆られた結果なのかもしれない──。

  • 恐怖を感じやすい人ほど買いだめする

  • 一方で誠実性の値が高い人は、よりトイレットペーパーを備蓄する傾向が強かった。

  • 高齢者は若者より買いだめする傾向が強かったが、それはおそらく高齢者のほうが若者より感染のリスクが高く、厳格な自主隔離を選択する可能性が高いからだろう。


これらは既存研究と一致する傾向でしょうか? と言うより、日本人の場合の文化的差異はあるでしょうか?








買溜めパニックにおける消費者の意思決定モデル
広瀬幸雄 名古屋大学
社会心理学研究 1(1), 1985
...最後に、将来の緊急事態での買溜めの対象となる可能性の高い生活物資の例としてトイレットペーパーをとりあげ、その流通径路、流通システムが買溜めパニックの発生蓋然性とどのように関連しているのかを検討する。
パニックの背景段階(1973年10月18日以前)

1974年度の国民生活白書は、もの不足騒ぎの発生原因として、第1に、全般的な物価上昇のなかでの消費者の買い急ぎ機運が熱していたこと。第2に、中東産油国による原油価格引き上げおよび供給削減の決定が全般的な危機感を強めたこと、第3に、紙の需給の逼迫によってその先行不安が高まり、ロコミ、マスコミをつうじてその不安が拡大したことをあげている。
...一般消費者の間で広く関心をひき始めたのは、10月19日に政府が「紙使用合理化国民運動」を閣議決定し、それが報道されて以後のことであり、それはつぎの段階にかかわることである。

...1973年当時の物価の急上昇と、商社等大企業による物資への投機が批判的に報道されるようになり、消費者行動の潜在的因子となったと考えられる。
インフレと投機買い占めに対する政府の対応を見ると、政府は石油危機に対して有効な対処が出来ないだろうと消費者が考えるようになり、物不足状況下では買い溜めが合理的自衛措置であると認知されるようになった
その前段階で、商社が買い占め行為を行っている事が知られていたからである
緊急事態において政府が消費者を保護出来ないと思われれば、買い溜めと言う自衛措置を取るしかないと考える者が少なくなかった。

何故、最初の買溜めパニックの対象がトイレットペーパーであったのかを後智恵的に推測すれば、その主要な理由を次の2つに整理することができる。
10月17・18日の石油危機の直後の19日に、政府が「紙使用の合理化国民運動」を国民に呼び掛けたことが石油危機の下でまず最初に紙不足が発生するかもしれないという憶測を生じるのに大きな影響を及ぼしたと考えられる
第2には、関西の一部スーパーが、市価よりもかなり安価でしかも少量のトイレットペーパーを目玉商品として販売していたこと。諸物価急騰のもとで、安価に敏感な主婦が目玉商品に殺到することは当然である。




........................

緊急時における買溜めの意思決定過程
緊急時における購買行動の特徴

意思決定の緊急性緊急事態か否かの判断から適切な対処行動の実行に至る一連の判断が迅速でなければならない。
通常時においては合理的とされる、徹底的な情報探索や行動選択肢の綿密な評価などに時間をかけることは、緊急時においては適応的ではない
物資の高騰、品不足の深刻化、または競争相手の急増という事態が予測されるとすれば、今すぐに買溜めしなければ入手不能になる

このような場合には、あせりや不安という情動が喚起されて、一連の情報処理を迅速化する動因が強くかかるであろうし、したがって不充分な情報にもとづいて、リスクを伴った意思決定をせざるをえなくなる。
この傾向はパニックの後半の段階におけるほど顕著となる



...初期・中期における深刻さの内容はおもに安値のトイレットペーパーの品切れ、大幅値上げである。
インフレによる物価上昇や預貯金の目減りにたいして特に脅威を感じている人ほど深刻に受け止めるであろう。
後期における深刻さの内容はおもに、品不足でトイレットペーパーが入手できなくなるである。
これは恐怖を感じやすい人ほど早い段階で買いだめすると解釈して良いでしょうか?
段階が進むほど、恐怖などは関係無く必要に迫られての買い溜めをするしかなくなっていきます


oil shock 1974
買溜めパニックに対する流通システムの安全性の評価

店頭では品切れを起こしていても、在庫はあるはずだし継続的に生産もしているはずである。にも関わらずなぜ商品が無くなるという事態が生じるのか?
...卸売りとメーカーの在庫量の正確な数字が分からないため推定量となるが、トイレットペーパーとほぼ同量の在庫があると考えられる洗剤を参考にする。1日の販売量は約240パックである。
朝日新聞、読売新聞の調査によるとメーカーでは20日分、卸売り段階では12日分(2880パック)の在庫がある。三和銀行の顧客調査から推測される、1回の買い溜め量は約20パック以上
1店舗の顧客は約4700人とした場合、全体の3%が初期買い溜めに奔っただけで、卸売りの在庫を全て使い切る。
...メーカー、卸は適正在庫を維持するために在庫を0にする事はしないため、最低限、6日分は維持しようとする。
この場合、顧客の8%が買い溜めを始めただけで、店頭での品切れ状態が発生する。
続きを読む

tak_tak0 at 10:48コメント(0)resource この記事をクリップ!
サイト内検索
にほんブログ村 科学ブログへ
にほんブログ村
adsense
Archives
amazon
blogchart
QRコード
QRコード
Recent Comments
o