2023年01月18日
単一画像生成 DropTheGAN の実装
![]() | Tweet |
![]() |
DropTheGANで何が出来るのかは実際に試してみると良く分かると思います...
...こうして実行するだけです。
SinGANよりは早いですが、しかしDropTheGANでも結構時間がかかるような気がします。 途中で経過が一切表示されないので...
画像サイズが大きい方が時間がかかるでしょうか?
generation
retargeting
editing
conditional_inpainting
structural_analogy
generation よりも editing , structural_analogy 等の方が更に長く時間がかかるような気がします。
conditional_inpainting が実行出来なかったんですが...マスク画像の与え方が正確には分からないです。
GPUの指定法は --device=cuda:0 で合ってるでしょうか?
...................
...................
しかしDropTheGANでは、semanticな意味ある物が入っている画像は上手く操作出来ないと思います。 人物や、ましてや顔面など到底無理です。 やってみればすぐに分かると思います。
風景、背景の様に平坦で地味な意味の画像でなければ上手く行かないと思います。
git clone https://github.com/WeizmannVision/DropTheGANレポジトリは必要です。
cd DropTheGAN
import fireこうなってしまったので、fireのインストールが必要だと分かりました。
ModuleNotFoundError: No module named 'fire'
pip install fireconda とかは必要なかったと思います。
...こうして実行するだけです。
python main.py generation --input-path="input.jpg" --output-path="output.jpg"
SinGANよりは早いですが、しかしDropTheGANでも結構時間がかかるような気がします。 途中で経過が一切表示されないので...
画像サイズが大きい方が時間がかかるでしょうか?
python main.py application可能なapplicationは以下です... --help で引数も見られるので迷う事は無いと思います。
generation
retargeting
editing
conditional_inpainting
structural_analogy
generation よりも editing , structural_analogy 等の方が更に長く時間がかかるような気がします。
conditional_inpainting が実行出来なかったんですが...マスク画像の与え方が正確には分からないです。
File "fold.py", line 30, in unfold2d
raise ValueError('expects a 4D tensor as input')
ValueError: expects a 4D tensor as input
GPUの指定法は --device=cuda:0 で合ってるでしょうか?
...................
...................
しかしDropTheGANでは、semanticな意味ある物が入っている画像は上手く操作出来ないと思います。 人物や、ましてや顔面など到底無理です。 やってみればすぐに分かると思います。
風景、背景の様に平坦で地味な意味の画像でなければ上手く行かないと思います。