ユーザーのニーズに合ったビジュアルコンテンツを合成するには、しばしば生成されたオブジェクトのポーズ、形状、表情、レイアウトを柔軟かつ正確に制御する必要があります。既存の手法では、生成的対抗ネットワーク(GAN)の制御性を向上させるために、手動で注釈付きのトレーニングデータや事前の3Dモデルを使用していますが、これらは柔軟性、精度、汎用性に欠けることがよくあります。本研究では、GANを制御するために、非常にパワフルであるがあまり探求されていない方法を研究します。