
画像から人物のポーズを認識し、それを元にAI画像を出力することが可能な技術「ControlNet」が発表され、注目を集めています。
ControlNetには画像を線画で認識するなどの技術も含まれていますが、中でも注目を集めているのは、画像に写った人物のポーズを棒人間の形で認識し、それを元にAI画像を生成する技術です。
今までは、AIにポーズを指定して人物を生成させるためには長いプロンプト(AIに文章で出す指示)が必要でした。その上、意図したポーズで出力されるとは限らず、例えば「腕を広げている人」と指示しても、どの程度腕を広げているのかなど、細部を制御するのが難しくありました。
ControlNetは人体を部位ごとに認識し、それを元に画像を生成するため、ポーズを指定するプロンプトが無くても、かなり正確に意図したポーズを取らせることが可能。元となる画像が無くても、棒人間を直接編集する「posex」なども存在します。

画像から棒人間の形で人物を認識するため、ゲームのキャラクターにエモートなどでポーズを取らせ、そのスクリーンショットを読み込ませることもできます。ただし人物を認識しやすいように、背景は出来る限り無地が好ましいかもしれません。