
最近の「お絵かきAI」の流行は凄まじいもので、日々進化を繰り返しています。それらのAIはユーザーから言葉で指示(プロンプトと言います)を受けて画像を生成する使い方が中心ですが、元となる画像を受け取って、それを仕上げるといった「img2img」と呼ばれる使い方も可能です。
AIにローポリキャラを高精細にしてもらおう!
そこで、AIに昔の作品のスクリーンショットを渡して、リアル風、もしくは高解像度のアート風に仕上げてもらえば、あの頃ローポリゴンのキャラを見て脳内で補完していた幻想の姿が現実になるのではないか?ということで、今回は『トゥーム・レイダー』シリーズから「ララ・クロフト」をAIに与えて、どのようにイメージを補完してくれるのか実験してみます。


対象はSteamで販売されている1996年版の『Tomb Raider I』と、比較するとやや高グラフィックな2007年発売の『Tomb Raider:Anniversary』の2つ。始まる前の予想としては、アニバーサリー版はカクカク感が大分薄れているので、思ったほど効果が得られるか不安、といったところです。
流石にローポリな『Tomb Raider I』
今回使用するお絵かきAIは「Stable Diffusion」です。環境としては「Stable Diffusion web UI」を使用し、モデルは特にチューニングされていないオリジナルの「sd-v1-4.ckpt」を選択しました。使用するモデル、またAIに与えるプロンプトと細かな設定で出力結果がかなり変わるのですが、まずはプロンプト無し、特に設定も弄らずに試してみましょう。
まずは『Tomb Raider I』から、キャラクターの移動に合わせてカメラが自動で動いてしまうので正面を向かせるのに苦労しましたが、何とか使えそうな1枚をパシャリ。

これが当時の技術力と考えると、時代の進歩を感じます。さて、背景の雪はともかく、タンクトップと両手の銃くらいは認識してもらいたいところです。結果はどうなるでしょうか?

病院か何かをモチーフにした現代アート風の何か、が出来てしまいました。同じ条件で何度か試しましたが、「白灰色の背景によく分からないオブジェクト」といったパターンが多く、思っているような形で画像が認識されていないことが判明しました。
さすがに意図と逸れ過ぎているので、元の構図をどれだけ保持するかを決めるパラメータなどを調節し、プロンプトに「Lara Croft」、「Tomb Raider」などのキーワードを書き記して様子を見てみます。

こちらは何度か試した中の比較的良い1枚です。方向性は間違いなく合っているのですが、何度生成しても顔が崩れてしまうことが多く、そもそもキャラクターが遠景すぎるのでは?という疑問が生じてきたので、元画像をトリミングして試してみます。
人物をアップにするのが鍵

かなり低解像度になってしまったので不安ですが、どうなるでしょうか?

インパクトのある結果が得られました。これは成功と呼んでも良いのではないでしょうか?この1枚が生成された時はプロンプトに「Photo」や「Realistic」といったキーワードを盛り込んでいたため、その影響もあるかもしれません。心なしか映画版の主演「アンジェリーナ・ジョリー」の面影も見られます。
パラメータを元画像寄りに調整するとこのように。

少し目元が怖いですが、3Dアニメのような味のある1枚になったりもします。
比較すると滑らかと言えるアニバーサリー版
同様に、アニバーサリー版も調整を絞りながら生成してみます。先程の結果を踏まえるとこちらも良い結果が得られそうです。

スタート画面をそのまま投入してみた結果はこちら。

メニューやタイトルらしきものを保持しようとするAIの姿勢は評価したいですが、やはり人物が遠いと顔が崩れやすいです。トリミングしてアップにする必要はありそうです。

トリミングして試した結果はこちら。

かなりステキな1枚が得られました。生成結果を見るに、まつ毛がバチバチで眼力が強そうというのがAIの持つ「Lara Croft」のイメージなのかもしれません。
以下はサングラスを掛けたゲーム内の1枚。glasses(メガネ)をプロンプトに入れないとサングラスを認識せず、無いものとして扱われてしまうといった問題点もありました。


結論としては満足いく結果に

今回はフォトリアルな生成結果になることが多く、最新作のゲーム画面と比較しても写実的な1枚が得られました。もちろん1枚の画像なのであのグラフィックが動くわけではないのですが、それでもお絵かきAIの実力は十分に確かめられたと言えるでしょう。とはいえまだまだ万能とは言えず、こちらの意図を汲んで貰うにはプロンプトを練る必要があるといった課題もあります。
筆者としては「逞しさと美しさを兼ね揃えた女性」というのがララ・クロフトのイメージなのですが、大量の生成結果を見てみても凛々しい表情で出力される傾向にあり、あのローポリゴンが納得行く形で美麗グラフィックに変換されて大変満足です。アニバーサリー版も予想より効果がありました。
もちろん、今回の結果はAIが学習して生成したものから、見栄えの良いものを選択してご紹介しただけに過ぎません。各個人があの日ローポリゴンのキャラに見た幻想を否定するものではないのでご注意を。
(編注)あのゲームやこのゲームのキャラを高解像度化してみてほしい!などありましたら、コメント欄にお気軽にどうぞ。ご意見ご感想お待ちしております。