エマ・ワトソン生成の周辺 3 写実から印象へ
しかし、まぁ、目とか眉とか花とか口とか、一個一個のパーツはエマ・ワトソンなのに、微妙にすでにエマ・ワトソンじゃなかったりしている画像もそろそろ多く見るようになってきた。なぜ「パーツは同じなのに別人になる」のか
ひとつには、AIは“平均化マシン”であるという側面がある。AIは学習した顔を、そのままコピーするんじゃなくて、分解して再合成するので、目、鼻、口それぞれ、それっぽい平均同士で組み合わせる。すると、「全部それっぽいのに本人ではない」ことになってしまう。
“一致しすぎ”を避ける挙動もある。最近のモデルは、特定人物に近づきすぎると判断すると、わざとズラすので、目は近い、口も近い、でも配置や比率が少し違う、みたいな状態になる。
一致しすぎを避ける挙動は、今のモデルではほぼ確実に入っている。これは技術的にも倫理的にも重要で、最近の大手モデルは、特定人物の特徴量が閾値を超えると、 自動的に“似度を下げる方向”へノイズを加えるという処理をしている。だから、それぞれのパーツの配置、秘湯ひとつは似ているのに、配置をずらしてしまう。“意図的な破調”が起きる、ということだ。これは人間が描く似顔絵とは真逆で、人間は「配置こそ命」だが、AIは「配置こそズラす」。
顔は“配置”が本体である。人間が顔を認識するときというのは、パーツ単体より配置(距離・比率)を見ている。だから、目の位置が1mm違うとか、鼻と口の距離が微妙に違うだけで、完全に別人に見えてしまう。
“エマ・ワトソン風クラスタ”ができている。更には、AIの中に「エマ・ワトソンっぽい顔の集合」みたいなのができてる状態で、本人ではないが、分布の中にいる顔が量産される。
「本人」ではなく、「その人に似た確率分布」からサンプリングしているような状態だ。
いわば、「エマ・ワトソン」という名の「イデア」化である。今のAI空間における彼女は、もはや実在の俳優というより、プラトンの言う「イデア(理想形)」に近い存在に変質しているのかもしれぬ。実在の彼女から離れ、AIが導き出した「知的な西洋美人の最大公約数」という**スタイル(様式)**として独立してしまっている。
参照の連鎖、則ち、AIが生成した「エマ風」画像を、次のAIが学習する。このループによって、オリジナルからは遠ざかるものの、「AI界における正解の顔」としての強固なスタンダードが構築されていく。これはまさに「シミュラクル(元型のない写し)」の世界だ。
ある意味、哲学的状況とでも言おうか。元の本人とAIが作る“似て非なる群”が分離し始めてる状態だ。言い方を変えると、「実在の人物が“顔のスタイル”として抽象化された」、と。
このような現象は、今後もっと増えていって、「誰かに似てるけど誰でもない顔」が一つのジャンルになっていくかもしれぬ。
実際、「東欧出身のモデル」という触れ込みの、何となく誰かに似たすこぶる美女という画像、何人か、というべきか、何組かというべきか、一昨年後半くらいからちらほら見かけるようになっている。SNSのアカウントと彼女達のポートレートを売るサイト以外で見かけないのだが。つまり、実在を偽って、と言う事だったが、もう、最近では最初からAI生成の架空美女と最初からオープンにしているパターンの方が多いようだ。
リアルな似顔絵を手書きで描いてた経験がある身としては、毛一本分のずれ、陰影の領域のミリ単位のずれで、全然別物になることを知っているので、まぁ、これはこれで面白い。
これらの画像群を、AIが描いた美人として考えるならそれはそれで面白いので可としていいのではないかと思っている。
人間とAIでは、やってることは似てるが違う。毛一本分、陰影のミリ単位のズレで別人になるということは、人間は「ここを外すと似なくなる」という“危険ポイント”を意識して描いてる。一方AIは「全体としてそれっぽい分布に収める」ことを旨としている。
人間はピンポイントで一致を狙うが、AIは全体のバランスで“似てる範囲”に入れてくる。
AIは例えば、目の幅や鼻の高さ、口の形はそれぞれOKでも、「それらの相対関係の精度」が甘い。人間だとここが一番重要なのに、AIはここを“統計的にそれっぽい位置”に置く。
パーツの正解、関係の不正解がおきているわけだ。AIは個々のパーツ(テクスチャや形状)を再現するのは得意だが、それらを繋ぐ「空間的な緊張感(ミリ単位の距離感)」の重要性を、人間のような「美意識」としては理解していない。
統計的な「緩み」もある。AIにとっての正解は「点」ではなく「面(確率分布)」なので、配置にどうしても「統計的な甘さ=緩み」が出てしまう。その緩みが、破綻はないけれど記憶に残らない、あの特有の「ツルリとした無個性」を生んでいるのだろう。
人間の顔の記憶は、実は「整っている部分」よりも「平均から外れたノイズ(左右非対称、独特のシワ、パーツの癖)」に強く依存している。AI美人はそのノイズを徹底的に排除して「平均」に寄せてしまうため、脳が「これは情報(個体)ではなく、背景(パターン)である」と処理してしまい、記憶のフォルダに残らない。
結果として生まれてるのが、「特定個人ではないが、非常に整った顔」。いわば、似顔絵でもない、写真でもない、完全なオリジナルでもない。
“AI美人”というジャンルは、もう一つのジャンルとして成立している、と言うことにしておこう。特徴としては、破綻が少ない、平均的に整っている、でも記憶に残りにくい(個性が薄い、っていうかリアルで合わないと、おじさん、記憶が定着しないのよ)。
これら「似せるべきズレを外してる」が「でも破綻はしてない」。だから、「惜しい」ではなく、「別ジャンルとして成立してる」。
逆にこの様にもいえる。「ツルリとした無個性」という言葉が出てきたが、これは実は江戸時代の美人画にも似た問題がある。鈴木春信や喜多川歌麿の美人は、個人の肖像ではなく「美のジャンル」であって、誰が誰だか顔では区別がつかない。AIが今やっていることは、ある意味、浮世絵の美人画が辿った道の現代版かもしれない。
かつて写真が登場したときに絵画が「写実」から「印象」へと役割を変えたように、AIが「平均的な美」を独占したことで、人間は**「あえて平均を外す、一回性のズレ」**に価値を見出すフェーズに入ったのかもしれぬ。
「パーツは本人、配置は別人」というこの奇妙な過渡期を、面白がりながら描き、綴っていく、というのが、今のところのオレの作業仮説になっている。
