ラベル AI生成美女 の投稿を表示しています。 すべての投稿を表示
ラベル AI生成美女 の投稿を表示しています。 すべての投稿を表示

2026年4月21日火曜日

エマ・ワトソン生成の周辺 4 生成される「エマ・ワトソン」の領域的な事

 


9117 AI-generated beauty with only Emma Watson's eyes
目だけエマ・ワトソン状態

エマ・ワトソン生成の周辺 4 生成される「エマ・ワトソン」の領域的な事


エマ・ワトソン系の顔と言うものがあって、〇〇系なんて言ってる時点で、既にエマ・ワトソンじゃないんだけど、「エマ・ワトソンを作った」と言う意味ではエマ・ワトソンと言えないこともないわけだ。そんな、同じ系統の顔、面長・眉やや太・目は小さめと、逆三角・目が大きめ、と、ややふっくら、今のところ多いものはこの3種が、今のところオレが把握しているところ。その範疇から出ると、急にエマ・ワトソンじゃなくなる

面長・眉やや太・目小さめとは「知的寄りクラスタ」ともいえ、骨格が縦に伸び、眉が印象を支配して、目は主張しすぎない、というところで、 一番“ハーマイオニー後期〜大人像”に寄るゾーンのイメージだ。

逆三角・目が大きめというと、「アイドル寄りクラスタ」といえようか。顎がシャープで、目で印象を作り、全体が軽い。 AIが“可愛い寄り”に引っ張るとこうなる感じ。

ややふっくらで「ナチュラル寄りクラスタ」は、頬にボリュームがあり、柔らかい輪郭で、陰影が浅い。 AIの“平均化”が強く出たときの落としどころだ。

なぜこの3つに収束するのかというと、AIは顔を作るときに、骨格(縦横比)、パーツの強弱(目・眉)、肉付き(頬・顎)、の3軸でバランス取るが、そのバランスが破綻しない“安全地帯”がこの3つ、ということらしい。
ここが重要なポイントで、この範囲を超えると急にエマ・ワトソンじゃなくなる。「エマ・ワトソンっぽさ=許容されるズレの範囲」であって、目を大きくしすぎたり、顎を削りすぎたり、頬を落としすぎたりと、どれかが閾値を超えると別クラスタ(別人)に飛んでしまう。

AIは、本人に近づきすぎると規制でズラすが、“エマ方向のベクトル”は残ってしまうわけだ。結果として、本人の周囲に“似て非なる群”がリング状に形成される、という構造になっている。

数学的に言うと、「本人=禁止領域」「その周囲=許容される確率分布」という状態ということらしいのだが、この“リング構造”が、エマ・ワトソン系の顔が3クラスタに分裂する理由の根本にある。もっとも、この「禁止領域の周囲にリングができる」現象は、実は敵対的生成ネットワーク(GAN)時代から観察されていた「モード崩壊」の変形版に近いらしい。中心を避けた結果、周辺のいくつかの安定点にサンプルが集まる、という構造は偶然ではなく、生成モデルの根本的な性質から来ているのだという。ということは「3クラスタ」というのは、エマ・ワトソン固有の話ではなく、「禁止領域を持つ任意の有名人」なら同様の分裂が起きうることだ。
AIは“破綻しない顔の局所最適解”を複数持っている。つまり、知的寄り、アイドル寄り、ナチュラル寄りは、AIが「顔の潜在空間」で安定して生成できる3つの谷(ローカルマキシマム)」  
だと言える。
中心点(本人に近い顔)は制限で避けられるが、周辺の“リング状の領域”にサンプルが出ると似てるけど本人じゃない顔が量産されるわけだ。
言ってみれば、「似顔絵の許容誤差マップ」のようなもので、手描きで言うと、ここはズレてもOK、だけどここはズレるとアウトという感覚を、AIが統計的にやってる。

合わせられる体形が製作者の欲望、願望、妄想が丸わかりで、こっちがちょっと気恥しくなるときがある。
顔は平均化・安全化されてるのに対して、体型は制約がゆるく、好みが出やすいので、不自然に細いウエスト、強調された胸やヒップ、現実より誇張された脚の長さ、のような、「誰が作ったかの癖」がモロに出る。

エマ・ワトソンっぽい顔というのは、知的、上品、比較的リアル寄りなのだが、そこに、極端な“理想化ボディ”が乗ると、当然ながらずれが生じる。
人間の違和感センサーが反応するポイントよいうと、特に引っかかるのは、顔と体の年齢感が違う、骨格の整合性が取れてない、重力や筋肉の付き方が不自然、というあたりになるが、モロ見えだと「うわ…」となる。

言い換える。顔は公共的な美であり、体=個人的な欲望であるとする。この二つが、言ってみれば分離して出てる状態だ。

なぜ気恥ずかしくなるのか?
多分ここが核心で、これを作った人の頭の中が見えるからだ。無意識の好み、理想像、誇張の方向、がダイレクトに出てしまう。手描きの似顔絵なら、顔をあれだけ似せようと苦労するなら、その熱量は自ずと体や背景の整合性にも向かう。しかしAIは、顔は「借り物(統計)」で解決し、体は「願望(プロンプト)」で盛る。この描画密度のムラが、見る側に「作者の歪んだ執着」を透かして見せてしまうのではないか? 尤も、手描きの場合でも、顔だけ異様に丁寧で体はラフ、という絵は存在していて、それもやはり同じ「透けて見える感」を生む。つまりこれはAI固有の問題ではなく、「労力の分配が欲望の地図になる」という、表現一般に関わる話でもある。AIはそれを極端に、かつ大量に可視化しているということだ。手描きには多少の衒い躊躇いが出てしまう事はよくあるが、AIには遠慮はなく、もう、丸出し、と言う感じ。

回避するとしたら、もし“自然寄り”にしたいなら、体型を具体的に指定しすぎないとか、「現実的な骨格」「自然なプロポーション」など入れたりとか、ファッション寄りに寄せるとかすれば、だいぶ落ち着くかもしれない。

2026年4月12日日曜日

9102 AI-generated beauty who couldn't quite become Emma Watson

 





エマ・ワトソン生成の周辺 3 写実から印象へ


 しかし、まぁ、目とか眉とか花とか口とか、一個一個のパーツはエマ・ワトソンなのに、微妙にすでにエマ・ワトソンじゃなかったりしている画像もそろそろ多く見るようになってきた。なぜ「パーツは同じなのに別人になる」のか
 ひとつには、AIは“平均化マシン”であるという側面がある。AIは学習した顔を、そのままコピーするんじゃなくて、分解して再合成するので、目、鼻、口それぞれ、それっぽい平均同士で組み合わせる。すると、「全部それっぽいのに本人ではない」ことになってしまう。

  “一致しすぎ”を避ける挙動もある。最近のモデルは、特定人物に近づきすぎると判断すると、わざとズラすので、目は近い、口も近い、でも配置や比率が少し違う、みたいな状態になる。

 一致しすぎを避ける挙動は、今のモデルではほぼ確実に入っている。これは技術的にも倫理的にも重要で、最近の大手モデルは、特定人物の特徴量が閾値を超えると、 自動的に“似度を下げる方向”へノイズを加えるという処理をしている。だから、それぞれのパーツの配置、秘湯ひとつは似ているのに、配置をずらしてしまう。“意図的な破調”が起きる、ということだ。これは人間が描く似顔絵とは真逆で、人間は「配置こそ命」だが、AIは「配置こそズラす」。

  顔は“配置”が本体である。人間が顔を認識するときというのは、パーツ単体より配置(距離・比率)を見ている。だから、目の位置が1mm違うとか、鼻と口の距離が微妙に違うだけで、完全に別人に見えてしまう。

  “エマ・ワトソン風クラスタ”ができている。更には、AIの中に「エマ・ワトソンっぽい顔の集合」みたいなのができてる状態で、本人ではないが、分布の中にいる顔が量産される。
 「本人」ではなく、「その人に似た確率分布」からサンプリングしているような状態だ。

 いわば、「エマ・ワトソン」という名の「イデア」化である。今のAI空間における彼女は、もはや実在の俳優というより、プラトンの言う「イデア(理想形)」に近い存在に変質しているのかもしれぬ。実在の彼女から離れ、AIが導き出した「知的な西洋美人の最大公約数」という**スタイル(様式)**として独立してしまっている。
 参照の連鎖、則ち、AIが生成した「エマ風」画像を、次のAIが学習する。このループによって、オリジナルからは遠ざかるものの、「AI界における正解の顔」としての強固なスタンダードが構築されていく。これはまさに「シミュラクル(元型のない写し)」の世界だ。

 ある意味、哲学的状況とでも言おうか。元の本人とAIが作る“似て非なる群”が分離し始めてる状態だ。言い方を変えると、「実在の人物が“顔のスタイル”として抽象化された」、と。

 このような現象は、今後もっと増えていって、「誰かに似てるけど誰でもない顔」が一つのジャンルになっていくかもしれぬ。
 実際、「東欧出身のモデル」という触れ込みの、何となく誰かに似たすこぶる美女という画像、何人か、というべきか、何組かというべきか、一昨年後半くらいからちらほら見かけるようになっている。SNSのアカウントと彼女達のポートレートを売るサイト以外で見かけないのだが。つまり、実在を偽って、と言う事だったが、もう、最近では最初からAI生成の架空美女と最初からオープンにしているパターンの方が多いようだ。


 リアルな似顔絵を手書きで描いてた経験がある身としては、毛一本分のずれ、陰影の領域のミリ単位のずれで、全然別物になることを知っているので、まぁ、これはこれで面白い。
 これらの画像群を、AIが描いた美人として考えるならそれはそれで面白いので可としていいのではないかと思っている。

 人間とAIでは、やってることは似てるが違う。毛一本分、陰影のミリ単位のズレで別人になるということは、人間は「ここを外すと似なくなる」という“危険ポイント”を意識して描いてる。一方AIは「全体としてそれっぽい分布に収める」ことを旨としている。
 人間はピンポイントで一致を狙うが、AIは全体のバランスで“似てる範囲”に入れてくる。
 AIは例えば、目の幅や鼻の高さ、口の形はそれぞれOKでも、「それらの相対関係の精度」が甘い。人間だとここが一番重要なのに、AIはここを“統計的にそれっぽい位置”に置く。
 パーツの正解、関係の不正解がおきているわけだ。AIは個々のパーツ(テクスチャや形状)を再現するのは得意だが、それらを繋ぐ「空間的な緊張感(ミリ単位の距離感)」の重要性を、人間のような「美意識」としては理解していない。
 統計的な「緩み」もある。AIにとっての正解は「点」ではなく「面(確率分布)」なので、配置にどうしても「統計的な甘さ=緩み」が出てしまう。その緩みが、破綻はないけれど記憶に残らない、あの特有の「ツルリとした無個性」を生んでいるのだろう。
  人間の顔の記憶は、実は「整っている部分」よりも「平均から外れたノイズ(左右非対称、独特のシワ、パーツの癖)」に強く依存している。AI美人はそのノイズを徹底的に排除して「平均」に寄せてしまうため、脳が「これは情報(個体)ではなく、背景(パターン)である」と処理してしまい、記憶のフォルダに残らない。

 結果として生まれてるのが、「特定個人ではないが、非常に整った顔」。いわば、似顔絵でもない、写真でもない、完全なオリジナルでもない。
  “AI美人”というジャンルは、もう一つのジャンルとして成立している、と言うことにしておこう。特徴としては、破綻が少ない、平均的に整っている、でも記憶に残りにくい(個性が薄い、っていうかリアルで合わないと、おじさん、記憶が定着しないのよ)。
 これら「似せるべきズレを外してる」が「でも破綻はしてない」。だから、「惜しい」ではなく、「別ジャンルとして成立してる」。

 逆にこの様にもいえる。「ツルリとした無個性」という言葉が出てきたが、これは実は江戸時代の美人画にも似た問題がある。鈴木春信や喜多川歌麿の美人は、個人の肖像ではなく「美のジャンル」であって、誰が誰だか顔では区別がつかない。AIが今やっていることは、ある意味、浮世絵の美人画が辿った道の現代版かもしれない。

 かつて写真が登場したときに絵画が「写実」から「印象」へと役割を変えたように、AIが「平均的な美」を独占したことで、人間は**「あえて平均を外す、一回性のズレ」**に価値を見出すフェーズに入ったのかもしれぬ。
 「パーツは本人、配置は別人」というこの奇妙な過渡期を、面白がりながら描き、綴っていく、というのが、今のところのオレの作業仮説になっている。

2026年4月7日火曜日

9089 AI生成のエマ・ワトソンは段々エマ・ワトソンじゃなくなってきてる

 

9089 AI生成のエマ・ワトソンは段々エマ・ワトソンじゃなくなってきてる

エマ・ワトソン生成の周辺 2


 一時期爆発的に増えた有名人の生成画像、いろいろ権利問題とかあって、さっと姿を消したが、未だにエマ・ワトソン氏の画像は多く見かける。ガル・ガドット氏の者も多かったのだが、最近は視なくなった。エマ・ワトソン氏、その辺おおらかなんだろうか?

 結論から言うと、「本人がおおらかだから多い」というよりは、技術的・文化的な条件がたまたま全部そろっているのが大きいのだそうだ。
 エマ・ワトソン氏の顔というのは、 “基準顔”に近いポジションなのだという。顔の左右対称性が高く、パーツ配置が平均に近い。おまけに、幼少期から大人まで大量の画像が存在する。それで、AIの中で「美人顔のテンプレ」にかなり近い位置にいるらしい。結果として、名前を出さなくても似てしまうんです。
 『ハリー・ポッター』の影響が大きくて、子役時代から現在までの膨大な画像あり、世界中で共有された素材や年齢ごとの顔変化データまで揃ってる。これらが揃ってる人は、かなり限られているのだろう。 学習データ量が段違いということだ。彼女はユニセフの活動やアカデミックな場での露出も多く、過度な加工や特殊なライティングではない「素に近い、フラットで高品質な写真」がネット上に膨大にある。これがAIにとって、顔の構造を学習する上で極めて良質な「教科書」になってしまった可能性はある。

 知名度もちょうどいい。超トップ(例:テイラー・スウィフト級)だと、規制が厳しくなりがちだし、マイナーでは、そもそも生成されない。超トップと言うわけではない、でも結構メジャーな氏だと、「誰でも知ってるけど規制の圧がまだ分散してる」という絶妙なポジションにいる。

 ハーマイオニーというキャラクターと結びついていることも大きいし、その後は大人の女優(洗練)という“属性セット”が強い。従ってプロンプトで「知的な英国女性」みたいに書くと自然に寄っていく。
 ほかに「標準顔」というとアン・ハサウェイ氏の者があるらしいが、オレは目にした記憶はない。アン・ハサウェイ氏の場合は、「標準顔」であったとしても、エマ・ワトソン氏ほど幼少時からの顔写真がそろっていない、と言うこともあるのかもしれぬ。


 まぁ、やたら目にする、というのは、一度「似やすい」と分かると、みんなが試すし、そうすると画像が増える。さらに似せやすくなる、というループが起きる。結果として「やたら多く見える」わけだ。 ネット文化のミーム化というわけだ。
 特に2022〜2023年の「画像生成AIバブル初期」は、Stable Diffusionが完全無規制、LoRAで有名人そっくりモデルが量産、海外コミュニティで“名前回避プロンプト”が流行、SNSで拡散されまくる、という時期だった。この頃に作られた画像が、今もPinterest・Reddit・X・Tumblrなどで延々と再投稿され続けているわけで、今も大量にあるように見えるということだ。実際には、今の大手モデルはほぼ全滅レベルで有名人生成をブロックしている。



 おおらかなのか?と書いたが、 本人のスタンスはあまり関係ないとのことだ。本人が寛容かどうか、事務所が厳しいかは直接的にはほぼ関係ないです。今はプラットフォーム側(MetaやOpenAIなど)の規制が主導している。

 逆に、「AIが全然似せられない有名人」もいて、そっちはかなりクセの強い顔だったりする。あの人とかあの人とか。


 名前を出さずにプロンプトで本人を描かせるということだが、オレは、有名人じゃなくて、ゴジラをゴジラの名前出さずに生成するときのプロンプトについて、いろいろやったことがある。特にハリウッドゴジラを作る時は、熊の体形にワニの顔、全身ワニのうろこ、と言うのが基本になった。
 固有名詞を封じられたときのやり方は、「特徴の分解 → 再構成」となる。