※当サイトは、アフィリエイト広告を利用しています。

スモークを使った白基調のテーブルフォト、前に実写で苦戦したビジュアルを、生成AIで再現できるか試してみる。

1年ほど前に、小型のスモークマシンとフロストのグラスを使って、白い背景に白いグラスというテーマでテーブルフォトを撮って記事にしたことがあります。

そのときは、まずガラス天板で失敗し試行錯誤の末、白いアクリル天板を使って何とか仕上げるのとができたのですが、かなり苦戦しました。

今でももう少しやりようがあったのかもと悔いが残る感じでした。

最近、生成AIもちょっとずつ利用するようになってきたので、同じようなビジュアルをAIで再現できるのか試してみることにします。

カエル
カエル

これがその記事です。

【被写体は実写を使用】今回はグラスではなくボトルを使う。

商品写真のイメージ画像を想定しているので今回、フロストのボトルは生成画像ではなく実際に撮影します。

まだまだ商品写真として純粋に画像生成したものを実際の広告で使うのをためらう人が大多数だと思います。

しかし背景として生成AIを使うのには抵抗がない人は多いのではないでしょうか。

これはやはり切り抜き合成という手法が昔からあり、定着しているのは、大きいと思います。ボトルのライティングについては以前記事にしたものと、ほぼ同じです。

【問題発生】Geminiで画像生成する際の注意点

新しいスレッドを立ててまずこんなコメントをアップしました。

カエル
カエル

切り抜き透過したフロストガラスボトルのPNG画像とプロンプトを、こちらからアップしますのでそれをもとに白いスモークを纏った画像を生成してほしいです。

するとこんな回答が返ってきました。

Gemini
Gemini

大変申し訳ございませんが、私(Gemini)はユーザー様が直接アップロードした画像を受け取ったり、その画像を「切り抜き透過したPNG」として認識・処理したりする機能を持っていません。また、アップロードされた画像を編集する機能も備わっていません。そのため、ユーザー様がアップロードされた画像を元に**「白いスモークを纏った画像」を生成することは、現在の私の能力では不可能です。**

Geminiには提供された画像を加工する機能はないのです。提供できるのはあくまでもサンプル画像です。たとえ生成された画像とサンプル画像が見分けがつかないほど似ていても、加工するというスタンスではなく生成するという立場だということを、憶えておきましょう

商品写真(サンプル)をGeminiに渡してプロンプトで指示。

さて、商品写真(あくまでもサンプル)は撮影できました。まずはイメージ用の資料としてそのままGeminiに渡し、このサンプルイメージを活かしてスモークをまとった画像を生成してもらうことにしました。プロンプトは記事の企画を相談しているスレッドで別のGeminiからもらったものです。

PROMPT

この画像からインスピレーションを受けて、この写真が本来持っていたであろう「幻想的でハイクラスな雰囲気」を、あなたの能力で最大限に引き出した、新しいフォトリアルな画像を生成してください。

元の写真の「フロストボトル」という被写体と、「白いスモーク」という要素は尊重しつつ、全体をより洗練された、完璧な構図の商業写真としてゼロから再構築(re-imagine)してください。

特に、ボトルがスモークに包まれている「空気感」や「レイヤー感」を重視してください。

果たして、画像生成の結果は?

確かに指示通りではあるのですが。やはり言葉の壁というか、解釈の違いというか言葉でのイメージの共有というのは難しいですね。

その後「春霞の山の風景のような」とか「淡い色調の日本画のような」とかプロンプトを追加してみたのですがあまり変化がありませんでした。

最後に以前記事にしたスモークとグラスの写真も見せたのですが、時既に遅し。

何度か経験している最初の画に固執するAIのクセ(Geminiはアンカーと呼んでいる)が出て、なかなか絵柄を修正してくれませんでした。

カエル
カエル

その後、プロンプトを工夫したりサンプル画像を見せたりしましたが、ほとんど変化ナシ。

こうなったら、前にやった「ラフスケッチ」のように、フォトショップでイメージイラストを作ろう。

カエル
カエル

ブラシツールと消しゴムでフォグのイラストを描き込みました。

ということで、前回うまく行ったラフスケッチを使った指示を試すことにします。

今回はスモークということで線画での表現が難しいのでフォトショップでボトルの上と下にレイヤーを作りブラシツールでスモークっぽい絵を描いて、イラストを作りました。

15分程かかりましたが、多分AIが見ても理解できそうな気がします。

イラストとグラスの写真をGeminiに見せて画像生成してもらう。

同じスレッドだと前回のアンカーが影響するかも知れないので、新しい専用のスレッドを作り、先入観のない状態で、最初から生成してもらうことにします。

最初が肝心だと学習したので、今回はボトルのイメージイラストとグラスの写真を同時にサンプルとして見てもらい、スモークの様子は写真に合わせてもらう指示をしました。

カエル
カエル

以前撮ったグラスの写真も資料で付けます。

PROMPT

この2枚の画像を参考にしてフォトリアルなボトルの画像を作ってください。フォグの雰囲気はグラスの画像を参考にしてください。

結果はこれ、ほぼ狙い通りの画になったと思います。

ラベル部分が見えにくくなっているのでスモークの量を50%くらいに減らしてと指示。

カエル
カエル

やはり、最初の指示がとても重要だと言うのが分かります。よく見るとボトル上部の質感が少しだけ変わっています。

フォグの量が少なくなりすぎたのですが、ここからの修正なら微調整ができそうです。フォトショップなどで、通常の後処理で加工してもいいかも知れません。

まとめ

生成AIと実写の融合という企画で試した実験でしたが、生成AIには実写の加工という考え方が無いというのは、新しい発見でした。

フォトショップにもAIは組み込まれていて実際の写真を加工しているはずなのですが、ここはアプリの設計思想の違いということなのでしょうか。

カエルの肌感覚ではGeminiにサンプルとして渡した画像は大きく崩れるようなことはなく、加工したものと比較しても見分けがつかないくらい、ディテールをキープしているように感じました。

言い方を変えれば初期プロンプトを段階でのAIのアンカー(クセ)を利用した感じだと思います。

厳密に言えば、実写画像ではないということなので気になる方もいると思いますが、撮影前のシミュレーションに使ったり、プレゼン用の資料にするなど、時短になりそうな使い方は今でもできそうです。

画像生成の歴史はまだ始まったばかりなのでこの先どういった使い方があるのかは未知数ですが、技術的な進歩が凄まじいのは間違いないですね。

カエル

カエルです。名前は「かんたんライティング」の頭文字Ka.L.からとりました。本業はグラフィックデザイナーで必要なときに商品写真やイメージ素材写真を撮ることがあります。カエルがデザイナー目線で調べたり工夫したり、試してみたいことなど写真撮影の小ネタを紹介できたらと思っています。アイデアが写真の完成度を上げられますように。

カエルをフォローする
ライティングTIPS
シェアする
カエルをフォローする