
人間が見ている世界って写真と比べると微妙に違いますよね。でも具体的に説明しろと言われると、うまく説明しにくい…。
今日は、ちょっと説明するとややこしい実験をしてみたいと思います。
普段、人は風景をどのように捉えているかをスケッチとカメラ、さらにAIの画像生成で実写化して比べてみるという企画です。
簡単にいうとカエルが公園に行ってスケッチをした後、同じ位置から、色んな焦点距離で、風景写真を撮って見比べ、どの写真が見た目に一番近いかを調べるのが主な目的です。
さらに自分で描いたスケッチと現場写真をミックスして確認するという流れです。
実家近くの公園で東屋(ガゼボ)をスケッチしてみる


冬というのもあり、人がほとんど居ない近場の公園

画角やパースの違いを見たいので、絵のモチーフは単純な形のものが良いと考え、公園の東屋を選びました。これでも最近、絵を描き慣れていない身としては結構ハードル高いです。
ちなみに柱の高さは、約3メートルです。スケッチする位置は一番手前の柱から5メートルにしました。
遠い位置からだと周りの風景は見やすくなりますが、パースがゆるくなり、遠近感がわかりにくくなるからです。
逆に近すぎるとパースはつきやすくなりますが、東屋だけが、目に飛び込んできて周りの風景の位置関係が把握しづらくなります。
程よく距離があって、パースも効いている距離がちょうど切りの良い5メートル付近だと思います。
腰を下ろして描いたので目線は地面から約80センチくらいです。
ほとんど人気のない公園なのですが、遠くにいた親子連れ二人が近づいてきて周りをウロウロし始めてスケッチに集中できませんでした。


現場で描いたクロッキーを下敷きにして加筆しました。
クロッキーでざっくりと当たりをとって、家に戻ってから若干加筆することにしました。
ちなみに、画角を感覚でどのように見ているか知りたかったので、デッサンスケールのような、ガイド的なものは全く使わずに目視だけで描いています。
スケッチと撮り比べ:24mm、50mm、85mm、肉眼に近いのはどれ?
スケッチ(クロッキー)を描き終えてから、撮影に取り掛かりました。今回持っていったカメラはフルサイズの24-120mmズームです。
24mm:スケッチの紙面の構図に一番近い

画角的にはこの写真がスケッチの構図に近いのですが東屋にはキツめのパースがかかり、ボリューム感にやや欠ける印象です。背景も遠近感が強調されパラッとした感じ
50mm:人間の見た目の感覚に近いと言われる焦点距離

見た目は確かに自然になりました。ただ画角的には周りの風景はカメラをずらしてコラージュしないと全景を捉えられません。
85mm:現場で観た印象とパース感が最も近いと感じた。

実はこの85ミリが実際に肉眼で見たときの存在感に一番近い印象でした。しかし50ミリのときと同様画角が狭くなるので、さらに細かくずらしながらコラージュしなければなりません。
『標準50mm説』は本当か?見えてきた人間の視覚の二重構造
カメラ業界や愛好家の人たちがよく話題にする焦点距離の話題、特に標準レンズと言われる50ミリが人の見た目に近いと言われるのに妙に納得してしまいました。
今回、東屋をモチーフにしてスケッチをしましたが、24ミリくらいの構図だと正直、画面の外側の景色はちゃんと見えている感覚が薄かったです。
木の位置やディテールを確認するために視線を意識的に移動する感じになります。
それに比べ50ミリくらいの画角だとなんとなく全体の雰囲気はつかめている感覚があります。
今回東屋のプロポーションが肉眼に近かった印象の85ミリは見た目は自然な感じではあるもののレンズの画角的にはかなり寄った感じで、ズームアップして見ている雰囲気になります。
結局、人の目は50から80ミリレンズのような感覚で視野は24ミリみたいな広角っぽく捉えている、二重構造っぽい見え方をしているようです。
根本的に人の目とカメラのレンズは違う。

こんな図をGeminiに描いてもらいました。人が風景を見ている状態を図式化したものです。
人間の目を球形のレンズだとするとセンサー部分は目の裏側の凹面になります。
もともとアールの付いたセンサーに像を結ぶので、感覚的には実際の風景をアールの付いたパノラマで見ていることになります。
そのため平面のセンサーで像を結ぶカメラに比べパースの歪みを感じにくいのだと思います。
更に目は常に動いて色んな場所を正面で捉えていて、それを脳が補完してつなぎ合わせるような作業をしているはずなので余計にパースを感じにくくなっているのだと思います。
おまけ。スケッチを写真AIに渡してフォトリアルに生成してもらう。

前回記事でもやったように、スケッチと現場の写真をGeminiAIに渡して肉眼で見たようなフォトリアルな画像を生成してもらいました。
結果は…サンプル写真とほとんど変わらない画像が生成されました。てっきりイラストのプロポーションで写真ぽい画像が出てくるかと思ったのに、意外な結果でした。
プロンプトも工夫して再チャレンジしましたが結果は変わらず。
Geminiに聞いて、現在画像生成AIは実写の写真をサンプルに学習しているので光学的に破綻のない画像があるとそちらにバイアスが掛かる可能性が大きいということでした。
簡単にできそうなのに不思議です。人間の思い込みのバイアスとAIの光学的な整合のバイアスの対比。面白いです。
まとめ
普段あまり気にすることはありませんが、写真と人の目って結構違うんだなと再確認できました。
カメラの焦点距離でいうとぼんやり風景を見ているときは24から35ミリレンズ、普段近くを見ているときは40から50ミリ、注目しているときは80から100ミリレンズと、カメラの定番レンズとほぼ一致しているのがわかったのも納得でした。
写実的な絵を描くときや、絵の資料として写真を撮ったりするときにちょっと役立つかも知れませんね。
さらに人は絵を描くときにデフォルメという表現もとります。昔も今(SNSなど)も盛って表現したい気持ちは変わらないようですね。

