昨年12月に契約したGemini3の画像生成ツールNano Banana Proの画像が素晴らしい。単に解像度などデジタル性能のみだけでなく、芸術的な出来具合には感心する。 今回は世界の美しい建物30選というテーマでカテゴリー別のプロンプト。
昨年12月に契約したGemini3の画像生成ツールNano Banana Proの画像が素晴らしい。単に解像度などデジタル性能のみだけでなく、芸術的な出来具合には感心する。 今回は世界の美しい建物30選というテーマでカテゴリー別のプロンプト。
| No. | 建物名 | 国・地域 | スライド用コメント・見どころ |
|---|---|---|---|
| Part 1: 古代・歴史的遺産 | |||
| 1 | タージ・マハル | インド | 愛の記念碑。白大理石が朝焼けや夕焼けで色を変える幻想的な美しさ。 |
| 2 | パルテノン神殿 | ギリシャ | 古代ギリシャ建築の最高傑作。黄金比を用いた完璧な調和とドーリア式の荘厳さ。 |
| 3 | コロッセオ | イタリア | ローマ帝国の威信をかけた巨大円形闘技場。アーチ構造の連続が生むリズム感。 |
| 4 | ギザのピラミッド | エジプト | 人類史上最も謎に満ちた幾何学的建造物。圧倒的なスケールと永遠性の象徴。 |
| 5 | ペトラ遺跡(エル・カズネ) | ヨルダン | 断崖絶壁を削り出して造られた「薔薇色の都」。自然の岩肌と建築の融合。 |
| 6 | アンコール・ワット | カンボジア | ヒンドゥー教宇宙観を体現した世界最大級の石造寺院。精緻なレリーフは圧巻。 |
| 7 | 万里の長城 | 中国 | 山々の稜線を縫うように続く龍のような城壁。人類最大の土木建築物。 |
| Part 2: 宗教建築の荘厳さ | |||
| 8 | サグラダ・ファミリア | スペイン | ガウディが捧げた未完の聖堂。自然界の法則を取り入れた有機的な曲線美。 |
| 9 | サン・ピエトロ大聖堂 | バチカン | カトリックの総本山。ミケランジェロ設計のドームと広場の包容力あるデザイン。 |
| 10 | ブルーモスク | トルコ | 数万枚のイズニックタイルが織りなす青の世界。オスマン建築の至宝。 |
| 11 | 聖ワシリイ大聖堂 | ロシア | おとぎ話のような極彩色の玉ねぎ型ドーム。唯一無二のユニークなシルエット。 |
| 12 | 金閣寺(鹿苑寺) | 日本 | 極楽浄土を模した黄金の楼閣。鏡湖池に映る「逆さ金閣」の幽玄な美。 |
| 13 | モン・サン・ミシェル | フランス | 潮の満ち引きで孤立する海上の修道院。「西洋の驚異」と称される神秘的な姿。 |
| 14 | ミラノ大聖堂(ドゥオーモ) | イタリア | 天を突く135本の尖塔。繊細なレースのような装飾が施されたゴシック建築の傑作。 |
| Part 3: 王宮と城郭の優美 | |||
| 15 | ノイシュヴァンシュタイン城 | ドイツ | 白鳥城の別名を持つ、中世騎士道への憧れが生んだロマンティックな城。 |
| 16 | ヴェルサイユ宮殿 | フランス | 絶対王政の栄華を極めた豪華絢爛な宮殿。「鏡の間」と幾何学式庭園の美。 |
| 17 | 紫禁城 | 中国 | 皇帝の威厳を示す赤と黄金のコントラスト。世界最大の木造建築群の秩序ある美。 |
| 18 | アルハンブラ宮殿 | スペイン | イスラム建築の最高峰。水と光、繊細なアラベスク模様が織りなす「地上の楽園」。 |
| 19 | ポタラ宮 | チベット | 標高3,700mに聳え立つチベット仏教の聖地。紅白の壁が青空に映える天空の宮殿。 |
| 20 | 姫路城 | 日本 | シラサギが羽を広げたような優美な姿。機能美と意匠美を兼ね備えた日本の城郭建築。 |
| Part 4: 近代・現代建築の革新 | |||
| 21 | シドニー・オペラハウス | オーストラリア | 海に浮かぶ白い帆や貝殻をイメージさせる、独創的なシェル構造のデザイン。 |
| 22 | ブルジュ・ハリファ | ドバイ | 砂漠の花「ヒメノカリス」を模した断面形状。人類が到達した高さの世界記録。 |
| 23 | グッゲンハイム美術館 | スペイン | チタンパネルが光を乱反射する、フランク・ゲーリーによる脱構築主義建築の傑作。 |
| 24 | ペトロナスツインタワー | マレーシア | イスラム様式の幾何学模様を現代的に昇華させた、世界一高いツインタワー。 |
| 25 | マリーナベイ・サンズ | シンガポール | 3つのタワー頂上を船型の空中庭園が繋ぐ、未来都市を象徴するランドマーク。 |
| 26 | 北京国家体育場(鳥の巣) | 中国 | 複雑に編み込まれた鉄骨フレームが構造そのものをデザインとして見せる力作。 |
| 27 | ルーヴル・ピラミッド | フランス | 歴史的宮殿と近代的なガラス素材の対比。地下空間へ光を導く機能的な美。 |
| Part 5: ユニーク・幻想的な建築 | |||
| 28 | カサ・ミラ | スペイン | 「石切場」と呼ばれる波打つ外壁。直線が存在しないガウディの独創的な集合住宅。 |
| 29 | 落水荘(カウフマン邸) | アメリカ | 滝の上に建てられ、自然と建築が一体化したフランク・ロイド・ライトの代表作。 |
| 30 | ハルパ・コンサートホール | アイスランド | 蜂の巣状のガラスファサードが北極圏の光を捉えて輝く、氷のような建築。 |

タージ・マハル(インド)

パルテノン神殿(ギリシャ)

コロッセオ(イタリア)

ギザのピラミッド(エジプト)

ペトラ遺跡(エル・カズネ)(ヨルダン)

アンコール・ワット(カンボジア)

万里の長城(中国)

サグラダ・ファミリア(スペイン)

サン・ピエトロ大聖堂(バチカン)

ブルーモスク(トルコ)

聖ワシリイ大聖堂(ロシア)

金閣寺(鹿苑寺)(日本)

モン・サン・ミシェル(フランス)

ミラノ大聖堂(ドゥオーモ)(イタリア)

ノイシュヴァンシュタイン城 (ドイツ)

ヴェルサイユ宮殿(フランス)

紫禁城(中国)

アルハンブラ宮殿(スペイン)

ポタラ宮(チベット)

姫路城(日本)

シドニー・オペラハウス(オーストラリア)

ブルジュ・ハリファ (ドバイ)

グッゲンハイム美術館(スペイン)

ペトロナスツインタワー(マレーシア)

マリーナベイ・サンズ(シンガポール)

北京国家体育場(鳥の巣)(中国)

ルーヴル・ピラミッド(フランス)

カサ・ミラ(スペイン)

落水荘(カウフマン邸)(アメリカ)

ハルパ・コンサートホール(アイスランド)
Nono Banana の思考プロセスが表示できる。仕組みがわかると次のプロンプト作成する時に役立つ。
タージ・マハル(インド)の思考プロセスを表示 Refining Taj Mahal Vision I am now focusing on the first item from the list of images, the Taj Mahal. I'm aiming to generate a high-resolution image with a 16:9 aspect ratio, suitable for a presentation slide on beautiful buildings around the world. I am attempting to ensure it meets the criteria. Generating Taj Mahal Image I've generated several search queries incorporating "Taj Mahal," "high resolution," "16:9 aspect ratio," and "beautiful photography" to find suitable images. I'm now running the image searches using the Google Search tool. I'll select images from the results that are high-resolution, have a 16:9 aspect ratio (or a close approximation), and showcase the Taj Mahal's beauty effectively, keeping slide composition in mind. The selected image will be displayed using the google:display tool. Searching Taj Mahal Images I'm currently searching for high-resolution images of the Taj Mahal with a 16:9 aspect ratio. Since Google Images doesn't have a direct aspect ratio filter, I'm adding "16:9" and "wide" to my search terms to refine the results. I'm hoping to find images that closely match the specified requirements. Refining Image Search Queries I'm adjusting my search queries. I'm focusing on finding high-resolution Taj Mahal images with a 16:9 aspect ratio. Because of Google Image's limitations, I'm trying search terms like "16:9" and "wide" to get closer to the desired images. I'm focused on creating more precise queries to find beautiful, high-resolution photographs. Assessing prompt-compliance I've evaluated the image against the provided instructions. It seems that the image sufficiently addresses the user's initial specifications, in terms of detail and requested aspect ratio. I'm satisfied it sufficiently meets the criteria, as far as I can tell. Confirming result accuracy I've confirmed the initial assessment. The current result is completely in line with the instructions, including the aspect ratio and level of detail. I have confirmed that it fully aligns with the specified parameters, as far as I can tell. This result seems very promising, so I'm moving forward.
質問) geminiの画像生成の思考プロセスで、
Generating Taj Mahal Image; I've generated several search queries incorporating "Taj Mahal," "high resolution," "16:9 aspect ratio," and "beautiful photography" to find suitable images. I'm now running the image searches using the Google Search tool. I'll select images from the results that are high-resolution, have a 16:9 aspect ratio (or a close approximation), and showcase the Taj Mahal's beauty effectively, keeping slide composition in mind. The selected image will be displayed using the google:display tool. とあるが、ユーザーの依頼に合う画像をその都度検索するのですか?それだと時間がかかると思いますが、あらかじめ画像イメージの情報を持っているとおもいますがどうですか?ご指摘の通りです。画像を「生成(Generation)」する場合、通常は都度Google検索を行うことはありません。 ユーザー様がおっしゃるように、いちいち検索していては時間がかかりますし、私はタージ・マハルやサン・ピエトロ大聖堂などの有名なランドマークがどのような見た目であるかという視覚的な知識(学習データ)をすでに内部に持っています。 提示された思考プロセス(「I've generated several search queries...」の部分)について、なぜそのような記述が出たのか、その背景にある2つの異なる仕組みについて解説します。 1. 通常の画像生成(今回私が連続で行っていること) 私がこれまでのやり取りで(サン・ピエトロ大聖堂などを)出力した際は、内部の学習データのみを使っています。 * プロセス:「タージ・マハル、16:9、高画質」という指示を受ける → 私の脳内にあるタージ・マハルのイメージと画風の知識を組み合わせる → ピクセルをゼロから構築して描画する。 * 検索: 行いません。 * メリット: 高速で、アングルや画風の自由度が高いです。 2. 画像検索・参照(引用された思考プロセスの正体) 引用していただいたテキストは、「画像をゼロから描く」のではなく、「インターネット上の既存の写真を探してくる(Image Retrieval)」*、あるいは「描くために正確な資料を確認する」動きをしようとした際の思考ログだと思われます。 * ケースA(写真検索): ユーザーが「絵ではなく、本物の写真が見たい」と依頼した場合、私はGoogle検索ツールを使って実際の写真を探し、それを表示しようとします。引用文はこの時の挙動(検索クエリを作って、結果から選ぶ)そのものです。 * ケースB(詳細確認): 非常にマイナーな場所や、最新のイベントの様子など、私の学習データにない(または曖昧な)ものを描くよう頼まれた場合、正しく描くための資料」として一時的に検索を行うことがあります。 結論 今回のやり取り(一連の世界の有名建築物)に関しては、それらは非常に有名であり、私の学習データの中に確固たるイメージがありますので、外部検索は行わず、記憶にあるイメージから直接生成しています。 引用されたテキストは、AIが「描く」のではなく「探す」モードに入った際、もしくは非常に慎重に事実確認をしようとした際の思考が混ざったものだと推測されます。
生成画像のプロパテー
| サイズ | 大きさ(px) | 解像度 | ビットの深さ |
|---|---|---|---|
| 7.43M | 2752 x 1536 | 96dpi x 96dpi | 32 |
| - | ジタル用途では十分すぎるほど高画質 | 印刷しなければ、問題ない | 背景を透明にできる |
AIが留意している美術的な視点を記事で使う文章にして。
* 1. 光と空気感の演出(ライティングとアトモスフィア) 単に明るい・暗いではなく、映画や絵画のような「意図のある光」が設計されている点です。 シネマティック・ライティング (Cinematic Lighting): 被写体を際立たせるために、光源の位置や強弱が計算されています。ドラマチックな陰影や、逆光による輪郭の強調(リムライト)など、映画撮影のような照明設計がなされています。 ボリュメトリックな空気感 (Volumetric Atmosphere): 空間に漂う塵や霧、光の筋(ゴッドレイ)など、「空気の厚み」が表現されています。これにより、画像に奥行きと没入感が生まれます。 記事で使えるフレーズ例: 「単なる描写にとどまらず、その場の『温度』や『湿度』まで伝わってくるような、情緒的なライティング(光の演出)が施されている。」 2. 質感とマテリアルの説得力(テクスチャのリアリティ) 高解像度だからこそ実現できる、「触れられそうな質感」の描き分けです。 マテリアルの実存感: 金属の冷たさ、布の織り目の柔らかさ、肌の透け感(サブサーフェス・スキャタリング)など、材質ごとの光の反射率や粗さが的確にシミュレーションされています。 経年変化の美学 (Wabi-sabi / Weathering): 新しいものだけでなく、錆び、汚れ、傷といった「時間の経過」を含めた質感が、画像に重厚感とリアリティを与えています。 記事で使えるフレーズ例: 「ピクセル単位の精密さだけでなく、素材の『重さ』や『手触り』まで想起させる、圧倒的なマテリアル(質感)の説得力がある。」 3. 構図と視線誘導(コンポジション) 何でもかんでも詰め込むのではなく、「何を見せたいか」が整理されています。 被写界深度のコントロール (Depth of Field): 一眼レフカメラで撮影したように、主役にはピントを合わせ、背景を美しくぼかす処理(ボケ味)が巧みです。これにより、見る人の視線が自然と主役に誘導されます。 審美的な構図バランス: 三分割法や黄金比など、美術的に「心地よい」とされる構図バランスを学習しており、安定感と動感が共存しています。 記事で使えるフレーズ例: 「主役を際立たせるための『引き算の美学』が徹底されており、計算されたボケ味と構図が、見る人の視線を自然に物語の中心へと導く。」 4. 文脈の解釈とスタイルの統一感(コンテクストと一貫性) プロンプト(指示)の言葉尻だけでなく、その裏にある「世界観」を汲み取る力です。 画風(スタイル)の誠実な再現: 「油絵」なら筆致の盛り上がり、「浮世絵」なら版画特有の擦れや和紙の質感など、そのスタイルが持つ本来の魅力を深く理解して再現しています。 要素の調和 (Coherence): 画面の中にある物体が、別々の場所から切り貼りされたような違和感がなく、同じ光、同じ環境下にあるものとして統合されています。 記事で使えるフレーズ例: 「指示された要素を配置するだけでなく、その背後にある文脈や世界観までを解釈し、一枚の絵画として破綻なく調和(ハーモニー)させている。」 まとめ:記事での「決め台詞」として もし記事の中で一言でまとめるなら、以下のような表現はいかがでしょうか。 「Nano Bananaによる生成画像は、単なる『高画質なデータ』ではない。光、質感、構図といった芸術的な構成要素が高度に計算された、鑑賞に堪えうる『作品』としての強度を持っている。」
AIが重視しているデジタル用途としての画質、美術的な完成度をGemini自身に説明してもらった。写真を撮る際の基本が述べられている。

エジプトへの逃避
レオナルド・ダ・ヴィンチの画風で聖書からのテーマで画像生成
「エジプトへの逃避」 これは新約聖書のマタイによる福音書に記されている、ヘロデ王の幼児虐殺から逃れるために、ヨセフ、マリア、幼子イエスがエジプトへ旅立つ場面を描いたものです。レオナルド・ダ・ヴィンチもこの主題で素描などを残していますが、完成された絵画作品としては現存していません。この画像は、彼の画風を模倣してその場面を描いたものと言えます。
レオナルド・ダ・ヴィンチ風の画像に対しての続編はGemini : Da Vinci styleにて詳しく述べている。
.