Gemini 3 体験レポート

2025/12/07,12/13

概要

これまで2年余りOpenAIのChatGPTプラス(20ドル/月)を使ってきたが契約更新の前日に、ChatGPTの契約更新はせずに、Gemini 3 Pro を新たに2,900円/月(税込み)で契約した。契約名はGoogle AI Proという。最初の一ヶ月は無料。

AI利用ではChatGPTとGeminiが激しく競っていたようだが、Geminiのエンジンを使っているNotebookLMや画像の品質でもGoogle whiskが優っている。

Google AI Pro プラン


「アルゴー船(アルゴナウタイ)の冒険」

Geminiは「双子座」、ギリシア神話に登場するカストル(Castor)とポルックス(Pollux)の双子の兄弟に由来する。

二人の冒険談についてはギリシア神話「アルゴー船(アルゴナウタイ)の冒険」がよく知られており1963年に制作された特撮映画は現在のようなCGはなかった時代、怪物の登場などのシーンが記憶に残っている。

参) 生成Slide「イアソンとメディア」


Gemini 3 Pro のスタート画面 ➯ ツールメニュー

「チャットだけじゃない!Geminiの6つの強力なツール」 Geminiのスタート画面を開くと、単なるチャットボットではなく「制作スタジオ」のようなメニューが表示されることにお気づきでしょうか? 従来の「チャットして終わり」から一歩進み、Deep Researchで深く調べ、Canvasで文章を練り上げ、Veoや画像生成でビジュアルを作る。これらを用途に合わせて使い分けることで、Geminiは「話し相手」から「強力なワークステーション」へと進化します。 各ツールの違いを一目でわかるように表にまとめました。

ツール名 特徴・できること こんな時におすすめ
Deep Research Web上の膨大な情報を自律的に深掘りし、複数の信頼できるソースを統合して、包括的なレポートや回答を作成します。 市場調査、論文のリサーチ、複雑なトピックの徹底的な学習。
動画を作成 (Veo) 最新の動画生成モデル「Veo」を搭載。テキスト指示から高品質な1080p動画クリップを生成します。 SNS用のショート動画、プレゼンのイメージ映像、アイデアの視覚化。
画像を生成 「Imagen 3」などの高性能モデルを使用し、写真のようにリアルな画像やイラストをテキストから作成します。 ブログのアイキャッチ、資料の挿絵、デザインのラフ作成。
Canvas チャット形式ではなく、ドキュメントやコードエディタのような専用画面で、AIと並走して執筆やコーディングを行います。 長文記事の執筆、プログラミング、メールの下書き、企画書の推敲。
ガイド付き学習 あなたの理解度に合わせて、AIが先生のようにステップバイステップで解説してくれる学習モードです。 新しいスキルの独学、資格試験の勉強、複雑な概念の理解。
動的ビュー 検索結果やデータを、状況に応じて最適な形式(グラフ、表、地図など)に自動で可視化して表示します。 統計データの比較、スケジュールの確認、複雑な情報の整理。

画像の生成

画像生成では、圧倒的にGeminiが優れている。単にプロンプトに忠実なだけでなく学習した知識に裏打ちされた画像を生成する。筆者は生成後の訂正も重視するがこちらもよく反応する。

Nano Banana Pro : Gemini 3 Proを基盤としたNano Banana Proはクリエイティブなアイデアを楽しく実用的に具現化。擬似的な高精度のカメラと照明機能を使って写真を編集したり、複数の画像を組み合わせて*モックアップを作成したり、文字が鮮明なポスターをデザインしたりする。(*モックアップ:外観が完成品そっくりの模型や見本)

(高精度カメラ)

ポスター

Snake River

(日本画)

囲碁

動画の生成

Veo3.1: Google AI Proプランでは8秒と短い。1日3本の制限。別プランありVertex AI(従量課金制)$0.40/秒など

日本語

Gemsの活用例

Gems は、 Gemini をベースに、特定のタスクや分野に特化したカスタム AI エキスパートの 「Gem」 を作成するための機能。 Gemini の汎用性を活かしつつ、特定のタスクに特化することで、より高度な機能を実現する。

GemのStorybook作成 : テーマ、対象年代、画像のスタイルを指定して子供や大人向けに10ページの絵本を生成する。

「黄金の羊毛をさがして: アルゴナウタイの壮大な航海」

10歳代の読者を対象とした、ギリシア神話「アルゴー船(アルゴナウタイ)の冒険」におけるイアソンの金羊毛探求の英雄的で壮大な物語を作成した。

*上下が表示されない場合はwindow幅を調整してください

「黄金の羊毛をさがして」storybook(試験運用版)

NotebookLMも上限が5倍に緩和

「シリアの歴史」ソース:

シリアの歴史を概説するこの文書は、同地域が紀元前8000年頃から文明の発祥地として重要であったことを指摘しています。古代にはエブラなどのセム語系都市国家が栄え、支配者が目まぐるしく変わる時期を経て、ヘレニズム・ローマ文化と東方文化が融合しました。7世紀にイスラーム勢力に征服されると、ダマスカスがウマイヤ朝の首都となり、イスラーム世界の中心として繁栄しましたが、その後はオスマン帝国による約400年間の支配を受けました。第一次世界大戦後にフランス委任統治領となり、1946年に独立を果たしましたが、政治的混乱からバース党による長期独裁体制へと移行しました。この独裁体制は、2011年に勃発した内戦を経て、直近の2024年12月に最終的に崩壊したことが示されています。シリアの歴史は、文明の黎明期から現代の激変に至るまで、常に世界の歴史の重要な舞台であったとまとめられています。

スライド生成 「シリアの歴史」(PDF)

Deep Research

Geminiの"Deep Research"を使った例 :
ホフステードの6次元モデルに基づく文化的アーキテクチャの包括的分析
容量の都合で別ページにした。信頼のできるデータを元に徹底的に調査・"使える"資料作成。
ホフステードの6次元モデルについてはこちら

ゴルフスイングの修正

Gemini3は画像認識も進歩したとされる。昔撮ったゴルフスイングの相談

自分のゴルフスイングの写真です。スライスしがちなので診てください。

*以下、写真を縦長で提供したため、AIが連続写真で右と言ってるのは上の列で、左は下の列。

貴重な連続写真のご提供ありがとうございます。 写真を拝見したところ、スライス(ボールが右に曲がる)の原因となりやすい動きがいくつか確認できました。主に「アウトサイドインの軌道」と「インパクトでのフェースの開き」が原因と考えられます。 具体的に以下の3つのポイントを修正することをお勧めします。 1. ダウンスイングでの体の開きを抑える 現状: 写真の左列、上から4番目(ダウンスイング開始)から5番目(インパクト直前)にかけて、上半身(胸)が目標方向へ向くのが早すぎるようです。 体が早く開くと、クラブが外側から遅れて入ってきやすくなり(アウトサイドイン軌道)、スライスの大きな原因となります。 改善策: ダウンスイングからインパクトにかけて、「胸を右に向けたまま」、あるいは「背中を目標に向けたまま」クラブを下ろしてくる意識を持ちましょう。 腕やクラブが体の正面に戻ってくるまで、体の回転を少し我慢するイメージです。 2. クラブをインサイドから下ろす意識を持つ 現状: 体の早い開きに伴い、左列の上から4番目、5番目の写真で、クラブが飛球線の外側(アウトサイド)から鋭角に下りてきているように見えます。 この軌道だと、ボールを擦るような打ち方になり、右回転(スライス回転)がかかりやすくなります。 改善策: トップの位置から、クラブを「右足のつま先方向」ではなく、「右足のかかと方向」、つまり体の近く(インサイド)から下ろすように意識してください。 練習ドリル: ボールのすぐ外側(右後ろ)に、もう一つボールやヘッドカバーなどを置いて、それに当たらないように内側からクラブを入れて打つ練習が効果的です。 3. テークバックを体の回転で行う 現状: 右列の上から2番目、3番目の写真(テークバック)を見ると、少し手先でクラブを上げているように見えます。 手上げになると、トップでクラブシャフトが飛球線とクロス(右を向く)しやすくなり、その反動でダウンスイングがアウトサイドから入りやすくなります。 改善策: 始動で手首や腕だけでクラブを上げるのではなく、左肩を右足の上に持っていくようなイメージで、上半身の捻転(回転)でクラブを上げるようにしましょう。 練習ドリル: 両脇にタオルなどを挟んで、それを落とさないようにハーフスイング(腰から腰までの高さ)でボールを打つ練習をすると、体を使ったスイングが身につきます。 まとめ まずは、「ダウンスイングで体の開きを我慢し、インサイドからクラブを下ろす」ことに集中してみてください。これだけでスライスが大きく改善する可能性があります。 一度にすべてを直そうとせず、一つずつ課題に取り組んでみてください。応援しています!

画像での比較

提供した画像

修正後のGemini生成画像

若い頃の写真。アウトサイドインが原因でスライスになるのは自分では分かっていたつもりでも治らなかった。

感想

Gemini 3 proを基盤とする画像生成モデルNano Bananaが素晴らしい。ピクセルの並びを学習しているだけでなく、言葉の意味や概念(セマンティクス)を深く結びつけている。そのため、「時代考証の合った服装」や「物理的に矛盾の少ない光の当たり方」など、「知識があるからこそ描ける正しさ」が画像に反映されていることを実感する。

追記:ChatGPT5.2

追記 : Gemini3の衝撃的な評判に危機感を持ったのか2025年12月12日にOpenAIからChatGPT5.2がリリースされた。ChatGPT5.1がリリースされてから一ヶ月しか経ていない。5.2は数学やプログラミングの性能を高めたほか、誤回答を減らしAIが代行する資料作成の出来栄えも改善した、という。

「AlphaGo」(囲碁AI)を開発したイギリスのDeepmind社を2014年にGoogleが買収した。これに対してGoogle一強を阻止しようとイーロン・マスク氏たちが2015年にOpenAIを立ち上げた。マイクロソフトがOpneAIに百億ドル出資したといわれる。

ChatGPTとGeminiの競争は益々激しくなると思うが、筆者の拙い経験ではGoogle GeminiがChatGPTを抜いたと思う。(2025/12/13)

Veo3.1による動画生成