Nano Banana Proを使いこなす — Google公式が教える7つのプロンプト戦略
使い方・Tips 2026年02月20日
#Gemini #画像生成 #プロンプト #Google

Nano Banana Proを使いこなす — Google公式が教える7つのプロンプト戦略

NanoBananaProの出力結果に、本当に満足できていますか?

「悪くはないけど、もう一段クオリティを上げたい」
「指示しているのに、思った通りにならない」

そんな違和感を感じているなら、原因は“モデル”ではなく“プロンプト設計”かもしれません。

この記事では、Google DeepMindのプロダクトマネージャー Bea Alessio さんが公開した
「Nano Banana Proを最大限に活用するための7つのヒント」をもとに、
出力クオリティを引き上げるための 7つのプロンプト戦略 を解説します。
※原著は英語で公開されており、本記事では内容を読み解きながら、実践視点で再構成しています。

公開日: 2026年2月20日
参照元: 7 tips to get the most out of Nano Banana Pro — Google Blog by Bea Alessio(2025年11月20日)


Nano Banana Proの設計思想を理解する

Nano Banana Progemini-3-pro-image-preview)は、Gemini 3 Proの推論能力と画像生成が深く統合されたモデルです。従来の拡散モデル(Stable Diffusionなど)と異なる最大の特徴は、生成前に内部で思考プロセスを踏むことです。

これにより:

  • 長く詳細なプロンプトでも「意図」を正確に読み取る
  • 複数の制約条件を同時に処理できる
  • あいまいな指示は「もっともらしい解釈」で補完する(これが意図とのズレの原因になる)

3つ目の特性が重要です。あいまいな部分はAIが解釈するので、プロンプトで明示しなかった部分は「AIのセンス次第」になります。これを踏まえた上で7つの戦略を見ていきます。

バージョン比較:

  • Pro(Thinking) gemini-3-pro-image-preview — 品質重視、生成時間は解像度・混雑状況により変動
  • Fast gemini-2.5-flash-image — スピード重視、反復確認や素案生成に

7つのプロンプト戦略


戦略1: ナラティブを込めた詳細なプロンプトを書く

構造化された5要素で「解釈の余地」をなくす

プロンプトの目標は「AIが補完する空白を最小化すること」です。次の5要素を全て埋めることで、出力の再現性が高まります:

要素 指定の目的 具体例
主語(Subject) 被写体の属性・特徴を限定 「30代、女性、起業家、自信に満ちた表情」
構図(Composition) 画角・フレーミングを指定 「クローズアップ、三分割法で右寄り、アイレベル」
動作(Action) 状態・動きで文脈を与える 「朝日を浴びながらコーヒーカップを両手で包んでいる」
場所(Location) 背景の世界観を固める 「東京・丸の内、ガラス張り高層オフィス、窓越しのビル群」
スタイル(Style) 仕上がりのトーン・質感を指定 「ハイエンドビジネス誌の表紙、ウォームトーン」

プロンプト例

自信に満ちた30代の女性起業家が、東京・丸の内のガラス張りの  
高層オフィスで朝日を浴びながら白いコーヒーカップを両手で包んでいる。  
窓の外にはビル群のシルエット。ハイエンドビジネス誌の表紙に  
使えるような、ウォームトーンのプロフェッショナルな写真スタイル。  


ポイント: 5要素を埋めることは「長くする」目的ではなく、「AIが独自判断する余地を減らす」ための手段です。


戦略2: 撮影パラメーターで出力を制御する

視覚的効果を数値化して指定する

Nano Banana ProはGemini 3の知識により、写真撮影の技術用語を正確に解釈します。感覚的な表現よりも数値や技術用語の方が再現性が高くなります。

パラメーター 指定例 視覚的効果
焦点距離 85mm24mm広角200mm望遠 圧縮感・歪み・ボケ量の制御
絞り値 f/1.4f/16 被写界深度のコントロール
シャッタースピード 1/1000s(動き止める)、1s(動きをブラす) モーションブラーの表現
ISO感度 ISO 100(クリア)〜ISO 6400(ノイズ多め) 暗部のノイズ量
光源・方向 チアロスクーロレンブラントライトリムライト 陰影・立体感の演出
撮影時間帯 ゴールデンアワーブルーアワー深夜の人工照明 色温度・雰囲気の設定

プロンプト例:高品質な商品写真

オーガニックコーヒーブランドの製品ラインアップ(4種のパッケージ)。  
90mm マクロレンズ、f/8(全体がくっきり)、自然光(窓際フラットレイ)。  
白背景、等間隔に並べたレイアウト。コーヒー豆・麻布・木製トレイを小道具に。  
ISO 100、後処理ナシのナチュラルな質感。Eコマース用プロダクト写真品質。  

実在の機材・フィルム名を使ったスタイル指定

ライカM6 + ズミクロン50mm f/2で撮影したような質感、  
コダックポートラ400フィルムの色乗り。  
アンリ・カルティエ=ブレッソンのストリートフォトグラフィーの構図感覚。  

戦略3: テキスト統合の精度を上げる

テキスト描画の制約と対処法

Nano Banana Proはテキスト描画を大幅に改善していますが、誤字・フォント崩れ・レイアウトのズレが発生することがあります。重要な文字は生成後に必ず目視確認してください。

精度を高めるための指定方法:

  1. テキストをダブルクォートで囲む"Spring Sale" のように明示
  2. フォントを具体的に指定ジオメトリックサンセリフ体、太字、72pt相当
  3. 配置座標を明示画像上部中央右下コーナーに小さく上から1/4の位置
  4. テキスト量を絞る — 短文ほど崩れにくい傾向がある。複数のテキスト要素を詰め込むほどリスクが上がる

プロンプト例:マーケティング素材

SaaS製品の機能紹介LPのヒーローセクション用ビジュアル。16:9横向き。  
中央左側に "データを、判断に変える。" をジオメトリックサンセリフ体、太字、  
大きめのフォントサイズ(画面高さの8%相当)で表示。  
右側にダッシュボード画面のモックアップ(浮かび上がるように)。  
背景はダークネイビー→ミッドナイトブルーのグラデーション。  
B2B SaaS製品のLPのようなクリーンでプロフェッショナルなデザイン。  

翻訳再生成

既存デザインのテキスト部分だけを別言語に翻訳して再生成できます:

添付したデザイン画像のテキスト部分を全て英語に翻訳して再生成。  
デザイン・レイアウト・フォントスタイル・余白は維持。テキスト内容のみ変更。  




戦略4: Gemini 3の実世界知識を活用する

知識ベースを画像生成に活かす

Nano Banana ProはGemini 3 Proの実世界知識と推論を活用できます。製品・地理・歴史などを踏まえたビジュアルコンテンツの生成が可能です。ただし事実精度は保証されません。数値・固有名詞・歴史的事実を含む場合は、必ず一次出典で確認してからプロンプトに組み込んでください

活用例①:製品デザインのリファレンス

iPhone 15 Proのデザイン言語を参考にした、架空のスマートフォン  
"AquaPhone X"の製品モックアップ。ティールブルーのチタニウム素材感、  
三眼カメラ配置。Apple.comスタイルの白背景製品写真。  
実在ブランド名・ロゴは使用しない。  

活用例②:データビジュアライゼーション

東京の主要地下鉄路線をベースにした路線図インフォグラフィック。  
各路線を統計データの大小で可視化(線の太さで表現)。  
日英二言語表記、交通機関のデザイン規約を参照したスタイル。  
  
【重要】表示するデータは以下の実際の数値のみ使用すること:  
[ここに公式統計から確認した数値を記入]  
架空・推測の数値は使用しない。  

インフォグラフィックでAIに数値を補完させると事実誤りが生じます。数値は必ず事前に確認して明記してください。


戦略5: アスペクト比とコンポジションを同時に設計する

使用プラットフォームから逆算して設計する

生成後のトリミングは構図の意図を損ないます。最初からアスペクト比と構図を一体で設計することで、そのまま使えるアセットが完成します。

プラットフォーム 比率 構図設計のポイント
Instagram フィード 1:1 中央に主被写体、四隅に余白
Instagram ストーリー 9:16 上1/3にテキスト、下2/3にビジュアル、最下部はCTAエリア
YouTube サムネイル 16:9 左60%にビジュアル、右40%にテキスト(または逆)
OGP画像(SNSシェア) 1.91:1 中央寄せ、端から15%以内は重要要素を置かない
LinkedIn バナー 4:1 横長なので左端にロゴ/テキスト、右端に画像

プロンプト例:マルチフォーマット素材

【フォーマット】9:16 縦向き Instagramストーリー用  
テックスタートアップの新機能リリース告知。  
  
レイアウト:  
- 上部25%: ブランドロゴエリア(白抜きスペース確保)  
- 中央50%: 製品スクリーンショットのモックアップ(デバイスフレームあり)  
- 下部25%: "New Feature" のタイポグラフィ + CTAボタン風のデザイン要素  
  
カラー: ダークモードUI(ダークグレー背景、アクセントカラーは電気ブルー)  

戦略6: マルチイメージ参照で合成精度を上げる

参照画像の役割を明示する

複数画像の入力(GeminiアプリやAI Studioで6〜14枚程度、サーフェスにより変動 出典: Google Blog 2025-11-20)では、それぞれの画像が「何のために使われるか」を明示することが合成精度を左右します。

画像A(添付1枚目):この人物の顔・表情・肌トーンを使用する  
画像B(添付2枚目):このポーズ・体の向きを参照する  
画像C(添付3枚目):この背景(夕暮れの渋谷)を使用する  
画像D(添付4枚目):このライティングスタイルを適用する  
  
照明の向きと視点の一貫性を保つこと。影の方向も統一する。  
映画のスチール写真のような仕上がりで。  


↓↓↓

キャラクター一貫性のあるシリーズ制作

最初のシーンで生成した画像を以降の参照画像として使い続けることで、複数シーンに渡るキャラクターの一貫性が保てます(Google公式表現では「up to 5 people」、サーフェスにより変動)。

【参照】画像A:メインキャラクター「AIちゃん」(青ショートヘア、白衣)  
【参照】画像B:サブキャラクター「ロボくん」(丸型ロボット、緑ランプ)  
  
外見を完全に維持したまま新シーン:  
「ふたりが東京タワー前で記念写真を撮っている」  
を4コマ漫画形式で。各コマは異なるアングルで構成すること。  

商品写真のバリエーション展開

【参照】画像A:商品(ハンドクリーム)の正面写真  
【参照】画像B:参照したいフラットレイスタイル(白背景、木トレイ、自然光)  
  
商品を主役に、ラベンダーの小枝と白い小石を添えたフラットレイ写真を生成。  
商品の質感・ラベルデザインはオリジナルを維持すること。  
Eコマース製品写真品質、後処理ナシのナチュラルな仕上がり。  

戦略7: ブランドビジュアルの量産フローを構築する

参照アセットの体系化

ブランドガイドラインの画像をアップロードして参照させることで、デザイナーの手を介さずにブランド一貫性のある画像を量産できます。

【ブランドガイドライン参照】  
- 画像A:ブランドカラーパレット(プライマリ: #2D6A4F、セカンダリ: #74C69D)  
- 画像B:フォント見本(ヘッド: Playfair Display、本文: Inter)  
- 画像C:既存キービジュアル3点(トーン・スタイルの参照)  
  
以上を維持しながら、新商品「スキンケアセット」のInstagram投稿用ビジュアル(1:1)を生成。  
被写体は商品と自然素材の小道具(白背景フラットレイ)。  
清潔感・高級感・エシカルなブランド世界観で。  

ブランドライブラリの育て方

生成成功例を「基準テンプレート」として蓄積し、以降の生成で常に参照させていくことで、時間をかけてブランドのビジュアルライブラリが充実します。

【成功例参照】  
- 画像A〜C:直近3ヶ月の人気投稿(スタイル・トーン固定用)  
  
これらのスタイルを踏襲しつつ、今月テーマ「秋」に合わせた  
新作ビジュアルを3パターン生成。構図のみバリエーションを持たせる。  
各パターンでアスペクト比・被写体の配置を変えること。  

上級テクニック

反復改善による精度向上

Nano Banana Proは1回のプロンプトで完璧を求めるより、対話的な反復で収束させるアプローチが効果的です。

【改善サイクル】  
1. 構成要素を網羅したプロンプトで初稿を生成  
2. 維持する要素を明示して固定(「左の人物のポーズはそのまま」)  
3. 変更箇所を1点に絞って指示(「背景の明度を+20%程度に」)  
4. 満足できるまで繰り返す  

一度に複数の変更を指示すると「どの変更が効いたか」の因果関係が不明になり、再現性が下がります。1修正1変更を習慣化することで、ノウハウが蓄積されます。

思考モデル特性の活用

ProバージョンはGemini 3の「thinking」機能により、複雑な制約条件を同時処理できます。これを活かして制約の多い複雑なプロンプトを渡すことが有効です:

【守るべき制約】  
- ブランドカラー: ミントグリーン(#A8E6CF)とオフホワイト(#F9F9F9)のみ使用  
- テキスト: "Summer Collection" のみ(英語・白・上部中央)  
- アスペクト比: 1:1  
- 被写体に人物を含めない  
- 影は柔らかく(ハードシャドウ禁止)  
- 全体のトーン: 清潔感・軽やかさ・夏らしさ  
  
上記を全て満たす、Eコマース向け商品ビジュアルを生成してください。  

よくある失敗と対処法

問題 根本原因 対処法
手・指が不自然 身体構造の複雑さ 解剖学的に正確な手の描写、自然な指の開き を明示
テキストの誤字・崩れ 文字列が長い・指定が不足 短文に絞り(短いほど崩れにくい傾向)、フォント・サイズ・配置を全て指定
背景合成が不自然 光・影の方向が不一致 透視図法の一致、背景との影の連続性、照明色温度を統一
ファンタジー指定が写実的になる 推論モデルの現実優先傾向 surrealist illustrationfantasy art style と英語で明示
プロンプトと全然違う出力 5要素のどれかが欠落 主語・構図・動作・場所・スタイルを全て埋める
バッチ生成の一貫性が低い 参照なしの独自解釈 1枚目の成功例を参照画像として以降に使い続ける

解像度とコストの選択

解像度 用途 価格目安(参考値)
標準(1K / 2K相当) Web・SNS用 約$0.134/枚
高解像度(4K相当) 印刷・大判ポスター 約$0.24/枚

上記はMax Woolf 2025-12実測値(Gemini API / 米国リージョン・2025年12月時点)。公式保証値ではなく変動します。最新価格は Google Cloud AI pricing でご確認ください。


まとめ:7つの戦略

# 戦略 核心
1 ナラティブを込める 主語・構図・動作・場所・スタイルの5要素でAIの補完余地をなくす
2 撮影パラメーターで制御 f値・焦点距離・光の向き・時間帯を数値で指定して再現性を高める
3 テキスト統合の精度を上げる 引用符・フォント・配置を明示。文字数を絞り、生成後は目視確認
4 実世界知識を活用 実在する製品・地理・歴史を組み込む(数値は事前確認が必須)
5 アスペクト比と構図を設計 使用プラットフォームから逆算し、最初から配置まで設計する
6 マルチイメージで合成精度向上 各画像の役割を明示して指定し、キャラクター一貫性も維持
7 ブランドビジュアルの量産 ガイドライン画像を参照させ、成功例を基準テンプレートとして蓄積

生成画像AIの出力が上手くいかない時は試してみてください(´ ˘ `)♡


引用・出典


本記事の掲載画像はNano Banana Pro(Gemini 3 Pro Image)を使用して生成しました。