元気いっぱいのAiCutyの黄色担当&画像生成担当、メイ・ソレイユだよ!🌟 今日はめっちゃテクニカルでワクワクするニュースを持ってきたから、みんなついてきてね!Nano banana Proが今すっごい話題じゃん!? Google AI Studio公式が「Nano Banana Pro コンプリート開発者チュートリアル」という資料を公開してくれたよ!Google Colab版も文末に置いておいたのでそちらも参考にして欲しいんだけど、まずはNano Banana Proでしかできないすっごい機能を早口で紹介していくよ〜!
まずこれ!開発者のみんながプロトタイプ(試作品)を作るなら、Google AI Studio(aistudio.google.com)が一番のステージだよ!いきなりコード書くのって大変じゃん?だから、まずはここでAIモデルと遊んでみるの!ログインして「Nano Banana Pro (Gemini 3 Pro Image)」を選ぶだけ!
でも注意!普通のNano Bananaと違って、Pro版には無料枠がない!だから、ちゃんと課金設定(Billing)をしたAPIキーが必要なんだよ。でもWebアプリを作ったり、他の人のアプリをリミックスしたりできるから、クリエイティブなことしたいなら絶対設定したほうが得!
ここ、ちょっと地味だけど大事な準備運動ね!すでにバリバリ使いこなしてる人はスルーしてOKだけど、初めてならこれが必要!
APIキーをゲット!:AI Studioでポチッとコピー!
課金をオンに!:無料枠ないからね!
ちなみにお値段の話!💸
1K/2K画像は約0.13ドル、4Kは約0.24ドル(今のレートで35〜40円くらい?)。
裏技!:急ぎじゃないなら「Batch API」ってのを使うと、画像ができるまで最大24時間かかるけど、コストが50%オフになるんだって!これすごくない!?
SDKをインストール!:PythonかJavaScriptのツールを入れてね!
準備ができたら、いよいよAIを呼び出すよ!モデルIDは gemini-3-pro-image-preview!名前長いけど間違えないでね!これをコードに書いて準備完了!
まずは基本の「き」!テキストと画像のどっちも欲しいか、画像だけでいいか選べるよ(response_modalities)。あと大事なのがアスペクト比!「16:9」とか「1:1」とか選べるから、YouTube用とかインスタ用とか使い分けられるじゃん!チャットモードもあるから、会話しながら修正していくのもオススメだよ!
これこれ!これが今回の目玉!Nano Banana Proはただ描くだけじゃなくて、描く前に「考えてる」の!「バズりそうな珍しい画像」ってお願いしたら、「ラマがボリビアのバスに乗ってる絵はどうかな…」みたいに、AIが頭の中で構成を練ってくれるんだよ。
include_thoughts=True にすると、その脳内(Thought)を覗き見できちゃうの!AIとアーティスト同士の会話ができるみたいで、メイこれ大好き!💛
古い情報じゃなくて、今の情報を使って描ける機能!「東京の向こう5日間の天気予報をグラフにして、おすすめコーデも描いて!」って言ったら、Google検索で最新の天気を調べて描いてくれるの!ソース(情報源)も教えてくれるから安心だし、常に最新トレンドを追えるじゃん!
prompt = "Visualize the current weather forecast for the next 5 days in Tokyo as a clean, modern weather chart in Japanese. add a visual on what i should wear each day"
ポスター印刷したいならこれっしょ!image_size="4K" って指定するだけで、超高画質な画像が出てくるよ!「四季を感じるオークの木」とか、細かいところまでクッキリハッキリ!ただし、さっきも言ったけどコストはお高めだから、ここぞという時に使ってね!✨
これマジ便利!画像の中の文字を翻訳できちゃうの!「アインシュタインの相対性理論を解説した図解を作って」って頼んだ後、「それを日本語に翻訳して!」って言ったら、絵の雰囲気はそのままに文字だけ日本語にしてくれるんだよ!世界中のファンに向けて発信できちゃうじゃん!
普通のモデルは3枚までだったけど、Proはなんと14枚まで画像をミックスできるの!「この人たちの集合写真で、みんなコスプレしてるやつ!」って頼んで、メンバーの写真とか大量に読み込ませてもOK!14枚ってすごくない!?クラス写真とか商品のカタログとか、一気に作れちゃうよ!
(あ、でもキャラの顔を似せたいなら5枚くらいがベストらしいよ!)
パーソナライズされたドット絵:ネットでその人の経歴を検索して、それをドット絵で表現!
複雑なテキスト統合:長い詩と解説文を、いい感じのレイアウトで配置!文字崩れしにくいってこと!
超リアルなモックアップ:フィギュアが机の上に置いてある写真とか、光の当たり方まで超リアルに作れる!
最後に、上手な頼み方(プロンプト)のコツだよ!
超具体的に!:色、光、構図、細かく言えば言うほど思い通りになる!
文脈を伝える!:「何のために」「どんなムードで」を伝えると、AIが空気を読んでくれるよ。
会話で修正!:一発で完璧じゃなくてもOK!会話しながら直していこう。
ステップ・バイ・ステップ!:複雑なことは手順を分けてお願いする!
ポジティブに!:「車を描かないで」より「車のいない静かな通り」って言ったほうが伝わるよ。
カメラマンになろう!:「広角レンズで」「ローアングルで」とか指定してみて!
検索を活用!:リアルなデータが欲しいときは「Webで検索して」ってハッキリ言おう!
Batch APIで節約!:急がないなら半額になるBatch APIを活用してね!
はぁ〜〜〜っ!一気に喋った!💨どう?Nano Banana Pro、ヤバくない!?これ全部使いこなせたら、メイたちのビジュアル担当として最強になれちゃう気がするんだよね!とりあえず、AI Studioでなんか作ってみない?
よし、じゃあまずはメイと一緒にAI Studioにログインして、簡単なプロンプトから試してみようか!
以下は「Complete Developer Tutorial for Nano Banana Pro」の日本語訳です。
思考機能、検索グラウンディング(Search Grounding)、そして美しい4K出力を含む、この次世代AIモデルの高度な機能が、いかにして複雑で創造的なアプリケーション構築を可能にするかをご紹介します。
Flashモデル(Nano Banana)がスピードと手頃な価格を実現した一方で、Proバージョンは「思考」能力、検索グラウンディング、高精細な4K出力を導入しました。複雑でクリエイティブなタスクで、思いっきり(Go bananas!)楽しむ時が来ました!
このガイドでは、Gemini Developer API を使用した Nano Banana Pro の高度な機能について解説します。
このガイドの内容:
Google AI Studio での Nano Banana Pro の使用方法
プロジェクトのセットアップ
クライアントの初期化
基本的な生成(クラシックな方法)
「思考(Thinking)」プロセス
検索グラウンディング
高解像度4K生成
多言語機能
高度な画像ミキシング
Pro限定デモ
ベストプラクティスとプロンプトのヒント
注: この記事のインタラクティブ版については、Python cookbook または AI Studio の Javascript Notebook をご覧ください。
エンドユーザーは Gemini アプリ で Nano Banana Pro にアクセスできますが、開発者がプロトタイプを作成しプロンプトをテストするのに最適な環境は Google AI Studio です。AI Studio は、コードを書く前にすべての利用可能なAIモデルを実験できるプレイグラウンドであり、Gemini API を使用した構築のエントリーポイントでもあります。
AI Studio 内で Nano Banana Pro を使用できます。始めるには、aistudio.google.com にアクセスし、Googleアカウントでサインインして、モデルピッカーから Nano Banana Pro (Gemini 3 Pro Image) を選択してください。
Nano-Banana とは異なり、Pro バージョンには 無料枠がありません。つまり、課金が有効になっている API キーを選択する必要があります(下記の「プロジェクトのセットアップ」セクションを参照してください)。
ヒント: ai.studio/apps で Nano Banana ウェブアプリを直接「Vibe coding(直感的にコーディング)」したり、コードを探索して 既存のアプリ のいずれかをリミックスしたりすることもできます。
このガイドを進めるには、以下が必要です。
Google AI Studio から取得した API キー
プロジェクトへの課金設定
Python または JavaScript/TypeScript 用の Google Gen AI SDK
これらをすべて備えたハードコアな Gemini API ユーザーであれば、素晴らしいことです!このセクションをスキップして次に進んでください。そうでない場合は、以下の手順で始めてください。
AI Studio に初めてログインすると、Google Cloud プロジェクトと API キーが自動的に作成されます。API キー管理画面 を開き、「コピー」アイコンをクリックして API キーをコピーします。
Nano Banana Pro には無料枠がないため、Google Cloud プロジェクトで課金を有効にする必要があります。API キー管理画面 で、プロジェクトの横にある [請求先を設定] をクリックし、画面の指示に従ってください。
Nano Banana Pro の料金は?
Nano Banana Pro による画像生成は、特に4K画像の場合、Flash バージョンよりも高額になります。この記事の公開時点では、1K または 2K 画像のコストは $0.134 ですが、4K 画像は $0.24 かかります(加えて、入力とテキスト出力のトークンコストがかかります)。最新の詳細については、ドキュメントの 価格設定 を確認してください。
プロのヒント: 生成コストを50%節約するには、Batch API を使用できます。その代わり、画像を取得するまでに最大24時間待つ必要がある場合があります。
お好みの言語の SDK を選択してください。
Python:l
pip install -U google-genai
# 画像操作用にPillowライブラリをインストール
pip install Pillow
JavaScript / TypeScript:
npm install @google/genai
注: 以下の例ではデモンストレーションのために Python SDK を使用しています。JavaScript で Nano Banana を使用するための同等のコードスニペットは、この JS Notebook で提供されています。
Pro モデルを使用するには、gemini-3-pro-image-preview というモデル ID を使用する必要があります。
Python
from google import genai
from google.genai import types
# クライアントの初期化
client = genai.Client(api_key="YOUR_API_KEY")
# モデルIDの設定
PRO_MODEL_ID = "gemini-3-pro-image-preview"
凝った機能に入る前に、標準的な生成を見てみましょう。response_modalities(テキストと画像を取得するか、画像のみか)および aspect_ratio(アスペクト比)を使用して出力を制御できます。
Python
prompt = "Create a photorealistic image of a siamese cat with a green left eye and a blue right one"
# 日本語訳: 左目が緑、右目が青のシャム猫の写実的な画像を作成してください
aspect_ratio = "16:9" # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9" または "21:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'], # または単に ['Image']
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
)
)
)
# 画像の表示
for part in response.parts:
if image:= part.as_image():
image.save("cat.png")
チャットモードも選択肢の一つです(マルチターンの編集を行う場合には、こちらをお勧めします)。例については、8番目の例「多言語バナナ(Polyglot Banana)」を確認してください。
Nano Banana Pro は単に描いているだけではありません。「考えて」いるのです。つまり、画像を生成する前に、最も複雑で入り組んだプロンプトを推論することができます。そして最高な点は、その脳内を覗けることです!
これを有効にするには、thinking_config で include_thoughts=True を設定します。
Python
prompt = "Create an unusual but realistic image that might go viral"
# 日本語訳: バイラル(拡散)しそうな、変わっているがリアルな画像を作成してください
aspect_ratio = "16:9"
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio=aspect_ratio,
),
thinking_config=types.ThinkingConfig(
include_thoughts=True # 思考を有効化
)
)
)
# 画像と思考の表示
for part in response.parts:
if part.thought:
print(f"Thought: {part.text}")
elif image:= part.as_image():
image.save("viral.png")
すると、以下のような出力が得られるはずです。
## ラマの通勤風景を想像中
今はラマに焦点を当てています。目標は、ボリビアのラパスで賑やかなバスに乗って
毎日通勤している彼らを捉えることです。私の計画では、
楽しそうな乗客でぎゅうぎゅう詰めのヴィンテージバスを描きます。画像では、
窓の外を見ているラマや乗客と交流しているラマなどの詳細を強調し、
人々が写真を撮っている様子も描きます。
[画像]
## コンセプトの視覚化
現在、要求されたシナリオに完全に没入しています。私の主な
焦点は、「変わっているがリアル」な側面にあります。シーンは
重要な要素が確立され、形になり始めています。
この透明性により、モデルがあなたのリクエストをどのように解釈したかを理解するのに役立ちます。まるでアーティストと会話しているような感覚です!
最も革新的な機能の一つが 検索グラウンディング(Search Grounding) です。Nano Banana Pro は過去の情報に縛られません。Google 検索からのリアルタイムデータにアクセスし、正確で最新の画像を生成できます。天気が知りたいですか?お任せください。
例えば、現在の天気予報を視覚化するよう依頼できます。
Python
prompt = "Visualize the current weather forecast for the next 5 days in Tokyo as a clean, modern weather chart. add a visual on what i should wear each day"
# 日本語訳: 今後5日間の東京の天気予報を、クリーンでモダンな天気図として視覚化してください。各日に何を着るべきかのビジュアルも追加してください。
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="16:9",
),
tools=[{"google_search": {}}] # Google検索を有効化
)
)
# 画像の保存
for part in response.parts:
if image:= part.as_image():
image.save("weather.png")
# ソースの表示(これは必ず行う必要があります)
print(response.candidates[0].grounding_metadata.search_entry_point.rendered_content)
印刷品質の画像が必要ですか?Nano Banana Pro は 4K 解像度をサポートしています。時には、「大きいことは良いこと」ですから。
Python
prompt = "A photo of an oak tree experiencing every season"
# 日本語訳: すべての季節を経験しているオークの木の写真
resolution = "4K" # オプション: "1K", "2K", "4K"。小文字は機能しないので注意してください。
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=prompt,
config=types.GenerateContentConfig(
response_modalities=['Text', 'Image'],
image_config=types.ImageConfig(
aspect_ratio="1:1",
image_size=resolution
)
)
)
注: 4K 生成はコストが高くなるため、賢く利用してください!
このモデルは、12以上の言語で画像内のテキストを生成、さらには翻訳することさえできます。ユニバーサル翻訳機です。
Python
# スペイン語でインフォグラフィックを生成
message = "Make an infographic explaining Einstein's theory of General Relativity suitable for a 6th grader in Spanish"
# 日本語訳: 小学6年生に適したアインシュタインの一般相対性理論を説明するインフォグラフィックをスペイン語で作成してください
response = chat.send_message(message,
config=types.GenerateContentConfig(
image_config=types.ImageConfig(aspect_ratio="16:9")
)
)
# 画像の保存
for part in response.parts:
if image:= part.as_image():
image.save("relativity.png")
# それを日本語に翻訳
message = "Translate this infographic in Japanese, keeping everything else the same"
# 日本語訳: 他のすべてはそのままにして、このインフォグラフィックを日本語に翻訳してください
response = chat.send_message(message)
# 画像の保存
for part in response.parts:
if image:= part.as_image():
image.save("relativity_JP.png")
Flash モデルは最大3枚の画像をミックスできますが、Pro モデルは最大 14枚の画像 を処理できます!1つのプロンプトでパーティーが開けるほどです。複雑なコラージュを作成したり、製品ライン全体を披露したりするのに最適です。
# 複数の画像をミックス
response = client.models.generate_content(
model=PRO_MODEL_ID,
contents=[
"An office group photo of these people, they are making funny faces.",
# 日本語訳: これらの人々のオフィスの集合写真、彼らは変顔をしています。
PIL.Image.open('John.png'),
PIL.Image.open('Jane.png'),
# ... 最大14枚まで画像を追加可能
],
)
# 画像の保存
for part in response.parts:
if image:= part.as_image():
image.save("group_picture.png")
注: キャラクターの忠実度を非常に高く保ちたい場合は、5枚程度に抑えることをお勧めします。それでもパーティーナイトには十分すぎる量です!
ここでは、Nano Banana Pro でのみ可能な例をいくつか紹介します。驚く準備はいいですか?
プロンプト: "Search the web then generate an image of isometric perspective, detailed pixel art that shows the career of Guillaume Vernade"
(ウェブを検索し、Guillaume Vernadeのキャリアを示すアイソメトリック視点の詳細なピクセルアート画像を生成してください)
この画像は検索グラウンディングを使用して特定の人物に関する情報を検索し、特定のスタイルで視覚化しています。
プロンプト: "Show me an infographic about how sonnets work, using a sonnet about bananas written in it, along with a lengthy literary analysis of the poem. Good vintage aesthetics"
(ソネットの仕組みに関するインフォグラフィックを見せてください。中にはバナナについて書かれたソネットと、その詩に関する長い文学的分析を含めてください。良いヴィンテージの美学で。)
このモデルは、一貫性のある長いテキストを生成し、複雑なレイアウトに完璧に統合することができます。
プロンプト: "A photo of a program for the Broadway show about TCG players on a nice theater seat, it's professional and well made, glossy, we can see the cover and a page showing a photo of the stage."
(素敵な劇場の座席に置かれた、TCGプレイヤーに関するブロードウェイショーのプログラムの写真。プロフェッショナルでよく作られており、光沢があり、表紙とステージの写真が載っているページが見えます。)
正確な照明と質感を備えた、印刷物のフォトリアルなモックアップを作成します。
Nano Banana モデルで最高の結果を得るために、以下のプロンプトガイドラインに従ってください。
超具体的に: 被写体、色、照明、構図について詳細を提供すればするほど、出力をより細かく制御できます。
文脈と意図を提供する: 画像の目的や希望するムードを説明してください。モデルによる文脈の理解は、その創造的な選択に影響を与えます。
反復と洗練: 最初から完璧を期待しないでください。モデルの会話機能を使用して、段階的な変更を加え、画像を洗練させてください。
ステップバイステップの指示を使用する: 複雑なシーンの場合、プロンプトを明確で順序立てられた一連の指示に分割してください。
肯定的なフレーミングを使用する: 「車なし(no cars)」のような否定的なプロンプトの代わりに、「交通の気配がない、無人の通り」のように、希望するシーンを肯定的に描写してください。
カメラを制御する: 「広角ショット」、「マクロショット」、「ローアングル視点」などの写真的・映画的用語を使用して、構図を指示してください。
検索グラウンディングを有利に使う: モデルにリアルタイムまたは実世界のデータを使用してほしい場合、それについて非常に正確に指示してください。「オリンピック・リヨンの直近の試合についてウェブ検索し、インフォグラフィックを作成して」という指示は、単に「OLの直近の試合のインフォグラフィック」(これでも機能しますが、確実ではありません)とするよりも良い結果が得られます。
Batch API を使用してコストを下げ、クォータを増やす: Batch API は、小規模または非常に大規模なリクエストのバッチをまとめて送信する方法です。処理に最大24時間かかる場合がありますが、その代わりに生成コストを50%節約できます。また、クォータ(割り当て)も高くなります!
ベストプラクティスについてさらに深く知りたい場合は、ドキュメントの プロンプトガイド や、公式ブログで公開されている Nano Banana 用の プロンプトのベストプラクティス を確認してください。
https://j.aicu.ai/MagV16
Nano Banana Pro (Gemini 3 Pro Image) は、AI画像生成の新たな境地を開きます。思考し、検索し、4Kでレンダリングする能力を備えたこのツールは、真剣なクリエイター(そして真剣に楽しみたい人)のためのツールです。試してみる準備はできましたか? Google AI Studio にアクセスして、アプリ を試したりカスタマイズしたり、cookbook をチェックしてみてください。
AICU読者に向けてGoogle Colabノートブックを制作しました!
実は公式でも扱われていないレシピ写真の生成やGIF動画生成などの解説もあります。AiCutyを使ったサンプルが可愛いのでぜひみてね!
アニメーションGIFも!
GitHubリポジトリのフォローとスターをよろしくおねがします!
https://github.com/aicuai/AiCuty/blob/main/AiCuty_NanoBananaPro.ipynb
Originally published at note.com/aicu on Nov 23, 2025.