Stable Diffusionのオープンリリースからちょうど3年となる2025年8月26日にGoogleから予告されていた新画像生成AI「nano-Banana」が各種生成AIプラットフォームに一斉リリースされました。
AICUでは「nano-Banana/Gemini 2.5 Flash Image」について、既存の画像生成AIのクリエイターがどのように使いこなしていくべきか、またこれから画像生成AI分野に参加する人々がどのように始めるべきか、複数回の連載で紹介したいと思います。
<編集部による作例>サンプル画像1枚とともに"make a 3d figure on a desktop"

Gemini 2.5 Flash Image(nano-Banana)を発表 ― 最先端の画像生成・編集モデル
2025年8月26日 Google for Developers
執筆:Alisa Fortin(プロダクトマネージャー)
Guillaume Vernade(Gemini開発者アドボケート)
Kat Kampf(プロダクトマネージャー)
Ammaar Reshi(プロダクト&デザインリード)
本日、Googleは最新の画像生成および編集モデル Gemini 2.5 Flash Image(コードネーム:nano-Banana) を発表しました。

こちらリンクでGoogle AI Studio内で試すことができます。
このモデルは以下を可能にします。
-
複数の画像を一つに融合
-
キャラクターの一貫性を保ったストーリーテリング
-
自然言語によるピンポイントな画像編集
-
Geminiが持つ世界知識を活かした生成と編集

Gemini 2.5 Flash Imageを使った開発をさらに容易にするため、Google AI Studioの「ビルドモード」に大幅なアップデートを行いました(今後もアップデートを予定しています)。以下の例では、カスタムAI搭載アプリでモデルの機能を素早くテストできるだけでなく、たった1つのプロンプトでアプリをリミックスしたり、アイデアを実現したりすることも可能です。構築したアプリを共有する準備ができたら、Google AI Studioから直接デプロイするか、コードをGitHubに保存できます。

「ユーザーが画像をアップロードしてさまざまなフィルターを適用できる画像編集アプリを作成してください」といったプロンプトを試したり、プリセットテンプレートの 1 つを選択してリミックスしたり、すべて無料で行えます。
<編集部による作例>「このフィギュアをAmazonギフト券の後ろに立たせて」(日本語)

背景と価格
まず今年初めにリリースされた Gemini 2.0 Flash は「高速・低コスト・使いやすさ」が好評を博しましたが、コミュニティからは「より高品質な画像」と「高度な創造的コントロール」が求められていました。Gemini 2.5 Flash Image は現在、以下のプラットフォームで利用可能です:
-
Gemini API(開発者向け)
-
Google AI Studio(無料で試用可能)
-
Vertex AI(企業向け)
価格:
100万出力トークンあたり30ドル
1画像あたり約1290トークン(=約0.039ドル/画像)
[訳註] $1=146.95円として
30ドル=約 4,408円
1画像(1290トークン)$0.039 = 約 5.73円となります
主な機能ハイライト

キャラクターの一貫性を維持
同一キャラクターを別の背景に配置したり、ブランド用のビジュアルを統一して作成可能。プロダクトの多角的なビジュアル展開や、シリーズもののビジュアル制作に最適です。
このモデルは、キャラクターの一貫性に加え、ビジュアルテンプレートへの準拠にも優れています。開発者が不動産物件のリスティングカード、従業員の制服バッジ、カタログ全体のダイナミックな製品モックアップなど、すべてを単一のデザインテンプレートから作成する例が既にあります。
プロンプトベースの画像編集
自然言語で「背景をぼかす」「Tシャツの汚れを消す」「ポーズを変更する」「白黒写真に色をつける」といった操作が可能。編集アプリのテンプレートも提供中。
世界知識を活用した生成
Geminiの知識ベースにより、手描き図の読み取りや、教育ツールとしての応用、現実世界に基づいた正確な表現も可能に。
マルチイメージ融合
複数画像を理解し、融合する機能を搭載。たとえば、商品画像を異なる背景に自然に配置したり、部屋の内装を別スタイルに変えるなどが、1つのプロンプトで実現できます。
すぐに使える!テンプレートアプリも充実
Gemini 2.5 Flash Image は Google AI Studio で、下記のようなテンプレートアプリを提供しています:
-
画像編集アプリ「PixShop」(UIとプロンプト両対応)
-
教育・図解補助ツール「Gemini Co-Drawing」
-
複数画像の融合「Home Canvas」商品配置シーン生成アプリ
これらはすべて「プロンプトだけ」で簡単にカスタマイズ可能。生成したアプリは GitHub へ保存、あるいは Studio 上からすぐに公開できます。
パートナーシップと展開
-
OpenRouter.ai:世界中の300万人以上の開発者へ展開。OpenRouter上で初めて画像生成が可能なモデルです。
-
fal.ai:ジェネレーティブメディア開発者向けプラットフォームと連携し、より多くの開発者に提供。
-
SynthID ウォーターマーク:すべての生成・編集画像には見えないデジタルウォーターマークを埋め込み、AI生成であることを識別可能。
Pythonでの利用例
from google import genai
from PIL import Image
from io import BytesIO
client = genai.Client()
prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the Gemini constellation"
image = Image.open('/path/to/image.png')
response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt, image],
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.save("generated_image.png")
今後の展望
Googleは現在、以下の強化に取り組んでいます:
-
長文プロンプトへの対応精度向上
-
キャラクター一貫性のさらなる精度アップ
-
細部描写や事実性の信頼性向上
📝 AICU編集部のまとめ
Googleによる「nano-Banana(Gemini 2.5 Flash Image)」の登場は、まさにStable Diffusionリリースから3年目の節目に起きた、画像生成AI界の地殻変動とも言える出来事です。
AICUでは、これまでComfyUIやAUTOMATIC1111など、オープンソースを基盤とする画像生成技術の進化を追ってきましたが、今回のGoogle製生成モデルの登場は「高性能×即応性×低コスト」を併せ持った“次世代の選択肢”として注目すべき存在です。
今後AICUでは、以下のような観点から実践的な連載を展開していきます:
-
ComfyUIとの使い分けや連携は可能か?
-
商用利用やポートフォリオ制作における最適解とは?
-
AIキャラクターの継続的な活用にどう活かせるか?
-
新規参入者が「どこから始めるか?」のガイド
生成AIを使った創作は、いまや選択肢の時代に入りました。AICUはこれからも「わかるAI」「つかえるAI」を届けることで、皆さんのクリエイティブの未来を支えていきます。
読者の皆さんからの投稿も歓迎です!
X@AICUai もしくは AICU.jp/c のコミュニティからお伝えください!
Originally published at note.com/aicu on Aug 28, 2025.
Comments