画像生成界の大激震! nano-Bananaの衝撃(1)

Stable Diffusionのオープンリリースからちょうど3年となる2025年8月26日にGoogleから予告されていた新画像生成AI「nano-Banana」が各種生成AIプラットフォームに一斉リリースされました。

AICUでは「nano-Banana/Gemini 2.5 Flash Image」について、既存の画像生成AIのクリエイターがどのように使いこなしていくべきか、またこれから画像生成AI分野に参加する人々がどのように始めるべきか、複数回の連載で紹介したいと思います。

＜編集部による作例＞サンプル画像1枚とともに"make a 3d figure on a desktop"

Gemini 2.5 Flash Image（nano-Banana）を発表 ― 最先端の画像生成・編集モデル

2025年8月26日 Google for Developers

執筆：Alisa Fortin（プロダクトマネージャー）
Guillaume Vernade（Gemini開発者アドボケート）
Kat Kampf（プロダクトマネージャー）
Ammaar Reshi（プロダクト＆デザインリード）

本日、Googleは最新の画像生成および編集モデル Gemini 2.5 Flash Image（コードネーム：nano-Banana） を発表しました。

こちらリンクでGoogle AI Studio内で試すことができます。

このモデルは以下を可能にします。

複数の画像を一つに融合
キャラクターの一貫性を保ったストーリーテリング
自然言語によるピンポイントな画像編集
Geminiが持つ世界知識を活かした生成と編集

(lmarena の結果は https://lmarena.ai/leaderboard から取得されます)

Gemini 2.5 Flash Imageを使った開発をさらに容易にするため、Google AI Studioの「ビルドモード」に大幅なアップデートを行いました（今後もアップデートを予定しています）。以下の例では、カスタムAI搭載アプリでモデルの機能を素早くテストできるだけでなく、たった1つのプロンプトでアプリをリミックスしたり、アイデアを実現したりすることも可能です。構築したアプリを共有する準備ができたら、Google AI Studioから直接デプロイするか、コードをGitHubに保存できます。

「ユーザーが画像をアップロードしてさまざまなフィルターを適用できる画像編集アプリを作成してください」といったプロンプトを試したり、プリセットテンプレートの 1 つを選択してリミックスしたり、すべて無料で行えます。

＜編集部による作例＞「このフィギュアをAmazonギフト券の後ろに立たせて」(日本語)

背景と価格

まず今年初めにリリースされた Gemini 2.0 Flash は「高速・低コスト・使いやすさ」が好評を博しましたが、コミュニティからは「より高品質な画像」と「高度な創造的コントロール」が求められていました。Gemini 2.5 Flash Image は現在、以下のプラットフォームで利用可能です：

Gemini API（開発者向け）
Google AI Studio（無料で試用可能）
Vertex AI（企業向け）

価格：
100万出力トークンあたり30ドル
1画像あたり約1290トークン（＝約0.039ドル/画像）

[訳註] $1=146.95円として
30ドル＝約 4,408円
1画像（1290トークン）$0.039 = 約 5.73円となります

主な機能ハイライト

キャラクターの一貫性を維持

同一キャラクターを別の背景に配置したり、ブランド用のビジュアルを統一して作成可能。プロダクトの多角的なビジュアル展開や、シリーズもののビジュアル制作に最適です。

このモデルは、キャラクターの一貫性に加え、ビジュアルテンプレートへの準拠にも優れています。開発者が不動産物件のリスティングカード、従業員の制服バッジ、カタログ全体のダイナミックな製品モックアップなど、すべてを単一のデザインテンプレートから作成する例が既にあります。

プロンプトベースの画像編集

自然言語で「背景をぼかす」「Tシャツの汚れを消す」「ポーズを変更する」「白黒写真に色をつける」といった操作が可能。編集アプリのテンプレートも提供中。

世界知識を活用した生成

Geminiの知識ベースにより、手描き図の読み取りや、教育ツールとしての応用、現実世界に基づいた正確な表現も可能に。

マルチイメージ融合

複数画像を理解し、融合する機能を搭載。たとえば、商品画像を異なる背景に自然に配置したり、部屋の内装を別スタイルに変えるなどが、1つのプロンプトで実現できます。

すぐに使える！テンプレートアプリも充実

Gemini 2.5 Flash Image は Google AI Studio で、下記のようなテンプレートアプリを提供しています：

キャラクター一貫性デモ
画像編集アプリ「PixShop」（UIとプロンプト両対応）
教育・図解補助ツール「Gemini Co-Drawing」
複数画像の融合「Home Canvas」商品配置シーン生成アプリ

これらはすべて「プロンプトだけ」で簡単にカスタマイズ可能。生成したアプリは GitHub へ保存、あるいは Studio 上からすぐに公開できます。

パートナーシップと展開

OpenRouter.ai：世界中の300万人以上の開発者へ展開。OpenRouter上で初めて画像生成が可能なモデルです。
fal.ai：ジェネレーティブメディア開発者向けプラットフォームと連携し、より多くの開発者に提供。
SynthID ウォーターマーク：すべての生成・編集画像には見えないデジタルウォーターマークを埋め込み、AI生成であることを識別可能。

Pythonでの利用例

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client()

prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the Gemini constellation"

image = Image.open('/path/to/image.png')

response = client.models.generate_content(
    model="gemini-2.5-flash-image-preview",
    contents=[prompt, image],
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))   
    image.save("generated_image.png")

今後の展望

Googleは現在、以下の強化に取り組んでいます：

長文プロンプトへの対応精度向上
キャラクター一貫性のさらなる精度アップ
細部描写や事実性の信頼性向上

📝 AICU編集部のまとめ

Googleによる「nano-Banana（Gemini 2.5 Flash Image）」の登場は、まさにStable Diffusionリリースから3年目の節目に起きた、画像生成AI界の地殻変動とも言える出来事です。

AICUでは、これまでComfyUIやAUTOMATIC1111など、オープンソースを基盤とする画像生成技術の進化を追ってきましたが、今回のGoogle製生成モデルの登場は「高性能×即応性×低コスト」を併せ持った“次世代の選択肢”として注目すべき存在です。

今後AICUでは、以下のような観点から実践的な連載を展開していきます：

ComfyUIとの使い分けや連携は可能か？
商用利用やポートフォリオ制作における最適解とは？
AIキャラクターの継続的な活用にどう活かせるか？
新規参入者が「どこから始めるか？」のガイド

生成AIを使った創作は、いまや選択肢の時代に入りました。AICUはこれからも「わかるAI」「つかえるAI」を届けることで、皆さんのクリエイティブの未来を支えていきます。

読者の皆さんからの投稿も歓迎です！
X@AICUai もしくは AICU.jp/c のコミュニティからお伝えください！

Originally published at note.com/aicu on Aug 28, 2025.

画像生成AI, Google Gemini, Gemini, nano banana