画像生成界の大激震! nano-Bananaの衝撃(1)

画像生成界の大激震! nano-Bananaの衝撃(1)

Stable Diffusionのオープンリリースからちょうど3年となる2025年8月26日にGoogleから予告されていた新画像生成AI「nano-Banana」が各種生成AIプラットフォームに一斉リリースされました。

AICUでは「nano-Banana/Gemini 2.5 Flash Image」について、既存の画像生成AIのクリエイターがどのように使いこなしていくべきか、またこれから画像生成AI分野に参加する人々がどのように始めるべきか、複数回の連載で紹介したいと思います。

<編集部による作例>サンプル画像1枚とともに"make a 3d figure on a desktop"

画像

Gemini 2.5 Flash Image(nano-Banana)を発表 ― 最先端の画像生成・編集モデル

2025年8月26日 Google for Developers 

執筆:Alisa Fortin(プロダクトマネージャー)
Guillaume Vernade(Gemini開発者アドボケート)
Kat Kampf(プロダクトマネージャー)
Ammaar Reshi(プロダクト&デザインリード)

本日、Googleは最新の画像生成および編集モデル Gemini 2.5 Flash Image(コードネーム:nano-Banana) を発表しました。

画像

こちらリンクでGoogle AI Studio内で試すことができます。

このモデルは以下を可能にします。

  • 複数の画像を一つに融合

  • キャラクターの一貫性を保ったストーリーテリング

  • 自然言語によるピンポイントな画像編集

  • Geminiが持つ世界知識を活かした生成と編集

画像
(lmarena の結果は https://lmarena.ai/leaderboard から取得されます)

Gemini 2.5 Flash Imageを使った開発をさらに容易にするため、Google AI Studioの「ビルドモード」に大幅なアップデートを行いました(今後もアップデートを予定しています)。以下の例では、カスタムAI搭載アプリでモデルの機能を素早くテストできるだけでなく、たった1つのプロンプトでアプリをリミックスしたり、アイデアを実現したりすることも可能です。構築したアプリを共有する準備ができたら、Google AI Studioから直接デプロイするか、コードをGitHubに保存できます。

画像

「ユーザーが画像をアップロードしてさまざまなフィルターを適用できる画像編集アプリを作成してください」といったプロンプトを試したり、プリセットテンプレートの 1 つを選択してリミックスしたり、すべて無料で行えます。

<編集部による作例>「このフィギュアをAmazonギフト券の後ろに立たせて」(日本語)

画像

背景と価格

まず今年初めにリリースされた Gemini 2.0 Flash は「高速・低コスト・使いやすさ」が好評を博しましたが、コミュニティからは「より高品質な画像」と「高度な創造的コントロール」が求められていました。Gemini 2.5 Flash Image は現在、以下のプラットフォームで利用可能です:

  • Gemini API(開発者向け)

  • Google AI Studio(無料で試用可能)

  • Vertex AI(企業向け)

価格:
100万出力トークンあたり30ドル
1画像あたり約1290トークン(=約0.039ドル/画像)

[訳註] $1=146.95円として
30ドル=約 4,408円
1画像(1290トークン)$0.039 = 約 5.73円となります

主な機能ハイライト

画像

キャラクターの一貫性を維持

同一キャラクターを別の背景に配置したり、ブランド用のビジュアルを統一して作成可能。プロダクトの多角的なビジュアル展開や、シリーズもののビジュアル制作に最適です。

このモデルは、キャラクターの一貫性に加え、ビジュアルテンプレートへの準拠にも優れています。開発者が不動産物件のリスティングカード、従業員の制服バッジ、カタログ全体のダイナミックな製品モックアップなど、すべてを単一のデザインテンプレートから作成する例が既にあります。

プロンプトベースの画像編集

自然言語で「背景をぼかす」「Tシャツの汚れを消す」「ポーズを変更する」「白黒写真に色をつける」といった操作が可能。編集アプリのテンプレートも提供中。

世界知識を活用した生成

Geminiの知識ベースにより、手描き図の読み取りや、教育ツールとしての応用、現実世界に基づいた正確な表現も可能に。

マルチイメージ融合

複数画像を理解し、融合する機能を搭載。たとえば、商品画像を異なる背景に自然に配置したり、部屋の内装を別スタイルに変えるなどが、1つのプロンプトで実現できます。

すぐに使える!テンプレートアプリも充実

Gemini 2.5 Flash Image は Google AI Studio で、下記のようなテンプレートアプリを提供しています:

これらはすべて「プロンプトだけ」で簡単にカスタマイズ可能。生成したアプリは GitHub へ保存、あるいは Studio 上からすぐに公開できます。

パートナーシップと展開

  • OpenRouter.ai:世界中の300万人以上の開発者へ展開。OpenRouter上で初めて画像生成が可能なモデルです。

  • fal.ai:ジェネレーティブメディア開発者向けプラットフォームと連携し、より多くの開発者に提供。

  • SynthID ウォーターマーク:すべての生成・編集画像には見えないデジタルウォーターマークを埋め込み、AI生成であることを識別可能。

Pythonでの利用例

from google import genai
from PIL import Image
from io import BytesIO

client = genai.Client()

prompt = "Create a picture of my cat eating a nano-banana in a fancy restaurant under the Gemini constellation"

image = Image.open('/path/to/image.png')

response = client.models.generate_content(
model="gemini-2.5-flash-image-preview",
contents=[prompt, image],
)

for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.save("generated_image.png")
 

今後の展望

Googleは現在、以下の強化に取り組んでいます:

  • 長文プロンプトへの対応精度向上

  • キャラクター一貫性のさらなる精度アップ

  • 細部描写や事実性の信頼性向上

📝 AICU編集部のまとめ

Googleによる「nano-Banana(Gemini 2.5 Flash Image)」の登場は、まさにStable Diffusionリリースから3年目の節目に起きた、画像生成AI界の地殻変動とも言える出来事です。

AICUでは、これまでComfyUIやAUTOMATIC1111など、オープンソースを基盤とする画像生成技術の進化を追ってきましたが、今回のGoogle製生成モデルの登場は「高性能×即応性×低コスト」を併せ持った“次世代の選択肢”として注目すべき存在です。

今後AICUでは、以下のような観点から実践的な連載を展開していきます:

  • ComfyUIとの使い分けや連携は可能か?

  • 商用利用やポートフォリオ制作における最適解とは?

  • AIキャラクターの継続的な活用にどう活かせるか?

  • 新規参入者が「どこから始めるか?」のガイド

生成AIを使った創作は、いまや選択肢の時代に入りました。AICUはこれからも「わかるAI」「つかえるAI」を届けることで、皆さんのクリエイティブの未来を支えていきます。

読者の皆さんからの投稿も歓迎です!
X@AICUai もしくは AICU.jp/c のコミュニティからお伝えください!

 

Originally published at note.com/aicu on Aug 28, 2025.

AICU Japan

AICU Inc. AIDX Lab - Koto

Comments

Related posts

Search 日本初の劇場公開オムニバスAI映画『ジェネレイドスコープ』 8/29より公開!