2025年5月27日、ComfyUIがさらに進化。LLM(大規模言語モデル)をコンテキスト付きでネイティブ搭載し、画像・動画・3D生成を含む主要APIがワンクリックで扱えるように!個々のサービスでも実現できない、生成AIの新しい標準ワークフローが、ComfyUIから始まります!
Google Cloud | Gemini 2.5 Pro、Gemini 2.5 Flash
OpenAI | GPT-4.1 / 4o / o1 / o3 / o4
Hyper3D AI | Hyper3D.AI - Rodin
Tripo AI | Tripo 3D V1.4 / 2.0 / 2.5
LLMノードが登場。パイプラインの作成、推論、プロンプト、制御をすべてComfyUIワークフロー内で実行できます。言語モデルを使用して、テキストを動的に生成したり、ロジックで分岐を構築したり、プロンプトを調整したり、さらには他のノード間で複数ステップのアクション チェーンを構築したりすることもできます!
テクスチャもメッシュも、もうComfyUIだけで構築。外部ツール不要です。
詳細なプリセットとポリゴン数コントロールを備えた高品質なメッシュ。スケッチ、通常、スムーズ、詳細から選択し、低解像度または高解像度のメッシュを出力できます。
高度に設定可能な3D作成パイプライン。テキスト/画像/マルチビュー入力をサポートし、テクスチャ編集、リギング、メッシュリファインメント、フォーマット変換ツールをすべてノード内で実行できます。
例:Tripo Image-to-3D + Flux .1
強力なカスタムパイプラインで、APIモデルとオープンソースツールを組み合わせます。プロトタイピングでも本番環境へのプッシュでも、すべてNode.jsのロジックで実行できます。
高度な連携例: Runway Image-to-image + OpenAI Chat + Flux Dev hires fixによる高解像度化 + Runway Image-to-Video
Gemini2.5、画像生成、そして動画生成はVeo2がアナウンスされました!
ComfyUIまたはComfyUI Desktopを最新にアップデート
テンプレートから「Image」「Video」「3D」「LLM API」など選択
クレジット購入してノード接続→即生成!
📘公式ドキュメントはこちら
APIの価格: https://docs.comfy.org/tutorials/api-nodes/pricing
https://corp.aicu.ai/ja/comfyui-guide-20250513
OpenAI Image-1で写真をリファレンスにして、それをRunway Gen3, Gen4を比較しながら生成します。Turboなのでめちゃくちゃ速い!
素材とプロンプト、実際のワークフローはメンバーシップにて!
—
この記事の続きはこちらから https://note.com/aicu/n/n0f197aa91ae1
Originally published at note.com/aicu on May 27, 2025.