Seedance 2.0

画像から動画へ

高品質な音声・映像生成モデル、安定した映像、そして音声と映像の同期を実現。

テキストに最適

音声対応

商用利用可

入力

モデル

プロンプトワード*

解像度

アスペクト比

長さ

音声を生成する

最初のフレーム*

メディアファイルをドラッグ＆ドロップ、クリップボードから貼り付け（Ctrl/Cmd+V）、またはURLを入力してください。対応形式: .jpg, .jpeg, .png, .webp

尾翼フレーム画像

メディアファイルをドラッグ＆ドロップ、クリップボードから貼り付け（Ctrl/Cmd+V）、またはURLを入力してください。対応形式: .jpg, .jpeg, .png, .webp

仕上がり

準備完了

生成準備完了

画像プレビューを生成するには、入力項目を設定して「実行」をクリックしてください。

Seedance 2.0 モデル紹介

モデル概要

Seedance 2.0は、ByteDanceのSeedチームが開発した映画のようなマルチモーダルな音声・映像共生成モデルです。革新的なデュアルブランチ拡散トランスフォーマー（DB-DiT）アーキテクチャを採用し、テキスト、画像、音声、動画の4つのモダリティの混合入力に対応しています。最大12個の参照ファイル（画像9個、動画クリップ3個、音声クリップ3個）を読み込み、2K解像度の動画とネイティブステレオ音声を単一の順伝播で出力することで、音声と映像のタイミングのずれやリップシンクの非同期といった業界の課題を完全に解決します。このモデルは、強力な3D空間認識能力と動的メモリ機能を備え、安定した動き、物理的なリアリズム、そして被写体の一貫性を実現します。マルチショットのナレーション、ストーリーボードデザイン、滑らかなカメラワークを自動的に完成させ、複雑な脚本や監督レベルのクリエイティブな意図を正確に再現します。指示への準拠性、視覚的な美しさ、音声再生において業界をリードし、映画、広告、ソーシャルメディアマーケティングなどのプロフェッショナルなシナリオに深く適応します。業界の配信基準を満たす高品質な視聴覚コンテンツを効率的に制作できるため、コンテンツ制作のコストと期間を大幅に削減できます。

料金

解像度	消費クレジット
480p(credits/s)	6
720p(credits/s)	12

技術仕様

技術パラメータ	仕様
コア機能	image_to_video
解像度	480p,720p
アスペクト比	16:9,4:3,1:1,3:4,9:16,21:9
時間	4,5,6,7,8,9,10,11,12,13,14,15
License	✔