「Creative Reality Studio」は、Open AI社の自然言語処理モデル・GPT-3とStability AI社の画像生成AIモデル・Stable Diffusionを統合した動画作成サービス。
テキストや音声データを入力するだけで、アバターが顔を動かしながらその文章を読み上げる様子が動画として出力されます。
日本語や英語含む119の言語に対応。写真に映った人物に文章を読み上げさせたり、アバターを画像生成AI機能で生成したりすることも可能です。
今回は「Creative Reality Studio」の使い方を紹介します。
D-ID「Creative Reality Studio」の使い方
1.D-IDのアカウントを開設する
ログイン前の「Creative Reality Studio」/以下、画像は「Creative Reality Studio」のスクリーンショット
D-IDのログイン画面
「term of service(利用規約)」と「privacy policy(プライバシーポリシー)」を確認して、チェックボックスにチェックを入れ、D-IDのアカウントを作成します。
登録したアドレスに届いたメールよりアカウントを確認したら、D-IDのアカウント開設は完了です。
2.「CREATE VIDEO」を選択
ログイン後の「Creative Reality Studio」画面
3.アバターの選択
Choose a presenter
読み上げ動画をうまく生成するための画像の条件はこちら。
【最適な結果を得るための画像条件(編集部訳)】
◯ミディアムショット(半身のみの写真)、正面を向いた写真
◯ニュートラルな表情、口を閉じていること
◯画像内に写っている頭部のサイズ一定(200X200 ピクセル)以内であること
◯良好で安定した照明
◯サイズ - 最大5Mb
×顔が隠れていないこと 「Creative Reality Studio」
Generate AI Presenter
キャラクターを生成する際は、「A portrait of」 に続くテキストボックスに英語でプロンプトを入力します。
4.読み上げる文章と声を選択
Type Your Script/画像はD-ID「Creative Reality Studio」のスクリーンショット
「Type Your Script」と表示されている入力フォームに読み上げさせたいテキスト(3875文字以内)を入力し、言語(Language)、声の種類(Voices)、そのスタイル(Styles)を選択すると準備が完了。
「Upload Voice Audio」からは、好きな音声データをアップロードすることもできます。
4.「GENETARE VIDEO」で動画の作成
GENETARE VIDEO/画像はD-ID「Creative Reality Studio」のスクリーンショット
作成された読み上げ動画/画像はD-ID「Creative Reality Studio」のスクリーンショット

この記事どう思う?
関連リンク
0件のコメント