日本語特化の画像生成AI「Japanese Stable Diffusion」がオープンソースで公開

日本語特化の画像生成AI「Japanese Stable Diffusion」がオープンソースで公開
日本語特化の画像生成AI「Japanese Stable Diffusion」がオープンソースで公開

「ハンバーガー 浮世絵」で生成

rinna株式会社が、日本語に特化した画像生成AIモデル「Japanese Stable Diffusion」を9月9日(金)に発表した。

この「Japanese Stable Diffusion」は、画像生成AIモデル「Stable Diffusion」に、約1億枚の日本語キャプション付き画像を追加学習させることで開発されたもの。

オープンソースコミュニティ・Hugging FaceとGitHubで公開されている。

【画像】「Japanese Stable Diffusion」で生成された画像(6枚)

オープンソースで公開 画像生成AI「Stable Diffusion」

「Stable Diffusion」は、Stability AI社が開発した英語の文字列から画像が生成されるAIモデル。

8月10日に発表され、日本ではnote社のCXO・深津貴之さんが公開した記事(外部リンク)などをきっかけに話題となった。

その後、オープンソースとしてリリースされ、LINEアプリ「お絵描きばりぐっどくん」や検索・閲覧サービス「Lexica」など、国内外で「Stable Diffusion」を使用したサービスが数多く登場している。

約1億枚の日本語つき画像を追加学習

「宇宙の月でバイクで走るライダー」で生成

rinna株式会社は「Japanese Stable Diffusion」の開発背景について、英語を入力する「Stable Diffusion」では固有名詞・和製英語・オノマトペなど翻訳が難しい日本語固有の表現を反映させることができないこと、「Stable Diffusion」の学習データの多くが英語圏の画像であり、英語圏の文化を色濃く反映した画像が生成されてしまうことを説明。

そこで、日本語に対応させるため、約1億枚の日本語キャプション付き画像を用いて追加学習させ「Japanese Stable Diffusion」を開発したという。

また、rinna株式会社は「劇的に進歩するAI分野において、英語圏の進歩に追随するために早期にモデルを公開」したとしている。

「Japanese Stable Diffusion」は、rinna株式会社が運営するAIキャラクターSNS「キャラる」やAIりんな公式Twitterにも実装されている。詳細はプレスリリースまで(外部リンク)。

「Stable Diffusion」の関連記事



この記事どう思う?

この記事どう思う?

関連キーフレーズ

0件のコメント

※非ログインユーザーのコメントは編集部の承認を経て掲載されます。

※コメントの投稿前には利用規約の確認をお願いします。