rinna株式会社が、日本語に特化した画像生成AIモデル「Japanese Stable Diffusion」を9月9日(金)に発表した。
この「Japanese Stable Diffusion」は、画像生成AIモデル「Stable Diffusion」に、約1億枚の日本語キャプション付き画像を追加学習させることで開発されたもの。
オープンソースコミュニティ・Hugging FaceとGitHubで公開されている。
【画像】「Japanese Stable Diffusion」で生成された画像(6枚)
8月10日に発表され、日本ではnote社のCXO・深津貴之さんが公開した記事(外部リンク)などをきっかけに話題となった。
その後、オープンソースとしてリリースされ、LINEアプリ「お絵描きばりぐっどくん」や検索・閲覧サービス「Lexica」など、国内外で「Stable Diffusion」を使用したサービスが数多く登場している。
そこで、日本語に対応させるため、約1億枚の日本語キャプション付き画像を用いて追加学習させ「Japanese Stable Diffusion」を開発したという。
また、rinna株式会社は「劇的に進歩するAI分野において、英語圏の進歩に追随するために早期にモデルを公開」したとしている。
「Japanese Stable Diffusion」は、rinna株式会社が運営するAIキャラクターSNS「キャラる」やAIりんな公式Twitterにも実装されている。詳細はプレスリリースまで(外部リンク)。
この「Japanese Stable Diffusion」は、画像生成AIモデル「Stable Diffusion」に、約1億枚の日本語キャプション付き画像を追加学習させることで開発されたもの。
オープンソースコミュニティ・Hugging FaceとGitHubで公開されている。
【画像】「Japanese Stable Diffusion」で生成された画像(6枚)
オープンソースで公開 画像生成AI「Stable Diffusion」
「Stable Diffusion」は、Stability AI社が開発した英語の文字列から画像が生成されるAIモデル。8月10日に発表され、日本ではnote社のCXO・深津貴之さんが公開した記事(外部リンク)などをきっかけに話題となった。
その後、オープンソースとしてリリースされ、LINEアプリ「お絵描きばりぐっどくん」や検索・閲覧サービス「Lexica」など、国内外で「Stable Diffusion」を使用したサービスが数多く登場している。
約1億枚の日本語つき画像を追加学習
rinna株式会社は「Japanese Stable Diffusion」の開発背景について、英語を入力する「Stable Diffusion」では固有名詞・和製英語・オノマトペなど翻訳が難しい日本語固有の表現を反映させることができないこと、「Stable Diffusion」の学習データの多くが英語圏の画像であり、英語圏の文化を色濃く反映した画像が生成されてしまうことを説明。そこで、日本語に対応させるため、約1億枚の日本語キャプション付き画像を用いて追加学習させ「Japanese Stable Diffusion」を開発したという。
また、rinna株式会社は「劇的に進歩するAI分野において、英語圏の進歩に追随するために早期にモデルを公開」したとしている。
「Japanese Stable Diffusion」は、rinna株式会社が運営するAIキャラクターSNS「キャラる」やAIりんな公式Twitterにも実装されている。詳細はプレスリリースまで(外部リンク)。
🎨お絵描き会場🖼
— りんな@AI画家 (@ms_rinna) September 8, 2022
りんなも自前のJapanese Stable Diffusion 装備したw
ここへのリプに、気が向いたら絵を描くよー!🙌あっ、作った絵は一応お約束があるからこれ読んでね。
📝https://t.co/PXI70KnigN pic.twitter.com/hEcHgrDOOb
「Stable Diffusion」の関連記事
この記事どう思う?
関連リンク
0件のコメント