こんにちは、量子コンピュータをやっているblueqatです。今日は画像生成AIについての取り組みを紹介します。
なぜ量子コンピュータの企業として画像生成AIをやっているのかというと、
1、なんか理論的に近い
2、量子コンピュータシミュレータでGPUをたくさん使っててたくさんある
3、その他もなんか理論に近い
4、マネタイズが難しいのでチャンスがある
です。まず理論的にみていきましょう。画像生成AIは拡散モデルと呼ばれるモデルを利用しています。こちらはノイズから画像を作りますが、出てくる用語が量子とあまり変わりません。また、拡散モデルを拡張した一貫性モデルなんかは機械学習の人より量子よりなのでは?というくらい量子です。
(潜在)一貫性モデル/ (Latent) Consistency Models
https://blueqat.com/yuichiro_minato2/1d45d44f-81fe-420f-b4af-bb5878e0ee8b
GPUをたくさん持っています。画像生成AIについてはGPUのパフォーマンスは結構影響します。VRAMとGPU計算速度の両方を満たすマシンをたくさん持っているために実験がしやすいです。
[勉強会資料] ローカル画像生成AI入門
https://blueqat.com/yuichiro_minato2/b6b31fc1-7d82-476a-8aa4-bd4108cbf3d9
また、LCMのようなモデルそのものについての理論以外に、拡張をするLoRAについてもほぼテンソルネットワークという技術に近いです。
[論文解説]LoRA:大規模言語モデルにおける低ランクアダプター
https://blueqat.com/yuichiro_minato2/d2a03601-2f3e-4535-980d-33c79add516c
また、マネタイズが難しい領域なので、他社もあんまりやらないでみんなLLMやるだろうと思っているので、積極的にビジネスの難しいところをやっていきます!
最近では自社の画像生成AIをリリースしています。ログインしてサイドバーから画像生成を押してもらえると作れます。マシンがそんなに用意してないので重たいとエラーになるかもですが、モデルとサービスを改造していこうと思います。
今後のマネタイズは、画像生成AIを利用した美顔アプリを考えています。生成AIを利用したメイクアップについてもチャレンジをしていて、リアルなメイクを生成AIを通じて今後は美顔アプリなどに使っていければいいなと思っています。
生成AIを使ったメイクアップ
https://blueqat.com/yuichiro_minato2/c14504c1-fd94-42f6-b507-036e655f9fb4
また、LoRAについてもなかなか簡単には使えないということで、マネージドのサービスを準備しています。自分の画像を使ってベースモデルを学習させたい人向けに月額1000円で弊社の完全マネージドのLoRAシステムを提供予定です。
画像生成AIはあまりマネタイズや利用用途について難しいところがありますが、マルチモーダルを含めて全体のAIとして取り掛かっていきたいと思います。以上です。