Two important breakthroughs from @GoogleAI this week – Imagen Video, a new text-conditioned video diffusion model that generates 1280×768 24fps HD video. And Phenaki, a model which generates long coherent videos for a sequence of text prompts. https://t.co/nTs67r21Sf pic.twitter.com/sOf5clkB3V
— Sundar Pichai (@sundarpichai) October 6, 2022
GoogleAIから2つの重要なブレークスルーがありました。
今週は、1280×768 24fps HDビデオを生成する新しいテキスト条件付きビデオ拡散モデル「Imagen Video」です。そして、一連のテキストプロンプトに対して、長いコヒーレントビデオを生成するモデル「Phenaki」。
googleのCEO「サンダー・ピチャイ」氏のtweetによると「Phenaki」というシステムも発表しています。組み合わせることで幅が広がりそうです。
We showcase unique capabilities of Imagen Video, such as generating videos in different artistic styles, 3D understanding, and text rendering and animation. Check out the paper for more details: https://t.co/w9cuE3jQje pic.twitter.com/cXfkPst156
— Jonathan Ho (@hojonathanho) October 5, 2022
様々な芸術的スタイルでのビデオ生成、3D理解、テキストレンダリングとアニメーションなど、Imagen Videoのユニークな機能を紹介します。詳しくは論文をご覧ください: https://imagen.research.google/video/paper.pdf
「A teddy bear washing dishes」で作成されたサンプルとのことです。スゴイ時代になりました。
あまり進化し続けると恐ろしくも感じますが、現時点では職業を奪われるレベルにいたっていないようです。
スレッド内で出てくるディープラーニング計のAI絵師の仕事は中々、高度なものに見えますが?






↑より引用
Stable Diffusion(ステーブル・ディフュージョン)は、2022年8月に無償公開された描画AIである[1]。ユーザがテキストでキーワードを指定することで、それに応じて画像が自動生成される仕組みとなっている[2]。その画風はフォトリアルなものから肉筆的なタッチのものまで幅広く対応している[1]。
GM dear humans ???#AIart #aiartcommunity #aiartist #stabledifussion #dalle pic.twitter.com/4QtJ3AEMRu
— lilyillo (@lilyillo) October 5, 2022
#AI画像 #AIイラスト #stabledifussion #WaifuDiffusion #trinart
ダンジョンに隠された街 pic.twitter.com/jcvlWuWUXo— 404 notfound (@404notf26312237) October 6, 2022
エルフの修道女さん。耳隠れててもなんとなくエルフ耳ってわかるあたり、結構凄いと思う(笑)#AI画像 #AIイラスト #stabledifussion #WaifuDiffusion #trinart pic.twitter.com/gXcKWub2Ag
— 404 notfound (@404notf26312237) October 8, 2022



コメント一覧