日前,阿里云方面宣布自研AI肖像视频生成框架“EMO”(Emote Portrait Alive)已接入通义App,并向所有用户免费开放。 据了解,EMO框架可以用于生成“对口型”视频,用户只需输入人物照片及音频(说话、唱歌、rap均可),就能够让照片中的人物开口说出相关音频,并支持中英韩等多种语言。而生成视频的最终长度,则取决于输入音频的长度。 据悉,EMO基于英伟达的Audio2Video扩散模型打造,使用了超过250个小时的专业视频和超过1.5亿张图像进行训练,...
AI云服务器
-
2024.05.09 | 小编:小惠 | 449次围观
-
2023.08.21 | 小编:阿里云服务器 | 1405次围观
-
2023.08.17 | 小编:阿里云服务器 | 1527次围观
-
2023.08.15 | 小编:阿里云服务器 | 1748次围观