AI 界又现变态神器,照片唱歌说话不是梦

各位朋友,今天要给大家介绍一个超级炸裂的东西,它就是一个叫 EMO的 AI!

这个 AI 太厉害了,它竟然可以让任何一张照片唱歌和说话!让人觉得夸张的是,经过 AI 处理后的人物在唱歌时,那些表情和动作甚至能让我们感受到一丝情感的流露,这些只有人类才能做到的细微自然反应,AI 居然都能完美还原出来!AI 界又现变态神器,照片唱歌说话不是梦

要注意哦,这仅仅是通过给人工智能一张照片和一段音频就得到的结果,所有的面部表情和姿势全都是 AI 自动生成的。

这是阿里刚刚发布的一个全新 AI 项目,它通过特别的注意力机制,确保视频中的人物表情动作和原始照片保持一致,再与音频同步,最终产生自然的动态表情。

看完这个项目,我真的特别兴奋,我觉得以后一张照片就能演戏的时代终于要来了!这个 AI 支持各种语言的歌曲,不同的肖像风格都能被它带入生活,它能直观地识别音频中的信息。

比如由 dreamshaperXL 生成的 AI 蒙娜丽莎,声音来源是 Mley Cyrus 的《Flowers》;还有由 ChillounMix 生成的 AI Girl,声音来源是陶喆的《Melody》。还有在 SORA 中的 AILady,声音来源是 Due Lipa 的《Don't Start》,不同的语言和肖像风格它都能完美应对,能识别音频中的音调变化,从而生成动态且表情丰富的化身。

甚至连奥黛丽·凯瑟琳·赫本也能通过 AI 唱歌,真的太神奇了!还有让 SORA 中的女生说话等等,真的太不可思议了!

版权声明:Midlight 发表于 2024-05-29 21:33:37。
转载请注明:AI 界又现变态神器,照片唱歌说话不是梦 | 程序员导航网

暂无评论

暂无评论...