各位朋友,今天要给大家介绍一个超级炸裂的东西,它就是一个叫 EMO的 AI!
这个 AI 太厉害了,它竟然可以让任何一张照片唱歌和说话!让人觉得夸张的是,经过 AI 处理后的人物在唱歌时,那些表情和动作甚至能让我们感受到一丝情感的流露,这些只有人类才能做到的细微自然反应,AI 居然都能完美还原出来!
要注意哦,这仅仅是通过给人工智能一张照片和一段音频就得到的结果,所有的面部表情和姿势全都是 AI 自动生成的。
这是阿里刚刚发布的一个全新 AI 项目,它通过特别的注意力机制,确保视频中的人物表情动作和原始照片保持一致,再与音频同步,最终产生自然的动态表情。
看完这个项目,我真的特别兴奋,我觉得以后一张照片就能演戏的时代终于要来了!这个 AI 支持各种语言的歌曲,不同的肖像风格都能被它带入生活,它能直观地识别音频中的信息。
比如由 dreamshaperXL 生成的 AI 蒙娜丽莎,声音来源是 Mley Cyrus 的《Flowers》;还有由 ChillounMix 生成的 AI Girl,声音来源是陶喆的《Melody》。还有在 SORA 中的 AILady,声音来源是 Due Lipa 的《Don't Start》,不同的语言和肖像风格它都能完美应对,能识别音频中的音调变化,从而生成动态且表情丰富的化身。
甚至连奥黛丽·凯瑟琳·赫本也能通过 AI 唱歌,真的太神奇了!还有让 SORA 中的女生说话等等,真的太不可思议了!
暂无评论...