AI 界又现变态神器，照片唱歌说话不是梦

文章 9个月前 Midlight

54 0 0

各位朋友，今天要给大家介绍一个超级炸裂的东西，它就是一个叫 EMO的 AI！

EMO

阿里巴巴EMO（Emote Portrait Alive）框架，让图片动起来

这个 AI 太厉害了，它竟然可以让任何一张照片唱歌和说话！让人觉得夸张的是，经过 AI 处理后的人物在唱歌时，那些表情和动作甚至能让我们感受到一丝情感的流露，这些只有人类才能做到的细微自然反应，AI 居然都能完美还原出来！

要注意哦，这仅仅是通过给人工智能一张照片和一段音频就得到的结果，所有的面部表情和姿势全都是 AI 自动生成的。

这是阿里刚刚发布的一个全新 AI 项目，它通过特别的注意力机制，确保视频中的人物表情动作和原始照片保持一致，再与音频同步，最终产生自然的动态表情。

看完这个项目，我真的特别兴奋，我觉得以后一张照片就能演戏的时代终于要来了！这个 AI 支持各种语言的歌曲，不同的肖像风格都能被它带入生活，它能直观地识别音频中的信息。

比如由 dreamshaperXL 生成的 AI 蒙娜丽莎，声音来源是 Mley Cyrus 的《Flowers》；还有由 ChillounMix 生成的 AI Girl，声音来源是陶喆的《Melody》。还有在 SORA 中的 AILady，声音来源是 Due Lipa 的《Don't Start》，不同的语言和肖像风格它都能完美应对，能识别音频中的音调变化，从而生成动态且表情丰富的化身。