Drift 字节的这个音频驱动的交互式头像视频生成框架有点酷:INFP,给它一段双人对话音频和人物头像,它可以生成双人交互视频,面部表情、头部动作、唇形一致性保持的非常好 可以根据音频自动切换角色,不需要手动指定角色,面部表情和头部动作比较自然 轻量级,运行速度比较快,40+ FPS,可以实时生成 支持多语言和唱歌,支持侧面和非人类图像 可以用于即时通讯比如视频会议、虚拟主播等等 项目:https://grisoon.github.io/INFP/