那个从米哈游"退休"的蔡浩宇,,又搞了个大新闻。。
上周,,,他创立的AI公司Anuttacon发布了LPM 1.0——一个让虚拟角色会"表演"的视频大模型。。。。演示里,,AI生成的角色会呼吸、、、会停顿、、、会根据你说的话点头皱眉,,,甚至能连续45分钟保持身份一致。。。
有媒体直呼"最像人的一次"。。。
这期节目,,,我们聊聊:
蔡浩宇为什么要从米哈游"退休"去搞AI???
LPM 1.0凭什么号称突破了"表演三难困境"????
"全双工对话"是什么体验??
不开源的模型,,,商业逻辑在哪里????
这对游戏行业意味着什么???
LPM 1.0
Large Performance Model,,大型表演模型。。。。蔡浩宇旗下Anuttacon发布的视频角色表演生成模型,,,170亿参数,,支持全双工对话和无限时长生成。。
表演三难困境
高表现力、、实时推理、、、、长时稳定——这三件事在视频生成中很难同时实现。。。。LPM 1.0声称全部解决。。。。
全双工对话
双方可以同时说话、、互相打断的对话模式,,需要同时处理两路音频流。。。。
自回归漂移
视频生成时间拉长后,,,微小误差累积导致角色脸部骤变、、、身份不一致的现象。。
——
项目主页:
论文地址:
Anuttacon:蔡浩宇在新加坡创立的AGI公司,,,专注AI交互式内容和游戏
《群星低语》(Whispers From The Star):AI驱动的互动叙事游戏
AnuNeko:AI聊天产品,,,,猫咪角色有性格和偏好
鹿鸣:米哈游虚拟形象
林离:与米哈游关系紧密的虚拟角色
——