在 KDD 国际数据挖掘与知识发现大会上,智谱正式发布了新一代基座大模型 GLM-4-Plus。与 GLM-4-Plus 同步上线的,还有国内首个面向 C 端开放的「视频通话」功能,这是国内首个面向 C 端用户开放的视频通话服务。
清言视频通话功能跨越了文本、音频和视频模态,并具备实时推理能力。用户在拨打清言的视频通话时,可以体验到流畅的互动,即使频繁打断,它也能迅速响应。清言不仅能够理解摄像头拍摄到的画面,还能听懂并准确执行用户的指令,带来如同真人视频通话般的体验。随着视频通话功能的加入,清言 app 成为首个可以通过文本、音频、视频和图像来进行多模态互动的 AI 助手。
未来世纪的皮克斯不会通过传统的电影或动画产生,而是通过交互视频。这种新的叙事形式将模糊电子游戏和电视 / 电影之间的界限,将深刻的叙事与观众的参与性和 「玩」 性结合起来,开辟出一个庞大的新市场。随着消费者对互动媒体的偏好增加,以生成式 AI 的发展,游戏已经成为现代叙事的前沿。
交互式视频通过将故事讲述与玩耍结合起来,提供了一个新的媒介格式。与传统的视频游戏不同,交互式视频完全由神经网络实时生成帧。这种格式结合了电视 / 电影的可访问性和叙事深度,以及视频游戏的动态系统和观众参与性。尽管以往的尝试,如 Telltale 的《奔逃僵尸》和 Netflix 的《Bandersnatch》,因为制作成本和时间的限制而面临挑战,但生成式 AI 模型的进步可能是实现交互式视频的关键。
近年来,模型蒸馏、图像生成和视频生成技术的显著进步,已经使得实时生成高质量视频成为可能。研究人员和公司正在探索新的交互式视频体验,并开发出能够生成完整 3D 可玩世界的基础模型。预计,随着技术的不断进步,完全可生成的交互式视频可能在未来两年内实现商业化。
未来的交互式皮克斯将需要是一个世界级的互动叙事工作室和顶尖的技术公司,能够将叙事和游戏设计与技术创新相结合。这样的团队将需要找到新的方法,让人类叙事者与 AI 工具协同工作,同时解决法律和伦理上的挑战。长远来看,生成式 AI 可以创造不仅仅是互动故事,而是整个虚拟世界。(@雷锋网) 写在最后: 我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。 对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。