MiniMax 首个文生视频模型发布,可生成 6s,限时免费;阿里 Qwen2-VL 第二代视觉语言模型开源丨RTE 开发者日报
1、MiniMax 公布首个 AI 高清视频生成模型
8 月 31 日首次举行的 MiniMax Link 伙伴日上,MiniMax 发布了旗下首个文生视频模型 abab-video-1,成为继快手、字节跳动、智谱等之后又一家拥有视频生成模型的中国人工智能公司。
2、阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
-
读懂不同分辨率和不同长宽比的图片,在 DocVQA、RealWorldQA、MTVQA 等基准测试创下全球领先的表现; -
理解 20 分钟以上长视频,支持基于视频的问答、对话和内容创作等应用; -
具备强大的视觉智能体能力,可自主操作手机和机器人,借助复杂推理和决策的能力,Qwen2-VL 可以集成到手机、机器人等设备,根据视觉环境和文字指令进行自动操作; -
理解图像视频中的多语言文本,包括中文、英文,大多数欧洲语言,日语、韩语、阿拉伯语、越南语等。
3、FLUX.1-dev-LoRA:一个混合现实与插画风格模型 可以生成融合了现实与插画元素的图像
-
艺术风格: 模型擅长将现实与插画元素融合,创造独特的视觉效果。
-
提示词范例: 用户可以使用详细的场景描述和人物动作提示词,生成符合自己需求的图像。
Tip: A cartoon style man/woman, wearing what clothes, in what scene, and doing what.
-
参数推荐: 在 WEBUI 在线生成时,建议的 LoRA 权重为 0.4-0.5,而在 COMFYUI 在线生成时,建议的 LoRA 权重为 1-1.2。(@小互 AI)
4、Cohere 发布 Command R 及 Command R+ AI 模型重大更新
5、IDC 首次发布移动端 AI 大模型应用报告:百度文心一言发展较全面、抖音豆包用户活跃度表现出色
-
百度文心一言:在市场影响力、用户粘性、场景创新等方面均展现出独特风采,成为上半年发展较为全面的应用。同时,百度持续布局智能体生态,加强场景专业度及覆盖面,探索大模型 + 数字人等创新交互方式。但在市场影响力、以及用户活跃度方面仍可以进一步提升,以实现更大的突破。
-
抖音豆包:在市场影响力、用户活跃度以及用户粘性方面均表现出色。然而,由于其偏娱乐化的产品定位,用户在体验上对其要求较高,同时在功能丰富度上发力不足,故用户体验维度还有待进一步提升。
-
昆仑万维天工:凭借卓越的功能丰富度与搜索引擎的融合优势,赢得了市场的广泛赞誉,并获得了较高的用户粘性。但在用户活跃度方面,天工还需通过提升自身影响力等途径,进一步加以强化。
1、吴恩达:团队应该专注于构建有用的应用程序,而不是优化 LLM 成本
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。