Looki 孙洋首次深度创业复盘:主动式 AI 的下一步是预测,整个世界都将是 AI 的 Prompt

长期关注 RTE 社区的朋友们或许注意到了,最近除了 Voice Agent,Visual Agent 和 Physical AI 也正高频出现在我们的讨论中。


今天为大家分享的这期播客里,Looki 创始人孙洋提到了一个很有洞察的观点:今年初能看到两条明显的模型路线分化——一条卷 Coding,另一条则走向原生的全模态。


孙洋说:「对于 Looki 来说,我们一直沿着多模态这条线走,随着模型能力越来越强、推理能力越来越好、成本越来越低,我们能吃到的红利会持续增加。」


当我们把全模态 Agent、Physical AI(比如穿戴式或桌面级硬件),甚至最近大火的 OpenClaw 连起来看,会发现它们其实都在指向同一个方向:一种更符合人类本能的、高度个体化的智能。这也让我们确信,多模态的交汇必将碰撞出更多普世化的融合场景。


顺便预告一个「彩蛋」:本期播客的主持人、Looki 的天使投资人、同歌创投执行董事李欣航Kara,恰好也是我们即将在硅谷举办的 Physical AI Meetup 的分享嘉宾! Kara 长期深耕 AI 硬件的早期投资,如果你在湾区,欢迎点击下方链接报名,来线下和 Kara 一起深聊:


Physical AI 系列活动硅谷站!探讨和上手全模态与硬件智能丨Meetup+Workshop,3月19日



本文转载自公众号 Day Zero

图片


主动式 AI|AI native硬件|Open Claw|推荐引擎→生成引擎


本期节目我们邀请到了Looki 创始人孙洋,和小宇宙超过12万粉丝的《中国好生意》主理人树杨,一起深度复盘AI原生硬件创业的第一线故事。


如果你正在做 AI 相关的产品、创业、或者正在思考 AI 时代的产品机会,这期值得反复听。我们会聊:


  • Looki从产品构思到量产发售的完整创业复盘

  • OpenClaw到底改变了什么,为什么孙洋认为OpenClaw 是一种思想而不只是一个工具

  • 在 Agent 越来越多的世界里,下一代应用和硬件的机会到底在哪

  • 信息流如何从推荐引擎走向生成引擎

  • 当"整个世界都变成 AI prompt",人和 Agent 的关系会发生什么根本变化

飞书文档 - 图片
飞书文档 - 图片

孙洋在 2024 年 5 月和 6 月 Looki 内部会议画的白板图,Looki 团队在近两年前 Agent 概念还未成熟时就确定了AI agentAI companion等核心方向,真的很有前瞻性和技术视野!


Looki团队在大力招聘!可以发送邮箱:

recruitment@looki.ai 或 hr@looki.ai 也可以上小红书关注 Looki


感谢树杨,中国好生意对本节目的大力支持!


也欢迎大家来小宇宙收听完整版。本期节目有视频版本,会在后续多平台放出,点点关注不迷路!

飞书文档 - 图片


欢迎加入Day Zero听友群,一起探讨科技趋势和用户洞察,扫码或添加13621745991。不定期组织线下聚会喔~


飞书文档 - 图片


嘉宾介绍:


孙洋

Looki 创始人兼 CEO,前 Google Assistant 工程师,曾就职于 AmazonMomenta、美团

树杨
WAKUART 创始人,「中国好生意」主播

李欣航Kara
Day Zero 主理人以前在游戏公司,现担任同歌创投执行董事,聚焦早期投资,寻找能改变世界的游戏、应用和智能硬件创造者!是Looki天使投资人,曾投资华策影视、WaveOptics等项目

Day Zero制作人介绍:


张新阳Francis
99年/滑铁卢+哥伦比亚大学/前纽约创业者/AI Native Developer/重度游戏玩家,现就职于同歌创投,聚焦早期to c投资


一、从天津少年到硅谷工程师:一段"不走寻常路"的成长


树杨:你是哪里人?从小到大的学习经历是怎样的?


孙洋:我是天津人,从小读小学、中学都在天津。高中之后去了海外读书,本科在多伦多大学,研究生在卡内基梅隆(CMU)读计算机。毕业后在湾区的 Google 工作了大概三年多,2018 年从硅谷回到国内。


说起来读书经历还挺奇葩的——我没参加过小升初、中考、高考。当时在天津外国语学校考了一个偏奥数风格的小卷,全年级 2000 人里考了第 50 名,男生里第 16 名,大家对我预期很高。但上了初一之后,成绩一落千丈,因为我实在不是那种喜欢死记硬背的孩子,英语、语文这类学科特别弱,数学还不错。那三年没少被父母"教育"一番。到了高中才开始开窍,逐渐追上来。


树杨:你从小就喜欢计算机吗?


孙洋:从小就喜欢。那时候家里条件不太好,在 90 年代,父母买了一些原始股,上市后卖掉挣了一两万,那个年代一两万还是很多钱,他们就全部给我买了台电脑——奔腾 233Windows 95。从那时候起就开启了我的计算机世界。


最开始是玩游戏,但很快就对玩游戏没兴趣了,转而对破解游戏产生了极大热情。那时候有光盘和刻录机,研究各种算法去绕过版权保护。上大一那年,为了玩到仙剑奇侠传,在海外买不到,前前后后捣鼓了三五天才搞定,把室友羡慕坏了。那种成就感,才是我真正的驱动力。


Kara:当时为什么没有想过进入游戏行业?


孙洋:我对"玩"游戏本身并不上瘾,我喜欢的是"破解"这件事背后的技术成就感,两者完全不同。CS(反恐精英)我玩了一会儿直接就晕了,所以游戏行业对我没什么吸引力。



二、Looki 的起点:那个被忽视的"物理世界"缺口


树杨:是什么样的起心动念,让你决定创立 Looki?


孙洋:创业的心从上学时候就有,但我给自己设了规划——至少要在硅谷真正理解"创新是什么",在大厂和小厂、国内国外都待一段时间,看明白运转逻辑。


真正的契机出现在 2022 年底。GPT-3.5出来之后,我看到了一个巨大的范式变革。我之前在 Google 做 Google Assistant,做的就是NLP相关,而那一波 AI 出来之后,NLP 这个概念几乎消失了。


更关键的触发点是:2023 年GPT刚出来时,我有机会为美团 lead 一个团队,做外卖场景的 AI Agent。做完之后发现了一个巨大的 gap——模型非常聪明,但它不理解物理世界里的东西。


用户问"推荐我吃什么",AI 没有视觉、没有声音、没有任何感知能力,只能从历史订单数据里抓 context。一个刚从健身房出来的用户,理论上应该推荐健身餐,但 AI 根本"看"不到这一切。这个 gap,给了我一个非常大的 trigger


树杨:当时就意识到物理世界的信息是 AI 能处理但还未被利用的?


孙洋:对。而且这跟我的职业经历有一种冥冥之中的呼应。我读书读的是纯软件,但工作一路都在被"push"去做软硬结合:在 Amazon 做仓储物流系统,赶上了 Kiva 机器人收购;在 Google 做 Google Assistant 和 Google Home 集成;回国后在 Momenta 做自动驾驶的后装 AI 硬件。所以很自然地,我意识到了这个结合点。


Kara:24 年多模态基座模型还在很早期,你当时怎么就有这个勇气决定创业?


孙洋:还是一些技术手感吧。我知道那个时候大家做的其实是"假多模态"——语言模型和视觉模型在第三个域做 projection 对齐,不是原生统一的架构。直到 Gemini 2.0 之后,才开始有原生多模态、统一 tokenizer 的方案。


但从立项到产品到用户手里,硬件有一年的周期。你必须提前把技术 sense、商业 sense、产品 sense 全部串起来,找到那个交叉点,提前押注。这是有一些笃定在里面的。



三、从账上只剩几万块,到"人生回看器"走红


树杨:早期融资是怎么过来的?2024 年资本寒冬,你们怎么活下来的?


孙洋:真的很难。2024 年那个市场,资本非常保守,不管美元基金还是人民币基金,大家都在求稳。我们又是在做极具创新但风险极高的事情。


投资人的核心质疑是:你的市场用户 GTM 在哪?那时候大家根本不理解 AI 硬件在整个 AI 赛道的意义,认为你就是在做一个消费电子硬件卖货生意。你跟他讲 AI 怎么在里面扮演角色,他根本不想听。


我们团队还给我摆了一个小摆件——一个拍一下就会说话的宠物玩具,录着"不要 toVC,不要 toVC",放在我桌子上。融资最难的时候,我就拍一下,告诉自己别为了融资去妥协产品方向。


,时长00:05


甚至有机构当场跟我说:"你今天做眼镜,我今天就发TS。"我最终抵抗住了诱惑。Looki 在第一年其实现金流差点断掉两次。最惨的时候,账上只剩几万块钱——工资都快发不出来,辗转腾挪才撑过去。


树杨:作为第一轮投资人,Kara当时你们为什么会投?


Kara:我们从 2024 年上半年开始关注 AI 与不同形态硬件的结合,包括眼镜、耳机、手表、手环、智能戒指,当时也已经有北美初创公司在做吊坠形态,但更多是基于音频模态。孙洋是我们在全球聊了几十位 AI 硬件创始人之后,唯一一个讲出与所有人认知都非常不同观点的创始人。做 ToC 硬件,核心壁垒在于创始人的认知,因为这决定了他能在多长时间范围内持续做出领先的事情。


树杨:早期团队是怎么搭建的?


孙洋:这是从 2018 年回国后慢慢积累的信任资产。在摩拜、Momenta、美团的六七年里,我招了很多同学,大家有非常深的相互了解。出来创业时,他们选择跟我一起走,最初七八个人,都是共事过很长时间、信任度极高的伙伴。


早期没有太多市场的人,核心是搭产品。大家志同道合,都是多面手,伴随着公司一起成长。



四、产品定义:第一性原理推导出"拇指相机"形态


树杨:你们是怎么定义出 Looki 这个形态的?


孙洋:从第一性原理往下推:


首先,要在正面——侧面的视角跟人的视角偏差太大;其次,要在胸部以上——胸部以下不行。这就圈定了一个大致的范围。


然后我们看,在这个区域里,过百万销量的硬件 form factor 有哪些——影石的拇指相机、眼镜、耳机。眼镜和耳机是成立的形态,但承载不了我们想做的"持续 always-on 感知"功能:眼镜要么太重,要么续航太短,用户没法长时间佩戴。最终我们看到了拇指相机的形态,最灵活,也更"无感",就往这个方向做了。


外观设计上,我们刻意做了一个选择:第一代产品不追求隐形,要让大家一眼看出来——这是一个阳光的、可穿戴的 AI 配饰,而不是一个偷拍设备。这也在量产上带来了很大难度。


树杨:量产过程怎么解决的?供应链最难的地方在哪?


孙洋:歌尔给了我们非常大的支持。这个产品的外形独特,硬件堆叠空间极其有限,防水工艺、各种模块都是挑战。我们在资金不充裕的情况下,在其他地方到处省钱,但在产品的BOM开模和项目节奏上没有省一分。这个冒险的决策,也是导致我们第二次现金流危机的原因——但最终歌尔和我们一起扛住了,"做难而正确的事"这种价值观,我们是一致的。


很多用户拿到第一代产品后都很惊讶:这是你们的第一代产品?做得这么精细成熟?这背后有歌尔非常大的助力。



五、隐私争议:每一次技术变革,都会经历这场讨论


树杨:隐私是 Looki 被争议最多的地方,你怎么看?


孙洋:隐私可以拆成两部分讲。


第一部分:数据安全。这个行业已经有成熟解决方案——数据加密、云存储合规、SOC2 认证。海外数据留海外,国内数据在国内,模型也用当地的,这方面我们非常合规,不需要担心。


第二部分:佩戴场景的"被拍"感。这本质上是用户自己来控制的——Looki 有物理开关,随时可以摘下放进口袋。而且软件层面,所有拍摄内容默认存在本地硬件里,只有用户在 APP 里主动点击"上传并分析",才会上云,上传前还可以再次筛选删除。


有意思的是,我们观察到:几乎所有关于隐私的质疑声音,都来自还没有买产品的人。真正买了 Looki 的用户很少在群里质疑隐私,反而带着产品出门,被路人好奇追问,成为了最好的自来水推广者。我们调研发现,有 20%~30% 的新用户是被朋友推荐购买的。


Kara:其实手机第一次加摄像头、GPS 定位、人脸识别,当年都有巨大争议,但今天我们都已经完全接受了,甚至忘记了当年的争论有多激烈。AI 硬件的隐私讨论也会随着时间的推移,随着大家体验到真实价值,慢慢被接受。当 benefit 大于 cost,用户自然愿意接受。


孙洋:说得对。Google Glass 当年被隐私问题喷得很惨,但今天MetaRay-Ban 已经卖了几百万副还在持续出货。10 年间,社会对可穿戴摄像头的接受度已经发生了根本性的变化——一方面是摄像头在社会中的渗透率显著提升,另一方面是抖音、TikTok 让大家习惯了日常生活化的拍摄记录方式。



六、产品三阶段:从"人生回看器"到"主动式AI"再到"预测未来"


Kara:有第三方媒体把 Looki L1 叫做"人生回看器",你认可这个定义吗?


孙洋:在目前这个阶段是符合的,但这个名字不是我们起的,是媒体用户自己叫出来的。在我看来,Looki 第一代产品会经历三个阶段:


第一阶段(过去时):记录回忆,回看过去,基于这些内容生成漫画、vlog,这就是现在大家体验到的"人生回看器"。


第二阶段(当下时):主动式 AI(Proactive AI)+ 长时运行 AgentAI 实时感知当下发生的事情,主动给用户反馈。举个例子:你设定了"每天最多喝一杯咖啡",当 Looki 发现你拿起第二杯咖啡,就会实时提醒你。或者当 AI 看到某个场景,自动给你关联推送一个相关的有趣知识点。这个功能很快就会上线。


第三阶段(未来时):基于过去的记录和对当下的理解,做Prediction(预测)。结合各类信息流,AI 能够前置地帮你做出判断和准备。


孙洋:我觉得大家都在讲"主动式 AI",已经快讲烂了。我们不想过度渲染,直接把产品给到用户,让大家自己去玩。



七、商业模式与壁垒:从卖货到信息流重构


Kara:商业模式上你怎么思考?


孙洋:会经历三个阶段。现在毫无疑问靠卖硬件,这是传统方式。接下来会有订阅,可能先从海外开始。最终我们想做的是重构信息流。


信息流经历了几个时代:门户网站(我有什么信息就 po 上去)→搜索引擎(聚合信息,用户主动搜)→ 推荐引擎(根据用户行为做个性化推送,抖音、TikTok 就是这个时代的代表)。


我们认为下一个时代是生成式引擎。推荐引擎依赖低维特征(停留时长、点击),生成式引擎需要高维理解。而高维理解的前提是感知——Looki 就是在解决这个感知问题。


举个例子:你和朋友去了一家餐厅,AI 知道你们是朋友、今天是元宵节、你第一次来这家店、你的口味偏好……它不是基于规则推荐一个套餐,而是为你千人千面地生成一个专属内容或优惠。这就是从推荐逻辑跳跃到生成逻辑的质变。


孙洋:ToC的那个位置是独占的——你脖子这里的位置只有一个,不会同时戴两款类似的产品。而且视觉信号和声音信号是通用的,这就是一个通用入口。只要是通用入口,就没有理由做垂直细分,你占领了这个入口,壁垒就会随着时间自然积累。



八、AI 生态展望:模型分化、Agent 哲学与海啸将至


树杨:2 月份一波模型集中发布,你怎么看现在的模型趋势?


孙洋:模型开始明显分化了,路线清晰了:


一条是Coding 方向——Coding 能力决定了模型的智能天花板,这已经被验证;而且 Coding 的商业化路径是最清晰的,所以大量公司在做,这很合理。


另一条是原生多模态方向——Google Gemini、Qwen,以及据说将发布的 DeepSeek v4,都走向统一架构、原生多模态。


对于 Looki 来说,我们一直沿着多模态这条线走,随着模型能力越来越强、推理能力越来越好、成本越来越低,我们能吃到的红利会持续增加。


Kara:关于 OpenClaw(Claude Computer Use)和 Vibe Coding 你怎么看?


孙洋:OpenClaw 刚出来我就部署完玩了一遍,对我来说其实没有太多新鲜感,因为里面用的模块某种程度上都早已存在,只是被非常好地粘合在一起,加了一个双循环机制。


但 OpenClaw 最核心的意义在于打通了私有数据(Private Data)。我在给 Kara 的那张 slide 里其实还有一条数据线的发展趋势:22-23 年是Training Data23-24 年是 Public DataPerplexity那个时代);24-25 年就应该是 Private Data 进来了。OpenClaw 本质上就是把你电脑里所有的私人数据结合起来,让 AI 真正做到"千人千面"。


孙洋:更重要的是,OpenClaw 代表的是一种思想和技术框架:搭了一个场,让 AI 能够在里面自由发挥。这和移动互联网时代的产品逻辑完全不同——以前做产品经理要写PRD,针对某个垂类集中开发功能;但今天你给 AI 搭的是一个场,它表演什么节目是它自己的事。Looki 也是同样的逻辑。


孙洋:还有一个范式变化很多人没意识到:以前搭一个场是为了,看 DAU、MAU这些指标;今天搭一个场其实是给AI / Agent的,让它在里面发挥价值。至于产生什么功能,是 Agent 自己来决定的。


Kara:长周期来看,你怎么看人和 Agent 的交互,以及 Agent 和 Agent 的交互?


所以 Looki 尽力避免让用户去写 Prompt,门槛太高了。整个世界都是 AI 的 Prompt——你经历了什么、看到了什么、听到了什么,都自动成为输入,AI 基于这些做出反应,你只需要点赞或点踩来校准。这是一个不断对齐的过程。



九、关于未来:AGI 已无限接近,AI 海啸将至


Kara:站在 2026 年初,你对未来三到五年人和 AI 的关系,有哪些非共识的预测?


孙洋:社会接受度上,大家会越来越把 AI 当成一种新型生物来看待,而不仅仅是聊天工具。正如 Sam Altman 说的,人类会出现"第三设备"——除了电脑和手机之外的第三个终端。


关于 AGI:在我看来,今天已经无限接近 AGI 了。很多人觉得体验不好,其实是因为没有给 AI 足够的 context,或者没有合理使用。


但我最近也有一种矛盾感——我们上周刚决定,不再招初级工程师了,因为 AI 已经可以完全替代。这件事在硅谷已经非常激进地发生,Twitter 裁了 40%Block 也裁了 40%,而且是全岗位裁员,不只是代码岗。


再过两三年,可能 senior 工程师也不再需要了,设计、市场各类岗位也是如此。我每天看到 AI 进步,一边兴奋,一边在想:今天的应届毕业生怎么办?未来十年他们长大后,整个职业市场会是什么样子?


Dario Amodei(Anthropic CEO)说过一句话让我很有感触:AI 是一场海啸,但人类还没有意识到。各行各业都会发生巨变。海啸过后,社会会重建成什么样子?我今天没有答案。但我能感受到这个趋势,可能再有两三年,大家的体感就会越来越强烈。


树杨:这两年创业,你个人最大的成长是什么?


孙洋:最大的成长是视角变了。以前在创业公司待着,总觉得这里不合理、那里不对,各种不满。真正操盘之后才发现——那些"不合理",原来都是有道理的,因为你掌握的是全盘信息,而不是某一个模块的局部视角。


孤独是肯定有的。每个创业公司的 CEO 都孤独,有太多决策旁人不理解,有太多事情不能对外说。孤独的时候就跟 AI 聊聊吧——我觉得这不是玩笑话,是认真的。


但不管 Looki 最终成与败,创业这个过程本身就很值得。你在今天科技世界发展的最前沿,带着一个团队在摸索,在牌桌上参与这场游戏,这已经是人生中非常享受的事了。


求点赞,收藏,转发!

图片


阅读更多 Voice Agent 学习笔记:了解最懂 AI 语音的头脑都在思考什么

图片

注册登录 后评论
    // 作者
    R
    @RTE_Dev_Comm
    还什么也没有写~
    • 0
    // 本帖子
    分类
    关键词
    // 相关帖子
    Coming soon...
    • 0
    Looki 孙洋首次深度创业复盘:主动式 AI 的下一步是预测,整个世界都将是 AI 的 Prompt RTRTE_Dev_Comm