130: 手机Agent大幕拉开!从刚上线的AutoGLM 2.0聊起,大模型如何改造手机|Agent#4

00:00
01:36:46
听完整版
节目详情
「智谱 AutoGLM 2.0 上线,字节酝酿“豆包手机”,苹果和华米OV 也不会缺席。」 本周三,智谱发布了首个手机通用 Agent,AutoGLM 2.0,能点外卖、买票、订餐;无邀请码直接用、免费。 https://tc-new.z.wiki/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20250820/TYiw/5712X3397/WechatIMG100_1.jpg/webp (这期的封面就是,AutoGLM 上周日给参加产品交流会的朋友点点的奶茶~) 从市场规模和人群广度看,网页端的 Agent 是湖,手机端的 AI Agent 才是海。因为在中国,每天用手机的人,几乎等于总人口;而每天用电脑的人则少得多,很多人的日常生活和工作里根本不需要电脑。 https://tc-new.z.wiki/autoupload/n-L6s5C_cu5ZZHPwIYlQzY12_FRYNb81z6UPhMWD8iI/20250820/5W8A/1080X472/accesswximg.png/webp 图注:AutoGLM 2.0,电脑端、移动端都可用 现在,大模型公司、移动互联网巨头和手机公司,都想到这片海里寻宝,手机端 Agent 将来一定会是一个兵家必争之地。 现在我们已经看到了一些苗头:《晚点》昨天就发布了一篇独家报道,讲字节的豆包手机进展;据此前市场信息,美团的王莆中亲自带队做生活服务助手 beam;苹果、华米OV也一定不会缺席手机 Agent。 这期,我们邀请 AutoGLM 2.0 的算法、工程和产品负责人,刘潇。从 AutoGLM 切入,我们一起聊了移动端 Agent 目前的产品形态;大模型公司、超级 App 厂商和手机硬件厂商,在移动端 AI 上的三方竞合关系;也通过回顾 AutoGLM 的开发过程,梳理了这类产品的难点、研发思路和未来的迭代方向。 1999 年出生的刘潇,今年 26 岁,本科毕业于清华大学计算机系。 制作这期时,我算了一下,这是我们第四期专门聊 Agent 了,之后也会有更多相关内容。所以我给这 4 期都加了 Agent 后缀和编号,方便大家检索往期。 本期主播:程曼祺,《晚点 LatePost》科技报道负责人 本期嘉宾:刘潇,智谱 AutoGLM 算法、工程、产品负责人 时间线跳转: -AutoGLM 2.0 速览 01:57 能点奶茶、能发帖,不占用屏幕、无邀请码直接上线、免费 05:作为用户的疑问:隐私、安全如何保障?关键步骤需接管,真能省事? 09:06 定时任务,高频但尚待解锁的场景 12:05 AI 竞争与外卖大战交汇:点外卖、找美食可能会被用得最多 -终端 AI 三方竞合:大模型、超级 App、手机厂商 14:14 当 AutoGLM 来到美团与用户之间,美团们怎么想? 16:12 Agent 调 App 的方式:GUI(图形界面) 和 API 会长期并存 20:59 手机个人通用 Agent 和超级 App 内部 Agent(如美团 beam项目) 的关系? 25:52 移动端尚没有 Web 端的 MCP 生态 28:44 手机厂商也在做 Agent,智谱与荣耀、三星的合作进展 32:53 华为、小米这样的公司有多种终端,它们推跨端 Agent 的优势? 33:55 智谱作为大模型公司自己做硬件?暂时没考虑 -近 30 个月的 AI Agent 探索 37:17 23 年 3 月 GPT-4 发布,刘潇的重心从预训练转向 Agent 42:39 23 年 4 月到 8 月,做出全球首个评估 Agent 能力的基准 Agent Bench 47:25 训练冷启动,人来构造数据 53:44 强化学习(RL)初现威力,离线强化学习已能大幅提升效果 01:01:22 o1、R1 的启发:做 RL 时,要用结果来 supervise 模型,而非用过程 01:04:02 RL 的两个关键:环境和激励 01:11:12 24 年 10月至今:工程上实现不占用电脑,以更大规模的在线强化学习提升纠错能力 01:15:16 激烈竞争的前提是,移动端 Agent 真的好用、成熟了 01:18:11 需要提升:模型能力、Infra、成本优化 01:28:56 产品马上发布:忐忑、期待和迭代计划 -连点成线 01:32:14 110 期,Agent 入口大战的预言回顾 01:34:54 我们聊过的那些强化学习 特别企划: 《晚点 LatePost》 (https://www.latepost.com/)和 AI 产品点评网站「观猹」 (https://watcha.cn/)联合发起了一份 lite 调研问卷,只有 10+ 个选择题,填写仅需3-5分钟!我们想了解:AI 应用产品在“模型调用”方面的真实现状——到底在不同场景中,哪些模型最多人用?最受欢迎? 调研数据脱敏后会成文公开,分享给大家,所有原始数据将被严格保密。问题也不涉及产品名称等敏感信息。 欢迎听友中的各位 AI 产品开发者和创造者来填写!十分感谢!!😄填写链接: https://www.wjx.cn/vm/eGkVD4a.aspx# 相关链接: 《晚点独家丨“豆包手机” 酝酿中,字节为大模型寻硬件载体》 (https://mp.weixin.qq.com/s/ueN6K-6yYdO8J7rNUywF0w) 《晚点聊》110: 与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 (https://www.xiaoyuzhoufm.com/episode/685a584ccaf6efb83f2c0042) 《晚点聊》96: 和楼天城聊 Robotaxi:学习人类优秀司机,让我绝望 (https://www.xiaoyuzhoufm.com/episode/676c92ed4e2405e3fde38272) 晚点聊 106 期:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need (https://www.xiaoyuzhoufm.com/episode/67cdb53f7ccfd410926b0c66) 《晚点聊》111: Pokee.ai 朱哲清的 Agent 造法:强化学习作后端,语言模型作前端 (https://www.xiaoyuzhoufm.com/episode/680818eb79d324fdd40c2b5e) 剪辑制作:Nick 本期主播: 小红书@曼祺_火柴Q (https://www.xiaohongshu.com/user/profile/5dfa9e92000000000100626f?xsec_token=YBSKzbnOGWpnyJ5fxw_yafTdnAUIDw-EfCtqmFTkCIM2o=&xsec_source=app_share&xhsshare=CopyLink&appuid=5dfa9e92000000000100626f&apptime=1736682459&share_id=331aecb9ca7941f498d81fb9c32ea810)即刻@曼祺_火柴Q (https://okjk.co/FBoH1Q) https://cdn.z.wiki/autoupload/20250129/p96l/1428X298/%E6%92%AD%E5%AE%A2-%E7%BB%93%E5%B0%BE%E4%BD%9C%E8%80%85%E7%AD%BE%E5%90%8D.png ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 https://tc.z.wiki/autoupload/f/vF9vElnh05iCqwr0xfm9iL4wP3sHaC7Y1psXYbgMe5eyl5f0KlZfm6UsKj-HyTuv/20250730/YNjr/907X339/WechatIMG1646.jpg 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章: https://hv.z.wiki/autoupload/20250129/DqTi/1452X514/%E6%92%AD%E5%AE%A2%E7%BB%93%E5%B0%BE%E6%88%AA%E5%9B%BE.png
展开
大家都在听
评论(0条)
快来抢沙发吧!
打开蜻蜓 查看更多