Powered by RND
Listen to 42章经 in the App
Listen to 42章经 in the App
(36,319)(250,152)
Save favorites
Alarm
Sleep timer

42章经

Podcast 42章经
KaiQu
你好,我是曲凯,42章经的创始人。 小的时候我不太舍得花钱,记得当年一毛钱一袋的牛肉干真的很好吃,但如果偶尔遇到一个很有趣的人,我会欣然花几十、上百块请他吃个饭,还觉得自己赚到了。 后来长大了一些,开始刷人人网、豆瓣、知乎、再到现在的即刻…… 你有没有偶尔在这些平台刷到过一个很有缘的人,然后在一个夏日的午后,把他...

Available Episodes

5 of 35
  • 我是这样用 RL + LLM 做 Agent 的|对谈 Pokee AI 创始人朱哲清 Bill
    新年正式第一期,来点新东西。大家都说 Agent 热,那 Agent 到底是啥、到底为啥热、到底咋做、到底长啥样?大家都说 RL 是新方向,那 RL 到底是啥,和 LLM 的关系是什么,又能怎么和 Agent 结合?这期我们就请到了在 Meta 工作了七年的应用强化学习组负责人朱哲清 Bill,讲一讲他是怎么用一种很新的技术路线来做一种很新的 Agent,并且在电商等领域是如何落地的。最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)【人类博物馆】导游:曲凯,42章经创始人30 号珍藏:朱哲清 Bill,Pokee AI 创始人兼 CEO,此前 7 年在 Meta AI 做应用强化学习组负责人,并攻读了斯坦福大学强化学习专业博士学位【时光机】Part1 强化学习 3:06 我们思考方式已经全面 RL 化 —— from OpenAI 研究员 4:36 Transformer 和 RL 到底是什么关系?又要如何结合? 10:15 RL 解答的是平行宇宙问题 12:35 RL+LLM,就是公认最好的技术路线吗? 14:02 RL 的算法原理类似于「多巴胺刺激」 14:42 在无法清晰定义 Reward 的场景下,RL 还好用吗? 15:12 RL 最强的三个能力Part2 给 Agent 用上强化学习 18:42 为什么直接用 LLM 做不出规划型 Agent? 20:17 一个有效的 Agent 架构:RL 做核心,LLM 做翻译 23:35 我们做出了一个电商领域的通用型 Agent24:39 体验相当于一个资深的网站负责人26:05 原理是让 Agent 通过 self-play 学会使用上千个底层 API 29:43 Agent 当前市场格局:29:52 Coding Agent 是皇冠上的明珠30:26 Vertical Agent 遍地开花,但准确性仍是大难题30:46 通用型 Agent 尚不存在,但 RL 或可迎战 31:17 万物皆可 call API 34:07 一个具体的应用示例:Agent 是怎么帮商家省钱提效的? 39:08 训练成本和推理成本都低得令人发指... 40:33 先定一个小目标:做各行各业的 API 杀手 42:57 对 25 年硅谷 AI 市场的观察和预判43:11 垂类 Agent 是绝对的热点赛道,融资并不困难45:29 25 年是 Agent 真正落地的一年【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescalero
    --------  
    45:57
  • 为什么我们对 25 年 AI 极度乐观|AI 年终复盘
    去年我们做了一期年终总结,叫《24、25 年会是下一代浪潮最关键的两年》,今天我仍然坚定的站在这个结论背后,24 年看似悲观实则蕴藏了很多机会,而 25 年就是爆发的一年。而还没有进场的人,可能 25 年就是最好的机会。在这期播客中,我帮大家快速理解:1)23 年 24 年市场发生了什么,核心重点是什么,原因是什么。2)为什么市场普遍悲观,而我们却极其乐观。3)当下市场中最流行的 Prosumer 概念是什么,为什么会有这个概念。4)市场都说 Agent 是重点,我从传统软件到 SaaS 再从 SaaS 到 Agent 解释了这里的机会和做法到底是什么。5)为什么多模态 2C 产品,反而是我们最看好的机会?这个可能就是 AI Native 的答案。这期播客一共 30 分钟,23 到 25 年 AI 市场的精华都在其中。最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)【时光机】Part1 复盘过去两年的 AI 发展 00:50 市场从盲目乐观走向过度悲观(不过最近有新风向 02:26 24 年 1-9 月,一级市场是过去十年 (大概率也是未来十年) 之最差 04:19 模型侧符合我们 23 年初的 4 个判断 05:17 应用侧不及预期,但也有人赚到钱 06:35 为什么我们开始乐观?06:48 ① 9 月后,融资市场明显复苏07:05 ② 多模态的能力在持续加强09:04 ③ 大多数人忽略的一点是,AI 创始人的画像发生了明显变化10:07 无论外部因素如何,最终起决定性作用的是资产价值本身Part2 展望 2025 10:41 市场大环境会进一步变好,但会越来越两极分化 11:59 当下最好的选择不是创业,而是先加入一家 AI 公司积累经验 12:30 市场关键词演变:23 年「大模型」,24 年「具身智能」,25 年「应用落地」13:06 目前最具共识的是 Prosumer 赛道,可能会率先跑出千万美金 ARR15:03 此外我们最看好 Agent 和多模态Part3 详谈 Agent 和多模态 15:30 Agent 会是 SaaS 的十倍? 16:02 Agent 更可能是新公司的机会,而不是现有 SaaS 公司的机会 22:57 Perplexity 未来其实是一家 Agent 公司 26:25 AI Native 的答案是什么? 30:28 早入场的人、乐观的人,往往都获得了回报【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    31:34
  • 用绝对理性应对世界的波动 | 对谈德扑世界冠军 Ricky Mao
    这期是我自己一直感兴趣的话题。我一直觉得像德扑、狼人杀这样的游戏设置非常有意思,里面的各种理性策略、感性判断和说服人的能力,都能体现在现实世界的角角落落。相信绝大多数人都大抵接触过这些游戏,哪怕不是相关领域的专家,所以我们这次就请来了一位德扑世界冠军来一起讨论他视角下的德扑,以及其中很多“技巧”对这个世界的映射。在整个聊天过程中,嘉宾说了无数次的“绝对理性”,也谈论了在游戏中是如何对“人”进行判断(比如行为基准线的概念),另外在结尾部分,他还说了一句点破社会经济运转规律的话,即“通胀是人生的大小盲”。这期很多内容比较偏向于德扑本身,希望大家听完能够从中收获些对现实世界中博弈、决策和投资等的参照,也祝所有人都能跑赢通胀。【人类博物馆】导游:曲凯,42章经创始人29 号珍藏:Ricky Mao,毕业于复旦、 MIT,前投资人、企业 CFO,现是全球 Global Poker Index 排名 200 左右、中国前 10 的扑克选手。曾获 WSOP(世界扑克系列赛,代表着竞技扑克的最高水平)金手链、两次 APT(亚洲扑克巡回赛)冠军。【时光机】Part 1 一个顶级牌手的核心素养 4:15 要素一:绝对理性 5:53 but how? 8:34 那还能 all in 吗? 10:26 要素二:识人 11:34 核心是知道基准线在哪里,然后分析每个人动作上的偏移 12:07 线下接触一个人,可以先通过外在形象给 ta 建模(日常生活不鼓励这么做哈- 示例:金表大哥 v.s. 沙滩白男的行事风格模型- 所以要怎么又快又准地给人建模? 14:55 见不到面时,能通过什么信息来判断对方是什么样的人? 15:28 国人更喜欢刺激、赌性更强 19:47 大家最常犯的错误是什么? 21:16 行业 top,最后真正拼的是什么? 22:29 要素三:掌握概率Part 2 心态篇 23:41 为什么说「一场比赛毁一个冠军」? 26:51 是人都会经历大的下风期 27:53 拿到金手链的精彩故事 28:20 我曾经想过:如果拿到金手链,我愿意第二天去死 29:04 肾上腺素飙升…反败为胜前的尖峰十小时Part 3 策略篇 31:03 大部分人对 Bluff 的认知都不对 35:26 更激进的打法,能引向更好的结果吗? 36:00 怎么打满价值? 40:02 位置这件事,到底有多重要?Part 4 人生思考 41:01 绝对理性和保持感性并不矛盾 42:28 「再坚持一下」可能是一种有毒的心态 43:36 通胀是人生的大小盲,环境不好的时候你完全可以空仓 48:03 顶尖高手的风格都是万法归宗【Notes】 Tom Dwan:一位著名的德州扑克选手,以其非常激进和高风险的打法著称。节目中还提到了几位顶尖高手,包括 Eric Seidel、Phil Ivey、Daniel Negreanu、Dan Cates (Jungleman)、Adrian Mateos、Steven Chidwick。 GTO(博弈论最优):GTO 策略是一种防守性策略,目的是让你不容易被对手剥削。在 GTO 策略下,玩家通过混合不同的行动(例如:下注、加注、弃牌等)来保持平衡,使得对手即使知道你的策略,也无法从中找到漏洞。 大小盲:德扑中使用的强制性下注结构中的两种盲注。小盲注(Small Blind)是由庄家左手边的玩家支付的强制性下注金额,通常为最小的注额。大盲注(Big Blind):是由小盲注左边的玩家支付的强制性下注金额,通常是小盲注的两倍。这些盲注的设置目的在于推动游戏进行,确保每一局牌都有一定的筹码池。游戏中的其他玩家可以选择跟注、加注或者弃牌,而支付盲注的玩家则已经支付了入池的初始金额。【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    49:38
  • 我在 Character.ai 做 Post Training|对谈前 C.AI 模型应用算法专家 Ted
    活动预告🥳:12 月 7 日,我们会请到 Ted 做一场线上活动,大家记得翻到 shownotes 末尾查看报名信息!在我 9 月份的硅谷行程里,我见过的印象最深、让我最有收获的人之一就是 Ted。那个时候他正要离开 Character.ai,作为第四十多号加入的员工,他对于 C.AI 的产品、模型、训练等等的熟悉程度都非常高,这次很开心能把他请来,跟大家一起分享下美国最著名的 AI 公司内部是如何运作的,Post Training 的最佳实践是怎么做的,以及硅谷一众 AI 从业者的现状和认知等。这期播客的内容基本代表了美国最一线的 AI 从业者的实践和认知,非常有代表性,希望对大家有帮助!最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)【人类博物馆】导游:曲凯,42章经创始人28 号珍藏:Ted,前 C.AI 模型应用算法专家Part 1 从内部视角看 C.AI 01:06 为什么商业化一直没做起来? 04:40 如果 C.AI 当时往 AGI 赌把大的,或者把产品交给字节系,能改写自己的结局吗? 06:51 我们很认可 Talkie,但不想学 Talkie 09:36 被收购后,你还相信 C.AI 类产品的未来吗? 11:35 有人说「C.AI 不是真正的 AI 陪伴」,那它到底是啥? 12:19 C.AI 为什么做得比别人好?Part 2 我在 C.AI 做 Post Training 的这一年 14:56 工作状态是 996(主动的哈,passion! 17:15 Post Training 的核心是设计高效的迭代路径 18:42 四种迭代路径,都有很多低垂的果实可以摘 21:40 怎么评估和改善「模型变蠢」的问题? 22:54 迭代中一个有趣的 EQ 涌现 24:19 Post Training 到底是怎么个流程? 25:37 介绍 Post Training 三大件:SFT(监督微调) 、RLHF(人类反馈强化学习)、DPO (直接偏好对齐) 32:07 以上天花板极高,RAG 和 Prompt Engineering 我们几乎没做 32:53 帮你拉开和同行差距的 2 道数据思考题: 33:18 你微调用的数据,质量真的不能更高了吗? 36:00 收集来的用户偏好数据,只能是点赞点踩吗? 39:32 大家现在关注的几个技术难题,C.AI 是怎么做的? 39:49 怎么做好评估? 41:10 怎么做好意图识别? 43:22 C.AI 的语音延迟基本是业界做得最好的,是怎么做到的? Part 3 硅谷观察 46:17 一个不被公开的秘密:ChatGPT 内部也是多模型混用? 47:28 硅谷整体还是很乐观,推理侧仍然大有可为 50:45 硅谷现状: 51:01 做产品的想靠多模态赚钱 51:06 搞算法的想复制 o1 51:16 两边都在期待自动交互 Agent 解锁的想象空间 53:48 复盘最近的硅谷求职记 53:54 Post-train 人才极其抢手 54:27 印象最深的是,面 Cursor 的时候,我甚至被允许用 Cursor 现场解题 56:03 最喜欢被问到「你觉得我们的 idea 有多不靠谱?」 56:45 如果我是面试官,我会考察面试者的这项直觉能力 57:28 我很喜欢现在硅谷的氛围!当下可能是华人扬眉吐气的最好时机【活动预告🥳】12 月 7 日,我们会请到 Ted 做一场线上活动,感兴趣的朋友欢迎点击链接或扫描下面的二维码,一起来认识&交流!【The gang that made this happen】 制作人:陈皮、Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    1:00:11
  • 这可能才是 AI 陪伴真正该有的样子|对谈刷屏产品 EVE 创始人 Tristan
    几周前,EVE 的产品宣传片一上线就在 B 站获得了超百万播放,且刷屏了朋友圈。几天前正好和一个投资人聊天,大家在讨论未来的 AI 巨头和入口型的公司/产品到底有什么可能性,我当时就说 AI 陪伴类产品肯定是有大机会的,过去两年里,真正验证了 PMF 的赛道就是 Character.ai 类的产品形态,不管从用户量级还是时长等数据来看,这类产品都一骑绝尘。当然,如 EVE 的创始人所说,在他眼中,C.AI 根本就还不算真的陪伴,这可能也是类似产品没有获得更大突破和成功的原因。作为最早的恋爱游戏类公司创始人,他有自己一套清晰的关于陪伴的定义,这不仅让他做出了最成功的乙男向游戏《奇点时代》,也让他能做出现在的这款万众期待的 EVE。在这期播客中,我们具体聊了他是如何定义陪伴的、他是如何用各种复杂工程手段解决长期记忆等模型问题的、以及他是如何把游戏和 AI 产品结合起来的等等话题,作为最早期的内测用户之一,我非常相信 EVE 能在明年成为一款现象级的产品。最后,我们的 AI 私董会也在持续报名中,目前已经聚集了一批市场上最好的 AI 创始人,欢迎点击链接报名(里面也有目前已加入的成员名单,可点击查看)【人类博物馆】导游:曲凯,42章经创始人27 号珍藏:Tristan,EVE 创始人,《奇点时代》创始人【时光机】Part 1 背景介绍 00:54 为什么我说 C.AI 类产品根本不是陪伴 2:38 陪伴的第一性原理Part 2 工程设计 4:22 所有人都解决不了的长期记忆问题,你们是怎么实现的? 4:55 被动记忆与主动记忆的区别 6:24 情侣实验与 128 个记忆槽位 8:03 给 AI 女友设计脑回路:我们用十几个模型搭建了一套工程管线 10:08 举个例子,一个最复杂的话题处理流程是什么样子的? 12:44 交代一下成本与商业模式Part 3 游戏设计 14:07 一个迷思:为什么只有你们把 AI 产品做到了这个程度? 15:42 从游戏转做 AI 陪伴的明显优势 17:07 那些产品中的游戏化设计 (及用意) 23:51《奇点时代》一年 2 亿流水,其实远低于我们对男性恋爱游戏的市场预期 25:00 我相信世界 50% 人都会需要一个 AI 伴侣 27:14 聊聊角色设计Part 4 AI 设计 29:27 怎么做到 10 个月的时间就快速搞懂、搭建起这样一套 AI 架构? 31:13 如何训练出市面上最好的情感聊天效果? 32:39 我们找了一个天资卓绝的真人陪聊,试图复刻她的大脑 37:51 AI 陪伴的四个核心要素38:10 超级对齐38:26 真实时空感知39:17 独立人格43:20 荷尔蒙钩子 43:45 模型的情商和智商到底是怎样一个关系?【Reference】 EVE 预告 PV (内含产品内测申请链接) EVE 模型系统工作机制:【The gang that made this happen】 制作人:Celia 剪辑:陈皮 Bgm:Mondo Bongo - Joe Strummer & The Mescaleros
    --------  
    45:16

More Technology podcasts

About 42章经

你好,我是曲凯,42章经的创始人。 小的时候我不太舍得花钱,记得当年一毛钱一袋的牛肉干真的很好吃,但如果偶尔遇到一个很有趣的人,我会欣然花几十、上百块请他吃个饭,还觉得自己赚到了。 后来长大了一些,开始刷人人网、豆瓣、知乎、再到现在的即刻…… 你有没有偶尔在这些平台刷到过一个很有缘的人,然后在一个夏日的午后,把他的发言、转载和收藏全都看了一遍,并觉得心有戚戚焉。 再后来工作和创业以后,每天就是聊各种各样的投资人、创业者。 如果能聊到一个优秀的人,真的会有一种如沐春风的感觉,并真心觉得很幸福。 而同行们见面经常会聊到的问题也是:最近有没有遇到什么有意思的人? 所以,这个播客就是要努力把这些人带到你的身边。 我们只专注和有趣、有独到认知、又愿意坦诚分享的聪明人聊天。 希望你听完每一期都能回到小时候,回到那个因为认识了有趣的人、收获了新知,而感到单纯美好幸福的时刻。 如果听完以后,你还能暗自感慨一句, “我也好想认识这个人啊。” 或者, “哇靠,有被启发到。” 那这个播客也就值了。
Podcast website

Listen to 42章经, Hard Fork and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
Social
v7.3.0 | © 2007-2025 radio.de GmbH
Generated: 1/21/2025 - 2:09:59 PM