Powered by RND
Listen to OnBoard! in the App
Listen to OnBoard! in the App
(36,319)(250,152)
Save favorites
Alarm
Sleep timer

OnBoard!

Podcast OnBoard!
Monica Xie
Hello World, who is OnBoard!? 两个爱码字的投资人关于科技创业与投资的真诚对话。 关注主播: Monica:美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 GN:前SaaS及科技投资人,Glo...

Available Episodes

5 of 60
  • EP 63. 直播回放:什么是开发大模型应用的新一代底层技术栈?对谈贾扬清,PingCAP黄东旭和AWS核心AI产品研发
    我们回来了!2024年转眼就剩下不到两周了,接下来要努力了!这一期是10月一场直播的录制。AI时代日新月异,最近几个月 windsurf, Devin 一众 AI 软件开发工具不断刷新我们对于软件开发范式的认知。这一期对于更底层 AI native 软件技术栈的讨论,仍然不过时。Hello World, who is OnBoard!?随着 GPT, Claude 等大模型的出现和迅速演进,AI 应用开发进入了全新的阶段。传统的软件开发流程正在被重新审视,新的开发框架、数据存储方式和调试方法层出不穷。这次的嘉宾,在软件技术栈的各个领域都可谓重磅。Andy Peng 是AWS 生成式AI核心产品 Bedrock 的核心成员,负责AWS上Anthropic 一系列重要 API 的同时,他也是 Linux Foundation 和 Cloud Native Computing Foundation (CNCF) 的重要成员,从云计算、分布式系统到AI 技术设施,都是绝对的一线专家。Dongxu 是我们的返厂嘉宾,开源数据库PingCAP的创始人兼CTO,本次的的话题也是受到他的一条朋友圈启发:围绕AI的应用开发,会对整个软件开发范式,包括开发框架、数据存储和处理方式、观测性工程和质量体系等等,带来怎样的变化?另一位返厂嘉宾也是绝对的大牛,Lepton AI 创始人 CEO贾扬清, 从 Google Brain 到 Facebook AI 到阿里巴巴,作为 Caffee2, Pytorch 的核心元老,到创立Lepton AI,致力打造 AI cloud,又看到整个AI开发生态有怎样的演进?有什么可以从上一代 AI infra 发展中可以参考的变与不变?这次讨论的话题需要一些技术基础知识,另外,嘉宾长期在海外工作生活,夹杂英文在所难免,不接受抱怨,欢迎评论区提出新的问题和观点。Enjoy!嘉宾介绍 贾扬清,Lepton AI 创始人 & CEO,ex-Facebook AI, Google Brain, 阿里云副总裁, 深度学习框架 Caffe 和 ONNX 的创建者之一 Andy Peng, AWS Bedrock 核心成员,Cloud Native Computing Foundation (CNCF) Ambassador 黄东旭,PingCAP 联合创始人兼 CTO,分布式数据库 TiDB 作者。 OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学我们都聊了什么03:05 嘉宾自我介绍,最近关注到的 AI 相关产品:DSPy, 快手可灵,Anthropic Artifacts12:08 开发基于大模型的应用,为什么需要不一样的技术栈?18:45 为什么上一波 AI 的API商业模式不work, 这一次 Model as a service 的API业务会有什么异同?25:26 过去一年,应用开发工具有哪些重要变化?未来更复杂的应用还有哪些需求?33:35 AutoGPT 启发了 RAG?Agent 的实际落地情况怎样?35:13 AI 应用为什么会重构 Kubernetes 的资源调度方式?40:08 多模态和非结构化数据的增加,会对 Infra 和开发工具有哪些新的需求?对于现在的 data infra 公司意味着什么?51:15 AI 应用需要怎样新的可观测性体系?61:43 AI 和RAG系统中的搜索,与传统搜索有哪些异同?64:47 Agentic workflow 会对应用开发技术栈带来哪些新的需求?现在做工具“抽象化”还太早了吗?70:56 变革中,新的定义如何产生?为什么很多概念定义都是在美国诞生的?73:18 这一系列变化中,有哪些是新玩家的新机会?哪些适合现有玩家做改良?76:58 做一个开发工具,如何决定是否要开源?78:41 多模态实时交互会对开发技术栈带来哪些新的挑战?81:12 如何判断哪些开源项目可以做商业化?85:45 我们需要单独的向量索引吗?VectorDB 有多少机会会被现有数据库公司占据?93:43 未来技术选型的决策会由AI来做吗?软件开发会变成标品吗?95:40 云厂商和大模型提供商之间是相互竞争的吗?99:22 端侧模型和云端部署模型之间是怎样的关系?未来的格局会有什么变化?104:21 未来1-3年,期待 infra 领域还有哪些变化?109:51 嘉宾的产品未来还有哪些重要计划!我们提到的公司 LangChain: www.langchain.com - 一个用于开发语言模型应用程序的框架。 LlamaIndex: gpt-index.readthedocs.io - 一个用于 LLM 应用程序的数据框架。 Databricks: www.databricks.com (可能是指他们的模型服务和优化基础设施) Anyscale: www.anyscale.com一个用于构建和部署 Ray 应用程序的平台,通常用于扩展机器学习工作负载。 Mosaic: www.mosaicml.com一个用于高效、可扩展地训练大型 AI 模型的平台。 Modal: modal.com一个用于构建和部署机器学习模型的平台。 Vercel: vercel.com一个用于前端框架和无服务器函数的平台。 Guardrails: shreyar.github.io - 一个用于为 LLM 应用程序添加安全性和可靠性的开源库。 SQLite: www.sqlite.org一个轻量级的、基于文件的数据库。 DSPy: github.com - 一个用于构建 LLM 应用的框架, Factory.ai: factory.ai LiveKit: livekit.io - 一个用于构建和扩展实时音频和视频体验的开源基础设施。 Dify: dify.ai - 一个用于视觉化构建 LLM 应用的平台,提供可视化界面和 workflow 编排功能。 AWS Bedrock: aws.amazon.com - AWS Bedrock 让你能够通过 API 访问和使用来自不同提供商的各种强大的基础模型。 AWS App Studio: aws.amazon.com - AWS App Studio 简化了在 AWS 云上构建、部署和扩展 Web 应用程序的流程。 Phidata: www.phidata.com - Phidata 帮助你构建实时数据管道和应用程序,处理和分析流式数据。 NPI AI: www.npi.ai - The best tool for AI taking action. Unstructured.io: unstructured.io - Unstructured.io 帮助你从各种类型的文档和数据中提取有价值的信息,例如文本、图像和表格。 Datalogy: https://www.datologyai.com/ - 自动生成和管理训练数据集。 Rockset: rockset.com - Rockset 提供了一个实时分析数据库,用于构建需要快速查询和分析数据的应用程序。 Anthropic Artifact: Anthropic Artifact 是一系列专注于安全性和可靠性的 LLM,可用于各种任务,例如对话生成和文本摘要。 AutoGPT: github.com - AutoGPT 是一个实验性项目,旨在探索如何使用 LLM 来自动执行任务和目标。 artificialanalysis.com - Artificialanalysis.com 提供了工具和资源来帮助你评估和比较不同的 LLM。 GraphRAG: github.com - GraphRAG 将知识图谱与 LLM 相结合,以提供更准确和全面的信息检索和生成。 vLLM: github.com - vLLM 帮助你更高效地在各种硬件上部署和运行 LLM 推理。 PGvector: github.com - PGvector 让你能够在 PostgreSQL 数据库中存储和查询向量嵌入,这对许多机器学习应用程序至关重要。 DuckDB: duckdb.org - DuckDB 是一款高性能的分析型数据库,非常适合处理大量数据和复杂查询。重要词汇 RAG (Retrieval Augmented Generation): RAG 通过从外部知识源检索相关信息来增强 LLM 的能力,使其能够生成更准确和翔实的响应。 Embedding: 嵌入是一种将文本、图像或其他数据转换为数字向量表示的技术,使计算机能够理解和处理这些数据。 Function calling: 函数调用允许 LLM 调用外部函数或 API 来执行特定任务,例如获取实时信息或与其他系统交互。 Prompt engineering: Prompt engineering 是一种设计和优化 LLM 输入提示的技术,以引导模型生成所需的输出。 RPA (Robotic Process Automation): RPA 是一种使用软件机器人来自动化重复性任务的技术,例如数据输入和处理。 Agentic workflow: Agentic workflow 是一种 LLM 驱动的自动化流程,LLM 可以自主地执行任务和做出决策。 Data lake: 数据湖是一个集中存储各种类型原始数据的存储库,例如结构化数据、非结构化数据和半结构化数据。 ETL (Extract, Transform, Load): ETL 是一种将数据从各种来源提取、转换和加载到目标系统(例如数据仓库)的过程。 Vector database: 向量数据库专门用于存储和查询向量嵌入,这对于许多机器学习应用程序(例如相似性搜索和推荐系统)至关重要。 Observability (可观测性): 可观测性是一种通过监控系统行为来了解和诊断系统性能和问题的方法。参考文章 www.enceladus.ventures a16z.com www.supervised.news www.factory.ai blog.livekit.io www.harness.io OpenAI Acquires Rockset欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!M小姐研习录 (ID: MissMStudy)欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
    --------  
    1:53:08
  • EP 62. Google Deepmind 与LLM研究员深度解读OpenAI o1 及LLM+强化学习新范式
    你们期待已久的最硬核干货的OpenAI o1模型技术解读来了!上个月最值得关注的事件,或许就是9月12号OpenAI o1模型的发布了,大家对这个新的模型翘首以待许久,OpenAI CEO Sam Altman 也称之为新范式的开始。经过强化学习(Reinforcement Learning)并结合Chain of thoughts 思维链技术,o1在处理物理、数学、编程等复杂问题时,甚至和该领域的博士生水平不相上下。OnBoard! 的嘉宾,不会让你失望!Hello World, who is OnBoard!?强化学习如何给大语言模型带来新的逻辑推理能力这?这种能力的来源、实现方式和未来潜力又是怎样的?o1带来的“新范式”会对行业有怎样的影响?这次的嘉宾都是有实际训练LLM经验的一线研究员。这场三个多小时的解读,相信会给你不一样的视角!其中两位就来自 RL 绝对高地的 Google, 也是AlphaGo, alphafold, alphageometry 等一系列世界领先的RL工作的发源地。他们都分别在RL和MCTS(蒙特卡洛树搜索)领域有长期的研究和实践经验。另一位嘉宾则是在互联网大厂从LLM预训练到RLHF都有一手经验。中美视角的综合,碰撞出很多火花。这个嘉宾阵容对o1的猜想和解读,相信会让你直呼过瘾。这次的探讨会涉及很多技术细节,嘉宾长期的海外工作学习,难免穿插英文,不接受抱怨。Enjoy!PS 本期录制时间是2024年9月27日嘉宾介绍Kimi Kong,Research engineer @Google deepmind, 他在 Stanford 读书期间就接触强化学习,从机器人到现在的大语言模型,对强化学习的理论和使用的沿革有非常系统的理解。Eric Li (返场嘉宾!),Research scientist @Google Cloud, PhD @Caltech。大家都猜测 o1 将蒙特卡洛树搜索 (MCTS) 应用到了LLM,是提升逻辑推理能力的重要方式之一。Eric 就发表了多篇LLM和MCTS结合的论文,绝对的专家。苏辉,前微信AI研究员,现国内一线互联网公司大模型负责人。Cohost: Cage,原字节的数据科学家,现拾像科技研究员,公众号“海外独角兽”撰稿人OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学我们都聊了什么02:36 嘉宾自我介绍,MCTS 科普,为什么对LLM+RL新范式很重要; Cursor 为何值得关注,Physics in LLM from Allen Zhu, 语言对推理能力的价值20:25 对o1发布有什么印象深刻的地方,数据的重要性和难点40:16 如何拆解o1能力提升的来源?如何重新训练一个o1?56:10 为什么复杂的o1 却解决不好简单的数学或常识问题?60:16 o1 用于 tool use 的任务,可能有什么挑战? 对agent 产品有什么影响?66:46 如何看待agent 数据集难收集的问题?68:38 什么是 Chain of Thoughts (CoT)和MCTS? 对o1的作用跟以前CoT做法有什么不一样?MCTS 在LLM推理中可能有什么作用?83:07 什么是强化学习(RL)?在LLM中应用RL是怎样的演进过程?89:35 RL和self play 其他领域,比如机器人,有怎样的应用?跟在LLM的应用有何异同?93:45 RL, CoT, self-play 之间是怎样的关系? 真的可以无上限提升LLM推理能力吗?106:56 o1 有可能是单一模型还是 multi-agent system?119:11 LLM和游戏有什么相互影响?为什么玩游戏的能力对LLM 很值得关注?游戏数据对LLM训练有什么价值?126:54 Google 很早就开始 RL 相关研究,为什么 OpenAI o1先出来了?133:16 o1 新范式的出现,对于追赶者来说意味着什么?更容易还是更难?141:43 要追赶 OpenAI o1, 最容易被低估和高估的是什么?143:48 对未来的展望:未来1年和3年,预期AI领域会发生什么?我们推荐的内容OpenAI: Scaling Laws for Reward Model OveroptimizationCursorAllen Zhu: Physics of Language ModelsLanguage is primarily a tool for communication rather than thoughtOpenAI: Improving mathematical reasoning with process supervisionInstructGPTOpenAI PRM 800k 数据集Let's Verify Step by StepAnthropic: Constitutional AI: Harmlessness from AI FeedbackRLAIFOpenAI Hyung Won Chung: "Don't teach. Incentivize."ToolformerChain of thoughtsDDPMDPOPPOSergey Levine: Soft actor-critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actorT HaarnAlphaGoAlphaGo-ZeroAlphaZeroMADDPG (Multi-Agent Deep Deterministic Policy Gradient (MADDPG), from OpenAI paper "Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments"AlphaZero-Like Tree-Search can Guide Large Language Model Decoding and TrainingReasoning with Language Model is Planning with World ModelChain of Thought Empowers Transformers to Solve Inherently Serial Problems参考文章openai.comopenai.comOpenAI’s Strawberry and inference scaling laws海外独角兽:LLM的范式转移:RL带来新的 Scaling Law张俊林:Reverse-o1:OpenAI o1原理逆向工程图解欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!M小姐研习录 (ID: MissMStudy)欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
    --------  
    2:42:51
  • EP 61. 深度访谈Castbox王小雨:50+款出海产品,5千万月活,播客App如何完成AI转型
    本期播客与《此话当真》合作,这次的创业者深度访谈,有些不一样!这位女侠一般的创业者 2016 年就开始做出海应用创业。这次的访谈,我们看看一位8年出海老兵,如何从0做到数千万用户,又如何在 LLM 大潮中,雷厉风行地带领公司将 AI 融入实践中。Hello World, who is OnBoard!?今天的嘉宾,是 Guru Network 创始人兼CEO, Renee 王小雨。2016年,她开发的 Castbox 成立并进军海外移动端播客市场,填补了市场空白,注册用户曾一度达到 3000 万,位列第三方播客产品榜首。如今,这位毕业于北大心理学系,有着多年开发经验的前 Google 员工,正沿着她的创业路径,领导着一个有着 50 多款产品和全球 5000 多万月活用户的公司。邀请 Renee 来,是我们看到了AI浪潮中,她如何通过自身快速的学习,不仅上线了数款AI native 产品,更是将AI技术迅速融入到各个产品的工作流中,甚至实现了组织和人才的整体进化。过去这么多年打造海外产品的心得,在AI时代有怎样的变与不变?有历史的创业者,如何带领自己的组织实现AI化的进化?相信你可以从 Renee 分享的一线实战心得中得到不少启发。这次两个小时的对话中,你也能感受到这位真性情的女性创业者。一路走来的蜕变与成长。我们聊得开心,也希望你听得有收获又尽兴。Enjoy!嘉宾介绍 王小雨 Renee(公众号:Renee创业随笔): Castbox 创始人兼 CEO(we are HIRING! [email protected]) OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学我们聊了什么Renee 的创业经历:从 Castbox 到产品矩阵01:50 北大心理系、大三自学编程、勇闯 Google 后选择离开创业11:20 创立 Castbox,月活一度达 3000 万13:56 单一产品商业化困难,转型矩阵式打法创始人如何有效组织和管理公司?21:27 发挥各家优势是跨国组织的效率密码22:47 Founder Mode 带来的启发:不管规模多大,创始人一定要抓细节应用 AI 技术给一家公司带来了什么影响和挑战?27:39 从生产到推广环节,AI 技术应用带来了历史最快的增长33:41 如何在公司中推广应用 AI:founder 要能够发掘出水下的新技术人才39:03 矩阵式打法背后:以市场和收入为导向会更轻松44:14 面对大模型生产力转化的不足,主动增加工程投入有价值吗?创业者视角 VS 投资人视角;单一产品做大 VS 矩阵式生意47:52 聊聊投资者与创业者心态的不同,做生意和做事业如何选择54:42 互联网产品早期就得砸钱吗?55:53 不是所有互联网产品都是赢家通吃,学着接纳多样化产品的自然规律如何在当下做好一个 AI 产品57:52 只看应用层,最后满足的还是用户需求;为什么说品类和组织能力是关键61:42 今天的 AI 产品经理需要真的懂 AI,知道 AI 的边界在哪66:56 潜力产品的两个特征:符合成瘾机制 + 激发心流状态聊聊创业本身,有关创始人的心态和行为71:31 创业作为一种生活方式,4000 weeks 如何教会我放弃执念,更有耐心77:19 如何决定是否要拿投资人的钱?为什么不要迷恋宏大叙事,先立地,再顶天81:39 创业者的悲观与乐观84:51 出海创业者一定要到美国去吗?88:40 快问快答:如何与自己和解,断舍离,对我影响大的人我们推荐的内容 公众号:Renee 创业随笔 创业的耐心 悲观的乐观主义者 Founder Mode By Paul Graham 上瘾——让用户养成使用习惯的四大产品逻辑 Hooked: How to Build Habit-Forming Products, by Nir Eyal 《底层逻辑2》by 刘润:商业的加减乘除 闪电式扩张 Blitzscaling: The Lightning-Fast Path to Building Massively Valuable Companies, by Reid Hoffman, Chris Yeh欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!M小姐研习录 (ID: MissMStudy)欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
    --------  
    1:40:03
  • EP 60. 全英文对话CRV投资人与LanceDB创始人:向量数据库下半场,大模型和多模态需要怎样的数据基建?
    OnBoard! 又一期全英文访谈来啦!去年采访 MosaicML ($1.3Bn 被Databricks 收购)的CTO Hanlin Tang 和 Sapphire Ventures 合伙人 Casber Wang 的那期节目很受欢迎,创始人和投资人从不同角度探讨一个话题的形式看来很值得再尝试一次。这次的两位嘉宾,Monica 也是期待已久啦!Hello World, who is OnBoard!?这次我们来聊聊硅谷一直以来的投资热点:大模型应用的数据基础设施。去年方兴未艾的 vectorDB (向量数据库),现在竞争格局有了怎样的演变?AI应用场景中多模态数据的增加对于 data infra 会带来怎样的挑战和机遇?这两位身处硅谷一线的嘉宾,太适合深入探讨这个话题了:创始人嘉宾 Chang She,LanceDB 的 Co-founder & CEO。LanceDB 是一个为多模态数据设计的开源向量数据库。Chang 是 data infra 的老兵了:他是著名的 Pandas library 的核心贡献者之一,他创立的 Datapad 几年前被Cloudera 收购。2022年,Chang 又开始了第二次创业征程,创立了LanceDB.VC 嘉宾 Brian Zhan,是硅谷50年历史的顶尖老牌早期基金 CRV的投资人。他们最新一期基金超过$1.5Bn, 投资过的 startup 包括DoorDash、Airtable, Vercel 等等。Brian 曾在 Meta 做 data infra 产品经理,后来加入了开源数据库独角兽Starburst。少有的有技术和产品背景的 infra 投资人!Brian 在2023年底领投了 LanceDB $8M seed轮, LanceDB 至今总融资额超过$11M. 现在,LanceDB 的用户已经囊括了一众头部 GenAI 公司,包括 Character.ai,Midjourney,Harvey 等等。我们还畅谈了Chang作为连续创业者的心得,以及两位对开源商业化模式和 data infra 热点话题的一些犀利观点,他俩的配合也是非常有趣。Enjoy!嘉宾介绍 Chang She (推特 @changhiskhan): Co-founder & CEO @LanceDB. 曾任 Tubi VP Engineering, 2013年创立的 Datapad 被Cloudera 收购。Pandas library 的核心贡献者。 Brian Zhan(推特 @brianzhan1):Investor @CRV. 加入CRV 之前,在 Meta 和 Starburst 担任 Presto 产品经理。 OnBoard! 主持:Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学我们都聊了什么02:15 Speakers' self-intro, which data infra project Chang found interesting05:20 Why CRV invested in LanceDB07:50 Why Chang started LanceDB, and why customers use Lance and LanceDB18:36 Investor's view on VectorDB - how LanceDB stand out from the competition? Why does it have the potential to become a platform?27:47 Will there be a convergence of vectorDB? How do we think about competition from incumbent databases such as PGVector by Postgres?32:57 Takeaways from the announcements from Databricks and Snowflake summits in June 202436:15 When do we need a new data format? Why is opensource important for data format?43:14 How will AI change the data infra landscape? What will stay, what will be replaced, and what will emerge?52:31 Why does Chang think that RAG is similar to recommendation systems?55:34 How to evaluate if a new opportunity is for incumbents or startups?57:57 What are some common mistakes in building data infra? Why does Chang think that opensource is not a default mode?60:05 How to view OpenAI's acquisition of Rockset?74:14 Is RAG system here to stay?79:11 Chang's lessons as a second time founder? Advice to technical founders.87:04 Brian: What early investors look for in early stage startups90:47 What do the speakers find exciting about AI in the next 1-3 years? AI agents, healthcare, robotics, multimodal (voice, video gen)99:36 Quick-fire questions: book recommendations, what's underrated and overrated, oat milk and pressure relief我们提到的内容 LanceDB: An open-source vector database designed for multi-modal data. Lance format: A storage format that improves the performance of LanceDB. Panda: A popular Python library for data analysis and manipulation. HDFS: The Hadoop Distributed File System, a scalable storage system for large datasets. Cloudera: A leading provider of enterprise data cloud solutions. Data fusion: The process of combining data from multiple sources into a unified view. Presto: A distributed SQL query engine for big data analytics. Parquet: A columnar storage format that is efficient for data analysis. Postgres: A powerful, open-source relational database management system. PGVector: An extension for PostgreSQL that adds support for vector embeddings. Unity catalog: A centralized metadata management platform for data discovery and governance. Prefect: An open-source workflow orchestration platform for data engineering pipelines. Dag works: A cloud-based data orchestration platform for building and managing data pipelines. Airflow: A popular open-source platform for programmatically authoring, scheduling, and monitoring workflows. Voyage AI: A startup focusing on building a platform for autonomous vehicle development. Reflection AI: A startup that uses AI to help people understand and improve their communication skills. Decagon AI: A startup that builds AI models for scientific discovery. Rockset: A real-time analytics database built for the cloud. RockDB: A high-performance embedded key-value store.参考文章 www.ycombinator.com blog.changshe.io blog.lancedb.com medium.com www.snowflake.com www.databricks.com Databricks + Tabular:www.prnewswire.com openai.com欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!M小姐研习录 (ID: MissMStudy)欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
    --------  
    1:54:15
  • EP 59. 对话硅谷连续创业者梁胜:20年3家公司总并购金额10亿美金,征战GenAI的走心创业思考
    OnBoard! 终于又上新啦!这一期的嘉宾是一位少有的硅谷成功连续创业者,梁胜,他创立的三家公司都被成功并购、累计退出金额达10亿美金!Hello World, who is OnBoard!?国内很多朋友可能不是很熟悉梁胜,但是在开源和 infra 领域,他绝对是鼎鼎大名。从2000年第一次创业开始,他亲历了云计算整个崛起的20年。最近一次,他2014年创立的Kubernetes 管理平台 Rancher Labs, 融资超过9000万美金,2020年以超过6亿美金被SUSE 收购。2022年,他又开始了新的创业征程。这一期超过2个小时访谈,你会听到一个硅谷创业老兵非常真实的创业和技术思考。每一次创业都经历了大小的转型:作为创业公司,如何在早期发现看似很小的机会?如何避开直面大厂的竞争?如何在快速变化的市场中做各种战略性的取舍?都是最一线的经历。这一次创业,梁胜的公司在我们的对话之前,也刚刚做了一次pivot 转型,从 infra 开发工具,也进入到生成式AI领域。他们发布的GPTscript, 让开发者可以用自然语言进行编程。我们对话之前,编程 agent Devin 刚刚横空出世,梁胜如何看待这次AI大潮对于开发者生态的颠覆性影响?这次 pivot 背后又是怎样的心路历程?不论你希望了解在开发者工具和开源领域创业,在硅谷的创业公司收并购,或许你也是在日新月异的AI领域探索的创业者和从业者,相信这一期真诚又有干货的访谈一定让你受益匪浅。因为种种原因,这一期其实是今年4月Monica 在硅谷的时候录制的。不过我们谈论的很多内容现在也没有过时!接下来我们还有好多存货要放送,敬请期待!Enjoy!嘉宾介绍梁胜,Acorn Labs 联合创始人 & CEO. 中科大少年班,耶鲁大学博士,创办了Cloud.com (被Citrix 2亿美金收购),成为Citrix 首位华人 CTO。Racher Lab 创始人& CEO, 2020年被SUSE 以6亿美金收购。2022年创办 Acorn labs, 融资超过千万美金。OnBoard! 主持 Monica:美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学我们都聊了什么02:00 Sheng 的自我介绍,24年前如何在硅谷第一次创业06:43 影响最大的投资人:不做到世界第一就不值得做?不同领域会有什么不同吗?13:55 用做到世界第一的思维,如何影响企业的决策?16:02 如何开始 Racher Labs ($600+M 收购) 的创业:创业越来越难了,Rancher 如何转型,如何被收购20:44 公司收购之后,在大公司里亲历创新者窘境,startup 为什么要创造新的市场25:48 为什么创业公司一定要从小的市场开始做?28:11 Rancher 定义新的市场的挑战,为什么觉得在5000万美金收入的时候卖掉?33:36 为何决定从收购的公司出来,开始第四次创业?要为AI开发者提供怎样的工具?39:18 为何 AI 应用开发需要不同的平台?平台的重构为何是随着应用改变?为什么说kubernetes 以后可能不需要了?44:39 Pivot 到AI产品的过程:GPTScript 如何诞生?用自然语言写应用是怎么实现的?54:33 如何克服大模型直接写应用的技术难点? 如何从用户需求角度思考不同场景的技术需求?60:54 为什么说现在以数据库为核心搭建的 RAG 走进了死胡同?64:07 过去几次创业经历,让我不再担心大厂? Agent 现在看着市场越小,对创业公司越好?70:22 如何思考是否应该开源?为什么说开源是最低成本的试错?最好的开源是“为自己做”?76:00 开源商业化模式有什么最佳实践?为什么说开源的困难其实都是市场太小?78:49 做开发者工具的生意有什么误区?开发者很难挣钱吗?81:56 创业过程中最大的挑战是什么?为什么说创业机会不是 evaluate 出来的?第一个客户怎么找?87:17 快问快答:推荐的书,创业以来的变化,期望AI会带来什么变化,创业者如何解压?我们提到的内容 GPTScript by Acorn Labs Devin/Cognition Lab: www.cognition.ai -构建端到端的软件代理,特别是Devin,第一个AI软件工程师。 Citrix: www.citrix.com - 一家云计算和虚拟化技术公司,提供服务器、应用程序和桌面虚拟化解决方案。 Kubernetes: kubernetes.io - 一个开源容器编排系统,用于自动化软件部署、扩展和管理。 Redhat: www.redhat.com - 一家领先的企业开源软件解决方案提供商,包括红帽企业Linux和OpenShift。 SUSE: www.suse.com - 全球领先的创新、可靠和企业级开源解决方案提供商,专注于Linux和云基础设施。 RAG: 一种大型语言模型架构,它将信息检索系统与文本生成模型相结合,以提高事实准确性并提供最新响应。 推荐的书:Zero To One, by Peter Thiel参考文章 www.acorn.io www.forbes.com Acorn Labs 介绍 GPTScript 介绍 Acorn Lab 转型欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!M小姐研习录 (ID: MissMStudy)欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加任意一位小助手微信,onboard666, 或者 Nine_tunes,小助手会拉你进群。期待你来!
    --------  
    1:32:14

More Technology podcasts

About OnBoard!

Hello World, who is OnBoard!? 两个爱码字的投资人关于科技创业与投资的真诚对话。 关注主播: Monica:美元VC投资人,前 AWS 硅谷团队+AI创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学 GN:前SaaS及科技投资人,Global SaaS社区Linkloud发起人,公众号我思锅我在 (ID: thinkxcloud) 主理人。| 即刻:High 宁 同名 Podcast 在各大平台都有哦: 喜马拉雅, Apple Podcasts, Spotify, Google Podcasts, Overcast 都可以找到~
Podcast website

Listen to OnBoard!, Lex Fridman Podcast and many other podcasts from around the world with the radio.net app

Get the free radio.net app

  • Stations and podcasts to bookmark
  • Stream via Wi-Fi or Bluetooth
  • Supports Carplay & Android Auto
  • Many other app features
Social
v7.1.0 | © 2007-2024 radio.de GmbH
Generated: 12/19/2024 - 4:05:56 AM