就是它的产品力其实没有那么强
它可能花了大量的费用去扩展客户
然后讲这样的故事
但是可能在产品上角度来讲的话
由于它并不是一个纯医疗的这种
它没有这个能力
去把这个所有的几百个基因
全部检测一遍
这样给大家的反馈
经常就会有人说拿到这个数据以后
然后呢
所以他更多的还是就像一个玩具
他不是一个
就是为了非常专业的好奇心
对不是一个特别专业的事情
对
因为我看见现在的很多基因检测公司
比如说像有一个叫做SelfDecode的
他们就说
他们的基因检测其实就比23andMe
它的数据范围会深100倍嘛
所以新一类的公司
包括你说一些专业的相关靶点的
测垂直领域的公司
他应该是能测的范围还蛮深的
对就是这个产品的形态吧
就是我觉得现在更新一代的公司
可能大家就是比较专注
比较垂直
在某一个疾病领域
或者说某一种类型
比如说他专门就是测的肠道微生物的
进行检测
或者专门测的是跟某一个癌症相关的
大肠癌的基因检测
它就会把这个做的非常的垂直
而且它可以利用起来很多这种数据库
但是23andMe它更提倡的是一个所有的基因
它全测
可能就是让人感觉有点业余吧
对23andMe给我的印象
还有这样一个印象
就是我感觉
他其实在跟资本市场
去讲这样一个故事
我们并不是靠卖基因检测赚钱的公司
我们有了很多人的基因检测的数据库
这些DNA的数据库
这些数据的价值是非常独特的
他可能是想学互联网的搜索模式
就是我们提供服务
可以是低价甚至是免费的
但是我怎么样去用这个数据赚钱
但我看他具体也没有玩出来什么
反而是因为这个模式
就是因为他最近有几次黑客事件
跟数据泄露事件嘛
就比如说2023年
他是泄露了
大概有690万客户的一些敏感信息
导致他自己还陷入了官司
支付了3,000万美元的可解金
而且这个事情一来
我觉得对他们公司跟消费者的信任
之间的冲击力
是非常大的
就相当于彻底摧毁了
大家对这个公司的信任
就更不想去了
是的
其实他在最开始每一轮融资的时候
都会讲这个数据的故事
其实
我们在这里经常接触到的一些投资人
也会说啊
这个公司最重要最值钱的是他的数据
他的数据可以用来做什么呢
对其实这就是一个特别好的问题
嗯有的时候也会想
就是问这个投资人他
是有很多数据
但这些数据怎么去变现呢
就是因为我们知道
这个数据是不可以随便商用的
理论上23andMe声称呢
它的80%的用户都是有同意
可以把数据去用于研究啊
或者是用于其他的一些用途的
那这个数据包括什么呢
除了说这些个人信息以外呢
就是它的这些生物数据
这些生物数据呢
在以前可能在我们还没有这么多
各种各样的技术之前
比如说80年代90年代的话
大家可能感觉不到它的重要性
但是现在其实是非常重要的
当时23andMe被黑客黑了以后呢
大家就开始想
这个黑客为什么要去黑他这种数据
其实这个有些使用场景啊
就比如说这些数据
首先它可以卖给一些保险公司
我也是后来看了一些报导和资料以后
才想到的
我就想啊
还能这么玩呢
就比如说这些保险公司呢
它会通过这个信息呢
看到每一个人患病的一些风险
那这个时候呢
如果你买了这保险
但是你最后真的患了这个病
他就可能拒绝你的理赔
因为说你本身就是自带的这种病
而不是一个突发的
比如说像一些重疾险
其实他只保一些unexpected
就比如说一些保险
其实他都会让你填一些既往的病史
还有一些家族的遗传的风险
尤其比如说像高血压呀
高血脂啊
还有这些心脏病啊等等
你可能当时没有填
但是其实你的家族里面是有这个信息
但有可能我们自己也不知道这个信息
是吧我们不去测的话就不知道
对对
所以这个是一个比较负面的一种作用
当然还有一种作用呢
就是
它是可以帮助一些有这种坏心思的人
去骗保这个也是一个非常坏心思
骗保是什么情况
这个骗保的话
可就跟刚才描述的是一种相反的情况
就是一些不法分子
他会知道有一些人
他有这些疾病的风险
而且是风险比较高的
那这时候他可以专门去买这个保险
那这个时候保险公司没有这个信息
但是这些骗保的人有这个信息
那他得了病以后
他就可以骗取高昂的保费
除此之外呢
还有一些
因为我们现在是有很多都是这个
我们叫biometric的一些生物识别的
你说指纹识别
比如说像指纹识别
对虹膜识别
对现在呢
更多的设备是这些
但是我们可能就看有些电影里面啊
其实它是有跟基因相关的
或者说未来它会有跟基因相关的
这种识别
其实更准确的吧
因为有时候看那电影里面
不是他拿个胶带去把那个指纹粘下来
就可以去复制
但是基因的信息是没有办法复制的
现在的基数
我们认为是没有办法复制的
但是如果说有人去复制了
这个基因的信息的话
他就可以去盗取很多东西
但是我觉得现在基因的识别
还没有上规模吗
对当然这是一个风险吧
那我其实还在想
除了保险公司的场景以外
还有哪些场景
这些DNA的数据是非常值钱的
对然后还有的话就是一些商业价值
现在看到这些基因的数据
很多这种临床数据啊
或者测序的数据
很多
医药公司是用来帮助他们去做研发
等等当然这些的话
就是如果说他的数据来源是合法的
这是一个非常好的事情
因为它确实可以加速
我们整个药物研发的进程
但是我们可以看到
就这个数据呢
如果是合法的途径
比如说医院
它管理是非常非常严格的
而且举个例子
比如说我们中国人在中国测的数据
是不允许到国外去的
我们这个管理是非常严格的
包括我们这种生物样本
比如说从23andMe这里的是唾液的样本
现在23andMe手里
就有几千万人的唾液样本
这就是生物样本
那这个样本如果是被窃取的话
肯定也是非常危险的
就像国内之前有过一个很大的案件
就是有人把医院里面的血样
偷偷拿出来
然后卖给了国外的公司
那这个人就是最终被判刑
是非常严重的
他就属于涉及危害国家安全这样子
这个血样卖给国外的公司
可以用它来做什么呢
他拿到这个以后
其实目前呢
他真正用来商用的是比较少的
但是
这个可能涉及到一些跟安全相关的
比如说生物武器
嗯所以整体上来说就是几件事
一个是用户增长有限
然后成本还是很高
然后数据泄露
我看他们管理层最近也很动荡
对毕竟现在的这个公司
市值已经低的非常低了
而且也收到了退市的风险警告
所以
公司现在肯定是一个不太健康的状态
而且这些都是恶性循环吧
就是越是业务做的不好
高管也动荡
然后业务就会越来越差
嗯那你觉得除了像23andMe
还有一些
刚刚我们其实你有提到Ancestry
还有My heritage
有这样的一些老牌的基因检测公司
他们是否也会面临一些同样的挑战呢
其实我觉得行业带来的挑战
或者用户增长挑战是普遍存在的
但是我们会看到
刚刚提到的这两家公司
比如说像Ancestry
它可能现在比23andMe更要健康
为什么呢
因为Ancestry这家公司呢
它本身是一个关注追溯你的祖先
然后你的家族历史等等
所以说它的用户在早期积累的时候
就已经是非常感兴趣这个方面的人
他有大量的用户积累
然后他才引进了基因测序的技术
去帮助他的用户去理解他的祖先啊
还有他的整个家族史的发展
所以从这个角度来看的话
在Ancestry的产品里面
它的这些用户需求
不是它自己创造出来的
而是已经存在的
然后它现在整个的数据库
其实比团队虽然蜜还要大
可能是两倍于团队虽然蜜
它现在是全球最大的经营数据库之一
2015年的时候呢
它的收入其实就已经突破了10亿美元
我们知道他的宣传
蜜的融资金额可能是十几亿
但是2015年的时候呢
其实他的收入就突破了10亿美元
而且其中8亿美元是会员订阅
就是subscription
那我们知道
会员订阅这件事情就会发生
这种重复的付费
这也是23andMe始终无法能够越过的一个山丘
但是呢Ancestry这家公司在很早的时候
就通过这个会员订阅
已经实现了非常高的一个收入
嗯我们在聊
新旧基因检测公司的整个话题
以前啊
我花一点点时间跟大家讲一下
为什么我现在突然想到了
要做这个选题
大概在今年年初的时候
我看了一本书叫做超越百岁
它其实也是一本
最近在整个生物医学圈非常有名的书
其实它里面就提到了
三代医疗的这样的一个概念
就是医学1.0、2.0、3.0
医学1.0基本上是以希伯克为代表的
他其实就是直接观察得出结论
举个例子
比如说以前发现在医院里
医生早上检测完尸体
下午去接生
就发现新生妈妈的死亡比例非常高
然后大家当时比如说你基于直接观察
知道啊这两者之间可能不太对
但是大家也不道为什么
就只能观察成
可能会走向一个迷信的那一端
然后后来发现了细菌
就知道哦
检测完尸体
要洗手才能去做接生的这件事情
其实
这就是慢慢的把这个医学1.0向2.0再引
直到青霉素的发明
他才是医学2.0
真正的一个规则的改变者
所以其实在整个医学2.0时代
我觉得人类还是取得了很多的进步的
比如说
我们通过疫苗快消灭了小儿麻痹症
饼干也可以治疗了
有很多很多这样的例子
但是整体来说
医学2.0的表现是它在治疗癌症
方向就是这些长期类的疾病
表现还不是很好
因为它其实是
帮助人去延缓死亡的
最近呢我就观察到作者
他是提出了医学3.0的理论
整个医学3.0就是说
我们的目标其实是要维持我们的寿命
还有生活质量
所以呢我们其实是有办法通过运动
还有营养饮食去改变自己的生活习惯
来达到这样的目标的
然后呢他还在那本书里面
其实有讲到这个四大骑士类疾病啊
就是像心脏病癌症糖尿病
还有神经性退性疾病
比如说像阿兹海默症这样的疾病
这四大疾病
其实是人类死亡的排名靠前的几大类
吗引起我关注的是
它的所有的这些预测跟数据
它都不是凭空发挥的
而是
它是监测到了一些具体的健康的指标
比如说它在讲到心脏病的时候
它提出了一个基因叫做ApoB
他就发现
ApoB它其实比简单的
我们现在常规体检的这个坏胆固醇
它是跟整个的心血管疾病相关性更高
更能去预测这些指标的
然后我就发现
比如说
你现在去跟医院去做一个常规的体检
他的这个体检里面
其实是并没有包含这些指标的
因为硅谷一直以来关于健康啊
养生方向
抗衰方向一直是走的非常前沿的
所以我是查到了一些公司啊
就比如说硅谷的很多公司
包括一些新的级检测公司
像InsideTracker这些公司
它是可以检测ApoB的这个指标的
在查整个资料的过程中
我就发现
其实基于大家对细分市场
对抗衰对长寿的这样的一些需求
整个硅谷的基因检测它是
在一个全面爆发的状态是
出现了还蛮多这样的新公司的
是的我觉得刚刚说的这个
从1.0到了2.0就是一种进步吧
其实像刚刚提到的
早期的时候大家都是这种经验科学
因为那个时候我们得到数据的手段
可能就是用双眼观察
然后做一些这种感官上的记录
到了后来呢
就有了更多的手段
刚刚提到跟这个心血管疾病相关的
比如说坏蛋蚊虫啊等等
那也是因为可能很多个decade
就是几十年前现代医学发展以后
大家抽血
然后去检查血液里面的一些蛋白啊
脂质啊等等
这些生物分子
通过它的含量跟疾病联系起来
其实也是一种观察
只不过是多了血液检查了这一步
那到现在呢
其实我们刚才说的
让ApoB是作为一个代表啊
就是它作为一种基因
然后我们也把这个基因的表达量
跟疾病去结合起来了
等于说
我们是一直都在用新产生的数据类型
跟我们实际人体表现出来的疾病
去做一个关联
然后再不断的学习这个规律
我们就可以总结出来
什么样的基因
可以引导向什么样的疾病
其实我觉得从这样看的话
真正在发展的还是这个检测的技术
还有科学观察的一些手段
对对对对对
你说的很对
那在23andMe之后
你觉得出现了哪些新的基因检测公司
23andMe是2006年建立的
也是快18年过去了
对整个浪潮已经变化好几次了
是
你要不要讲一下新一代的这些公司
他们的一些特征是什么样子
嗯对
有几个大的节点
整个行业
23andMe创立的时候确实比较早
是2006年的时候
那个时候早到我们
可能还没有进入到生物医药领域
还在上学
那那个时候呢
我觉得23andMe
它整个是以一个互联网形式
来运营一个生物技术的产品
它是依托于他们当时有的一些技术
比如说刚刚提到的二代测序啊等等
但是后面它的主要工作
我觉得不是在尝试更多技术啊
或者说测序仪的突破
它更多的是想办法运营这个产品
想办法做出这种to c的
一些商业的结果
那现在呢
我们看到现在可能更健康的
或者更新的
这公司呢
我觉得是有两个特点啊
一个是有的基因测序公司呢
他们是依托于
或者说他们开发了自己的测序技术
有更好更高效的测试技术
比如说湾区的另外一家公司叫10X
就是10X Genomics
这家公司呢
其实是非常知名的一个公司
10X Genomics这家公司呢
一开始也是靠融资融了过亿的美金
它成立于2012年
相当于是晚于23andMe
但是他们呢
有一个革命性的DNA测序技术
可以加快整个基因组的测序
而且它的收入增长是特别特别快的
就它并不是说大家去把基因给到它
它单个单个的去给你测序
它可能是卖的这个Kit
然后呢这个Kit是可以用来去测序的
它更多针对的客户呢
其实就是科研机构
还有其他的基因检
测公司因为它有非常好的技术
有两种技术
一个是可以测试DNA短序列的
叫linked raise
还有一种
是对单细胞RNA进行测序的一些技术
所以这两种技术呢
大家听起来就会觉得它好像更高端
更复杂一点
就是它并没有直接说
这个技术是用来跟某种疾病联系的
因为它可以做所有的这种测序
这个场景是非常广的
它可以跟很多科研实验室去合作
然后跟很多公司去合作
它每测一次它是直接收费的
所以说一个是service based
然后是这种试剂耗材类的销售
然后还有它设备的销售
所以它的这个商业模式呢
跟直接ToC
做成一个互联网消费的
这个产品是不一样的
市场规模也更大
嗯所以听起来
博客
-
E171_濒临破产的23andMe与基因检测行业的新旧交替(2)
-
E171_濒临破产的23andMe与基因检测行业的新旧交替(1)
欢迎收听硅谷101
我是泓君
今天我们要聊的这个话题
对我来说有一点点危险
说它危险呢
是因为我认识非常多优秀的记者
还有投资人
都在这个行业里面摔过跟头
那这个行业呢
就是基因检测
另外
最近硅谷也有一家明星的独角兽
正在濒临倒闭
它就是 23andMe
23andMe on the verge of getting delisted now
from the Nazdag
due to a shortfall
and the number of independent directors on its board
a major cyber security breach at 23andMe
led to personal information for millions of people
going up for sale on the dark Web
23andMe是一家直接面向消费者
提供基因检测服务的公司
就是客户吐一口唾沫样本
然后他们收集来
就可以做客户的DNA分析了
那这家公司在2021年上市的时候
市值还有60亿美元
三年过去了
它的市值如今只剩下巅峰时期的2%
而且我们说股价暴跌
客户流失
内部的矛盾也是特别多
今年8月份
23andMe
关闭了公司内部的药物研发部门
9月份所有的董事会成员集体离职
原因呢是他的联合创始人兼CEO Anne Wojcicki
她提议以每股40美分的价格
将公司私有化
这家公司从成立以来一共融资了26轮
18年以来还没有盈利
它的CEO
将原因归咎于市场竞争的加剧
也就是说
新一代的基因检测公司们
正在快速崛起
根据行业分析公司grand view research的
报告
直接面向消费者的基因检测市场呢
预计会在未来的几年内飙升
从2023年的19亿美元
增加到2030年的88亿美元
那今天我们就一起来聊一聊
基因检测行业新旧交替的机会与危险
那今天跟我在一起的
是N1 life的联合创始人与CEO Janice
她的中文名字是臧晓羽
hello Janice你好
hello泓君
开始
要不要跟大家先简单介绍一下你自己
大家好我是Janice臧晓羽
今天非常高兴有机会来到硅谷101
跟大家交流啊
我是博士毕业于斯坦福大学
然后一直从事的呢
就是生物医药还有Biotech这个行业
2018年毕业之后呢
我就创立了N1 life这家公司
目前呢我们是base在
硅谷还有苏州的一家Biotech
那提到基因检测
其实硅谷有一家非常知名的公司
就是23andMe
它其实也是谷歌的创始人谢尔盖布林
他的前妻Anne Wojcicki创建的
这家公司呢
从2021年上市以来啊
可以看到他现在的市值是急转直下
可不可以跟大家分析一下
这家明星的基因检测公司
到底是怎么样陨落的
为什么短短的三年时间
发生了一个这么大的转折
对其实这家公司
是非常有代表的一家硅谷公司
我觉得而且
其实离我们现在这个录音的地方
很近啊他的总部就在mountain view山景城
这个地方
就是从它的出现一直到现在
可能也就是十几年的时间
在最初创立的时候
这家公司其实是吸引了大量
的目光以及投资
刚刚提到的这个创始人和他的CEO
Anne Wojcicki她不仅仅是谢尔盖的前妻吧
她的姐姐也是一个非常有名的YouTube
YouTube的前CEO
对虽然现在她已经过世了
但是就是她整个家族都是非常有名
而且是活跃在科技圈的
所以当时呢
按他在创立这个公司的时候呢
其实是因为2000年到2010年
这个时候
人类全基因组测序的这个计划
得到了很大的进步
就是有很多技术上的进步
然后大家也看到了
这个human genome project是有非常大的潜力
可以帮助我们在医疗啊
在健康啊等各个方面
去理解人体的一些表现
所以呢她就是有着硅谷创业的激情
以及她的专业背景
她自己呢
因为是毕业于耶鲁大学生物专业
然后他呢
就是有这样的一个背景吧
也看到了这样前景
所以呢她就创立的这个公司
当然那个时候呢
也是因为硅谷的投资都比较活跃吧
她这个公司刚创立呢
其实就得到了很多的融资
包括来自谢尔盖布林的投资
大家如果看这个资本的记录的话说
它成立之后总共的融资轮次有26轮
总共包括它上市的时候融的钱
可能有十几亿美金
但是现在呢
就是急转直下
现在账上的资金嘛
华尔街时报估计可能只能坚持到2025年
对所以这个过程
其实还是非常令人唏嘘的
但是我觉得这个公司的出现以及发展
其实打破了很多行业固有的一些成见
还有打破了一些壁垒
因为我们知道人类基因组这个计划
总共的花费是超过了30亿美金
所以说在那之前
所有的基因测序技术
是非常非常昂贵的
但是随着技术的进步吗
23andMe做了一个
我觉得非常有突破性的事情
就是把非常昂贵
感觉门槛非常高
离普通人生活非常远的技术
带到了我们日常的生活中
它把一次测序
最终它的价格就是99美金
所以它是首先把价格降下来的
嗯对的对的
它为什么能把价格降下来呢
我觉得它是第一个把价格降下来
并且是直接to c的一个公司
嗯这个还是挺重要的
其实它并不是第一家基因检测公司
我们知道基因检测这个事情呢
其实很多公司在做
但是更多是ToB的
比如说在美国的这个LabCorp
还有Natera等等
都是跟医院去合作
然后去做这些基因检测啊等等
但是23andMe可能是最早的
直接ToC的基因检测的公司之一
嗯
大家为什么会有检测自己基因的需求
跟动力呢
你说在医院的话
其实我非常能理解
比如说一个新生儿
我们送他去基因检测
看他有没有一些基因缺陷
或者是有医疗需求
对有医疗需求的
或者是你得了什么特殊的疾病
我们需要找一些靶点
那消费者直接去做基因检测
他的动力是什么呢
我知道他们最开始有一些
在一些名人的派对上
然后大家去吐唾沫
通过这个明星效应的带动
让很多人去检测自己的基因
对但是我还是不知道
普通人他去检测这个
他的需求是什么
在更早的时候
对其实我觉得
更多的是满足了大家一个好奇心
或者是猎奇心理
其实这么说的话
我觉得这个探寻人觅
还是挺互联网的一个公司啊
就是它是利用了这个名人的效应
因为创始人的家庭啊
还有他们投资人带来的这些光环
使他能够通过名人去宣传这个产品
然后普通人就会去效仿
那另外一点呢
但是它其实并不是第一个啊
就是美国还有德国早期有两家公司
例如有一家叫Ancestry
他们其实更多的是一个族谱
就是他让你去探查你的祖先是谁
所以大家会有这个好奇心
因为现在比如说美国吧
我们以前也学过
美国是民族大熔炉吗
就是大家会好奇我到底是什么人种的
所以说他就是利用了大家
一个这种好奇的心理
说是用一种更科学的手段
可以满足这个好奇心
那这个时候大家一看哎
只要100美金可能就还行
所以呢
就会有一些消费者去做这个事
你有做过吗
我没有做过
哈哈哈对
我其实并没有做过
我觉得
可能因为我对我的家族史太清楚了
哈哈哈嗯
所以对这个没有太大的好奇心
但是你有做过其他类型的
比如说在医院的这些的基因检测
对
这个我觉得就是非常重要的一个区别
就是我们到底把基因检测
作为一个消费产品
还是一个医疗产品
作为消费产品的话
就类似于刚刚讲的一些
其实我就没有尝试过
我觉得好像
它并不是一个刚需
但是在医院其实还是做过的
比如说现在会有给女性做的
一些生育的一些检查
她会检测DNA啊
或检测有没有染色体的缺陷啊等等
这些是这种医疗需求的
还有就是这些癌症早筛等等对
那为什么它在ToC的场景呢
首先把价格降下来
针对ToC的检测跟ToB的检测
这两个点它的不一样的地方在哪里呢
我觉得这个价格能降下来的话
其实跟整个技术的进步也是有关系的
基因测序仪
对基因测序仪这个设备的技术
我们知道很有名的公司
比如说Illumina
这家公司呢
其实就是行业的标杆
或者说它就是一个领头羊
从Illumina最重要的这个技术呢
我们叫二代测序
或者叫next generation sequencing NGS
这个技术一出现呢
首先它的测序的速度
还有它的通量都提高了
这个时候我们不需要一个样本
一个样本去花很多天去测
它可能可以收集很多样本
然后一起去测
那这个时候它整个成本就降下来了
所以说像23andMe
它最早期开始的时候
它收集大量的消费者个人的这种样本
然后把它集中到它的中央实验室去做
这时候其实它的成本确实低很多
就是一次性测的越多
它的成本越低
对为什么呢
大家可能听过一个词叫开机费
就是有的时候你会去医院
比如说查血什么
他会说早上出完血说下午会出结果
就是因为他要collect
他要收集所有人的
样本然后一起去做一个实验
这样的话
其实它的整个的耗材的使用啊
还有它机器运行的费用等等
都会平均到每一个样本上
所以这个机器是一个耗材型的机器
这个设备本身是一个硬件的设备
但是呢
每一次做这个基因测序的时候
因为它包含了多个步骤
它首先呢是要提取这个DNA
从样本里面
比如说血液呀
口腔黏膜啊等等
提取了DNA这个过程
其实就需要一些提取的试剂
然后提取完了以后呢
就要扩增
因为那个含量是非常非常低的
扩增这个过程也需要一些试剂啊等等
然后扩增完了以后再去测序
那其实这过程中呢
使用了很多试剂和耗材
这些呢是消耗品
每一次每一个样本的固定的成本
嗯所以这个消费产品和医疗产品
它的场景也是不一样的
比如说我们在医院里
尤其是在美国去进行基因检测的时候
是医生开的一个处方
下了这个处方之后
我们再去做这个检测
然后这个时候是保险是来支付的
所以说这个里面的费用呢
其实是保险支付
其实它是比较贵的一个费用
但是我们没有直接支付
所以感受不到它的费用的高低
但是像这种消费产品呢
像23andMe这样的话
其实它当时全部都是用户自己去支付
所以它必须要把这个价格降下来
其实
23andMe最早期技术建立的时候呢
也确实是在设备啊
还有整个它自动化的流程上
做了很多的创新
和突破这才使得它能够承受
99美金的这个价格
但是我们如果看他财报
确实发现从他创立到现在
他是没有盈利的
所以说这个里面肯定还是有很多
这成本还是没有彻底的打下来
对打下来了一部分成本对
嗯我觉得还是在努力的过程中吧
他们可能一开始希望通过价格降下来
然后以量取胜
薄利多销这种感觉
可但是在他这个用户增长啊等等
可能就是ToC的market还是比较难做的
就是我理解
你去购买一个测序仪这样的机器
它其实是一个非常大的成本
那按理说
这个机器
它其实放在这一直测就可以了
它中间是有很多的稀缺的一些制剂
或者什么东西
它会占到一个比较大的成本嘛
是的
比如说测序过程中刚才提到了PCR
就是扩增这一步
这一步里面
它用的试剂就非常多种多样
这个实验吧
其实是很多生物实验室都在做的
它的耗材包括两种
一种是试剂类的
比如说DNTP的混合物
它是有四种核苷酸
它纯度要求是非常高的
而且需要低温的保存
然后也需要引物
还需要一些酶
所以说这里面的这些试剂
首先它生产这些试剂
它一定是从试剂生产商那儿采购的
而且还需要比较苛刻的一些保存条件
另外呢还有这种耗材的
比如说Eppendorf Tube
就是一些管子
还有比如说引液枪的枪头啊等等
这些都是要完全无菌
而且是次抛
就是用完不能重复用
就它只能吸
一次然后就
所以它会产生很多这样的耗材的废弃
它每一次用的时候你会发现
做生物实验的时候
这个引液枪的枪头
做一个实验可能你只花了半个小时
但是你可能产生了几百个废弃的枪头
所以在这个过程中
这个费用是一直存在的
在还没有自动化的时候
因为这些所有操作都是人在操作
那人工的费用也是非常高的
但是刚才提到23andMe早期的时候
其实也通过一些自动化的设备去帮助
能够减少人工的这个成本
嗯所以我理解23andMe
它还是有一些技术壁垒在的
然后它的技术壁垒
首先是主打的市场消费者
它希望能够通过更多的消费者来监测
然后把它的整个的成本拉下来
第二个是
它也做了很多的自动化的测试
把整个流程给自动化了
而不再依靠人了
呃对
其实还补充一点
刚才我们聊的其实主要是实验
就是这个
我们叫wetlab在实验上的这些成本
但是除此之外
每一次基因测序
每个人测出来是有一个海量的数据的
而且从23andMe创立到现在呢
他就说他有1,000万人的样本
那这些样本
这些大量的数据的处理还有存储
其实也是很高昂的一个费用
他把这些数据全部都整理建库的话
其他有个非常大的团队
而且他的infrastructure
整个这些硬件的设备
存储啊等等
这个我觉得成本也是非常高的
嗯那他为什么急转直下了呢
这个问题呢
其实很多人都问
过他的CEO就是Anne Wojcicki
Anne的说法呢
因为现在的行业不景气
大家对于检测的需求降低啦等等
但实际上呢
很多人就会反驳
就说虽然这行业不景气
但是别的公司也有能盈利的
其实我们如果去看
那些靠谱的经营检测公司
大家都是能盈利的
而且包括刚才提到那些Illumina啊Illumina
比如说然后就连我国的华大基因
比如说还有Roche的公司
就是罗氏的一些检测公司啊等等
其实大家业绩还是比较好的
而且呢从技术角度去讲
其实这些基因检测公司呢
他们不是发明设备的公司
大家用的测序仪大差不差
可能区别呢就是在于
也许我的样本来源不一样
我们测序的时候
收集数据的手段不一样
分析数据手段不一样
数据库不一样等等这些
然后最最重要的还是这个商业模式上
所以我们如果去看他的宣传密的话
他的商业模式
从一开始
就是走的这种ToC的商业模式
然后这个
也可能是他出现现在这些问题的
一个根本的原因
就是说消费者做一次基因检测
其实就满足他们的终身需求了
因为我的DNA是不变的
对对对然后我一次就可以检测出
我所有的这些基因
大家会认为这个是一个很大的问题
因为在最早
在23andMe的创始人们
在讲这个故事的时候
它是首先有海量
比如说美国吧
几亿人口的数据
如果每人做一次
确实也是一个非常大的天文数字
但除此之
外呢就是它还联系起来
就是
大家会把这个跟这些疾病的risk factor
就是一些风险去联系起来
但是现在呢
其实如果看23andMe的产品
它并没有完成这件事
如果是看这种用户的反馈的话
就会知道它真正能够测的
那些跟疾病相关的点
比如说某一种疾病
它有几百个已知突变的基因的点
但是可能在23andMe的产品里面
只能测5个
测的不够深入
对对 -
E170_大模型应用之困与异军突起的_埃森哲们_(6)
其实我刚才很同意Keith说的
其实Infra的一个很强的可能性
就是基础设施
是找到一个可以交钥匙的一个点
就是你成为一个小型的操作系统
可能在某一类的垂直场景里面
你变成一个操作系统
你不用说我一下变成个浏览器或者iOS
但是我可能是在某个垂类里面
可能能成为一个iOS
交钥匙意思说我上面的应用层
我拿过来还就能够实现它了
但是
你想做一个非常泛的一个操作系统
其实肯定是有难度的
就是一下
让所有的应用都能直接用你的
他就可以上了
直接就不用埃森哲了
这个其实确实是有难度的
但是我觉得可以探索这么一条道路
这样你跟底座的关系也比较容易切分
因为还是这个意思
底座都想通用
他们一定不会想
在任何一个特别垂类的一个里面
去深扎的
他总想把所有的这些行业
他就想做那个叫做AI+
他说我是AI
我要加所有的东西
所以这块儿是我觉得是有机会
对
其实我最近有跟一些创业者聊天啊
他们就觉得
其实如果是做ToC的应用的
话在硅谷融资没有太多的优势
就是因为他们普遍判断
硅谷是更加偏ToB的市场的
我不知道中国的情况怎么样
就你觉得中国这种做ToB的市场
跟Infra架构附近的事情成立吗
因为其实在过去的这么多年里面
我们看到硅谷的SAAS公司
发展的还是非常成功的
但是在中国
我觉得整体上下次没有起来
当然我觉得用户付费意愿是一个方面
还有中国的大公司
他其实把创业公司能做的事情都做了
应用一个方面
但是这次在基于大模型的这个创业
我不知道你们会不会看
中国的ToB市场
以及你觉得他的终局
他能不能起来这样的一批独角兽
对首先我们肯定两边都看ToC
to b其实是个非常复杂的问题
因为传统来讲
确实美国的ToB文化更强
归国的ToB文化更强
中国历史上都是比较
因为ToC的退出是最多的
就大的退出
这些巨头其实都是从ToC开始的
中国的ToB文化相对是偏弱了
那我们如果打破地域上呢
如果我们只是看
因为现在AI确实太早了
你很难说
我其实不是那么相信
就是一定会一下就分成一个
哪个国家的AI
因为现在大家都很早期嘛
从我个人的判断来看的话
我借用互联网的这个经验
其实还是应该ToC
你觉得中国是ToC先起来
然后美国我觉得应用ToC先起来
美国应用ToC先起来
对对我是说
做投资我从那个融资的角度来看
你是说哪种项目先起来吗还是
呃不是
我的意思是说就是对对
就是在中国
投资人你们会看ToB市场的这个赛道
会投ToB类的公司吗
确实在中国会
ToB会看的少
确实在中国看的ToC更多一点
哎对
中国的这个相对来说的习惯吧
惯性思维还是会偏ToC一些
对但是你在美国会看ToB
对美国ToB to c都会看
但是我觉得可能还是ToC会先跑出来
但是现在你看到的很多其实是toB
比如ChatGPT很多
其实它还是c端
其实还是ToC的流量
目前看起来会更大一些
那中国对ToB的这个
其实也有它的一些历史上的原因
但事实上你看到国内投的真正的量
投的多的
比如说这几个底座模
因为底座模型的核心其实它是ToB嘛
但是他们现在很多角色
其实可能也会有点像埃森哲
因为他是底座模型
但是一旦他要商业化的时候
就发现很多客户
其实是他需要定做模型
对没有能力去做这事了
是他就
所以这些底座的公司
就承担埃森哲的角色
这其实应用他的商业化的一个
那这个事情为什么让埃森哲去获利呢
还不如我自己就把团队放进去这样
当然实话说
他的这个人力成本是很高的
他也变得有一些劳力密集性的
但是这是它商业化的一个很好的
但它你从它的实质上的而言
它还是ToB的
所以它是也有点
割裂就说一方面
大家对ToB其实是有担忧的
但是真正融资最多的这些公司
其实你可以理解它还是ToB会多一些
因为它很多还是在做这些项目
埃森哲应用个ToB公司吗
是理解理解
最后一个问题就是
我们刚刚其实有不停的提到
Rag跟Fine Tune
你要不要简单的用一两句话解释一下
这两个名词是什么意思
RAG就要检索增强生成
Fine Tune就是微调
其实可以这么理解
就是说这两种都可以放在后训练里面
应该公平来说
OpenAI其实是做了努力的
就GPT这个路线
其实它是有一定的思考的
他们其实是说底座
就是基础设施跟应用层
希望以这种形式来分开
就是说我先做一个预训练
然后剩下的是
我可以把后训练交给应用层来做
后训练就包括RAG和微调
那还有一些公司说
他们是在Llama的基础上再加数据进去
跟原有的那个模型一起训练
这个叫什么
继续训练
我听完你说的这话
大哥里他们应用用微调和RAG
Llama其实就开源模型
他应用
但是Llama就你可以本地部署了
就比如你的私有数据
你用来做RAG和微调的
这些私有数据你可以部署在你的本地
但是如果你用地缘模型的话
大概率你就得放在云上面了
这个是它的一个好处
从这点角度来讲对
其实是是很类似的
就这个Fine tune
其实就很容易讲到一个刚才说的
一直假观点你
Fine tune之后
你可能是因为你的多了一点数据
然后呢看着确实比ChatGPT也好啊
或者是Gemini也等等啊什么
稍微好一点
但是当下一次
这些大模型在更新的一次的之后
多一点数据了
一下就把你这个全都给撵过去了
对这是个风险
这就是我刚才说
在设计这个GPT架构的时候
预训练加后训练的时候
它其实算是没有完全解决这个问题
但是呢这个后训练就rag和微调
一定是非常有价值的
不管你底座再怎么样更新
因为你毕竟有私有数据嘛
这个其实可以做个比喻
我一直喜欢做这样的一个比喻
也不是我发明的
其实在很多其他的地方
预训练很像是一个本科院校
它是做这种通用的一个教育
你一定要是有很多这种下游场景的
所以你会有很多这种研究生院
就是针对每个垂直场景
比如法律我会有法学院
金融我可以有个什么商学院对吧
医疗我可以有个医学院
让他们去继续对你进行教育
但现在大部分的后训练的这个能力呢
我个人是觉得他们还没有能做到这些
他们做的很多是什么
比如RAG RAG想做的什么事情呢
比如说我有一个本科生出来了
但是我想让他去做很多律师的事情
但是Rag的核心点
因为它叫检索增强生成嘛
它其实是什么意思
就是说你不一定能够去上完
法学院的所有的课
但是我把法学院所有的课的这个书本
都整理出来了
然后放在你面前
然后这个本科生呢
就是我在解决这些法律问题时候
我就随时去查这些书
他给你一个很强的一个查书的能力
就叫检索能力
这个大家都能理解
它实际上其实很像这么一个过程
对有人把它叫开卷考试
为什么叫开卷考试
就是我是没有学的
我没有学这些书本
我并没有上过这些
法学院的课
微小就更复杂
但是可以简单
就是说
我也没有办法把你全都送到法学院去
但是呢我给你做很多
有点像上岗培训
就有点像短期的一个
我用以前的监督数据嘛
其实就是说我以前的这些例子
我以前在法学院的这些例子告诉你
然后你按照这个去
一个一个的针对后面的这个事情
对吧但是我觉得它难点就在说
你用这两种方式
后训练的方式
今天其实就没有像我希望的那样
能够真正在后训练的过程中能够加速
这个事给你唠
就是我数据量大的时候
我怎么样真的能变成一个法学院
而不是只是一个一堆法学的书
放在桌上给我看
或者是一段时间的法学的培训
RAG其实现在是一个最火的一个商业
应用最多的
应用最多的
但是呢其实我也很同意
像Jonathan讲的
我们也非常认为现在的rag呢做法呢
应该是不对的
这个比喻非常好
我给你一本上课一本书
因为你很强
然后我问你
我给你出道题
然后你从中翻翻
翻翻你把这题告诉我了
说这个你看这题这么回答对吗
对没有问题
好我给你10本书
你去翻翻翻
又找着了
又告诉我这答案
没有问题
给你1万本书
我不告诉你这个一万本书是什么
我就给你一万本书
OK这一万本书你现在我给你一道题
你给我回答
这道题更难了
非常难的
但是就是按照Scaling Law
他本来应是应该更简单的
结果他越变越难了
因为对
所以我刚才的观点就是说
现在反而数据变成一个负面的
就是我数据越多
我如果用现在的这种后训练的方法
就后训练的人数据越多
反而对他来说
当他都可以放到RAG里面
但rag就说能不能使scale
就是这个
所以1万本书能不能实现我这个
我们一辈的这个能力
观点呢
就是说因为这个数据都是原始数据
就是非结构化的原始数据
在这里面
是大多数
现在都这样的
就我把整个篇文章全都扔进去
我也不告诉你哪个是作者
我也不告诉哪个是开头
哪几个是什么
就没有这种标注的
他是把整个一大段东西
全都扔到Vector DB里面去嘛
然后就结束了
基本上所有人都是这么做的
因为你去做标记这个成本是极高的
所以大家都这么做
就是像刚才Jonathan举的例子
我有给你1万本书了
你去说我现在要找找这个的作者
是这篇文章的作者是谁
他在哪天写的
这是一个就语言模型
几乎它是完成不了的事情
所以说它可能这把对
下把是错的
它没有一个连贯性
它可能从头到尾不仅没有连贯性都给你猜
说是3月7号
其实12月6号完全没有关系的
这是现在一个非常普遍的事情
就是因为整个数据
所以回到之前Jonathan一直讲的嘛
我感觉很有道理
用国内大厂的话讲
就是这个数据的对颗粒度的问题
现在的话Rag有很大的问题了
嗯对
但是我觉得啊
就是因为现在
其实有很多细分方向的应用
就是不管它难还是简单
事情我们还是得做
还是得给大家效果
感觉这些应用也会标配Rag
所以从大家的观点来看
就是说其实Rag是现在
我们没有办法去达到
细分垂直领域的这种精准度
我们暂时用的一个开卷考试
暂时用的一种解决方法
但是长远来看
这种解决方法它的数据并不是越多
然后它就效果越好
反而是相反的
所以它可以是一个过渡阶段的产物
但是它不是一个最终方向的产物
这个结论也不是那么容易做
但目前观察到的是这样
就是我们也希望
它能够持续的这样迭代下去
所以我还是刚才的观
就是你持续做RAG可能会有一些风险
但今天确实没有特别好的解决方案
因为你再往下做
继续训练也好
重新预训练也好
肯定成本都会很高
嗯好的好的
那我们今天的节目就先到这里
谢谢Jonathan和Keith
谢谢泓君
谢谢泓君
谢谢大家
好的这就是我们今天的节目
如果大家喜欢我们的节目
欢迎在你所收听的音频渠道来订阅
我们
中国的听众可以通过小宇宙苹果播客网易云音乐
QQ音乐荔枝FM
蜻蜓FM来订阅我们
海外的听众可以通过苹果播客Spotify
还有在YouTube上搜索硅谷101播客
来关注我们
感谢大家的收听 -
E170_大模型应用之困与异军突起的_埃森哲们_(5)
他真的会帮你把它搭起来
还是说他只是动动嘴
那这个就看你的具体的核
但你简单理解
就他帮你整个搭起来嘛
就比如说AI年代
去除我做VC吧
我作为一个客户
就是我现在要有一个我内部的
我自己的GPT
叫做投资GPT
就是上面问我一些投资的问题
你都能回答
这个GPT实现不了
因为我有一堆我投资的这些私有数据
但是我不知道怎么去搭这个投资GPT
这是我就可以找咨询公司
事实上我们现在就在做
但我不透露了
很多投资公司也在做这个事情
就找一个
我们不会找埃森哲这么大的
但是有很多这些
但是在互联网时代呢
这个事情
就比如我今天要做一个
我自己的一个APP
我也可以对不对
或者我要做个什么我的网站
但是在互联网时代
如果你对比啊
就说整个商业化的版图里边
一种是咨询公司不参与的这个收入
和咨询公司来做的这个收入
这两边是完全不成比例的
基本全是独立的
互联网公司
可以自己来实现这个事情
你是说咨询公司参与的收入更多
咨询公司参与的收入额
其实只占很小一部分
就大组团责任也很大
但是互联网的规模那么大
你把埃森哲啊玛卡西这种都加在一起
所有外包公司加在一起
其实只占其中很小一部分
是为什么呢
就是因为我刚才说的中间有一个OS
就所以说他把这个门槛大大降低了
大部分公司都能自己做这个事情了
或者大部分的应用
你想做个应用的话
你其实可以自己很快弄一个团队
或者说你即便找咨询公司做这个事情
他成本也很低
以前是有报价的
我我一下记不清楚了
就是做一个简单的APP
可能就30万人民币左右吧
几万美金可能就能做出来
非常低的
但在今天这个AI的年代
咨询的成本是很高的
而且很多人都会用
咨询的原因是什么
就是因为中间有一个很高的门槛
就是你做这个事情其实是不容易的
我想做个APP
或者说我公司内部
我作为一个客户
我想用底座大模型
这个工具
我一下子用不上
我手上有这么多数据
而且这个形成一个矛盾
就是我反而数据越多我越头疼
数据多本来是好事情嘛
大家在数据链都知道
大数据嘛
数据越多少
但数据越多
首先成本抽取啊什么
很可能就是需要用到Keith这样的工具
本身应用个成本
然后我抽取清洗整理这些都是成本
然后我要再去训练
我要把它放到相当数据库里面做RAG
那我就干脆就去找一个咨询公司
所以埃森哲在这里面呢
他的这个生意越兴隆
就说明这个生态越没有成立
就你都靠第三方的交付公司去
这个时期呢
就是我们观察到的生态的一个现况
但是这个其实就本身是个阻碍
就是必须得迈过去
大部分的公司都能
我自己不用这种或者
说用很小的成本
对所以我理解
其实就是说在互联网时代
大家用埃森哲这一类的公司
或者移动互联网的时代
帮他们做一个APP
它其实这部分的比例占的很小
是因为基础设施比较完善
大多数公司可以自己做
对完善
然后OS也比较具备
对但是在这个AI时代
因为他的基础设施不太完善
然后比如说每个公司
他要根据自己的数据
去定制一个自己的模型
现在还是门槛比较高的
高就干了这么多步
从数据开始
嗯拿到后面的RAG
RAG看上去很简单
但事实上很多公司都做不好
嗯就我刚才说
你其实需要对底座模型有一定的理解
对所以就是说现在整个在AI时代
公司再去搭一个
基于自己的数据的模型
它的门槛是很高的
咨询公司在中间扮演了一个桥梁
就是我来帮你打磨
你可以理解为它解决了三个问题
嗯第一个是
就是一个全新的事物出现嘛
我要做什么
嗯定方向
对第二个是怎么做
第三个是用什么做
工具就是对
用什么工具做
这三个因为太新了
说白了就是大家也都不知道
没人整明
从第一个问题到第三个问题
没有人知道怎么去
或者大公司吧
还没有准备好怎么去解决这三个问题
最埃森哲就出来了
就像假如全球突然全都变冷了
那可能所有这个我们东北人
都可以成为埃森哲了
那因为大家都需要知道
说冬天到了
我们要做什么呀
那我可以告诉你
冬天会冷到什么程度
你要准备什么样的秋衣秋裤
你要准备好家里盖打暖气片
你需要做冬储粮大白菜等等等等
我全都给你讲清楚
因为我作为一个南方人
我怎么没经历过这事啊
你怎么办
那这个就是埃森哲现在做的事
对我们就是期望有一天
如果用你刚才说的场景
就是应该出现这么一层
把所有刚才说的这些事情
都已经隔离好
对咨询公司可能会变成中间层吗
不可能因为因为这商业模式
商业模式
商业模式
它一定是叫做项目制
它的核心能力
它其实不是大框架
对他不需要
他也不应该这么做
这不符合他的核心利益
有的时候
他会开发一些内部的一些工具
去提高他自己的生产力
就比如
他可能也用Keith的这个工具去帮他
他的核心价值
你可以理解成还是一个劳力密集型的
因为它的收费很多是靠人时的
就Man Hour
就是靠人小时去做
去实现的
对将我补充一下
有一个变化会是为什么呢
因为恰恰就是按照小时计费的
这样的一个群体
这包括了咨询公司
包括了律师
等等脑力劳动的大量密集型的行业中
反而我自己感觉到的啊
或者开始看到的一个方向
就是说他们肯定会来做调整了
过去他们不会进入到中间层的
但是因为你想
当生产效率发生改变的时候
就是
这些按照小时计费的脑力劳动者们
是很容易或者说很前沿被替代的
所以我见到蛮多几家
就是所谓四大
呀什么这些人呢
大家其实都在担心或者考虑的都是说
怎么样把一小时计费的
这样一些脑力的工种
转换成一个中间层
比如说他是不是可以做一个模型
把他们的经验教训所有的知识
因为这应用一个数据点
然后转成一种小型的模型
或者是一个什么样的模型
把这个卖出去
而不是卖人力的小时费
对
这很可以变成一个垂直场景去实现
但就它本身应用一个被颠覆
被改造的一个行业
在自己应用一个应用
你可以这么理解
但是我们观察到
从互联网历史上
就是这些公司
他自己往往很难自己跳出来
就往往还是需要有一个所谓AI原生的公司
用这些新的
你说工具也好
Infra也好
应用这些新的模式成为一个新的
就好像你原来是一个出租车公司
你可以把这些类似于Uber的应用
装在你的司机和这个上
但是你很难就变成个Uber
还是需要一个原生的Uber
或者说你原来是个零售公司
你很难自己成为一个Amazon
对我们还是期望第二类公司会出现
但事实上
历史上看起来
也大部分都是第二类公司
第一类公司就是埃森哲自己
很难变成一个AI power的埃森哲
自己杀死埃森哲的可能性还是很低的
是不高的
对也不是完全没有
对对
那从这个角度讲啊
因为其实我们刚刚一直在讨论
模型层的创业
应用层的创业
其实是存在大量的中间层的创业的
比如说像硅谷我
知道有一家公司叫Fireworks
他们其实是在做整个AI的frame
就是框架
然后他们跟埃森哲最大的不同就是
他们其实是做一套标准化的框架
让创业公司基于他们的框架去使用
包括还有很多在做基于GPU的租赁
可以在云上去训练模型
那从投资的角度
是不是这个阶段
所有这些做中间服务
甚至在建设
整个大模型时代的基础设施的公司
ToB的公司
做服务的公司
做基础架构的公司
是更有价值的呢
在这样的一个阶段
嗯是很有机会的
嗯就刚才
包括Fireworks
包括我们也知道Lepton对吧
对
Lepton这样这样的公司
你刚才说的那个用GPU应该是LAMDA
类似这样的公司
这些其实包括做数据的
啊
对包括做数据
包括Keith这样的公司
其实对其实你可以理解
从我们投资人角度
我是这么看的
这些我们都放在基础设施里边
这个是比较容易去看这个事情的
因为技术设施是很复杂的
如果我们把它简化下
就是就是工具
就各种各样的工具
你用各种各样工具自己去搭
但是他们不改变这个生态
就是说如果按照他们这种
其实还是不会大大降低应用层的
这个门槛
就用层还是要有能力去用这些工具
其实最好还是底座大模型
把这些事情都做了
那当然
这个就变得非常的叫做交钥匙工程嘛
其实OpenAI他们是往这个方向在走的
他们也都在做所有这些事情
OpenAI自己
当然他也有Framework
他一定有Framework
刚才包括这些算力优化啊
他都要做
然后云计算公司也要做
为什么
微软跟office它是有一定的绑定
因为Azure和office
它是云资源和底座模型
所以他们都是可以理解成infra啊
但是在哪个点上infra啊
基础设施层能够变成一个操作系统
这个是我们非常期待的
我觉得刚才上述这些公司
包括Keith的公司
我觉得都是有潜力的
就是如果你能够充分的隔离应用层
跟所有底层的这些细节
让应用层能够充分的
像个交钥匙的一样
就是我就写一个网页
我就是做一个很简单的
一个html的这么一个编程
我真的把我的这些私有数据
把我的这些内容
把我以前的所有这些用户
我自己积累的用户的这些data
都能够实现起来
然后
我产生我自己的一个垂直的大模型
能够做到这么一点的话
那这个生态就会被打开了
但在今天
这个生态没有完全打开的情况下
所有这些点状的工具
其实都是很有价值的
但是风险也比较大
因为这个生态还很不清晰
你可以它是整个一个技术栈嘛
这个整个计算都不清晰的时候
所以他们每一个每一个都互相在重叠
大家都互相竞争
就每个都可能会做对方的事情
就比如我做Lepton
我很可能也要处理些数据上的事情
我要帮我的用户去做一些数据上的
抽取也好
清洗也好这样的事情
所以大家会互相的重叠但
是
可能又很难找到一个完全互相配合的
这么一个方式
现在就是还是处在于很早期
刚才那个Keith说
可能你说是两个月的baby吧
我觉得这个比喻特别好
我觉得基本上还是在这么一个阶段
那一种方法
就是说你就现在的很多应用公司
就是我就是用这些工具
我能够实现我的这个垂直场景
这种其实今天是很有价值的
对你刚刚其实提到了
在你们投应用的时候
其实你会去看他的数据
持有数据
包括他在模型上的一些训练的方法
最后会不会训练到基础模型
就是你有一套非常完整的投资逻辑
那如果你在判断这些中间层的公司
ToB项的公司
你觉得最核心的几点能力
抽取出来是什么
嗯
这是一个很好的问题
其实不太容易回答的原因就是说
因为我们判断应用层的时候
我们可以有比较清晰的几个指标
因为现在比较清晰的点就是应用层
在这呢就有应用公司的人
然后有一个底座模型
底座模型其实我也把它放在Infra里面
但它是Infra里面是最重要的一个
就相当于一个最大的一个巨人
坐在Infra的这么一个池子里面
但是周围会有很多围绕底座模型的
小的Infra
是帮助他
最后能够实现一个近似于操作系统的
这么一个事情
就是我能够充分隔离上层跟下层
但现在都最大的难点就在于说
周围这一圈小的infra啊
如何跟中间这个最大的
底座模型的这个infra去互动去共生
因为他也在挪移
他可能会把你挤掉
但是你又需要它
但是很多时候
你可能应用需要
把它的中间切下来一块
所以这个就造成一个
不是那么容易判断
就比如做framework
就是做框架
框架是里面很重要的一个事情
但他应用会处在一个比较微妙的一个
对就是有能力的应用中
我肯定是自己做框架了
就比如你可以看到
基本大部分的这些会会自己做框架
但是我一旦没有能力呢
要么就用埃森哲了对吧
埃森哲可以自己帮你去搭一个
这样的东西
要么就是说我
很多时候我就
我也可以依赖底座提供的
或者是云厂商提供的
所以你看这么多人都在这个池子里边
所以他产生的这个点是会非常的复杂
对于做Infra的人的考验
其实是会更高
但是Infra在今天
可能反而是最有希望的
因为上下层都没有那么清晰嘛
所以为什么你看很多人去投底座模型
其实投底座模型就是他
应用
就是我感觉说他是一个大的Infra
然后底座模型周边的这些配套Infra
我可以把它称之为配套的Infra
应用非常有价值的
但是你怎么做
这个非常考验他们
作为投资人来讲
我们可能抓一个基本点
就是团队的能力
刚才Keith说的这个意思就是
他是要在里面泡的
是要做各种各样的转型和尝试的
对Keith你你们自己也在这个中间做事
你觉得护城河跟核心能力是什么呢
我感觉刚才其实
装的是已经基本把整个这个链条
讲的非常清楚了
其实是这样的
我自己在里面感觉呢
这听着有点像废话啊
但其实真的是这样的
因为其实做infra嘛
做基建嘛
他从工程角度应该是最难的
当我感觉呢
解决了最难的这个问题之后
其实是在语言模型的时代
往上走一层反而是容易的
就是我们解决了这个很难的一个问题
之后我向Jonathan刚才讲嘛
说加一个交钥匙的
这样的一个解决方案
其实这个是简单的
因为这都是有一堆既有的产品啊
工具啊各种各样
这就是回到上一代的互联网的
这个概念上嘛
其实都有的
难的是什么
难的是选择一个角度
就是底层的这个模型
他很难走进去的赛道
在这个赛道上你把它做到最好
其实对我们来说
语言模型不是我们的目标
但是呢
它是我们的一个很重要的工具
这是我们对他的一个理解
我们做的一个事
我们认为是语言模型
永远都解决不了的
就是你把这个一个网页交给语言模型
让他去帮你抓一些数据
能做吗能做没有问题
但是这个东西当你想到上到量
想到一个大量的准确度
一个连贯性
因为语言模型都会产生幻觉吗
一个网页越复杂
你会越多的幻觉
那你怎么去掉这些幻觉
怎么解决掉
刚才用一个推土机砸钉子的问题
就拿一个巨大的一个语言模型
来解决一个钉子的问题
这些其实是很难的问题
而语言模型
以我们的认知上它
很难走到这样的一个角度上
其实我理解
这还是对垂直行业的一个深度理解
跟你基于大量扎实的工作
建立起来的基本功
去解决这个AI的幻觉问题
他需要对工程的理解
要远远胜过对语言模型的理解
嗯这个非常对
嗯这个需要很多工程
上面的你可以理解成是包裹吧
在上面要叠加一层 -
E170_大模型应用之困与异军突起的_埃森哲们_(4)
但是你现在就要思考问题
你的护城河在哪里
我最早跟那个大部分的GPTS
其实我花了蛮多时间去聊
这边的GPTs上的
很多还算是比较成功的公司
发现他们都不太考虑私有数据
有比较成功的公司
吗应该是没有吧
那个时候还是最火的时候
就年初的时候
你聊了哪些公司
我就不具体说了
但当时我就是特别清晰的问这个问题
说你有没有私有数据
他首先他愣了很久
然后他在说我为什么需要自有数据呢
我们没有数据
然后我第二句话说我
那你会不会担忧你的护城侯
这个我当时直接问吧
defensibility
他就是我的护城河
就是我的产品设计啊
这个在互联网年代
是非常通用的一个思维
为什么互联网应用公司
能够比大厂厉害
其实很多时候是在产品层面
他在产品设计上面吗
他能够走
这就大家说的这个产品经理
尤其是垂直领域的这些
他肯定比做底座或者甚至大厂的人
他都有这样的一个优先性吧
但是你现在就要详细考虑
你的护城河的问题了
对在这个时候
你就必须得去深扎这个事情
所以你觉得其实在大模型时代
开始以产品切入可以
但是如果你要找护城河的话
你最终还是需要有自己的私有数据
加上底层模型
加上底层模型的能力
底层模型的能力就是你私有数据
即便我一向的观点就是
你即便只做rag或者微调
你对底层模型
应用要有相当的熟悉度的
最好是找底层模型的人
对Perplexity有吗
他在做自己
他是底层慢的
那这个可能是他的商业机密了
但是我从侧面去了解啊
但是这个我们后续可能可以去
我觉得他一定会在往底座去做
但是这个他可以有多种方法
你可以有开源底座
去做一些这种继续训练
你可以有不同的步骤
就是因为你要从成本上考虑嘛
你当然一上来就全都重新训练
但这个成本太高了
但你可以做叫继续训
continue训练
继续训练啊
但这个难度也其实应用不低的
但是可能比微调要更难一些
但即便是微调
微调跟继续训练
有的时候
它的中间的界限也开始在模糊
就是它们的成本
而且同时还有风险
就说你做不好
可能效果并不一定好
所以这个都是他的成本
都要计算进去
但大方向一定是往这走
这就是你的护城河
你要么就不要有数据
就像我说GPTs那些人都不要数据
但很快GPTs也都没有了嘛
就是你可能会有一段时间的商业化
所以有的时候我们看商业化
有时候也会有一定的误区
他可能甚至一段时间还
用户好像也还不错
还甚至能够有一些收入
但是让他只要没有护城河的情况下
他要么就是被底座给覆盖掉了
就底座的更新也能实现同样的功能
对吧要么就他自己
不能够持续的迭代下去了
但是我是在想
以这种创业公司
跟应用类的模型的迭代
它怎么能卷得过
你看像openAI这种
动辄百亿美元融资的公司
因为你做底层模型
你是自己需要买卡
然后需要自己去训练的
那如果说一个模型
他真的训练的越来越大
他的智能真的涌现了
这些创业公司他再去训练底层模型
他的意义何在呢
所以就是几
种方法一种就是我刚才说
你一个步骤一个步骤
有点像baby step
等于你的卡会越来越多
但是可能你还是得不断的
这个你可以理解这个Scaling Law
因为我数据越来越多了
数据越来越多
理论上我最后的成品的
最后输出的这个模型的参数量
或知道它能力吧
参数量可能不一定是一个KPI
但是我的能力一定是
应该是越来越高的嘛
但这个对于我
刚才三要素其实都得在里边
我数据一定是越来越多
我能力越来越强
我对算力要求肯定应用越来越高
这个你是避不开的
这个你是可以通过步骤去实现的
第二个就是说你聚焦
就是你跟OpenAI的不同点
包括跟国内所有比如这6家模型
六小龙吧的不同点
是说所有做底座模型人
都有刚才说的这么一个做平台的诉求
所以他也在做应用的同时
他在还是想说
我要赋能所有的上层应用
这样一下就把他给摊平了
之所以他对算力的这个要求
因为他也要对所有的应用场景
现在来了一个教育行的人找他
来了一个制造业的人
或者医疗行的人找他
都得跟他去
要能够service
就是能够服务这些人
这个是它跟你的最大的区别
就是你你能够放弃
作为一个通用平台的诉求
就聚焦在一个
比如说就是AI搜索
就是一个垂直的一个应用
端到端的
我把这些一件事情做好
我整个底座模型的所有的每一件事情
都是为了这个
我不为了
去赋能不是作为下一个iOS的
这个心态出现了
这个时候你其实你会简单很多
这个在互联网时代
其实是有这么一个时期的
互联网在浏览器出现之前
其实我们那个年纪人都我们用很多
叫FTP
嗯对
暴露年纪了哈哈
啊没事
继续对Telnet
对因为最早那时候没有网页嘛
其实那时候你有很多内容
就是我们在学校里有很多内容
现在后来就是我就放在一个网页上
你就能够访问了嘛
但那时候我们会放在FTP服务器上面
但是FTP这个事情
其实它是一个端到端的事情
因为它现在没有
像浏览器这么一个平台
它其实挺难用的
但是你做FTP的人
你肯定是前后都得去搭的
这个就是我说的
一个叫垂直整合的这么一个事情
这个有点像当时的那个年代
就有点像这个浏览器出现的这个时候
所以你要做这么一个应用呢
就是很遗憾
你可能你门槛就得这么高
但这应用你今天的一个护城河
它其实是一个相互的作用
你没有这个门槛
你也没有这护城河
对就还是让回到了数据
什么护城河
还是你垂直领域的数据啊
你的数据的优秀程度
你的专业程度
你的精专程度嘛
有点像大语言模型
是个推土机
那我其实就想凿个钉子
难道我拿铲车推土机去凿它吗
也可以也能弄进去
但是何必呢
其实我拿个小锤子
嘣一下就进去了
那我就用小锤子不就得了吗
是这么个概念
嗯对
Keith你有觉
得比较好的案例
包括是商业化方向的案例
给大家分享吗
我感觉商业化
其实美国本土还蛮多的吧
比如说现在的有几个做coding的
coding最近这几个月还是蛮火的一个嘛
当然
这个也涉及到它会有多大的护城河
这个问题
比如说GitHub要去做的话会怎么
就是GitHub也有嘛
那这个东西它会到底怎么样
还有一个特别火的
那个coding的应用叫啥
就是之前一直在排预约的那个
Magic Cursor
就有一个
那个报就是那个见光
见光死那个是吗
叫叫什么
coding现在特别火
大概有快10家
都到10亿美金了
应该非常多
Augment Magic
前段有一个挺火的
之前做Demo做的巨好
然后后来以正儿八经release出来
然后就那是Devon
Devon对哦
Devon对对对对
Devon就是见光死的对
就大模型时代见光死
这demo最好看
做完之后应用层一看
完全用不了的东西太多了
Coding应用
我所说的这个分界不是那么清晰
其实我也可以用GPT
其实现在很多码农就直接用GPT
就就已经帮他在编程了
所以他就
我说你怎么去创造这么一个切分
一个分界
这个是所有做Coding应用的这些人的
一个
他很多时候产品肯定是做的很好的
但是你要实现这个scaling law
我口顶这个能力要不断的scale
我也要用我的私有数据
在去训练的时候
我怎么去跟底座的这些人去竞争
去做长期的竞争
我现在的
如果他们要问我对他们的建议
就是说你
你得拥有自己的底座哈
如果你一直是用所有第三方的底座
的话你的风险永远是大的
就说他一定也在不断的在训练
你跟他要一个division
是你觉得还有其他方向吗
其实他现在做的好很多
可能也都是商业化做的比较好
也就是说他对这个价值啊
或者在这个方面上
某一个点抓的标准的
像什么Harvey啊
Legal的这样的一些东西啊
它是一个处理法律方向的大模型
对
大模型应用
应用对
也也不知道多好用或者多难用
但是呢就能讲好故事
这应用一个能力嘛
如果要从一个真的
一个大规模的应用角度来说
其实就回到状态算讲的
这个还是很遥远的了
因为我自己总感觉的
整个这个问题回到核心上还是太早
整个拿新的一个生产效率改变的工具
来解决什么问题
这个应该是人来解决的
而人现在还没有完全去
因为这个工具长什么样
怎么回事什么的
很多东西还没有在摸索清楚前
人们怎么用它
其实是很多误会的
大家是把生产工具
很多人就当成了生产力
比如说这个是一个比较范式
我认为现在很多的一个情况对
如果再补充一些
就是我自己作为一个音频工作者
我感受到的
比较好的产品或者案例的话
其实我刚刚有提到Notebook LM
我觉得用它来做一个长文本的分析
它还是一个蛮好用的应用的
但是它其实是谷歌做的
对它
也不算是创业公司
那另外有一家创业公司
就是我自己非常喜欢的
叫做Elevenlabs
它是可以我输一段文字进去
它有自己的一些英语的配音
它可以把这个配音配的非常好
或者是我的音频有时候我们说错了
一些数据需要补录的时候
它不用嘉宾现场到场补录
它可以AI生成
而且
可能会比你们补的那个效果还要好
是因为
大家每次说话的声场环境不一样
他的这个补录是比真人更加无痕的
但是在整个的中文方面
表现还不是特别好
其实我觉得
这个可能应用他自己的数据
跟他的产品
没有专门针对中文产品
去做特别的优化
按理说这其实不是一个特别难的事情
但是他没有做特别的优化
其实我看Elevenlabs这样的公司
在融资市场上的表现
也还是非常优秀的
应该也快到独角兽级别了
还有像之前我们在节目中分享过的
Suno文字生成音乐
它是一个音乐模型
其实它应用做了自己的模型层们
我觉得至少是从融资来看
反正我们在聊完以后
它应用过亿美元的估值
然后也融了很多钱
表现还是不错的
这是我看到的一些细分场景
对这两家都属于跨模态多模态
多模态
多模态的这个产品
他我的印象或者我的预测
他一定应用要往底座去去延展的
我觉得他们其实是有底座的
它们不仅仅是有底座
而且其实它自己在这个声音的处理上
它自己是有自己的独特优势
在的对
它是有一些paper的
对因为多模态反而不像语言模
因为语言模型
已经有很好的第三方底座了
你基本上就可以用它了
但多模态很多时候你其实是要做
因为你如果你只用SD
只用类似这种一些开源呢
其实你像Midjourney
你肯定是有自己的底座的
所以他们这些公司其实也倒过来
要求他们得
同时他要有训练数据
然后用自己的
或者说半自研的这样的底座
去实现他的最后呈现的这个模型的功
我觉得这个其实可能是多模态
从这个角度讲
多模态就更符合我刚才说的
因为他
你没有一个可以利用的第三方的底座
你反而是更会需要自己去做很多事情
所以现在整个市场上
会不会多模态的表现会更好一点
对这个应用我的一个预估
当然他应用个双刃剑
就他倒过来要求你要怎么做
所以很多人都会先就往这条路上去走
这样你的护城河从第一天开始
就是应该是有的啊
不是像在纯语言模型里面
你可以刚开始就没有护城河
所以从冷启动的角度来讲
纯语言模型可能更快一些
我直接调GPT
我就能出来一个很好的产品了
但是你要在多模态的领域
你肯定是要先做出一些东西的
所以它其实双刃剑
但是
我个人也其实应用比较看好多模态的
这个多模态
甚至包括跨到所谓的硬件模态
就现在所谓的巨深智能
它其实应用一个广义的多模态
这些创业公司如果能够把硬件
数据跟Robotic Transformer嘛RT
就是谷歌在尝试的这些事情
能把语言和硬件的传感器数据
和最后这个机械执行的数据
能够打通的话
不一定完全的短道短
但它能能够从训练层就能打通的话
我觉得
这个它本身应用多么菜的一种体现
我个人觉得还是有蛮大空间的
对
其实归根到底就还是数据的独特性
数据的准确性
数据的优势了
还是刚才Jonathan讲的整个这个核心吗
反正我自己跟这边的几家比较大的
美国本土的最大几家VC啊什么的
聊天的时候
感觉都是这样的
就因为这些VC
他们都有自己的一个
相当于是business operation啊
或者是go to market的这种类型的团队吧
反正我记得上次在跟某一家的负责人
我们在那喝东西的时候
我就说你现在比如说这个
美国这些大的企业啊
接受AI都是怎么样的一个状态
他的回答
反正就是吆喝声还是非常多的
就大家都想学
都想知道
都在讨论
但是真正能落地的东西
当然还是非常非常少的嘛
所以整个这一块
这里面呢
你看大家做的东西呢
其实都是关于AI的咨询
AI的rag
这一块是上一年
就过去这两个季度吧
是最火的这些东西
因为这个东西
相当于是我要是一个公司的it负责人
我肯定要考虑
我的公司接下来整个AI方面
我要做什么呀
我肯定要花钱啊
怎么办呢
那我先做什么
我先不能拍板因为可能这顿我也不知道该做什么
但是
我最起码可以先把这个架子搭起来
架子的话就是咨询AI方面的这些讨论
所以呢在美国呢
像埃森哲呀
这样最大的这种科技类的咨询公司
光咨询类他是赚的最多的
他第一个季度的话
他就是6亿美元的一个营收
第二个季度呢
这个营收从6亿美金呢涨到了9亿美金
我之前跟一另外一家就很大的
这边的VC去聊天的时候
他就说当然他说的是英文了
但他意思就是说哎
你说咱们这忙乎什么呢
忙活这么半天
这个他居然耍下嘴皮子做两个RAG
这个9亿美金拿到手了
就是这样一个现状
你有用过埃森哲的服务吗
我们用不起的
这个太贵了
应该多少钱平均一个项目
那这个真很难讲
因为就是他就是做咨询
像麦肯锡
对就大项目 麦肯锡一样
对就是一个项目可以非常多的
但是总而言之就这块
你可以看一下不同这些公司的财报啊
什么的这几家公司都是过去一年来
增长最多的一块项目
其实恰恰就是我特别想补充的
咨询公司在今天的这个地位
其实就是符合我刚才说的这个理论的
因为我们回头看那个互联网时代
互联网时代咨询公司
埃森哲应用存在的
就是我一定有很多公司说
我今天要做数字化
我要开始做网站了
对我要做互联网化嘛
我也有这样的一个门槛要越过
很多公司也会去找外包
找咨询公司进来帮我把这个事情做了
咨询公司
他们提供的服务的核心是什么 -
E170_大模型应用之困与异军突起的_埃森哲们_(3)
但是跟我刚才说的数据是有关系的
因为深度学习从2012年开始
发生了一件什么事情呢
就是2012之前所有的计算机科学
包括那些所谓的传统人工智能的
这些领域
就我说的这些传统的agent
传统的这些自然源处理
它的核心点都是人来写算法
有个说法叫有多人工就有多智能嘛
就都是因为人工智能有多智能
背后就有多少人
这个人工是什么呢
这个人工就是我们码农对吧我是
我是这样的
我从我可能从小学开始我就开始写代码
就是我们这帮马农在后面
就是每一件事都得用代码去写
但2012年开始了
其实第一个就是叫AlexNet
就他做一件事
就是把我刚才说的
这两个传统的人工智能的领域
一个叫机器学习
一个叫神经网络
这两个合在一起形成一个叫深度学习
然后呢他的核心点就是
我现在不靠码农这个一行
一行人工的敲代码了
我现在就是弄一大堆的数据
当时要做很多标注
然后我去用一个训练算法
就那个时候
AlexNet那段时间就叫卷积神经网络
那个时候那一波最然后呢
你看数据这边
就是李飞飞当时弄了一个叫ImageNet
当然还有一个叫算力
算力其实有个华人叫吴恩达
其实他贡献最大
因为他的算力第一次用了GPU
随之三个东西结合在一起
算法就AlexNet
然后数据当时有个ImageNet
然后算例
这三个加在一起
可以称之为人工智能三要素嘛
但是加在一起就发生了一次大爆炸
爆炸之后
就把我们之前所有计算机科学
包括人工智能
所谓传统人工智能做的事情
全都给颠覆掉了
就是现在我不用写代码了
我就出来一个叫做黑盒子
就是一个模型
但是这个黑盒子的效果
反而比以前我们一行型的代码
敲出来白盒子的模型还要好
还要精准
错误率还更低
那唯一的就是
它可能可解释性会差一些
因为它是黑盒子嘛
这个事现在也研究了一个方向
但是我们先不讨论这个
这里面最核心的点
就该说三要素
三要素里面其实最核心的点就是数据
就现在变成一个
从2012年开始
整个的这趟浪潮变成一个
我们可以称之为叫数据定义
就是所有事情都是从数据开始
那是第一波
然后到了2020年左右吧
GPT3开始的时候
它其实应用数据定义的
应用第一次
把我们以前人类积累下来这么多
电子书也好
Wikipedia Reddit知乎
全都作为数据这样输进去完
我训练出来一个这么大规模参数量的
这么一个
然后它实现的功能
也比我们之前用一堆的
这叫自然语言处理算法
因为自然语言处理
应用个人工智能领域
传统自然语言处理的这些
都被颠覆掉了
都被这个大语言模型训练出来的
这么一个大黑盒子
把这些那么多的教授做自然语言处理的
以前做的所有的这些成果
都可以把它给超越了
所以这个是核心点
就是来来回回
我们其实想说的一件事情
就是
在今天我们已经完全不能绕开数据了
就是在互联网时代
我们在做创业
做Uber的时候再做创业
最早在做雅虎的时候
我们都知道
数据实际是它的一个结果嘛
它是产生出来的
因为我一旦有互联网的这个运营啊
用户的这些行为之后
我就会产生数据
但是我在创业的那一天
我可能不会想说
我是不是只能拿着数据才能开始创业
但在今天其实就要突破这个认知了
就回到我刚才说的
我们就有两条线了
一方面我们把互联网产品要做好
但一方面
我们要把数据这条线要做的非常扎实
什么样的数据是有用的
这是个非常好的问题
这其实就是整个人工智能浪潮里面
不断的回答你的问题
其实上他就实现Scaling Law的问题
就是他在不断地寻找有用的数据
就有用的数据
其实要打引号就是它
其实这个定义是在变化的
你像在AlexNet出现之前
我们市场是有大量的图片的
但那时候是用不上的
就是我用这些数据去训练
我也不能去收敛
为什么
因为我的算法没有到
就没有AlexNet的这样的训练算法出现
就是我刚才说
结合这种深度的
神经网络生成的机器学习的算法
Transformer的主要贡献是什么
对Transformer就是第二波了
Transformer就是说
他能把刚才说的这些语言的数据
能够训练进去
然后生成出来的
这样的一个语言处理的模型的
这个能力
超过了我之前的所有的自然语言处理的
这些算法
啊所以
其实Transformer它是替代自然语言的
把传统的基于自然语言的
这种rule based的白盒模型
替换成了黑盒模型
它是产生了一个这样有有意义的算法
它应用个算法
它这个算法
就是对于处理语言是最有能力的
你可以这么理解
但是传送门也至少经历两个阶段嘛
一个第一个阶段叫BERT
它其实是一个incode only的
然后到了GPT是个decode only
其实穿梭物也有两个阶段
到了decode only
其实又打开了一层在BERT这个阶段
它其实Scaling Law应用到了一个瓶颈了
其实我这些Reddit啊
Wikipedia啊其实都有的
但是在BERT这个技术路线的时候
其实我这些数据也不是都有用了
所以回到刚刚泓君说的
这其实有用
数据这个词应用一个在动态的
就是很多数据
我们今天看到的实际上是又是没用的
所以数据永远是不会枯竭的
这是我的一个理论
数据其实都在那
只不过刚开始都用不上
但是GPT出来以后
就把所有这些Wikipedia啊都能用上
电子书这第一次之前也用不上
CAA肯定是用不上这些数据的
BERT也用不上
这些数不是用不上
就是把它都灌进去之后
训练出来的模型
最后并不能完全收敛
所以他是看你的算法怎么样
就是数据
是依赖于你背后的一整套的算法的
算法来定义
我需要什么样的数据
跟这些数据需要什么样的标签
标签也很重要对不对
对所以在语言里面
它你可以理解成它是一个自监督
或者自标签
因为语言等于是前后再互相看
字更重要
所以图像是需要标签
对对对但现在不是Transformer
其实把图像也试图语言化
就是把它也向量化
也利用图像内部的这些语义去训练这
这是它的一个方向嘛
但是这还是一个尝试啊
这还是语言式
现在是最容易去scale的
它是最符合scale
但是这个中间其实你看我刚才就提到
包括像腾讯啊这些
他们有很多这种数据
其实现在很多数据并没有完全都能用上
是数据其实还是有很大的空间的
有用数据的范畴和定义
实际上还在扩展
但这个扩展的过程
就需要
你对算法的一个更进一步的迭代
嗯对
翟老师你觉得什么样算有用的数据
你们正好是做数据抓取的
对反正我刚听Jonathan讲
我也在想
就
我是很同意数据和application这两层的
因为人工智能嘛
说白了就是和人要很接近嘛
那这个是和之前的上一代AI
是不一样的嘛
那本代AI整个这个核心就跟人会很像
他的写出来东西啊
整个思维啊什么的
你会模拟的非常像
那你就想咱们人上网干什么
咱们人上网用互联网
用网页
其实所有的所有东西到最后就两件事
第一件事是读
第二件事就是写
读是什么呢
就是你从网上
比如说你看信息
听咱们硅谷101的播客
看陈茜的视频
所有这些东西其实就是一个事
就是你在从上面把数据抓取下来
那你第二件事你要做什么呢
就你有了这个信息之后
有些人可能说哎
那我要去做投资
有些人可能说哎
我要去trade某一支股票也好啊
或者说买什么一个产品
或者说我要去点一个button
click一个键
这是什么呢
这你就可以把它理解成一个应用层
它其实就在写那数据这一块
就是获取的一个过程
这些大量的数据
就像正确说数据是在那里的
但是对于很多
他要是做vertical
就是垂直领域的模型啊
或者垂直领域
应用的时候
他其实这个数据是获取非常困难的
因为这些所有的互联网上的
沧海一般的数据
打从有互联网那年开启
这东西就是给咱人去用的
所以当今天的机器去来学习它的时候
其实是有好多限制的
因为网上的每一个网站
它都是一个护城河基本上
比如有哪些限制
他会反抓取还是怎么样
就是反抓取是一个最基本的嘛
但是你想
当一个机器
去想获取某一个网页的信息
也就是数据的时候
才需要API
他需要一个API call
才能去获得这个网页上的数据
OK那他要没有这个API call的话
就像你说的泓君
我要去做一个
写一个script去抓取这个网页上的数据
但这个script是最费人的
写这个东西是一个非常累的
然后你获取前端的就网页上的数据
任何一个东西都是非常麻烦的一件事
咱们可以不去讲技术性的问题
但这东西但凡做爬虫的呀
都说这是没人愿意干的活
这是一个最脏最累的活
互联网里面的脏活
脏活累活
并且是永远是cover不到所有的
你永远干不完
那这个就是现在
在我看来
就是对于很多垂直领域也好啊
对什么机器学习也好啊
它是一个非常大的挑战
所以这就回到了跟Jonathan说
很多做的application的公司
他们的其实数据差不多的
他没有什么更特别的一个数据
跟这个大公司比
因为现在大家获取的数据的方式
是非常有限的
是基于上一
代的时候
人们获取数据的方式来获取的
这个是现在的一个很大的阻碍
所以
我们其实在解决的是这样一个问题
对这个非常从投资人角度
Keith做的这件事情
我们其实都会放在这个叫infra
这个层面
因为你们其实也会在support其他的
这些应用公司嘛
其实因为我现在问所有的应用公司
我是几个问题
第一个就是你有没有数据
第二点数据怎么获取
怎么抽取
怎么清洗
这其实每一步都是非常的昂贵
复杂的就是你肯定用大量的工具
当然很多现在很多公司强一点
比如OpenAI
他是有一套数据栈的团队
对他每一件事
都是可能一个巨大的团队去做的
大家都知道OpenAI可能随随便便获取
最后整出一套数据的成本
都是在几亿美金
这么一个谅解成本
这里面包括他的团队的开销
和他的所有这些工具的开销
对就很多公司
现在的话
小公司商业化之所以很难啊
是因为他没有什么一些特别的数据
像刚才Jonathan讲的
他很多的数据呢
也都是同类的数据
他呢顶多呢就是会从爬虫呢爬一些
就是一大块的非结构化数据
然后扔给这个语言模型嘛
然后剩下就还是做prompt
来让语言模型把这东西做的更好
技术含量实话讲都是很低的
它的整个上面相当于它底下那个饺子
我们包个饺子
饺子馅全都是模型
那上面的话我剥个皮就是特薄
那整个这个东西
这皮其实没什么价值
然后这个完全就是馅拌的不好吃了
但馅有别人的
你就剥个皮
这个价值是非常低的
所以基本现在是这样一个情况
当然就是除非短期
有一些做的比较好的
短期商业化做的好的呢
他解决的是个什么问题呢
就是AI或者语言模型
它解决的问题是生产效率的一个问题
那这些现在短期内很多
举个例子
有点抽象
呃语言模型解决的是生产效率
它其实在现在阶段下
它并没有取代所有人的能力
但它是大大提高了人的生产力
对对所以说
语言模型是在解决的是生产效率
其实互联网的本质应用解决效率问题
都是叫生产力工具
就是这个意思
但是呢现在大家呢
很多做这个的嘛
因为尤其是最开始
你去拿语言模型做个东西
哇这个一看就是做个demo
其实都好牛啊
感觉好了不起啊
那大家就误会了
就是有点把这个生产效率
就误解成这就是全部
其实不是全部的
你人还是要解决的是价值问题
AI没有办法解决你的这个价值问题
就是所谓的产品在市场上的一个定位
也好啊这个产品的价值在哪里
这东西是人来定位的
但是语言模型给人造成了一个幻觉
让人以为说它可以取代所有的东西
所以很多的产品它其实就是
所以你觉得产品方向很重要
这个产品到底是提升你的效率
还是取代人
这可能是根本上的两种产品
你用语言模型的时候
你可能在最开始的很长时间内
你会认为他可以取代人
这是语言模型给很多人造成的幻觉
也就像你还记得吗
去年不前年有个很有名的事
一个谷歌的工程师
他当时还闹了很大一个事
他认为是谷歌那个原模型
可以是个真人
他在跟这个原模型在沟通的时候
产生了这样的一个认知
说这是我在跟真人对话
但那会还跟谷歌闹出了很多的纠纷
所以说这个就语言模型
在你最开始使用的时候
你会认为它是万能的
它可以解决好多好多
你解决不了的问题
然后你就把它看到的这个点
你会把它以为是一个面
然后把它推广到一个范式上
你说这个都可以做
其实不能的
嗯
对你们觉得在这一轮的AI创业中
有哪些公司是做的非常好的
或者现在是非常赚钱的
美国这边当然比较典型的
像perplexity这种其实是比较有希望
其实是它从某种层
最符合我刚才说的这个定义
Perplexity它的底层是自己的模型
还是开始建立在其他模式
刚开始并不是
所以我的总体定义是说
有底座潜力和底座能力的应用公司
因为它是DeepMind的背景
所以他是有这个思维的
就是我从各种侧面渠道就知道
创始人
其实还是在跟各种做底座模型的人
去做很多的深入的交流
包括DeepMind
自身吧因为他本身就这个背景
所以他们是符合这个
他可以有几个step
他刚开始肯定也还是用就刚才
甚至就是套个壳儿
对吧我就有点像个GPTs
的就是就是我直接用API
靠多做些rag对吧
rag然后开始做微调
但我想它是到了一个层面
一定会自己做
因为again
它是要自己不断有自己的
这个数据的
叫custom data
就是私有数据嘛
它一旦不断的要积累自己私有数据
跟用户的这些
所以它可以用这数据再去做微调
但是它同时
它也应该把这些数据
去生成自己的一个底座
这是我的一个观点
我其实比较好奇这样的思就是
那你看perplexity
它在做相当于一个检索嘛
那和Google
比如说他要下场做同样的东西
或者说Microsoft用下场做同样的东西
比的话
对就是回到刚才那两条线嘛
我作为一个AI原生的一个应用公司
其实我有两个角色
第一个我是互联网产品
这做的非常的好
在这个层面
其实很多创业公司
甚至是大于这些模型公司对吧
或者大厂的对
因为你的视角不一样
很多确实从产品介入
刚开始可能我就是真的就套个壳儿
但是我的易用性
我的交互流畅性非常的好
所以用户一下就上来了
但这个是不表明你成功了
就像最早Jasper这种
它其实为什么当时比GPT用的好
其实它还是产品设计确实会更优 -
E170_大模型应用之困与异军突起的_埃森哲们_(2)
一个叫Netscape moment
就在Netscape出现之前
其实大家为什么并没有看到
就Cisco其实比呢
这个Netscape要早
但Cisco内容其实并不是很大
Cisco真正大爆发
其实真正应用浏览器出现之后
因为浏览器出现之后
在Cisco这个基础设施之上
出现了一个操作系统
从系统出现之后才出现各种网页
雅虎啊这些出现之后
然后应用就开始爆发了
用爆发之后
当然Cisco的这个价值
一下子就体现出来了
所以这个OS是非常重要的
那大模型时代的OS应该是什么呢
对移动互联网的OS
这两个都很好理解
对对现在就是难的
难点就是在大模型时代
人工智能时代
很多人会觉得自己是个OS
但是并没有
比如OpenAI对吧
OpenAI其实当时做了一个OS的尝试
叫GPTs他觉得我自己是个OS嘛
他就是就是模仿iOS的做法嘛
然后我也充分的隔离了上下层
在他看起来就下面是这个底座模型
上面你就是GPTs上各种应用
甚至最早叫Plugin嘛
后来变成了GPTs
但是呢它的核心点就是说它的上层
就是把应用层跟它的这个底座模型
或者叫基础设施的这个中间的分界
其实并没有那么清晰
或者说如果你是按照他这个分界的话
你的价值就变得很低了
谁的价值变得很低
就是医用层的价值
应用层
你看很容易你被底座就给覆盖掉了
是的是的对吧
因为你回到互联网时代或者iOS的
首先比如你在上面做个雅虎
你跟浏览器是没有任何冲突的
是没有任何的重叠的
浏览器做浏览器的事情
你做个雅虎.com
你是提供内容提供流量
提供用户运营
提供商业化
这个是你雅虎做的事情
但是浏览器不做这个事情
所以你两边是非常分割的
就是它这个分界线是很清晰的
这个叫上下层的
这个解耦是非常清晰的
到iOS时代应用一样
你做的是微信上的APP
是微信和比如说Uber吧
你跟iOS是完全不一样的
你一听就知道
iOS跟微信是没有什么可以交叉的点
但在今天
你看
你基本上所有的所谓的GPTs上的应用
跟GPTs本身都是会有一定的重叠的
市场是有相当大的重叠的
我们提到应该提到那个Notebook LM嘛
对吧它其实跟GPT的功能
GPT其实很多时候也能实现这些功能
但是在之前那个Jasper
Jasper跟GPT的功能就
是或者说你今天在GPTs就非常清晰了
GPTs上所有的这些功能
其实它很多是做了一层产品上的一个
我们有时候叫壳儿嘛
但是GPT其实很多时候是可以实现的
而且它在迭代的过程当中
它可能会实现越来越好
而且你们的数据
就是我作为应用层的数据
跟底层的数据
就底座吧
就是foundation model的数据
其实它的数据跟你的数据
有时候长得其实是会非常像的
还有一个
这个分界不清晰的另外一个特点
就是说我们可以从另外一个角度去看
就是说
今天你做了一个基于GPT的一个模型
出来垂直模型
然后你用这个垂直模拟
去回答你的客户的问题
这时候客户回答了一个问题
得到一个答案
这时候你能不能清晰的判断
这个答案后面支撑的这个能力
是由底座提供的
还是由你的这个应用提供
其实在很多情况下并不是那么清晰
这个跟互联网是不一样的
比如互联网就说我在Uber
Uber上我你实现了Uber的功能
但其实哪一块是iOS提供的
哪一块是Uber本身提供的
其实是非常清晰的
网页和浏览器的这个区分
应用非常清晰的
但在今天他在训练阶段
他的数据很多都在一起了
其实我刚才说
一切都可以从数据层面去考虑
这个事情
其实数据今天是看出来
没有一个特别清晰的
一个切分的点的
对
我们待会可以仔细再讨论一下数据
但是回应你刚刚讲述
的这一部分
其实有一点我是不太同意的啊
好的比如说你提到了像Notebook LM
它的那一部分
它是不是一个跟GPT非常相似的
这样的一个应用
我觉得表面上来看很简单的回答是
但是根本上又不是
就是因为它的底座模型
其实是谷歌的Gemini
嗯嗯嗯它之所以就我说GPT
其实就是Gemini属于这一类
就是底座模型
对对对应用因为这个产品啊
让我最近两周对整个大模型的看法
我在心态上发生了很多的改变
因为这个产品
我发现比如说
我把我的播客的一个链接放进去
然后他最后可以自动生成一段
这个英文的播客
他其实不是为了生成播客的
简单来说
这个产品你可以理解成
你放长文本进去
它可以给你一个summary的研究报告
同时你可以去问它
这个研究报告里面的各种细节
它也会给你一些引导性的问题
在这个层面上
有一点像那个Perplexity
就是有一点搜索似的
他在给你回答的时候呢
他也会引用他的这个回答
是根据哪几段来整理出来的
他的这个体验非常好
之所以能生成Podcast
是因为它最近就新加了一个功能
不知道是哪个天才工程师啊
在Notebook LM的右边加了一个
它叫做Audio Overview
就是音频的总结
但是他非常聪明的
把这个音频的总结
做成了一个播客的形式
所以就是他现在是可以一个链接
或者一个长文本
就自动生成一个播客了
我觉得就是你
说语气语调很好
交互非常自然
我觉得
这可能是有很多工程上可以调的问题
但是
我觉得这个产品最让我惊艳的部分
是他抓点的能力非常强
就翟老师
我们之前都做记者
其实一个好的记者
他要非常会抓这个问题的关键点
要会抓细节
同时要会抓关键的案例
就是我觉得他在这一点上
是比我们招到的一些记者的平均水准
是要高的
但是对你说它的分析逻辑怎么样
就不讨论
但是整体上我觉得这个产品
就我前面说了那么多
它其实都有一个非常大的特色
就是Gemini这个底层的模型
它的长文本的处理能力
其实在这次今年的Google IO上
他们有着重的强调这件事情
它是做得非常好的
它可能是比open AI的底座模型要好的
所以其实我就在想
就像你刚刚说的
你说这个应用到底是应用本身的能力
还是这个应用底层的模型的能力
它确实就是分界不清
对这个就是我说的
可以说是个特点嘛
但是在我现在看来
其实应用在制约
现在这个生态的一个问题
据说这个分界不清晰
我们讲这个例子时候
不是在讨论GPT
而是讨论Gemini
Gemini跟Notebook LM
就是一个底座跟上层应用的一个
其实就刚才说它的这个功能
比如它生成了这么一个音频的summary
你说这个功能
这个里面一定有很多是底座在做的
底座在实现的
其实Notebook LM
当然技术细节我们没有去
但是我们从
外面看就刚才你说的这些功能
其实回到我刚才说的这两条线
一个肯定是产品设计线
就是我们之前说
因为它的实质还是个互联网产品嘛
就产品设计线
这个一定是它的一个特点
詹姆莱也可以做这个事情
但是它跟用户这个交互的这种流畅性
这个是互联网经理产品经理们做的
这个最强项的一点
很多其实是高于这些底座
模型的这些团队了
所以这个他一定做的很好
他跟用户的交互
所以让你会觉得很流畅
很好用对吧
也很耐用
这个是他的第一条线
第二条线他一定是做了
他是做了一个
相当于是在这个上面又做了一些Chatbot的提升的
这可能是用一些微调翻跳
然后他肯定是要做一些Rag了
Rag做些检索增强生成这些功能
所以这是我说的数据线
他会用数据线去增强底座的这个能力
那现在的问题就是说
所以我回到我刚才这个核心点
它是一个AI的应用
它不是个纯互联网的应用
所以产品那条线
是不能足以支撑它的长久的
当然这个它有点特殊性
它就是Google内部的一个
但是
我们如果假定它是一个外部的产品呢
就是其呢
我有个外部公司
应用对外融资的
然后但是我就从一个第三方公司角度
我用Gemini的
所以你就觉得
如果是第三方的公司
来基于Gemini上面做这样一个应用的话
他的核心竞争力就没有那么强
核心竞争力就会比较有挑战的原
因是说他长期的
因为短期他可以就像这个Notebook LM一样
借助他产品能力
和对于一些数据的处理能力
就是刚才说可以做微调可以做
但长期还是要看底层模型的能力
长期你再往下
首先你的数据就回到我刚才这个观点
我的观点但是未必正确
但是是我很重要的一个思考
这个就是AI原生时代
跟互联网时代的一个差别
就是我一定要讲数据
而且我数据是越多越好
这个很多人其实同意的
但是
你用这个观点来看这个案例的时候
你就会陷入这么一个
就说Notebook LM
如果它是个独立公司
它一定要不停地积累数据
他数据会越来越多
他数据多了以后
我再怎么样再去跟底座去结合的时候
我是继续可以用翻跳
还是我继续用rag
都会有甚至我还有很多数据
其实是更适合于预训练了
其实如果我们在计算看的深一点的话
我们会知道
其实不管是翻听就是微调还是RAG
其实都会跟底座有很大关系的
你是需要很多底座的支持的
就尤其你越做越好的时候
那这个时候你跟这个底座模型的这个
其实我刚才说
你其实是不太容易去解偶的
你要这条路要走的很长
你的defensibility
门槛护城河要很高的话
你是一定要去一种方法
就是说
你怎么样跟Gemini做一个更深度的
或者说你你就要做一些自研的
就或者你自己去训练一些底座
某种预训练的方式去生成自
己的一个底座去支撑自己的
这个其实是我们可能看到很多
包括像Perplexity这样的公司
Perplexity大家可能知道它是
其实是DeepMind的背景
对
我们从各种渠道都听说他们其实是
其实他们最开始肯定应用这条路
就Perplexity第一个产品
很可能跟Notebook LM其实一样的
它还是比较轻量的
但它越来会越来越重
越来越重
它也会去买显卡
然后再去往Pretrain
就是预训练这条路
所以你的观点是
所有的应用公司
最后都会去拼自己的模型的这条路
在今天的这个技术架构里面
很不幸似乎是这么一条
但是就是说对于不同创业公司
可以寻找不同的方向或者道路
但在今天这个架构里面
可能你没有太多其他的选择
你只能先按照这个
不然的话你总是要回答这个问题
我需要把数据越来越多
然后数据越来越多的时候
我怎么样不断的维护我这个门槛
同时推进
因为你做个应用
事实上你应用有这个责任
是推进scaling law的
这个
是作为应用的一个很大的一个角色
翟老师同意吗
呃我感觉数据这个肯定是这样的
我非常同意
我感觉Jonathan讲的这一点
其实应用
我们做数据这块的一个考虑了
因为数据肯定是接下来的一个切入点
数据的话
你怎么去使用数据
你得到的是什么样一个质量的数据
就为什么说结构化的数据
和就是你把整个网页随便一抓下来的
这个unstructured
就非结构化的数据这些东西
其实都会带来不同的产品
甚至是嗯
但是你认为所有的应用
最后开始都会卷到底座模型这吗
我感觉主要现在是太早了
说白了还是一个太早的时候吗
就刚有互联网的时候
没有各种的开发者工具
什么都没有
那这会中间这些层啊
我理解Jonathan就这些层什么都没有呢
其实说白了
那接下来语言模型再往下发展
那周围的这一套配套的设施
因为互联网也不是一上来
就把所有配套设施都建起来的吗
也像你讲啊
就是有了浏览器之后
很多东西又开始往上再叠加
所以它这个我个人的一个理解就
说白了就是现在太早了
就跟那个苹果的这个APP store
刚出来的时候
应该大家也没几个人还能记得
最开始那一批很火的这些application
就那个应用都有什么了
其实那会应该是最早的时候
第一代iPhone
我记得那会最火的一个应用程序
就是手电筒
就我一下载之后就装个手电筒
收我9毛9
不收多少钱我也记不清了
然后那会感觉哇
这好了不起啊
这手机还能这么装一个东西
就可以当手电筒用
对吧都是各种
现在回想起来
都是特别又幼稚又傻的这些应用
所以这东西就看怎么看了
就是在当时的情况下
不少的应用应该也都赚到了钱
但是他们会不会都成长为像后来Uber
像后来的Doordash等等这些非常成功
或者是在某一些程度上
非常伟大的公司呢
它其实也没有
所以说就看
心态问题了
或者说
你把自己做的这个产品或者公司
是放在一个什么样的时间语境下去看
是放在一个风物长宜放眼量的
一个几十年为周期的语境来看
你想做成一个伟大的公司
还说我想赚个200万我就跑了
那这个应该是不同的一个逻辑来看
这个事情的
你们属于哪一种
我们肯定是这个风物长宜放眼量了
对啊这肯定是这样的
因为我们是数据人
也都是看第二种
对第一种叫Utility
对Utility
很多其实不属于我们看的范畴
对对其实说到这个我其实还想问
因为我们也在市场上看到了两种公司
第一种比如说它就是一个应用
它始终现在在Google store或者APP store
它的榜单的前十名
但是呢这类应用它也不融资
它可能就是靠用户付费
它就能赚很多钱
但是说实话
就大模型一更新
底座模型一更新
甚至是大厂的一些手机升级
它很可能就会覆盖掉这些应用
但是他们可以赚一个短暂的钱
而且还挺赚钱的
这是一波对不对
然后还有一类
就是说我想去做基业长青的公司
那可能就是投资人考虑的这一类
所以我理解
你刚刚说
所有的应用都会做到底层模型
其实你应用想说
我们要抱着建立一家
整个AI时代的独角兽的
这样的一个想法
去看待这家公司
而不是说
这个市场上哪些是赚钱的公司
来去看待这样的公司的心态
对
对我们刚刚其实反复在提到数据啊
Jonathan我知道
你对人工智能是有自己的定义的
就什么是人工智能
你要不要跟大家讲一下
你自己对什么是人工智能
就是这个问题本质的理解
以及为什么数据那么重要的一个逻辑
对可以再重点说一下这个理论
其实人工智能的历史
基本上跟整个计算机科学
是差不多平起的
一九五几年的时候有这个
有个达特茅斯会议
从那时候人工智能就开始了
所以刚才说的那些领域
包括agent
就是智能体
包括像自然语言处理啊
我刚才说一系列的这些继续学习
神经网络
都基本从那时候就开始了
但是我定义的人工智能
其实是从2012年开始
就真正的
我们把它叫做产业化的人工智能
就是如果非产业化的人工智能
其实我们不需要太去花时间
因为它就是科研嘛
但是产业化人工智能的其实核心点
我总结其实就是深度学习
这个是我的一个很核心的一个 -
E170_大模型应用之困与异军突起的_埃森哲们_(1)
欢迎收听硅谷101
我是泓君
今天跟我在一起的两位嘉宾
一位是华映资本的合伙人Jonathan Qiu
hi Jon你好
听众朋友大家好
对还有一位是AgentQL的创始人Keith Zhai
哈喽翟老师你好
泓君你好
谢谢邀请
因为今天其实我们主要想聊一下
大模型方向的应用啊
就大家一直在提应用应用
但是投资人是怎么看这个市场的
包括创业者最终在这个市场里面
好不好难融资
好不好做商业化
待会我们可以具体的讨论一下Keith
你要不要跟我们介绍一下AgentQL
它是做什么的
对AgentQL的话
它其实我们是一种比较底层的一个语言
但其实核心的话
就是可以把所有的网页
和所有的document
很容易的变成structure data
就结构化数据
抓完结构化数据的话
你可以去来做分析
做商业分析也好
或者是做其他各种各样的东西也好
这个是一个非常简洁的一种方式
因为过去抓数据
其实是一个非常复杂的一个过程了
但是我们是把一个网页和文件
都以一种语义的方式
来结构这样的一种东西
嗯对
其实说到生成式AI的这几年
我们整个播客聊他的时间还比较早
大概从2022年
就是ChatGPT还没有发布
开始是扩散模型的时候
就文生图的时候
已经在报道它了
经过这几年啊
其实我觉得我自己的心态上
也一直是在发生改变的
大家最开始说在整个的这个市场里面
最大的应用就是ChatGPT对吧
其实我是前几天看到这个Notebook LM出来我觉得
它其实是比ChatGPT要更惊艳我的
因为我是做播客的
但是这个产品我们具体放到之后
我们可以再聊啊
那在之前的时候
我也想听一听
大家在投资跟创业的过程中
跟随AI这波浪潮
你们在心态上的一些改变
Keith你应该是这一轮中
才开始自己的创业的
对我们是从去年下半年开始的吧
这改变东西实在太多了
因为整个这行业实在是太早了
其实像泓君你们聊的时候
这个事其实更早嘛
但是整个这一波AI的话
对于绝大多数公司来说
应该是在就ChatGPT3.0前后吧
很多人开始往这方面去看的
在此之前的话
就比如说上一代嘛
现在大家都会说
上一代的AI和现在的AI
在很多人眼里
是完全不同的两种东西了
归根到底
它是一个非常年轻的小娃娃
可能就才两个月大这样的一个小娃娃
所以一切东西实在是太新了
而对一个小娃娃来说
它这个是日新月异的
每天都在成长
就比如说当时我们刚刚开始的时候
那个时候其实连agent这个词儿都没有
也就是中文讲的AI智能体
这个词儿当时是没有的
因为以前一说什么是agent呢
那你按照中文的这样一个转换过来
一个理解
那就是007
就什么邦德对吧
FBI这才是agent
那别的agent其实是就没有这个概念的
后来那我们刚开始的时候其实也不知道这叫什么
但是后来的话才慢慢发现哦
这个市场开始慢慢有了一个定义
叫agent
那这个时候已经有这个定义之后
OK这时候又发现一个问题
下一个演化呢
就是说当大家都在谈论agent的时候
大家在谈论什么
因为最开始当出现agent的时候
大家说哦
我们见面都会聊agent
agent right但是其实什么是agent呢
这东西是完全不一样的
我说的agent和你说的agent
可能咱们在讨论用一个词儿
但其实讲的是完全不同的两个东西
你可能说的是一个chatbot
就是一个聊天机器人
我可能讲的是一个动作的
一个范式的动作模型
对
或者是一个工作流程的一个自动化
所以说这就是很像村上春树啊
什么就当我在跑步的时候
你在想就是没有人知道你在说什么
这个其实就是当一个很多的事物啊
在他一个非常早期的时候的
我认为是一个很明显的体现
对Keith
如果听过我们播客的同学
可能对你之前聊到的一期爆款节目
就是我们讲东南亚诈骗的
还非常有印象啊对
那个时候
你的身份还是华尔街日报的记者
这次其实你是以一个AI创业者的身份
来继续参与我们的节目
就是我很想知道
当时你在选择AI这个赛道
来创业的时候
你是怎么想的
然后当时市场是什么样的
然后我们对比今天的这样的一个市场
就是你觉得这中间不管是
心态上还是融资
还是大家对这个行业的认知上
最大的变化是什么
当时的话
其实肯定有很多原因了
因为我之前那份工作
做了将近20年的时间
应该做的还OK的
但是离开的话
其实肯定有很多的原因在里面
但是我感觉其中一个让我跟本期话题
可能是最接近的一个原因吧
是当时我记得我问了一个不错的朋友
他应用一个非常成功的
国内某一家很大型上市公司的
一个创始人
之一因为当时我是想开始做了
然后我跟很多人去聊这个事情
聊AI啊大家怎么看
我记得当时呢
印象很清楚
我们是坐在一个酒吧里
他当时在开始跟我讲
他说Keith
这是一个范式的革命
paradigm shift
什么是paradigm shift呢
就是像电器
像这样的一个不是一个行业的改变
它带来是整个社会的一场改变
这样的一种革命
他说你
当你认为这个是一场范式革命的时候
你不需要去想你要做什么
你需要做的是进去开始做
这就是为什么我最开始
当时的一个最主要的决定点之一吧
因为我自己作为一个知识的获取者
或者知识的产出者
我自己过去这些年啊
用过好多好多的其他的语言模型类的
就上一代的AI
我用过好多好多产品
但这些产品在我看来
根本还是距离
我自己写作都是没有办法去比的
就差的非常远
但是当我最开始用GPT-3的时候
就我自己心里那个震撼
应该是一个非常强烈的
那我随着推移
我能看到它是这样的一个范式的革命
那这个时候我是非常同意的
那这时候干嘛呢
你先跳进去
先扑棱扑棱在里面再说吧
基本是这样的一条逻辑
对那现在的感受呢
现在的感受
当然就一直在里面扑棱着了
作为创业
那不就一直在里面扑棱着吗
就是一直
就是我们去年开始到今年上半年
一直在stealth这个隐身模式
中文可能是就是到这样的一个时候
反正我们刚做完A轮
但是整个过程中
从来没有感觉一天是在上岸的
一直在水里扑窿着
因为像你刚才讲的泓君
整个这个行业
整个时代变化的实在是太快了
跟过去不是一个量级的改变
过去的这个十年来说
和现在的话
它在范式革命过程中
因为尤其是叫AI
它对效率是一个根本性的一个调整
那在这样的一个环境下
它这更新换代
整个迭代是非常快的
对我来说
在过去的一年多的时间里
适应这样的一个快速的更新换代
其实对创业的人来说
可能就要不断的在水里去扑腾
可能过去你做完a轮可能也会感觉哎
是不是上岸了
但现在的话
甭说做完a轮了
我们看到多少公司做的更大了
容了更多钱的
上百个million的
这样的一些公司
大家最后也都不行了
所以上岸
是一个很难去拿融资的阶段
来界定的事情
嗯对
其实在我来看
我觉得你们的融资已经是非常顺利了
也很快
是是
我感觉是这样的但是还是距离上岸
就是所以说感觉是不一样的
对就在这里面
一直在水里扑腾着
对对
那我们现场正好有一位投资人啊
Jon 你会怎么看
因为其实我知道
你最开始是学人工智能的
然后你一直都在这个领域
也在这个领域做投资
包括看项目
你觉得当时ChatGPT出来跟现在
你再去看
整个生成式AI引领的投资浪潮
你觉得这几年最大的一些变化是什么
首先我们从GPT刚开始出来到现在
其实并没有核心的转变
因为我们投资的最后
都是以商业化为目的
对吧
其实我们其实都是投以应用为导向的
但是有一个小的转变
就是我可能自己开始思考
是不是纯应用的
在今天会有一定的风险
所以它其实需要一定的整合
这个是我现在的一个思考
就ChatGPT自己
它其实应用个叫垂直整合的应用
它虽然是个应用
但是它是有很强的一个底层能力
因为刚才刚好也说到agent嘛
其实agent其实应用
刚好是在整个技术栈里面
非常重要的一块儿
刚才泓君也介绍了我
其实最早我是学AI
其实就是我事实上是agent的方向
就我补充一下
agent其实在90年代就有了
当时的agent是指什么
其实是一样一模一样
就是叫智能体
对我是叫Multi agent collaboration方向
说的更完整一些
就是叫多智能体协作
这么一个人工智能的一个分支
就人工智能其实有多个分支
包括深度学
那是不叫深度学叫机器学习
神经网络这个agent
自然语言处理及其视觉
其实都是人工智能的研究方向
我当时南加大的PHD方向嘛
我们选了其中一个
但是我没有选机器学习和神经网络
但后来发现机器学习加神经网络
深度学习就形成了
深度学习其实是
后来发现是整个的一个driver
所以跟那个时候比啊
那个时候的agent跟现在的相比
其实它一个核心的区别就在于说
现在都是在围绕深度学习
这个是我一直在总结的一个事情啊
就是说从第一波我们就要机器视觉嘛
包括无人驾驶
包括脸部识别
就中国有四小龙
五小龙开始到今天的大模型
其实都是围绕着深度学习展开的
所以在深度学习的这个范畴之内
其实我们现在对应用的要求
事实上会比原来要高
原来我们就是有种说法
就是分成两派嘛
就是看应用的或者看模型的
其实这两派事实上是一致的
就是我们其实两都一定会看
就底座模型
纯应用但是在看的过程当中
我们就意识到一个事情
就是说应用其实并没有大爆发
然后它导致了模型
其实也在面临一个挑战
就底座模型
因为上层应用不爆发
我就变得说
我的商业模式
似乎就没有完全体现出来嘛
我作为一个平台
我必须我上面的生态
然后都能够很大规模的
在各个垂直场景落地
我作为一个平台的价值来体现出来了
但是现在GPT为什么
所以他其实他自己
现在真正用的最多的
反而还是他自己的这几个应用
他其实power的这些东西
事实上
现在还没有看到一个特别清晰的
所以这个可能算是一个转变
就是回到泓君的问题
其实我们是
至少我自己是会更多的看一些
能够从纯应用的角度跨越出去的
这样的一种应用
这种应用
跟以前的互联网应用确实不太一样
在互联网的这个时代里面
是有纯应用的
它可以不用考虑太多的底层架构的
这些因为我的底层平台
比如说浏览器
比如网络协议
其实都是已经ready了
就是establish
我在上面
所以我具备很强的产品能力
互联网产品经理
我就能够做出一个很好的产品运用
最早的时候是一个网页
后来变成一个APP
它是能够在这个上面很快的铺下去
但在AI年代
其实跟互联网是有一些不同的
是或者说它加了一个维度
就同样它应用一个产品
它必须有产品的形态
但是呢
同时它有一条我称之为叫数据线
就回到刚才叫深度学习嘛
因为我们现在都是围绕深度学习的
深度学习其实一个最重要的基本点
包括我们现在今天的agent
跟当年的agent很不同的一个点
就是现在所有的都是需要数据驱动
数据定义的
所以我们在我刚才说的
相当于有一个叫产品
但在产品这条线
只是互联网的一个角色
但是我们在产品这条线的平行的
还会有一条数据这条线
所以我必须得问我自己
我做这个事情
即便我是个应用公司
纯应用公司
我有没有真正的数据
这个在以前是会说
但是没有那么的变成个潜质
相当于是一个不是可有可无的这个说
你对这个问题的回答
很可能是你的一个生死回答
我是不是真的有数据
然后我最后我的数据是怎么用的
对吧现在很多人做RAG也好
做微调也好
我是怎么样真的能把数据
最后能够融合到我
最后的这么一个垂直模型里面
真正然后再跟我的产品合在一起
所以现在相当于是有两条线
是互联网产品这条线
还是再加上AI的数据这条线
所以比起当年的互联网创业
其实在应用侧使门槛多了一层
所以现在的难度事实上是加大了
对我觉得
我们可以一层一层的往下去深剖啊
就是产品跟数据线
但是在此之前
我注意到刚刚两位
其实你们都有提到一个观点
就是觉得他离大爆发
或者像Keith的表述
就是说离上岸还很早嘛
也就是说
其实我们现在界定这些应用
它是不是真的对我们有帮助
这个可能是存在争议的
而且Jon你记不记得
之前其实我们有一次在咖啡馆聊天
你有问我用着怎么样
我其实自己的感受就是
我现在还很难用ChatGPT
让他帮我去写采访提纲
去写shownotes
因为他问出的问题不够好
他整理的shownotes
我觉得跟我们所要求的
他达到的一个水准还差很多
你觉得这个是跟AI的能力有关系的吗
是的这跟AI能力是有直接的关系的
所以我们看一个浪潮吧
或者一个大的时代
从我的观点
我觉得至少有三块
就刚才说的
我们是叫底层能力
这块是非常重要的
对应互联网年代
我们可以理解成就是当时
因为我在硅谷第一份工作是思科嘛
我从那个南加大毕业
思科其实当时提供的
就是这种底层能力
互联网最核心的就是连接嘛
这就叫网络嘛
它就是用网络协议对吧
那是叫TCP IP
后台的路由器交换机帮你连接在一起
这个是最重要的
但在今天的大模型或者人工智能时代
最重要的
其实还是我们把叫做涌现能力
或者叫做是底座模型
叫foundation model
底座模型的这个能力
这个能力其实还在迭代
就你刚才说的这个层面
其实还在这一块
它的底座还没有完全
就像当年思科
可能我就有点像
我的协议都还没有完全的稳定
就是你觉得基础设施还没有好
就是我们即使看美国最先进的模型
它的基础设施还是不够
还没有完全ready
但事实上它已经很不错了
实话说就是它已经能做很多工作了
这是一块
然后适当今天还缺失的
就是我刚才想说的有一块
其实在基础设施之上
其实还有一个东西叫做操作系统
叫OS这个在今天其实是非常缺失的
在今天大模型时代
大模型时代的操作系统跟OS是什么呢
其实首先OS的定义是什么
就OS跟基础设施
Infra Infra的定义是什么
Infra更像是工具
就你拿来可以实现
就可以帮助你
这就是今天你做的上面的这些应用啊
Developer啊
它都可以用Infra
但是OS一个很重要的点
就是我可以把底层的细节
跟上层的应用很充分的隔离开
这样应用该说的
你就可以就是个产品经理
你就是一个应用场景
垂直领域的一个专家
你就可以来做事情了
所以在互联网时代的OS
其实就是浏览器
所以在互联网时代 -
E169_特斯拉Robotaxi发布会的台前幕后_兴奋的现场与失望的华尔街(5)
作为一个汽车公司该有的东西
你都能有
这是他一直欠缺的
欠缺了好久啊
然后所以其实在这儿
bare minimum最次的
啊最差
大家其实是希望看到
哎你能给我一个update
告诉我我的model 2是个什么样子
什么时候会来
我的price他给大概是多少
我的这个配置是什么什么样子的
一直都没有啊
昨天大家戏称了
说这个Cybercab就是
这有可能是model 2的一个改良版
哈哈哈是
吧大家都这么讲
那你看但是他其实没有给你个细节
说我这个model 2是什么时候才能出来
那你明年的预期是怎么算
没有model 2
可以很确定的讲
你的这个EPS是给不上去的
你的这个profit margin也是给不上去的
你可能就是现在这个
现在大家可能市场给个两块五
三块钱的fiscal year 25年的这么一个EPS
那你给他50倍估值
就算3块钱
50倍估值是多少
这就公司就值150块钱对吧
那你给70倍估值才
哈哈哈是210块钱才
所以你什么样的一个增长是deserve
这个70倍的估值啊
这就是市场的struggle
那好这是你的传统的车的这个业务
那说
我喜欢你未来你讲的这些所有的故事
啊无人驾驶robotaxi
我愿意给你一些多的估值
我觉得现在比如说210块钱的股价
已经给了很大一部分这块的估值了
但是你不能一直讲故事
你你得这故事要一点一点兑现
这就是回到我们刚才说的
在这一块里面
大家不否认它在FSD上的领先性对吧
确实是严而不否认
他可能在这一块比起其他的竞争者
他更有优势
但是到目前为止
这个东西没有办法去Monitize对吧
你没有办法
就是我算出一个
他对我的EPS的这个增长
能够提升多少
哎这就是我们说的没有细节
哪怕你给大家一个肉卖
不知道你刚刚讲的
有一些些细节的时候
大家都好去推算这个数
什么都没有的话
真的是很难去给估值的
所以我觉得这就是市场的struggle
你作为一个投资人
当你看到这一票
你有这么好的一个创始人
一个CEO
但是在另外一点上你没有办法
你去想说服自己是有点难的啊
除非我就无脑信了
哎我这是对你这个人的一个信任
可能
但是市场未必是每个人都是这么想的
希望我讲清楚了
哈哈对
非常清楚
特斯拉股票在今年以来
其实就像你说的
还是比较挣扎比较struggle的
在过去一年来
我们先不讲year to date啊
过去一年来其实现在还是负的
超过17% 但是呢
就是现在的价格其实是比今年
比如说4月中的时候
今年4月中那个真的是个低点
当时是140美元上方一点点的这个价位
那从4月份到现在
其实已经是涨了不少了
现在是在217 210上方的
这样的一个价位了
那在过去的这段时间的涨幅
你觉得更多的是跟着大盘一起来的
还是说它其实是
还是包含了市场对于特斯拉未来FSD
还有robotaxi这部分的期待呢
之前跌下来
尤其是年初那一大波跌下来
其实但是
市场把重心放在了他的基本业务上面
因为那个时候FSD的更新还没出来
如果没有记错的话
那个时候市场完全就是看到
你能卖多少车
你能不能deliver
当时是状况是非常非常糟糕的
所以整个大盘在往上走
Tesla是在往下跌
哈哈那时候你求Tesla
真的是很辛苦的一个事情
后面到了我忘了具体时间了
因为那个时候
我记得我们好像还在硅谷的时候
还见得有
当时也我也在硅谷哎
他的FSD出来
还组织了一个
对对对还有很多投资人的一个聚会
然后当时我也去了
当时我还记得
很多的投资人
其实对FSD当时是抱有很强的预期
跟期待的
期待的当然在现场很多的技术
对对对也有警告说
可能这个robotaxi
或者无人驾驶
这个技术没有那么容易
对我记得对
那个时候咱们是有那个对话的
对其实后面再回来
其实就是他在这一块
说白了就是有了新的故事讲
然后再往后呢
可能这个车的生意
就没有大家担心的那么下滑的
那么严重
哎那这些利好的消息
又把这股票砰砰砰砰砰就推上来了
随着后面马斯克和董事会的争执
当时还有一个他的工资的问题吗
如果你还记得话呸
还专门开了一个董事会
把这个问题又解决掉
大家会认为啊
伊隆马斯克
他的现在的重心又可以回到特斯拉
这是有很多这种故事
大家想一想
其实是之前是阻碍这个股票发展的
这些问题慢慢解决之后
其实特斯拉这个恢复还是挺漂亮的
漂亮到这个之后呢
包括在这个event之前
大家对这个的期待也是在这个里头的
现在很多东西就落地了
开始了经常有这么一个part嘛
大家叫sell the news
当这个东西真正的公布了之后
哎啊
大家发现Elon Musk是一直都这样子
可能老股东也都习惯了
都是over promise under delivery
对吧但是他又很厉害
最终总是还能给你deliver
哈哈哈但就是这么一个price action吧
啊这个股票基本上就这么走完
那到这个点上
后面的故事是什么
我们其实就可以问一问自己
后面还能支撑他的故事是什么
我觉得FSD一定要有某种形式上的
有一个爆发吧
因为这次会上
正是另外一个让人失望的点
他对FSD的技术上
或adoption上面的进展是什么样子的
也没有一个公布啊
大家都不知道
大家都说还行
还可以但是你现在是每个月收100块钱
到底有多少人用啊
哈哈哈哈
你相对的安全指数是什么样
这些都是很模糊的概念
每个人的理解又不一样
所以这些就是投资人怕uncertainty
这些都是uncertainty
那接下来看
确实也看不到
至少我们没有想
我也在想
因为这个
大家正在琢磨
后面的特斯拉的利好的消息
或者以外的会是什么
现在可能暂时就出现一个真空期
那短期内我觉得的股票是会受影响的
那当然了
如果大盘起来了
这又回到另外一个问题
大势起来了
再比如联储进入降息周期
我们的这个周期股又起来
就是意味着他的卖车的这个生意
可能又要稍微好一点的时候
哎那可能又会帮着撑一撑
所以后面可能就是市场的focus
市场在意的点可能会有变化
这是我的点
但总体来讲
它要能够支撑它变成一个梦想谷
的东西
现在是缺失的
对但是今天我们也看到
比如说Uber股价大涨对吧
然后市场意识到
可能特斯拉也没有那么快能够拿下
比如说以后sharing ride
或者是这种打车服务
或者以后Uber如果想要做robotaxi的话
可能就是
特斯拉也没有那么快
能够吃掉整个市场嘛
那你觉得接下来
投资人会怎么去看
特斯拉
在robotaxi这个市场上面的一个布局
你们会觉得在什么样的一个indication
或什么样的一个迹象
会让你们觉得说哎
有可能特斯拉要开始吃这个市场了
至少从现在知道的东西
我觉得这稍微有点早
去做一个特别强的一个判断
但至少给问他
现在这个发布会发布的东西
你很难看到他在这一块
无论是技术上还是从operation运营
其实这是一个强运营的事情
它比其他人有更强的优势
至少这一块是看不到的
那还有一个点是说
那当然这更是speculating啦
就算台斯拉
可能大家会认为
他在技术上是有优势的
对吧其他人都是是L4
可能我台斯拉这个很快就我得到L5
你真的我这个L5的
给我的技术上的优势
它能帮助我再去拓展
或者是去抢robotaxi这个市场份额上
到底有多大的帮助啊
这个mode到底有多强
其实也是不知道的
那其他人会不会相对来说
更快的去catch up
包括成本优势
我觉得这块成本优势也是很重要的
这些细节的缺失就是还是回到那
想拍一个数都很难拍
可能我今天没有办法很详细的回
答你这个问题啊
就说我们怎么能看到段我
相对来说我不会那么乐观
就觉得我只要我摊死了
我决定进入这个市场
我ramp up我的2026年
我这东西ramp up了
我立刻我的这个胜利是given的
我可能不会这么乐观
我觉得还要看他们自己具体的
每一步的去deliver
至少你能像waymo这种对吧
你在这个周
你做这个testing
你得到这个regulation的proval
这些细节你要deliver出来让大家看到
而不是就是简单的说
叫明年我们Texas和California就可以有了
哈哈哈来个好
哈哈哈对吧
我倒不是说他在撒谎和吹牛皮啊
就是有些东西还是要一点一点落地
然后我们可能才能去把它分析清楚
嗯嗯说的特别好
大家都在讲一个educated guess吧
大家都在猜
但是这个猜也要是educated的
不能是拍着脑袋胡猜哈哈
对我这边插一个问题啊
那其实特斯拉除了发布Cybercab之外呢
它还发布了robovan
然后还发布了机器人嘛
你觉得华尔街会买后两个产品的账吗
Robovan我觉得是不会的
这就更这是一个展示品啊
大家看到我未来的发展的方向
他自己也没有更详细的东西去了
人形机器人其实是大家是很有兴趣的
华尔街其实在之前那个
大家也觉得
这是他未来的一个大的增长点的
这个是确认的
那这一次
其实出来这个marginal的变化啊
增量变化太小了
没有什么特别实质性的增量变化
我不知道你们觉得
这只不过是他表现的形式
挺好的让大家走进来
你看那个视频去交流啊
就挺酷的
但是你真的还是回到这
他昨天展示的这个Optimus
和之前展的
还有实质性上
给我们有特别大的变化吗
也还没有啊
但是这是点人形机器人
肯定是特斯拉
这从市场角来讲
给他估值的一个重要的点在未来
也是
对所以你觉得
在这一次
Elon Musk跟特斯拉
在向包括华尔街在内的公众
沟通的时候
他们采取的这个策略其实是不合格的
就是他们不应该这么的简化
他们画的这个饼
他们其实是应该给出更多的信息
才能够给大家更多的信心
我自己是这么认为
看你这个event你是给谁开的了
如果你是给投资人开的
那可能这个确实是有点不及格
哈哈哈哈哈
但是我觉得作为现场参与的人
哎哎呀
这个确实是挺有意思的啊
以这么一个模式
然后有机器人在你这
你这我也看了好多
这些大家后面拍的那些视频
是挺有意思的
这个机器人在那给你
我能理解
从那个角度来讲
哎这时就感觉像去了未来一样
好的好的
因为这期节目
我们也有其他很多特斯拉多头加入
所以呢我们也想问一下
就是能不能大家稍微披露一下
你们在特斯拉上面的持仓
因为就比如说振华
他们肯定是有持仓的嘛
我们可能会在节目里面稍微披露一下
但Bruce我不知道你方不方便披露一下
你是否现在有特斯拉持仓
我们的ETF产品里面
我们是一点持仓都没有的啊
然后在我们的对冲基金里面
我们一个小持仓不到1%
通过option哈哈哈
好的感谢
感谢感谢
好的这就是我们今天的节目
那在本期节目中
三位嘉宾
像Leo
于振华还有Bruce均有特斯拉的持仓
节目不构成任何的投资观点
投资有风险
入市需谨慎
另外
大家如果对特斯拉的技术感兴趣
可以去听我们之前的播客
也可以在硅谷101的视频上
找到我们对自动驾驶
最近做的一些总结性的报导
我们10月19号在硅谷也会有一场活动
去继续探讨生成式AI的方方面面
如果大家感兴趣的话呢
欢迎来报名我们线下的活动
期待我们线下见
最后
中国的听众可以通过苹果播客小宇宙
喜马拉雅
蜻蜓FM荔枝FM网易云音乐
QQ音乐来关注我们
美国的听众可以通过苹果播客Spotify
还有可以在YouTube上搜索硅谷101播客
来关注我们
感谢大家的收听谢谢 -
E169_特斯拉Robotaxi发布会的台前幕后_兴奋的现场与失望的华尔街(4)
我刚才说从20多块钱股价跌到12块钱
但是你看今天200多块钱
你都难以想象
对吧就那个时候
就是一个非常非常差的一个环境
其实我不太喜欢
那一次的发布会的一个很重要原因
就是
我觉得整个团队是放下正常的产品
而为了这个这件事情
我不做产品了
我去就为一个特定路线工作一个月
和这一次是截然不同的
这一次你看9月份的FSD进展这么大
这么迅速
显然这个团队没有为了这发布会
而放下产品的研发
而2019年的是放下产品研发
而且他给大家压力非常大
是那次发布会之后fire了一组的人
fire把这个planning control的人全都fire了
你说2019年他把planning control全fire了
对这2019年 那
次发布会
我不刚才说了
他当天晚上认为非常成功
他说给大家放3-4天的假
我不是还都去蹭饭了吗
结果蹭饭我可能还没回到我家呢
我当然我也住Mountain View
我还没回到Mountain View的家呢
然后就是收到领导邮件说快回来
出事情了
就好像是他是在洛杉矶
在好莱坞跟人家投资人在进行聊天
看
我们这发布会多好
人家好像我记得是摩根斯坦利还是哪个bank的人跟他说
你们这不行啊
我们还是看重Waymo
本来很生气啊
回来之后开始裁人
把整个Planning control的一组的人
全裁掉了
所以那一次的这个
我其实很不喜欢的一次发布会
我相信你们也没有任何同事
喜欢那样的发布会
我们喜欢的是这种发布会
对是让Phil
让云塔这些核心的骨干
让他们更加有激情有斗志
觉得实现人类未来理想了
这样的一个发布会
而且unsupervised FSD
我觉得在他内部评估
或者在他的整个特斯拉AIS组的进展
给他brief的情况来看
让他自己本人认为已经近在眼前了
就是他昨天是一个非常非常轻松
甚至说一个无所谓的
就是说我来给你铺成一件事情
这件事情一定会到来
这样一种心态
我觉得他昨天的整个的发布会
感觉还是在展示一个概念车
同时也是把机器人技术展示了一下
顺便我想八卦一下
就振华你消息比较多
马斯克是一个在发布会前
会准备的人吗
也有可能是改PPT呢
这也是有可能的啊
因为对对对
因为上一次说这个事了
哈哈哈
上一次2019年啊
Autonomy Day2021年2023年两次AI Day
2011年的那次AI Day的
前几个小时就在改PPT
然后就删了十几页
所以说昨天这么快的结束
搞不好他把一些重要的细节告诉他了
啊哈哈哈
就给删掉了
也许是我觉得振华这次说的那个信心
其实是挺有特色的
因为其实Tesla
我觉得他的纯视觉的方案
其实之前在自动驾驶界
应该是大家不太认可的方案
是吧
包括其实你也会看到Waymo进了三番
武装到牙齿的
他的所有传感器
可能装到每一个corner的范围内
而且一定要corner上都会有激光
雷达和camera同时会出现
因为它需要保证
所有的各种case都能够cover住
那其实台词了
你现在看到的还是这么几个
typical cover的side top
我觉得做起来难度非常高
说实话但是呢
我觉得马斯克他有自己的特色
他自己一直有自己的信念
就他觉得人能看见什么
能开出什么样
我的车应该就做到是吧
人也是不能看到我车所有的这些corner
这些情况
是吧人也是不能看得更远看
绕过去东西看
但是既然人做不到
他能开那为什么我的车开不了
其实它是它最非常有这个信念的
所以它一直在坚持做这个事情
那直到我觉得它应该是20年
是不是它当时发布的那个HydraNet开始
我觉得它整个技术突破上
就大家开始非常的impressive了
就觉得他开
始在类似于端到端的方案
或者纯视觉方案上
他的突破开始越来越快了
20年还没有端到端吧
不是端到端
当时当发布的
我印象中可能是20年
他发布了一个HydraNet
叫九头龙的一个概念
就它后面有个大的backbone的一个network
然后前面会有一些九个
或者一些special的pad
所以你是从2020年就开始关注特斯拉了
我是18年就买车了啊
所以我其实很早就关注了
我说他的这个技术的发布会
我其实会关注
他的整体的技术方案我会关心比较多
但是真正他的自动驾驶的技术方案
我觉得真正打动人心的
可能是从HydraNet的开始
大家会觉得这个事情开始不一样了
包括其实在Waymo内部
其实也从那个点上
我觉得非常的关心
他们的进展是怎么样的
以及类似于纯vision的方案
到底能做到多好
会把他seriously
当成一个很好的竞争对手
我觉得说到HydraNet
我就觉得特斯拉特别的善于起名
就是内部啊
包括Andrej Karpathy
这个人特别的能够取名字
跟他开会一会儿就蹦出一个名字
一个概念
然后这个present给Elon
就我觉得他也很喜欢
我觉得这是一个在特斯拉一个工作
你会看到特斯拉工程师的一个画像
形容很重要一点就是打鸡血的感觉
包括泓君
我们比较熟悉的Phil段
他昨天这个发了一个tweet啊
很肉麻的啊
他说我和世界上最好的人
然后在做最好的项目
太幸福太inspiring啊
然后伊朗
还给他回了个心啊
这个然后给像这种然后包括云塔
他说我来洛杉矶工作
我的孩子在视频上看我们的直播
他说我觉得非常自豪
他为我自豪
我自己也觉得非常自豪
我觉得你看你有没有觉得像一种
就是以前美国老一代的工程师
就是他们在拉萨工作
为了这个登月
有这样一种情怀的一种感觉啊
就变成了一种说
大家有的时候说
特斯拉的粉丝是宗教啊
你你不得不说他有一种宗教属性
在Elon变成了一种宗教
所以说
这就是一个很有意思的一些小故事
我好奇一个细节
马斯克他在开这种发布会之前
他会准备吗
他会花多长时间准备
然后他会在前5分钟
来推翻你们之前做的所有的PPT吗
因为你跟他合作过很多次了
这个准备其实时间非常长的
包括这一次
为什么会推迟两个月的时间
我觉得主要是那个车的原因
你看是在昨天有20辆车
这个是很不得了的一件事
你就20辆车能够直接public给大家
让大家就这么乘坐
而且里面没有任何一个特斯拉员工
坐在里面
来保护这辆车
你就随便坐
然后呢你随便拍
然后里面的UI everything全都ready的
让你坐
这个我觉得大家可能低估了这个难度
关键还要装配它的FSD对吧
整个这些东西
然后在这个一个完全全新的一个现场
来做这个事情
不翻车
我觉得主要是这个原因导致推迟
那么至于它的presentation的部分呢
一般来说的
话它的准备时间是非常长的
因为首先我们肯定是从比如Powerpoint
或者Google doc
这种比较正常的office软件
来开始准备
对吧那么大家来帮你提供素材
然后最后会有专门的美工团队
然后把这个做的非常精美
你肯定需要一些时间的
在内容的这一部分
他是亲自要看
亲自要听的
所以说
如果最后前几个小时还发生过删减
十几个月
就是他不满意啊
就是他看了
就是他你讲的什么东西啊
就是他就把他让你把他给删掉了
那么他自己
我觉得昨天这个
除了可能看了我推特原因之外的话
我觉得他也可能就是不想多讲
他想你跟你们讲
你们也不懂
你看他有时候他的性格就这样
他会临场变卦对不对
比如说已经准备好了
然后我们发布会已经到了
快开始的时间
假设还有半个小时
他可能还会去改
很多东西
他可能会做
但是具体是不是昨天是这样
那我觉得就不一定
但是昨天确实给人一种不过瘾的感觉
对所以你们跟他工作的时候
他也会经常
比如说在最后的deadline
给大家很多这种疯狂的改动
那倒不太会
但是他会改变主意
就是说他还是会很reasonable
我一直说从媒体上看到他
然后和跟他工作的他
是完全是一个截然不同的
他是非常dedication
我记得那一次就两年前他去中国
他从中国当天回来
他就带着他那个小儿子
来我们Austin office
一开会就开3个小时
就在他他儿子旁边都已
经烦了都已经坐不住了都已经
他还在那跟我们讲啊
讲讲讲讲讲讲讲
中国感受啊
不不不讲其他事情
就是他这种dedication
还是会让你也愿意跟他同样的
付诸热情
比如说我们同事是真的那个很好玩
就是因为有些同事会抱怨他对
哎呀就是什么哎你
当然他人一来
他人一来
他那种领导力一体现
对吧每个人都会很愿意跟他工作
就这种领导力是很不一样
嗯对
我觉得总体我的感受是
这几款车都还蛮好看的
就很有未来感
之前
其实在书上可能也看到了一些样子
但是真的在现实环境中看到这样的车
还是觉得蛮震撼的
就像每次在路上
如果有cybertruck开过去的话
大家就会觉得还是想多看一眼
以上就是支持者眼中的
特斯拉的这次发布会
那正如利诱所说啊
从我们这次发布会的股价上来看
其实是存在争议的
华尔街也是并不看好的
我们硅谷101视频的主理人陈茜
在第一时间
采访到了华尔街的投资人Bruce刘
接下来我们听一听
华尔街对特斯拉的期待到底是什么
好的
非常感谢Bruce来做客我们的节目啊
布鲁斯也是我们的老朋友了
感谢你们的邀请啊
很高兴又见面了
然后今天主要是也是想跟Bruce
从华尔街和市场
如何看待特斯拉在最近的这场发布
robotaxi以及
可能其他的一些产品的这个市场反馈
上啊
那Bruce你昨天看到特斯拉的发布会
你有什么样的感想
其实这个发布会
大家确实还是蛮期待的啊
因为可能到今年下半年
这是特斯拉最重要的一个产品发布会
了而且又是和他未来的增长的模式
很直接相关的啊
robotaxi
Elon Musk也给大家讲了很多
这个方面就是前戏做的很足了啊
那大家就是等等
你看你拿什么东西出来
确实也是有期待的
坦白的讲
大家会觉得你至少要给一个roadmap
就是说
你接下来你这么强调你的自动驾驶
无人驾驶
包括机器人的这一系列AI Driven的
基于AI的这么一个新的增长曲线
你从公司的角来讲
你的这个roadmap是什么的
发展历程
你怎么看
其实大家是希望
能有一些很具体的东西出来的
从这个角度来讲是很令人失望的
哈哈哈我昨天看看看
突然就结束了
什么都没有
我还问我和我们同事聊哎
这就没了吗
哈哈哈
大家真的就去party了啊
真的就去party了
咱就结束了
你关心的东西啊
它这个Cybercab出来了
你也看到了
这个车其实它也不是一个完全的
让你自由的运行的
这种完全靠无人驾驶车
它有固定的路线
也没有人
大家去参与
包括了这个Robovan也出来了
也是一样的
大家期待看看啊
你要推这个robotaxi
你有没有相应的APP出来
对吧你的economics是什么
而且最重要的是
robotaxi背后你的技术性的知识
还是要FSD
这个东西嘛
你要成熟对不对
要有足够的信心
这个东西是从技
术上从安全上
甚至你和监管的交流上
他都是支持你的
大家是希望看到这些各个方向上
能够把你真正的推到一个无人驾驶
经济啊或者自动驾驶经济
不管你叫什么名字
这些其实都没有啊
基本上这就更像一个受
就像个节目
大家看了个热闹
当然后面也
你也不能说一点亮点都没有啊
就比如说它这个Cybercab
它的设计上它取消了方向盘
我觉得这是试图给大家信心的
因为大家怎么定义有真正的无人驾驶
其实可能不同人会有不同定义
但我觉得一个很重要的点就是说哎
你不再需要方向盘的时候
那这就证明
你真的是达到了无人驾驶的境地啊
那我觉得他从设计的这个理念上呢
其实告诉大家了哎
我们是往这个方向去走的
但是没有细节啊
真正到投资人
其实可能是更需要有具体的细节的
在这个点上再去画大饼可能就不够了
包括后面最后大家
也可能我们也没有去现场
但是从之后的很多不同的人拍的视频
你可以看到
他的Optimus机器人也挺有意思的
不是完全的无人操作
它其实还是会有一些干预在里头的
Pre programming在里头的
但至少啊
你可以看到机器人的那个灵活程度呀
还是有他的娱乐性
其实是在提升的啊
还是回到那个点上
你从一个投资人的角度来讲
整个这个发布会
其实是令人失望的
嗯对
然后我也看到有些观点说
就华尔街不买
Robotaxi
这个故事
但是华尔街更喜欢看到的是
特斯拉推出一个非常有roadmap
非常有计划路线的一个model 2
一个更加低价版本的车出来
因为这可能会帮助特斯拉
非常快的去提升它的销量
然后在财报上可能会做得更好
但是从刚才布斯你的这个说法上来看
就是说市场或者华尔街
也不是说不买账robotaxi这个故事
而是说市场因为没有看到细节
以及没有看到
特斯拉如何达到robotaxi的这个故事
所以不买账是吗
对那我们step back这一点啊
我们回过来讲讲
大家怎么看特斯拉这个公司
特斯拉这个公司
其实就在这个临界点上
如果我就是一个卖汽车的公司
那我可能就是股价值个100块钱
哈哈哈哈
就是值这么个价钱
那所有投资者的热情
对他的我们叫bookcases啊
大家觉得这个股价你以后能涨
完全是基于一个认为
特斯拉就是一个AI公司了
它是完全一个靠技术
在无人驾驶无人经济这块儿里面
它是一个最主要最主要的infrastructure
伴随的airline
就是你的FSD要成熟
你的无人驾驶车
你的robotaxi
包括你后面的人形机器人这一系列
那我们就是在这儿的
你不相信这个故事
实际上那你就是一个汽车公司
汽车公司大家都知道
现在其实整个auto这个行业
在经济这个阶段
因为加息又很强
这我不详细讲了
但是因为加息很强烈
其实是压制了它的需求的
而且再加上中国的这些
电动车竞争格局
又和前几年又不一样了
所以两个方面
从这一面和这一面
都给特斯拉在过去两年
造成了很大的压力
对吧然后特斯拉自己
其实大家诟病他最大的一个问题
就是他没有新的产品出来
对吧一直还在卖model 3 model y老产品
而且它都是相对在高端的啊
这个price point都是相对高的
这一点
就在这一块市场上
他基本上能吃到的都吃到了
在想维持Elon Musk的讲究每年50%
这个增长
难度很大很大
他必须需要开拓下沉市场
所以大家为什么会有这个
model 2的这个需求
这是这个auto
这个生意是这样子
你这个价格降到了这个category
就是针对这个人群的
他能给你
帮他立刻就打开一个大的市场
没有这个产品你就是不行
这个东西就是这个行业的规律
所以这就是为什么
大家特别的anticipate的啊
特别的需求
说你一定要有一个新产品出来了
来帮助你
把你的本来有的