E170_大模型应用之困与异军突起的_埃森哲们_(4)

但是你现在就要思考问题
你的护城河在哪里
我最早跟那个大部分的GPTS
其实我花了蛮多时间去聊
这边的GPTs上的
很多还算是比较成功的公司
发现他们都不太考虑私有数据
有比较成功的公司
吗应该是没有吧
那个时候还是最火的时候
就年初的时候
你聊了哪些公司
我就不具体说了
但当时我就是特别清晰的问这个问题
说你有没有私有数据
他首先他愣了很久
然后他在说我为什么需要自有数据呢
我们没有数据
然后我第二句话说我
那你会不会担忧你的护城侯
这个我当时直接问吧
defensibility
他就是我的护城河
就是我的产品设计啊
这个在互联网年代
是非常通用的一个思维
为什么互联网应用公司
能够比大厂厉害
其实很多时候是在产品层面
他在产品设计上面吗
他能够走
这就大家说的这个产品经理
尤其是垂直领域的这些
他肯定比做底座或者甚至大厂的人
他都有这样的一个优先性吧
但是你现在就要详细考虑
你的护城河的问题了
对在这个时候
你就必须得去深扎这个事情
所以你觉得其实在大模型时代
开始以产品切入可以
但是如果你要找护城河的话
你最终还是需要有自己的私有数据
加上底层模型
加上底层模型的能力
底层模型的能力就是你私有数据
即便我一向的观点就是
你即便只做rag或者微调
你对底层模型
应用要有相当的熟悉度的
最好是找底层模型的人
对Perplexity有吗
他在做自己
他是底层慢的
那这个可能是他的商业机密了
但是我从侧面去了解啊
但是这个我们后续可能可以去
我觉得他一定会在往底座去做
但是这个他可以有多种方法
你可以有开源底座
去做一些这种继续训练
你可以有不同的步骤
就是因为你要从成本上考虑嘛
你当然一上来就全都重新训练
但这个成本太高了
但你可以做叫继续训
continue训练
继续训练啊
但这个难度也其实应用不低的
但是可能比微调要更难一些
但即便是微调
微调跟继续训练
有的时候
它的中间的界限也开始在模糊
就是它们的成本
而且同时还有风险
就说你做不好
可能效果并不一定好
所以这个都是他的成本
都要计算进去
但大方向一定是往这走
这就是你的护城河
你要么就不要有数据
就像我说GPTs那些人都不要数据
但很快GPTs也都没有了嘛
就是你可能会有一段时间的商业化
所以有的时候我们看商业化
有时候也会有一定的误区
他可能甚至一段时间还
用户好像也还不错
还甚至能够有一些收入
但是让他只要没有护城河的情况下
他要么就是被底座给覆盖掉了
就底座的更新也能实现同样的功能
对吧要么就他自己
不能够持续的迭代下去了
但是我是在想
以这种创业公司
跟应用类的模型的迭代
它怎么能卷得过
你看像openAI这种
动辄百亿美元融资的公司
因为你做底层模型
你是自己需要买卡
然后需要自己去训练的
那如果说一个模型
他真的训练的越来越大
他的智能真的涌现了
这些创业公司他再去训练底层模型
他的意义何在呢
所以就是几
种方法一种就是我刚才说
你一个步骤一个步骤
有点像baby step
等于你的卡会越来越多
但是可能你还是得不断的
这个你可以理解这个Scaling Law
因为我数据越来越多了
数据越来越多
理论上我最后的成品的
最后输出的这个模型的参数量
或知道它能力吧
参数量可能不一定是一个KPI
但是我的能力一定是
应该是越来越高的嘛
但这个对于我
刚才三要素其实都得在里边
我数据一定是越来越多
我能力越来越强
我对算力要求肯定应用越来越高
这个你是避不开的
这个你是可以通过步骤去实现的
第二个就是说你聚焦
就是你跟OpenAI的不同点
包括跟国内所有比如这6家模型
六小龙吧的不同点
是说所有做底座模型人
都有刚才说的这么一个做平台的诉求
所以他也在做应用的同时
他在还是想说
我要赋能所有的上层应用
这样一下就把他给摊平了
之所以他对算力的这个要求
因为他也要对所有的应用场景
现在来了一个教育行的人找他
来了一个制造业的人
或者医疗行的人找他
都得跟他去
要能够service
就是能够服务这些人
这个是它跟你的最大的区别
就是你你能够放弃
作为一个通用平台的诉求
就聚焦在一个
比如说就是AI搜索
就是一个垂直的一个应用
端到端的
我把这些一件事情做好
我整个底座模型的所有的每一件事情
都是为了这个
我不为了
去赋能不是作为下一个iOS的
这个心态出现了
这个时候你其实你会简单很多
这个在互联网时代
其实是有这么一个时期的
互联网在浏览器出现之前
其实我们那个年纪人都我们用很多
叫FTP
嗯对
暴露年纪了哈哈
啊没事
继续对Telnet
对因为最早那时候没有网页嘛
其实那时候你有很多内容
就是我们在学校里有很多内容
现在后来就是我就放在一个网页上
你就能够访问了嘛
但那时候我们会放在FTP服务器上面
但是FTP这个事情
其实它是一个端到端的事情
因为它现在没有
像浏览器这么一个平台
它其实挺难用的
但是你做FTP的人
你肯定是前后都得去搭的
这个就是我说的
一个叫垂直整合的这么一个事情
这个有点像当时的那个年代
就有点像这个浏览器出现的这个时候
所以你要做这么一个应用呢
就是很遗憾
你可能你门槛就得这么高
但这应用你今天的一个护城河
它其实是一个相互的作用
你没有这个门槛
你也没有这护城河
对就还是让回到了数据
什么护城河
还是你垂直领域的数据啊
你的数据的优秀程度
你的专业程度
你的精专程度嘛
有点像大语言模型
是个推土机
那我其实就想凿个钉子
难道我拿铲车推土机去凿它吗
也可以也能弄进去
但是何必呢
其实我拿个小锤子
嘣一下就进去了
那我就用小锤子不就得了吗
是这么个概念
嗯对
Keith你有觉
得比较好的案例
包括是商业化方向的案例
给大家分享吗
我感觉商业化
其实美国本土还蛮多的吧
比如说现在的有几个做coding的
coding最近这几个月还是蛮火的一个嘛
当然
这个也涉及到它会有多大的护城河
这个问题
比如说GitHub要去做的话会怎么
就是GitHub也有嘛
那这个东西它会到底怎么样
还有一个特别火的
那个coding的应用叫啥
就是之前一直在排预约的那个
Magic Cursor
就有一个
那个报就是那个见光
见光死那个是吗
叫叫什么
coding现在特别火
大概有快10家
都到10亿美金了
应该非常多
Augment Magic
前段有一个挺火的
之前做Demo做的巨好
然后后来以正儿八经release出来
然后就那是Devon
Devon对哦
Devon对对对对
Devon就是见光死的对
就大模型时代见光死
这demo最好看
做完之后应用层一看
完全用不了的东西太多了
Coding应用
我所说的这个分界不是那么清晰
其实我也可以用GPT
其实现在很多码农就直接用GPT
就就已经帮他在编程了
所以他就
我说你怎么去创造这么一个切分
一个分界
这个是所有做Coding应用的这些人的
一个
他很多时候产品肯定是做的很好的
但是你要实现这个scaling law
我口顶这个能力要不断的scale
我也要用我的私有数据
在去训练的时候
我怎么去跟底座的这些人去竞争
去做长期的竞争
我现在的
如果他们要问我对他们的建议
就是说你
你得拥有自己的底座哈
如果你一直是用所有第三方的底座
的话你的风险永远是大的
就说他一定也在不断的在训练
你跟他要一个division
是你觉得还有其他方向吗
其实他现在做的好很多
可能也都是商业化做的比较好
也就是说他对这个价值啊
或者在这个方面上
某一个点抓的标准的
像什么Harvey啊
Legal的这样的一些东西啊
它是一个处理法律方向的大模型

大模型应用
应用对
也也不知道多好用或者多难用
但是呢就能讲好故事
这应用一个能力嘛
如果要从一个真的
一个大规模的应用角度来说
其实就回到状态算讲的
这个还是很遥远的了
因为我自己总感觉的
整个这个问题回到核心上还是太早
整个拿新的一个生产效率改变的工具
来解决什么问题
这个应该是人来解决的
而人现在还没有完全去
因为这个工具长什么样
怎么回事什么的
很多东西还没有在摸索清楚前
人们怎么用它
其实是很多误会的
大家是把生产工具
很多人就当成了生产力
比如说这个是一个比较范式
我认为现在很多的一个情况对
如果再补充一些
就是我自己作为一个音频工作者
我感受到的
比较好的产品或者案例的话
其实我刚刚有提到Notebook LM
我觉得用它来做一个长文本的分析
它还是一个蛮好用的应用的
但是它其实是谷歌做的
对它
也不算是创业公司
那另外有一家创业公司
就是我自己非常喜欢的
叫做Elevenlabs
它是可以我输一段文字进去
它有自己的一些英语的配音
它可以把这个配音配的非常好
或者是我的音频有时候我们说错了
一些数据需要补录的时候
它不用嘉宾现场到场补录
它可以AI生成
而且
可能会比你们补的那个效果还要好
是因为
大家每次说话的声场环境不一样
他的这个补录是比真人更加无痕的
但是在整个的中文方面
表现还不是特别好
其实我觉得
这个可能应用他自己的数据
跟他的产品
没有专门针对中文产品
去做特别的优化
按理说这其实不是一个特别难的事情
但是他没有做特别的优化
其实我看Elevenlabs这样的公司
在融资市场上的表现
也还是非常优秀的
应该也快到独角兽级别了
还有像之前我们在节目中分享过的
Suno文字生成音乐
它是一个音乐模型
其实它应用做了自己的模型层们
我觉得至少是从融资来看
反正我们在聊完以后
它应用过亿美元的估值
然后也融了很多钱
表现还是不错的
这是我看到的一些细分场景
对这两家都属于跨模态多模态
多模态
多模态的这个产品
他我的印象或者我的预测
他一定应用要往底座去去延展的
我觉得他们其实是有底座的
它们不仅仅是有底座
而且其实它自己在这个声音的处理上
它自己是有自己的独特优势
在的对
它是有一些paper的
对因为多模态反而不像语言模
因为语言模型
已经有很好的第三方底座了
你基本上就可以用它了
但多模态很多时候你其实是要做
因为你如果你只用SD
只用类似这种一些开源呢
其实你像Midjourney
你肯定是有自己的底座的
所以他们这些公司其实也倒过来
要求他们得
同时他要有训练数据
然后用自己的
或者说半自研的这样的底座
去实现他的最后呈现的这个模型的功
我觉得这个其实可能是多模态
从这个角度讲
多模态就更符合我刚才说的
因为他
你没有一个可以利用的第三方的底座
你反而是更会需要自己去做很多事情
所以现在整个市场上
会不会多模态的表现会更好一点
对这个应用我的一个预估
当然他应用个双刃剑
就他倒过来要求你要怎么做
所以很多人都会先就往这条路上去走
这样你的护城河从第一天开始
就是应该是有的啊
不是像在纯语言模型里面
你可以刚开始就没有护城河
所以从冷启动的角度来讲
纯语言模型可能更快一些
我直接调GPT
我就能出来一个很好的产品了
但是你要在多模态的领域
你肯定是要先做出一些东西的
所以它其实双刃剑
但是
我个人也其实应用比较看好多模态的
这个多模态
甚至包括跨到所谓的硬件模态
就现在所谓的巨深智能
它其实应用一个广义的多模态
这些创业公司如果能够把硬件
数据跟Robotic Transformer嘛RT
就是谷歌在尝试的这些事情
能把语言和硬件的传感器数据
和最后这个机械执行的数据
能够打通的话
不一定完全的短道短
但它能能够从训练层就能打通的话
我觉得
这个它本身应用多么菜的一种体现
我个人觉得还是有蛮大空间的

其实归根到底就还是数据的独特性
数据的准确性
数据的优势了
还是刚才Jonathan讲的整个这个核心吗
反正我自己跟这边的几家比较大的
美国本土的最大几家VC啊什么的
聊天的时候
感觉都是这样的
就因为这些VC
他们都有自己的一个
相当于是business operation啊
或者是go to market的这种类型的团队吧
反正我记得上次在跟某一家的负责人
我们在那喝东西的时候
我就说你现在比如说这个
美国这些大的企业啊
接受AI都是怎么样的一个状态
他的回答
反正就是吆喝声还是非常多的
就大家都想学
都想知道
都在讨论
但是真正能落地的东西
当然还是非常非常少的嘛
所以整个这一块
这里面呢
你看大家做的东西呢
其实都是关于AI的咨询
AI的rag
这一块是上一年
就过去这两个季度吧
是最火的这些东西
因为这个东西
相当于是我要是一个公司的it负责人
我肯定要考虑
我的公司接下来整个AI方面
我要做什么呀
我肯定要花钱啊
怎么办呢
那我先做什么
我先不能拍板因为可能这顿我也不知道该做什么
但是
我最起码可以先把这个架子搭起来
架子的话就是咨询AI方面的这些讨论
所以呢在美国呢
像埃森哲呀
这样最大的这种科技类的咨询公司
光咨询类他是赚的最多的
他第一个季度的话
他就是6亿美元的一个营收
第二个季度呢
这个营收从6亿美金呢涨到了9亿美金
我之前跟一另外一家就很大的
这边的VC去聊天的时候
他就说当然他说的是英文了
但他意思就是说哎
你说咱们这忙乎什么呢
忙活这么半天
这个他居然耍下嘴皮子做两个RAG
这个9亿美金拿到手了
就是这样一个现状
你有用过埃森哲的服务吗
我们用不起的
这个太贵了
应该多少钱平均一个项目
那这个真很难讲
因为就是他就是做咨询
像麦肯锡
对就大项目 麦肯锡一样
对就是一个项目可以非常多的
但是总而言之就这块
你可以看一下不同这些公司的财报啊
什么的这几家公司都是过去一年来
增长最多的一块项目
其实恰恰就是我特别想补充的
咨询公司在今天的这个地位
其实就是符合我刚才说的这个理论的
因为我们回头看那个互联网时代
互联网时代咨询公司
埃森哲应用存在的
就是我一定有很多公司说
我今天要做数字化
我要开始做网站了
对我要做互联网化嘛
我也有这样的一个门槛要越过
很多公司也会去找外包
找咨询公司进来帮我把这个事情做了
咨询公司
他们提供的服务的核心是什么

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注