E170_大模型应用之困与异军突起的_埃森哲们_(5)

他真的会帮你把它搭起来
还是说他只是动动嘴
那这个就看你的具体的核
但你简单理解
就他帮你整个搭起来嘛
就比如说AI年代
去除我做VC吧
我作为一个客户
就是我现在要有一个我内部的
我自己的GPT
叫做投资GPT
就是上面问我一些投资的问题
你都能回答
这个GPT实现不了
因为我有一堆我投资的这些私有数据
但是我不知道怎么去搭这个投资GPT
这是我就可以找咨询公司
事实上我们现在就在做
但我不透露了
很多投资公司也在做这个事情
就找一个
我们不会找埃森哲这么大的
但是有很多这些
但是在互联网时代呢
这个事情
就比如我今天要做一个
我自己的一个APP
我也可以对不对
或者我要做个什么我的网站
但是在互联网时代
如果你对比啊
就说整个商业化的版图里边
一种是咨询公司不参与的这个收入
和咨询公司来做的这个收入
这两边是完全不成比例的
基本全是独立的
互联网公司
可以自己来实现这个事情
你是说咨询公司参与的收入更多
咨询公司参与的收入额
其实只占很小一部分
就大组团责任也很大
但是互联网的规模那么大
你把埃森哲啊玛卡西这种都加在一起
所有外包公司加在一起
其实只占其中很小一部分
是为什么呢
就是因为我刚才说的中间有一个OS
就所以说他把这个门槛大大降低了
大部分公司都能自己做这个事情了
或者大部分的应用
你想做个应用的话
你其实可以自己很快弄一个团队
或者说你即便找咨询公司做这个事情
他成本也很低
以前是有报价的
我我一下记不清楚了
就是做一个简单的APP
可能就30万人民币左右吧
几万美金可能就能做出来
非常低的
但在今天这个AI的年代
咨询的成本是很高的
而且很多人都会用
咨询的原因是什么
就是因为中间有一个很高的门槛
就是你做这个事情其实是不容易的
我想做个APP
或者说我公司内部
我作为一个客户
我想用底座大模型
这个工具
我一下子用不上
我手上有这么多数据
而且这个形成一个矛盾
就是我反而数据越多我越头疼
数据多本来是好事情嘛
大家在数据链都知道
大数据嘛
数据越多少
但数据越多
首先成本抽取啊什么
很可能就是需要用到Keith这样的工具
本身应用个成本
然后我抽取清洗整理这些都是成本
然后我要再去训练
我要把它放到相当数据库里面做RAG
那我就干脆就去找一个咨询公司
所以埃森哲在这里面呢
他的这个生意越兴隆
就说明这个生态越没有成立
就你都靠第三方的交付公司去
这个时期呢
就是我们观察到的生态的一个现况
但是这个其实就本身是个阻碍
就是必须得迈过去
大部分的公司都能
我自己不用这种或者
说用很小的成本
对所以我理解
其实就是说在互联网时代
大家用埃森哲这一类的公司
或者移动互联网的时代
帮他们做一个APP
它其实这部分的比例占的很小
是因为基础设施比较完善
大多数公司可以自己做
对完善
然后OS也比较具备
对但是在这个AI时代
因为他的基础设施不太完善
然后比如说每个公司
他要根据自己的数据
去定制一个自己的模型
现在还是门槛比较高的
高就干了这么多步
从数据开始
嗯拿到后面的RAG
RAG看上去很简单
但事实上很多公司都做不好
嗯就我刚才说
你其实需要对底座模型有一定的理解
对所以就是说现在整个在AI时代
公司再去搭一个
基于自己的数据的模型
它的门槛是很高的
咨询公司在中间扮演了一个桥梁
就是我来帮你打磨
你可以理解为它解决了三个问题
嗯第一个是
就是一个全新的事物出现嘛
我要做什么
嗯定方向
对第二个是怎么做
第三个是用什么做
工具就是对
用什么工具做
这三个因为太新了
说白了就是大家也都不知道
没人整明
从第一个问题到第三个问题
没有人知道怎么去
或者大公司吧
还没有准备好怎么去解决这三个问题
最埃森哲就出来了
就像假如全球突然全都变冷了
那可能所有这个我们东北人
都可以成为埃森哲了
那因为大家都需要知道
说冬天到了
我们要做什么呀
那我可以告诉你
冬天会冷到什么程度
你要准备什么样的秋衣秋裤
你要准备好家里盖打暖气片
你需要做冬储粮大白菜等等等等
我全都给你讲清楚
因为我作为一个南方人
我怎么没经历过这事啊
你怎么办
那这个就是埃森哲现在做的事
对我们就是期望有一天
如果用你刚才说的场景
就是应该出现这么一层
把所有刚才说的这些事情
都已经隔离好
对咨询公司可能会变成中间层吗
不可能因为因为这商业模式
商业模式
商业模式
它一定是叫做项目制
它的核心能力
它其实不是大框架
对他不需要
他也不应该这么做
这不符合他的核心利益
有的时候
他会开发一些内部的一些工具
去提高他自己的生产力
就比如
他可能也用Keith的这个工具去帮他
他的核心价值
你可以理解成还是一个劳力密集型的
因为它的收费很多是靠人时的
就Man Hour
就是靠人小时去做
去实现的
对将我补充一下
有一个变化会是为什么呢
因为恰恰就是按照小时计费的
这样的一个群体
这包括了咨询公司
包括了律师
等等脑力劳动的大量密集型的行业中
反而我自己感觉到的啊
或者开始看到的一个方向
就是说他们肯定会来做调整了
过去他们不会进入到中间层的
但是因为你想
当生产效率发生改变的时候
就是
这些按照小时计费的脑力劳动者们
是很容易或者说很前沿被替代的
所以我见到蛮多几家
就是所谓四大
呀什么这些人呢
大家其实都在担心或者考虑的都是说
怎么样把一小时计费的
这样一些脑力的工种
转换成一个中间层
比如说他是不是可以做一个模型
把他们的经验教训所有的知识
因为这应用一个数据点
然后转成一种小型的模型
或者是一个什么样的模型
把这个卖出去
而不是卖人力的小时费

这很可以变成一个垂直场景去实现
但就它本身应用一个被颠覆
被改造的一个行业
在自己应用一个应用
你可以这么理解
但是我们观察到
从互联网历史上
就是这些公司
他自己往往很难自己跳出来
就往往还是需要有一个所谓AI原生的公司
用这些新的
你说工具也好
Infra也好
应用这些新的模式成为一个新的
就好像你原来是一个出租车公司
你可以把这些类似于Uber的应用
装在你的司机和这个上
但是你很难就变成个Uber
还是需要一个原生的Uber
或者说你原来是个零售公司
你很难自己成为一个Amazon
对我们还是期望第二类公司会出现
但事实上
历史上看起来
也大部分都是第二类公司
第一类公司就是埃森哲自己
很难变成一个AI power的埃森哲
自己杀死埃森哲的可能性还是很低的
是不高的
对也不是完全没有
对对
那从这个角度讲啊
因为其实我们刚刚一直在讨论
模型层的创业
应用层的创业
其实是存在大量的中间层的创业的
比如说像硅谷我
知道有一家公司叫Fireworks
他们其实是在做整个AI的frame
就是框架
然后他们跟埃森哲最大的不同就是
他们其实是做一套标准化的框架
让创业公司基于他们的框架去使用
包括还有很多在做基于GPU的租赁
可以在云上去训练模型
那从投资的角度
是不是这个阶段
所有这些做中间服务
甚至在建设
整个大模型时代的基础设施的公司
ToB的公司
做服务的公司
做基础架构的公司
是更有价值的呢
在这样的一个阶段
嗯是很有机会的
嗯就刚才
包括Fireworks
包括我们也知道Lepton对吧

Lepton这样这样的公司
你刚才说的那个用GPU应该是LAMDA
类似这样的公司
这些其实包括做数据的

对包括做数据
包括Keith这样的公司
其实对其实你可以理解
从我们投资人角度
我是这么看的
这些我们都放在基础设施里边
这个是比较容易去看这个事情的
因为技术设施是很复杂的
如果我们把它简化下
就是就是工具
就各种各样的工具
你用各种各样工具自己去搭
但是他们不改变这个生态
就是说如果按照他们这种
其实还是不会大大降低应用层的
这个门槛
就用层还是要有能力去用这些工具
其实最好还是底座大模型
把这些事情都做了
那当然
这个就变得非常的叫做交钥匙工程嘛
其实OpenAI他们是往这个方向在走的
他们也都在做所有这些事情
OpenAI自己
当然他也有Framework
他一定有Framework
刚才包括这些算力优化啊
他都要做
然后云计算公司也要做
为什么
微软跟office它是有一定的绑定
因为Azure和office
它是云资源和底座模型
所以他们都是可以理解成infra啊
但是在哪个点上infra啊
基础设施层能够变成一个操作系统
这个是我们非常期待的
我觉得刚才上述这些公司
包括Keith的公司
我觉得都是有潜力的
就是如果你能够充分的隔离应用层
跟所有底层的这些细节
让应用层能够充分的
像个交钥匙的一样
就是我就写一个网页
我就是做一个很简单的
一个html的这么一个编程
我真的把我的这些私有数据
把我的这些内容
把我以前的所有这些用户
我自己积累的用户的这些data
都能够实现起来
然后
我产生我自己的一个垂直的大模型
能够做到这么一点的话
那这个生态就会被打开了
但在今天
这个生态没有完全打开的情况下
所有这些点状的工具
其实都是很有价值的
但是风险也比较大
因为这个生态还很不清晰
你可以它是整个一个技术栈嘛
这个整个计算都不清晰的时候
所以他们每一个每一个都互相在重叠
大家都互相竞争
就每个都可能会做对方的事情
就比如我做Lepton
我很可能也要处理些数据上的事情
我要帮我的用户去做一些数据上的
抽取也好
清洗也好这样的事情
所以大家会互相的重叠但

可能又很难找到一个完全互相配合的
这么一个方式
现在就是还是处在于很早期
刚才那个Keith说
可能你说是两个月的baby吧
我觉得这个比喻特别好
我觉得基本上还是在这么一个阶段
那一种方法
就是说你就现在的很多应用公司
就是我就是用这些工具
我能够实现我的这个垂直场景
这种其实今天是很有价值的
对你刚刚其实提到了
在你们投应用的时候
其实你会去看他的数据
持有数据
包括他在模型上的一些训练的方法
最后会不会训练到基础模型
就是你有一套非常完整的投资逻辑
那如果你在判断这些中间层的公司
ToB项的公司
你觉得最核心的几点能力
抽取出来是什么

这是一个很好的问题
其实不太容易回答的原因就是说
因为我们判断应用层的时候
我们可以有比较清晰的几个指标
因为现在比较清晰的点就是应用层
在这呢就有应用公司的人
然后有一个底座模型
底座模型其实我也把它放在Infra里面
但它是Infra里面是最重要的一个
就相当于一个最大的一个巨人
坐在Infra的这么一个池子里面
但是周围会有很多围绕底座模型的
小的Infra
是帮助他
最后能够实现一个近似于操作系统的
这么一个事情
就是我能够充分隔离上层跟下层
但现在都最大的难点就在于说
周围这一圈小的infra啊
如何跟中间这个最大的
底座模型的这个infra去互动去共生
因为他也在挪移
他可能会把你挤掉
但是你又需要它
但是很多时候
你可能应用需要
把它的中间切下来一块
所以这个就造成一个
不是那么容易判断
就比如做framework
就是做框架
框架是里面很重要的一个事情
但他应用会处在一个比较微妙的一个
对就是有能力的应用中
我肯定是自己做框架了
就比如你可以看到
基本大部分的这些会会自己做框架
但是我一旦没有能力呢
要么就用埃森哲了对吧
埃森哲可以自己帮你去搭一个
这样的东西
要么就是说我
很多时候我就
我也可以依赖底座提供的
或者是云厂商提供的
所以你看这么多人都在这个池子里边
所以他产生的这个点是会非常的复杂
对于做Infra的人的考验
其实是会更高
但是Infra在今天
可能反而是最有希望的
因为上下层都没有那么清晰嘛
所以为什么你看很多人去投底座模型
其实投底座模型就是他
应用
就是我感觉说他是一个大的Infra
然后底座模型周边的这些配套Infra
我可以把它称之为配套的Infra
应用非常有价值的
但是你怎么做
这个非常考验他们
作为投资人来讲
我们可能抓一个基本点
就是团队的能力
刚才Keith说的这个意思就是
他是要在里面泡的
是要做各种各样的转型和尝试的
对Keith你你们自己也在这个中间做事
你觉得护城河跟核心能力是什么呢
我感觉刚才其实
装的是已经基本把整个这个链条
讲的非常清楚了
其实是这样的
我自己在里面感觉呢
这听着有点像废话啊
但其实真的是这样的
因为其实做infra嘛
做基建嘛
他从工程角度应该是最难的
当我感觉呢
解决了最难的这个问题之后
其实是在语言模型的时代
往上走一层反而是容易的
就是我们解决了这个很难的一个问题
之后我向Jonathan刚才讲嘛
说加一个交钥匙的
这样的一个解决方案
其实这个是简单的
因为这都是有一堆既有的产品啊
工具啊各种各样
这就是回到上一代的互联网的
这个概念上嘛
其实都有的
难的是什么
难的是选择一个角度
就是底层的这个模型
他很难走进去的赛道
在这个赛道上你把它做到最好
其实对我们来说
语言模型不是我们的目标
但是呢
它是我们的一个很重要的工具
这是我们对他的一个理解
我们做的一个事
我们认为是语言模型
永远都解决不了的
就是你把这个一个网页交给语言模型
让他去帮你抓一些数据
能做吗能做没有问题
但是这个东西当你想到上到量
想到一个大量的准确度
一个连贯性
因为语言模型都会产生幻觉吗
一个网页越复杂
你会越多的幻觉
那你怎么去掉这些幻觉
怎么解决掉
刚才用一个推土机砸钉子的问题
就拿一个巨大的一个语言模型
来解决一个钉子的问题
这些其实是很难的问题
而语言模型
以我们的认知上它
很难走到这样的一个角度上
其实我理解
这还是对垂直行业的一个深度理解
跟你基于大量扎实的工作
建立起来的基本功
去解决这个AI的幻觉问题
他需要对工程的理解
要远远胜过对语言模型的理解
嗯这个非常对
嗯这个需要很多工程
上面的你可以理解成是包裹吧
在上面要叠加一层

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注