E170_大模型应用之困与异军突起的_埃森哲们_(2)

一个叫Netscape moment
就在Netscape出现之前
其实大家为什么并没有看到
就Cisco其实比呢
这个Netscape要早
但Cisco内容其实并不是很大
Cisco真正大爆发
其实真正应用浏览器出现之后
因为浏览器出现之后
在Cisco这个基础设施之上
出现了一个操作系统
从系统出现之后才出现各种网页
雅虎啊这些出现之后
然后应用就开始爆发了
用爆发之后
当然Cisco的这个价值
一下子就体现出来了
所以这个OS是非常重要的
那大模型时代的OS应该是什么呢
对移动互联网的OS
这两个都很好理解
对对现在就是难的
难点就是在大模型时代
人工智能时代
很多人会觉得自己是个OS
但是并没有
比如OpenAI对吧
OpenAI其实当时做了一个OS的尝试
叫GPTs他觉得我自己是个OS嘛
他就是就是模仿iOS的做法嘛
然后我也充分的隔离了上下层
在他看起来就下面是这个底座模型
上面你就是GPTs上各种应用
甚至最早叫Plugin嘛
后来变成了GPTs
但是呢它的核心点就是说它的上层
就是把应用层跟它的这个底座模型
或者叫基础设施的这个中间的分界
其实并没有那么清晰
或者说如果你是按照他这个分界的话
你的价值就变得很低了
谁的价值变得很低
就是医用层的价值
应用层
你看很容易你被底座就给覆盖掉了
是的是的对吧
因为你回到互联网时代或者iOS的
首先比如你在上面做个雅虎
你跟浏览器是没有任何冲突的
是没有任何的重叠的
浏览器做浏览器的事情
你做个雅虎.com
你是提供内容提供流量
提供用户运营
提供商业化
这个是你雅虎做的事情
但是浏览器不做这个事情
所以你两边是非常分割的
就是它这个分界线是很清晰的
这个叫上下层的
这个解耦是非常清晰的
到iOS时代应用一样
你做的是微信上的APP
是微信和比如说Uber吧
你跟iOS是完全不一样的
你一听就知道
iOS跟微信是没有什么可以交叉的点
但在今天
你看
你基本上所有的所谓的GPTs上的应用
跟GPTs本身都是会有一定的重叠的
市场是有相当大的重叠的
我们提到应该提到那个Notebook LM嘛
对吧它其实跟GPT的功能
GPT其实很多时候也能实现这些功能
但是在之前那个Jasper
Jasper跟GPT的功能就
是或者说你今天在GPTs就非常清晰了
GPTs上所有的这些功能
其实它很多是做了一层产品上的一个
我们有时候叫壳儿嘛
但是GPT其实很多时候是可以实现的
而且它在迭代的过程当中
它可能会实现越来越好
而且你们的数据
就是我作为应用层的数据
跟底层的数据
就底座吧
就是foundation model的数据
其实它的数据跟你的数据
有时候长得其实是会非常像的
还有一个
这个分界不清晰的另外一个特点
就是说我们可以从另外一个角度去看
就是说
今天你做了一个基于GPT的一个模型
出来垂直模型
然后你用这个垂直模拟
去回答你的客户的问题
这时候客户回答了一个问题
得到一个答案
这时候你能不能清晰的判断
这个答案后面支撑的这个能力
是由底座提供的
还是由你的这个应用提供
其实在很多情况下并不是那么清晰
这个跟互联网是不一样的
比如互联网就说我在Uber
Uber上我你实现了Uber的功能
但其实哪一块是iOS提供的
哪一块是Uber本身提供的
其实是非常清晰的
网页和浏览器的这个区分
应用非常清晰的
但在今天他在训练阶段
他的数据很多都在一起了
其实我刚才说
一切都可以从数据层面去考虑
这个事情
其实数据今天是看出来
没有一个特别清晰的
一个切分的点的

我们待会可以仔细再讨论一下数据
但是回应你刚刚讲述
的这一部分
其实有一点我是不太同意的啊
好的比如说你提到了像Notebook LM
它的那一部分
它是不是一个跟GPT非常相似的
这样的一个应用
我觉得表面上来看很简单的回答是
但是根本上又不是
就是因为它的底座模型
其实是谷歌的Gemini
嗯嗯嗯它之所以就我说GPT
其实就是Gemini属于这一类
就是底座模型
对对对应用因为这个产品啊
让我最近两周对整个大模型的看法
我在心态上发生了很多的改变
因为这个产品
我发现比如说
我把我的播客的一个链接放进去
然后他最后可以自动生成一段
这个英文的播客
他其实不是为了生成播客的
简单来说
这个产品你可以理解成
你放长文本进去
它可以给你一个summary的研究报告
同时你可以去问它
这个研究报告里面的各种细节
它也会给你一些引导性的问题
在这个层面上
有一点像那个Perplexity
就是有一点搜索似的
他在给你回答的时候呢
他也会引用他的这个回答
是根据哪几段来整理出来的
他的这个体验非常好
之所以能生成Podcast
是因为它最近就新加了一个功能
不知道是哪个天才工程师啊
在Notebook LM的右边加了一个
它叫做Audio Overview
就是音频的总结
但是他非常聪明的
把这个音频的总结
做成了一个播客的形式
所以就是他现在是可以一个链接
或者一个长文本
就自动生成一个播客了
我觉得就是你
说语气语调很好
交互非常自然
我觉得
这可能是有很多工程上可以调的问题
但是
我觉得这个产品最让我惊艳的部分
是他抓点的能力非常强
就翟老师
我们之前都做记者
其实一个好的记者
他要非常会抓这个问题的关键点
要会抓细节
同时要会抓关键的案例
就是我觉得他在这一点上
是比我们招到的一些记者的平均水准
是要高的
但是对你说它的分析逻辑怎么样
就不讨论
但是整体上我觉得这个产品
就我前面说了那么多
它其实都有一个非常大的特色
就是Gemini这个底层的模型
它的长文本的处理能力
其实在这次今年的Google IO上
他们有着重的强调这件事情
它是做得非常好的
它可能是比open AI的底座模型要好的
所以其实我就在想
就像你刚刚说的
你说这个应用到底是应用本身的能力
还是这个应用底层的模型的能力
它确实就是分界不清
对这个就是我说的
可以说是个特点嘛
但是在我现在看来
其实应用在制约
现在这个生态的一个问题
据说这个分界不清晰
我们讲这个例子时候
不是在讨论GPT
而是讨论Gemini
Gemini跟Notebook LM
就是一个底座跟上层应用的一个
其实就刚才说它的这个功能
比如它生成了这么一个音频的summary
你说这个功能
这个里面一定有很多是底座在做的
底座在实现的
其实Notebook LM
当然技术细节我们没有去
但是我们从
外面看就刚才你说的这些功能
其实回到我刚才说的这两条线
一个肯定是产品设计线
就是我们之前说
因为它的实质还是个互联网产品嘛
就产品设计线
这个一定是它的一个特点
詹姆莱也可以做这个事情
但是它跟用户这个交互的这种流畅性
这个是互联网经理产品经理们做的
这个最强项的一点
很多其实是高于这些底座
模型的这些团队了
所以这个他一定做的很好
他跟用户的交互
所以让你会觉得很流畅
很好用对吧
也很耐用
这个是他的第一条线
第二条线他一定是做了
他是做了一个
相当于是在这个上面又做了一些Chatbot的提升的
这可能是用一些微调翻跳
然后他肯定是要做一些Rag了
Rag做些检索增强生成这些功能
所以这是我说的数据线
他会用数据线去增强底座的这个能力
那现在的问题就是说
所以我回到我刚才这个核心点
它是一个AI的应用
它不是个纯互联网的应用
所以产品那条线
是不能足以支撑它的长久的
当然这个它有点特殊性
它就是Google内部的一个
但是
我们如果假定它是一个外部的产品呢
就是其呢
我有个外部公司
应用对外融资的
然后但是我就从一个第三方公司角度
我用Gemini的
所以你就觉得
如果是第三方的公司
来基于Gemini上面做这样一个应用的话
他的核心竞争力就没有那么强
核心竞争力就会比较有挑战的原
因是说他长期的
因为短期他可以就像这个Notebook LM一样
借助他产品能力
和对于一些数据的处理能力
就是刚才说可以做微调可以做
但长期还是要看底层模型的能力
长期你再往下
首先你的数据就回到我刚才这个观点
我的观点但是未必正确
但是是我很重要的一个思考
这个就是AI原生时代
跟互联网时代的一个差别
就是我一定要讲数据
而且我数据是越多越好
这个很多人其实同意的
但是
你用这个观点来看这个案例的时候
你就会陷入这么一个
就说Notebook LM
如果它是个独立公司
它一定要不停地积累数据
他数据会越来越多
他数据多了以后
我再怎么样再去跟底座去结合的时候
我是继续可以用翻跳
还是我继续用rag
都会有甚至我还有很多数据
其实是更适合于预训练了
其实如果我们在计算看的深一点的话
我们会知道
其实不管是翻听就是微调还是RAG
其实都会跟底座有很大关系的
你是需要很多底座的支持的
就尤其你越做越好的时候
那这个时候你跟这个底座模型的这个
其实我刚才说
你其实是不太容易去解偶的
你要这条路要走的很长
你的defensibility
门槛护城河要很高的话
你是一定要去一种方法
就是说
你怎么样跟Gemini做一个更深度的
或者说你你就要做一些自研的
就或者你自己去训练一些底座
某种预训练的方式去生成自
己的一个底座去支撑自己的
这个其实是我们可能看到很多
包括像Perplexity这样的公司
Perplexity大家可能知道它是
其实是DeepMind的背景

我们从各种渠道都听说他们其实是
其实他们最开始肯定应用这条路
就Perplexity第一个产品
很可能跟Notebook LM其实一样的
它还是比较轻量的
但它越来会越来越重
越来越重
它也会去买显卡
然后再去往Pretrain
就是预训练这条路
所以你的观点是
所有的应用公司
最后都会去拼自己的模型的这条路
在今天的这个技术架构里面
很不幸似乎是这么一条
但是就是说对于不同创业公司
可以寻找不同的方向或者道路
但在今天这个架构里面
可能你没有太多其他的选择
你只能先按照这个
不然的话你总是要回答这个问题
我需要把数据越来越多
然后数据越来越多的时候
我怎么样不断的维护我这个门槛
同时推进
因为你做个应用
事实上你应用有这个责任
是推进scaling law的
这个
是作为应用的一个很大的一个角色
翟老师同意吗
呃我感觉数据这个肯定是这样的
我非常同意
我感觉Jonathan讲的这一点
其实应用
我们做数据这块的一个考虑了
因为数据肯定是接下来的一个切入点
数据的话
你怎么去使用数据
你得到的是什么样一个质量的数据
就为什么说结构化的数据
和就是你把整个网页随便一抓下来的
这个unstructured
就非结构化的数据这些东西
其实都会带来不同的产品
甚至是嗯
但是你认为所有的应用
最后开始都会卷到底座模型这吗
我感觉主要现在是太早了
说白了还是一个太早的时候吗
就刚有互联网的时候
没有各种的开发者工具
什么都没有
那这会中间这些层啊
我理解Jonathan就这些层什么都没有呢
其实说白了
那接下来语言模型再往下发展
那周围的这一套配套的设施
因为互联网也不是一上来
就把所有配套设施都建起来的吗
也像你讲啊
就是有了浏览器之后
很多东西又开始往上再叠加
所以它这个我个人的一个理解就
说白了就是现在太早了
就跟那个苹果的这个APP store
刚出来的时候
应该大家也没几个人还能记得
最开始那一批很火的这些application
就那个应用都有什么了
其实那会应该是最早的时候
第一代iPhone
我记得那会最火的一个应用程序
就是手电筒
就我一下载之后就装个手电筒
收我9毛9
不收多少钱我也记不清了
然后那会感觉哇
这好了不起啊
这手机还能这么装一个东西
就可以当手电筒用
对吧都是各种
现在回想起来
都是特别又幼稚又傻的这些应用
所以这东西就看怎么看了
就是在当时的情况下
不少的应用应该也都赚到了钱
但是他们会不会都成长为像后来Uber
像后来的Doordash等等这些非常成功
或者是在某一些程度上
非常伟大的公司呢
它其实也没有
所以说就看
心态问题了
或者说
你把自己做的这个产品或者公司
是放在一个什么样的时间语境下去看
是放在一个风物长宜放眼量的
一个几十年为周期的语境来看
你想做成一个伟大的公司
还说我想赚个200万我就跑了
那这个应该是不同的一个逻辑来看
这个事情的
你们属于哪一种
我们肯定是这个风物长宜放眼量了
对啊这肯定是这样的
因为我们是数据人
也都是看第二种
对第一种叫Utility
对Utility
很多其实不属于我们看的范畴
对对其实说到这个我其实还想问
因为我们也在市场上看到了两种公司
第一种比如说它就是一个应用
它始终现在在Google store或者APP store
它的榜单的前十名
但是呢这类应用它也不融资
它可能就是靠用户付费
它就能赚很多钱
但是说实话
就大模型一更新
底座模型一更新
甚至是大厂的一些手机升级
它很可能就会覆盖掉这些应用
但是他们可以赚一个短暂的钱
而且还挺赚钱的
这是一波对不对
然后还有一类
就是说我想去做基业长青的公司
那可能就是投资人考虑的这一类
所以我理解
你刚刚说
所有的应用都会做到底层模型
其实你应用想说
我们要抱着建立一家
整个AI时代的独角兽的
这样的一个想法
去看待这家公司
而不是说
这个市场上哪些是赚钱的公司
来去看待这样的公司的心态

对我们刚刚其实反复在提到数据啊
Jonathan我知道
你对人工智能是有自己的定义的
就什么是人工智能
你要不要跟大家讲一下
你自己对什么是人工智能
就是这个问题本质的理解
以及为什么数据那么重要的一个逻辑
对可以再重点说一下这个理论
其实人工智能的历史
基本上跟整个计算机科学
是差不多平起的
一九五几年的时候有这个
有个达特茅斯会议
从那时候人工智能就开始了
所以刚才说的那些领域
包括agent
就是智能体
包括像自然语言处理啊
我刚才说一系列的这些继续学习
神经网络
都基本从那时候就开始了
但是我定义的人工智能
其实是从2012年开始
就真正的
我们把它叫做产业化的人工智能
就是如果非产业化的人工智能
其实我们不需要太去花时间
因为它就是科研嘛
但是产业化人工智能的其实核心点
我总结其实就是深度学习
这个是我的一个很核心的一个

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注