那至于Manus为什么当时没有用RFT呢
是因为RFT的发布本身也没有多久
而且RFT是要调背后的
那个带有思维链的模型的
如果他们选择了用Sonnet
Sonnet是不允许你去微调它的
所以他们所谓的用SFT调的
其实并不是它
中间做思维链过程的那个model
它其实是用SFT
我估计
他们是在调
比如说那个computer used model
其实他是在调他们的手
而不是在调他们的脑子
泓君我还想再补充一个小点
我其实觉得
Manus有几个就是挺明显的困境
我记得他们
最早能爆
除了一方面像陶哥讲到的
他自己说到了可能Claude 3.7出来了
然后模型变得更强
他们做出来这么一个产品力
很强的产品
也被带动了
但我觉得还有另外一方面
就是他们把自己定位成了第一个
就是world first general
AI agent这样的一个定位
他们要去抓用户的一个心智
但是这个东西
我觉得是一个非常双刃剑的事儿
因为你抓了用户心智
但其实generalist这样的一个定位
其实是很悖论的
就是你能做任何事情
听起来很强
但是用户永远不会想
一个什么都能做的人
来帮自己做这件事情
就通用性
它其实更等于没有第一的联想场景
等于没有心智位置
所以呢他们最开始抓这种心智
更像是一种hype
就是我抓到了那些early adopter
他们觉得OK
你挺酷的
但是你后面该怎么做呢
可能这是一个很强的双刃剑的问题
就是定位上
然后另外就是
其实我觉得对于AI agent这样的产品
你的认知启动成本其实是挺高的
因为通用agent的学习和使用
都需要用户来理解agent的能力
边界是什么
以及就是agent是怎么表达的
就它比你单纯去摁几个按钮
是更难学会的
因为许多用户
他根本不知道我该说什么
这也是我觉得
现在业内聊得很多的一个问题
因为我现在用这种LUI的产品
说实话我都不知道该怎么去提这个问
然后我该怎么说
让它能怎么做
这也是为什么
我之前讲到就是
可能我会倾向于让它来问我
来跟我澄清
然后我再回答它的问题
再来到我觉得最重要的一个弊端点
就是网络效应
我我觉得
可能Manas的网络效应是断裂的
因为通用agent是没有统一场景的
也就是说你难以形成一个平台级的
flywheel 它不像Notion Slack
它是有组织单位
它不像ins对吧
它是有一个社交结构的
现在Manus其实有很多的这种user gallery
对吧
用户上传的use case反馈和数据分散
所以它难以构建一个正反馈的机制
所以我觉得这三点
可能是很大的一个问题
然后我也对应的想了想
一些比较有意思的策略
因为其实通用的这种定位
历史上其实有挺多人栽过跟头的
比如说有一个产品挺老了
就是在09年的时候
它叫Google Wave
它是一个集合体
Google现在还有没有我不知道
可能已经被删掉
就它集成了邮件 IM 协作文档
还有一些可发布东西的这个平台
但它失败的点就是
用户根本不知道它是啥
也不知道拿它该干嘛
现在我猜也没多少人知道这个产品了
但是我在挖掘以前
以前Google的一些产品时候
Google有个坟墓
那坟墓里面找还找到这个Google Wave
但后来这些功能它被切分了
切成了现在的Gmail
然后Doc和现在的Chat
其实我们能看到就是
都是从通用的一个定位
然后慢慢切成更加垂直
现在我也能看到Manus有一些
动作包括Cursor也有一些动作
他们都在全球办了很多的活动
我觉得这是他们的一个策略
就是想通过community-led process(社区主导过程)的方式
去更好地接触用户
了解用户到底真正需要什么
垂直场景的东西
以沉淀更好的use case以及user scenarios
最后为他们找到方向
然后让Manus往这些垂直的领域去走
避免Google Wave这样的产品的出现
我觉得这可能是他们在通用上面
怎么解决的问题
你刚刚提到了AI agent如何表达
比如说你提到了一个例子
就是你让agent来问你一些问题
这是一种他的表达方式
在你现在试用过的这些agent当中
你觉得有哪些agent
他的表达是非常好的
或者它的交互是非常好的
我其实觉得还是Replit
因为它能非常好地
在我需要他来跟我澄清的环节
来跟我进行澄清
其实我还想再提另外一个产品
就是它有可能是Manus的竞争对手
它叫Fellou
这个产品也是最近才新发的
它是一个agented browser
是谢扬做的
它里面很符合我的一个预期
就是它在执行任何的任务之前
然后它会更可视化的给我对齐
对齐完之后
我就可以让它自己去运行了
因为它是PC端
所以它其实是有系统级权限的
在每一次有高危的操作时
它会过来找我
它会系统级直接给我弹窗
比如说OK这块需要你登录一下
OK这块需要你输个密码
但Manus经常会
由于没有这样的对齐
由于这样的高危操作场景
它其实没有权限
所以会直接卡在那
一方面可能直接消耗干净了我的credits
另一方面可能直接没有完成任务
所以我觉得就是像Fellou和Replit
他们都会在关键的场景让human in the loop
我们来跟它进行对齐
嗯 对
因为其实我们今天聊AI agent
也是一个比较大的话题啊
就我想问一下
你们觉得现在在你们用过的agent里面
从整个的用户使用体验
包括我们从商业判断
这个产品商业前景的角度
有哪些是你们特别看好的公司吗
我个人认为
今天这个市场上
还并没有出现一个真正的说是全人群
全通用场景的agent产品
但是我觉得
大家其实还是在找一个角度切进去
我比较看好的一个实话实说还是Cursor
它是从技术人员的角度切进去
但是我觉得
我们都低估了
Cursor作为一个未来的通用agent的潜力
很多人对Cursor的印象
还是一个做Web coding的一个工具
对吧
或者说是来辅助编程的一个工具
但随着MCP这样的基础的建设
Cursor其实很积极的在拥抱
把它由一个编程工具
变成一个可以开放性的连接各种场景
应用数据的一个平台
我昨天想
是不是有一天他这个界面都会改掉
也许不是一个纯IDE的界面
或者说会有一个模式
一种是以IDE为中心
我的目标还是做代码的产出
对吧 另外一种
可能是代码产出只是辅助的
我的目标其实是为了完成任务
美国公司其实做这些事情的时候
就有一个特点
就是它会先搭一个比较solid的底层
然后一层一层往上layer的上面去建设
我比较看好它
为什么是Cursor不是Windsurf呢
因为在我们今天录播客的时候
外媒还传出一个消息是
OpenAI打算30亿美元收购Windsurf
然后Windsurf
它也是一个很好的代码工具
对 就是他们
其实差不多吧
嗯
你想表达的是这一类不独指这家公司
对
但是Cursor
它的整个市场渗透率还是更高一点
它毕竟还是在Windsurf之前
更早做出了这个形态
所以我比较相信
他们团队在探索上的那种进取心吧
Windsurf被OpenAI收购也不代表它
我不知道
也许它OpenAI
也会给他注入一个很强的意志
让它变成一个通用agent
但一个独立的团队
我想他的自由空间会更大一点
嗯 明白
补充一句
就是我觉得Manus还是有机会的
它是从办公人群的一些办公场景
去切入的
也不只是做Deep Research了
它也其实有蛮多做文件处理啊之类的
能力它都有的
但我觉得它也是从这个角度去切入
正确的做法是
慢慢的去拓展它上面的
能力集
其实通用agent的建设是一个很长期的
持续积累的过程
嗯
Kolento有吗
可能我关注的agent产品
我觉得非常非常有前景的
都是那种特别垂的可能
也不是大部分人知道
但是它在他们那个领域
应该是非常出名
这种很好
因为我自己是很喜欢用很垂的agent的
因为我觉得
它可以解决一个非常具体的
细分的需求
对我来说这就够了
对我用过超级多很垂的
然后我又觉得有几个非常的好
极其有前景
对比如说那个vental V A N T E L
好像它前天还火了一下
应该刚刚拿到YC的钱了
就是它专门给那些商业保险经纪人
做的一个人工智能软件
就是因为很多那种做保险的人
他们80%的时间都是那种重复性的工作
比如说你要做很多保单分析
然后你要手动录入很多数据
所以他们专门帮insurance这类的user
去做一个自动化流程
这么一个AI agent
他们自己讲
能每周帮一个经纪人
省10个多小时的时间
然后他们的最开始的demo
能够让一个经纪人在5分钟
就能够比较什么
长达几百页
富含多少个什么factor的保单
我觉得那个效果很好
我看了他们demo
然后看了很多user feedback
就是这个产品
挺有意思的
另外还有一个是23年的时候我很关注
他们现在做的也不错
他们叫The Sweet Spot
我一直觉得这个产品未来大有前途
因为他们是做AI for granting的
跟我自己之前的创业小项目非常像
但他们虽然是做全球
就他们帮助全球的business
然后以及NPO NGO
包括一些SMB申请grant 联邦补助金
帮他们读contract
然后还能帮他们做招投标的分析
以及帮他们招投标
这个做的非常好
就是我当时为了不付钱
我换了八九个邮箱
因为他每次是只给你48小时
限定时间用
最后我联系了他们的CEO
让他们能不能给我开一个会员
因为真的很好用
而他们里面的用户体验做的非常好
就是前期帮你搜各种的contract
搜出来之后呢
能够帮你做很深的解读
所以他们的UI在23年时候
做的就不错了
它叫The Sweet Spot
就是甜蜜点
The Sweet Spot 是一个粉色的
我自己用过一个
我觉得还挺不错的
也是非常垂类场景的AI agent
是叫Gemma G A M M A
它是一个可以用AI
去做PPT的设计软件
之前大家可能比较习惯用Canva
但是我用了它以后
我觉得它可以秒杀Canva
我只用给它一个大概的框架
它所有的内容会用AI自动帮我生成
然后排版
假设我小朋友的学校
给大家讲什么是Podcast
让他给我做一个PPT
5分钟完事
而且如果你觉得哪个地方
你稍微要修改一下
你给它一个框架
或者你给它一个主题
它会直接去生成这样的一套PPT
它输出的PPT你觉得哪里有错误
你直接手动在里面改一下
然后把它导出就好了
我觉得非常方便
它排版也很好看
这个很巧
就是我是Gamma的
好像是前100个用户
因为他们是2020年创始的
我的那个账号到
现在的cedits应该是用不完的
就我一直用Gamma
就很多人对Gamma有印象
是像刚才您讲的这个
就是可以用AI generate PPT
但是我当年用Gamma
是根本就没有AI的时候
那个时候我觉得这个产品非常牛逼
我现在所有的presentation
还有我所有的PPT我只用Gamma做
而且我觉得不是因为它的AI功能
而是因为它的立体效果
对 它的设计非常好
对 它是模块化的PPT
然后把不同的模块
可以拖拽到不同的页面上去
所以会有很炸裂的视觉效果
当时我大概记得是疫情的时候
应该是21年
20年的时候
看他们一个demo
怎么就能够在那种静态的这个PPT上
啪炸出来一个视频
我觉得太帅了
然后我就觉得
一定要用这Gamma去做个PPT
然后效果就非常炸裂
所以我后面就一直用他们
然后
他们现在又出了各种AI生成的功能
我觉得做的是非常完善的
因为我知道Canva应该是刚announced
他们出了AI功能
但其实Gamma对用户的这种分析
虽然他们现在如果不付费的话
只能用10张
但这10张
已经是我觉得覆盖到大部分人
非常常见的需求了
然后
包括他可以对每一页做很精细的微调
提供基本上所有的组件
是他能对你每一个加的图片上面区分
你是不是可以商用
还是说
我可以去不同的这个图片库里面搜
就是我觉得每一个细节
他们都考虑到了
对 它的能力就像你说的
不仅仅是在AI
而是在整个设计领域
包括PPT的交互上
整个都做的非常好
我觉得
它在这个垂直领域的积淀还是很深的
是的
还有一个是想问一下大家
这两个月
就比我们上次录AI agent
你们觉得就是两个月过去了
但是是发展非常快的两个月
大家觉得你们在心态
或者做事方式上有哪些变化吗
我觉得有非常明显的变化
尤其这几个月来讲
Manua出来 然后各种产品都出来了
其实我做事情的这个速度
会变得更加的快了
当我去横向看很多的竞争对手的时候
我会觉得他们的速度非常非常快
不管是开源还是
闭源世界
其实都会要求你对一个事情的执行
甚至有些时候要大于你的planning
因为之前
可能我从产品经理角度来思考
很多时候
我们的第一想法是先去拆解很多东西
所以你会把很多东西想的很细
然后你就会长篇大论的写了一堆东西
包括我们传统来讲我们应该写PRD
但实际上
现在我觉得很多公司
可能也对PRD这个事情
是没有那么的重视
我们觉得应该打通更快的链路
比如说从产品的需求
然后到工程的实施
所以不但是个人的方面
包括在工作场景下
我觉得所有的事情都在加速
可能跟不管是行业内所有产品的浪潮
还是跟这个时代的速度
我觉得都是有一个同样的速率吧
这是我最大的体验
就变快了
嗯对
然后你上次说你自己断断续续
的其实有做过200多个agent
这200多个agent
有什么你商业化比较成功的吗
我觉得他们不能被称之为agent
上次可能我说应该是chatbot
我觉得agent还没有到那个程度
因为我觉得它不够智能
或者是它不够动态
更像是个workflow
然后我觉得里面比较好商业化的
其实还是我23年做那个
它是一个很长的pipeline
我们当时服务的是
东非的中大型的NGO和NPO
帮他们去申请federal granting
因为他们是非常缺这笔钱的
所以帮他们从第一步就是做搜索
那时候用的是AI搜索
因为你以往去搜一个grant
就你入口是非常深的
而且你需要去抓取各种网页的东西
所以我为什么不把他们搜索完之后
直接展开一个答案给他们
而不是给他们一个结果列表
所以这个场景是很适合演搜索的
所以第一步就是先展开这个结果
然后用户可以去选择那些他们感兴趣
看完结果的grant
然后再跟那个grant上面的文件
进行对话
旁边就会有个Copilot
第三步就是当你用户点击申请之后
可能我会把你跳转到
就是external的界面
然后你也可以回来
在我们的这个编辑器上面
去编辑你的这些文书
然后你写完之后
我们当时没有做协同
这么一个功能
我们就是让用户自己download到本地
然后再copy去external的网站上面
帮他们去交申请
大概是这样的一个pipeline
我觉得那个时候还
是人工需要看好每一步的
但是后面我做了很多checkbot
都是我在实习或者各种工作中
就是在不同的场景里面做了一堆
但是那些都没有对个人有商业化
但对公司应该是有商业化的
发表回复