其实符合我们在线下的这种行为范式
这是能够让用户更能接受的一种方式
要不然的话
只是用户去找AI
那其实这是个单向关系
其实不是个双向关系
用户的反馈呢
用户很喜欢当他无聊的时候
当他也没有想到说要去找人家的人
要来找他
这是对他一个很好的社交补充
但这个其实还是因人而异
所以说我们并不是说我们的AI
会给所有的用户
都会去主动的发起沟通和聊天交流
其实我们还是会根据用户本身的性格
兴趣他在受理的行为
我们做出一个最终的决策
从你的观察来看啊
现在这些有AI辅助社交
然后有AI伴侣
有这些AI产品的落地
它对你们整个产品
包括用户粘性是会有大的提升吗
非常非常大的提升
其实我们在2024年
其实来自于AI对整个产品粘性的贡献
其实已经是占了大部分了
这个点
其实我们最开始还是非常谨慎的
就刚才您提的那一个
就是说用户喜不喜欢AI来找你
用户喜不喜欢和AI沟通他
这个其实我们最开始还是个问号
所以我们在推进整站的过程当中
其实我们采用了很多的产品策略
或者说运营方式
就比如说刚才的AI辅助社交这个事情
我们在放量的过程当中
既要考虑到使用AI辅助的人
也要考虑到对方
他是否愿意接受这种方式
我们通过非常仔细的人群的实验
然后来做出我们最终的产品策略
和放量策略
刚才说的AI陪伴这个产品也一样的
因为Soul原来
其实一直是能够有这么好的用户粘性
能够有这么好的年轻人的
这样的渗透
其实主要是Soul提供了一个真实信任的
安全的平台
基于用户对平台的信任
才产生了用户和用户之间的信任
这是我们过去七八年
产品力构建出来的一个结果
我们也很担心
我们上了AI机器人过后
大家会不会认为哎
Soul里面全是AI的虚拟人
他没有真实的社交了
对我们当时也很担心这个事情
所以说我们在推进
我们AI的伴侣的过程当中呢
其实我们做的方式
还不是跟AI辅助那一样
其实我们到现在为止
我们都没有AI伴侣
实际的产品中心入口
我发现了
就是得有人告诉我
然后我去搜
我才能找到
因为你们没有产品入口
然后
上面会有那个AI虚拟伴侣的标注嘛
所以我最开始第一个问题产生的原因
就它到底是真的假的
我还怀疑我是不是搞错了
搜到了一个真人对
对所以我们在这个点上
我们希望说愿意接受人机互动的用户
你可以在Soul里面通过找其他的Souler
能够找到这些AI的虚拟人
你可以自己去搜到
这样的AI虚拟人
我们把它定义为
这叫做用户价值驱动产品
当你认可这样的一个产品形态
带来的用户价值
用户自主的去选择他
这样的话其实我们就规避了
我们在直接一刀切
大规模的去推AI伴侣
最后
带来我们对最开始那个问题的担忧
但其实我们现在跑了
大半年过后
我们AI的渗透越来越高
我们用户的粘性也越来越好
嗯
那你们会担心
平台上机器人变得越来越多
改变了用户的体验吗
这会是你们担心的一个方向吗
这是我们考虑的问题
但是我们从长远来看的话
我们还是觉得
人机互动
是未来社交一个非常大的补充
那其实我们应该尽大可能的
在保证
那些对AI其实有排斥的用户群体
在传统的社交体验不变的情况下
我们加大
对人机互动感兴趣的那一批人群
在AI层面更好的体验
其实是这样的
我们应该是分群而去制止
那今年
因为你们其实也有AI产品推出来嘛
从你的观察来看
纯粹是因为AI这个功能
进入到所有的平台用户
就这部分用户
它占一个怎么样的比例
你觉得这样他未来会是一个很大的
增长的区间吗
对我觉得未来其实增量的用户里面
拥抱AI的群体是越来越多的
主要是第一
不仅是Soul
其实整个行业
整个社会对AI的认知的灌输和渗透
其实是越来越强的
比如说在3年之前
说让你去跟一个AI伴侣聊天
到3年之后你再去说跟AI伴侣聊天
那其实接受的人只会更多
不会更少
所以说对任何一个产品来讲
其实拥抱AI的用户群体
肯定是越来越多的
嗯对
我记得其实之前我们俩有聊过天啊
就是你其实有提到在2017年的时候
soul就已经开始搭建这种chatbot了
可不可以聊一下
2017年其实也没有生成式AI嘛
那个时候整个人工智能的功能
还是这种基于规则的人工智能
当时你们的想法是什么
能不能简单的给我们的听众介绍一下
因为你们有这么长时间
搭建Chatbot的经验
能不能介绍一下你们探索的几个阶段
2017年做chatbot
其实并不是说
我们想从技术角度上做chatbot
的确也是基于说
我们对社交的理解和认知出发
说我们要去做这个事情
2017年的出发点
其实跟我们现在为什么要做AI
出发点是一模一样的
其实
我们还是为了解决社交平权的问题
能够让每个用户
都能够平等的获得社交资源
能够获得情绪价值和信息价值
这个出发点是不变的
但2017年这只是存在我们的想法当中
我们并没有把它实现
也没有投入资源去做
因为我们调
研了整个行业
也调研了学数据
其实没有人能够做到这样的事情
因为当时我们提出的
也是能够情感自然拟人的
这样的一个形式
其实我们当时有个产品形态
甚至是说我们要有一个能说会唱的
能够懂你的类似宠物
这是一个非常具象的一个产品形态
当用户来到soul里面
没有办法获得社交资源的时候
能够跟懂你的宠物进行沟通聊天
这当时一个很具象的一个想法
但当时并没有投入资源去做
因为的确是做不到
这效果不好是吗
效果不好
我们也跟几个公司看了一些
他们客服层面的一些对话
产品其实是没有办法做到的
我们那时候其实也在创业起步阶段
我们也没有资源说自己来做这个事情
重拾这个事情其实是19年20年
因为那时候呢
我们提出
其实我们需要从我们的产品出发
一个用户在soul里面
其实是构建了全新的人设
那这个人设
其实我们的个人主页
其实代表了他人设的内在
那我们也希望我们人设
其实他有个形象
你的用户在线下
你是的形象
而不希望把你自己线下的这种形象
传到线上来
我们希望基于你在soul里面的人设
其实你打造一个符合人设的形象
我们就推出了这种捏脸捏人
对原来是2D的到3D的
然后在这个基础上呢
我们就进一步去思考
我们有了形象
那我希望他能够说话
他能够将自己的内在表达出来
那20年其实我们就开始去做对话
那时候20年
其实我们就明确了
我们在产品上对AI诉求是什么样子
技术上
我们要打造一个什么样的一个AI
那其实我们当时提出的一个规划
就是我们要构造一个AI being
和human being的共存社区
我们在Soul里面
其实你既有AI的人类
你也有真实的人类
它是一个共存的状态
也可以人和人进去沟通
也可以人和AI进行沟通
然后在这个基础上
我们就开始投入去做对话
嗯就是2020年就开始准备做对话了
2020
对那个时候是以什么样的方式做
那时候想了很多办法
一是说改写一些这种理解性的模型
发现效果不行
我们又在上面去做一些
基于角色素的搜索
做融合其实也是不行的
因为你聊天过程当中
你可能能聊个10轮
聊个20轮
你能聊下去
但是对方一定知道他没有真人的感受
他知道他在和机器人聊天
就是效果太太机械了
对对对太机械了
我们采集到数据
当时其实有一个偏差
我们把我们的产品
其实在线上做了一些测试
那时候衡量一个对话的产品
叫做CPS这样的一个概念
它的论述还挺多的
是不是说用户能聊下去
后来我们发现这是个结果
因为不聊的人其实就不会去跟他聊
聊的人我知道你是个机器人
我还要去跟你聊
其实他已经抛弃了
说我要在这个过程当中获得体感
而只是为了聊一聊
其实是没有产品意义的
单纯的对话的技术指标和产
品的体验其实脱离了
后来我们就把CPS这干起进行
已经不再提这个事情
对我能理解
那个时候
大家最多的
这种一层一层往下拨的感受
可能有点像打客服电话干嘛
干嘛请按几
我们即使拿世界上语音跟机器的交互
比较前沿的像Siri这些来看的话
它当时也只是一个单轮对话
它其实很难支撑你
一个有逻辑的多轮对话
所以技术上还是很难的
对都是指令性的这种
对对
对对对
我发个指令
你回答我这个指令
你的指令是搜索产生的
还是模型生成的
上下文的关系其实没有
是的是的
对 2020年做对话
2021年就开始投入做语音
你会发现节奏在整个AI的投入
始终围绕着说
我们要打造一个能说会唱
能够拟人的一个AI人
那人和人的交
我们认为说
语音的交互其实是未来的一个主流
对
那其实我们就开始做语音方面的投入
去做合成啊
那时候我们的合成
其实还是基于传统模型去
我认为你的说话的语气
一定是要自然的
平滑的
那时候其实产生了很多语音的AI产品
比如说一些内容平台
让AI去配那个脚本
把脚本语音化
类似这种
但是其实也是很机械的
一听其实你是有机械的声音
在一些语气词方面其实表现的很生硬
那时候投入的方向
其实我们还是要做情感化的语音生成
那是21年投入做语音
所以你觉得你现在训练的这个机器人
他的语调特别的平缓
跟当时21年
这个在研究整个的声音技术
音调怎么跟理人上是有关系的吗
还是说那个时候他的技术
到现在他其实是完全用不上的
其实是这是我们很焦虑的一个事情
因为那时候
其实我们就在做差异化的技术
但现在我们线上体验的
基本上没有用到
那时候的技术完全是新的
还是基于我们现在的LLM
这种模式去做的
双工的语音的效果
然后原来那个其实是原来的
传统的语音的模型
对我们只是在上面去做更多的标注
能让他尽可能的是做拟合
他是个拟合
这边是个生成
其实还是不太一样的
但是那时候沉淀下来的数据
对我们其实是有用的
以及说我们在语音方面的思考
对你一定是要情感化的表达
真实的这种表达
其实也是我们现在模型
所要去构建的方向
那时候沉淀下来是沉淀下来数据
以及对语音
语音在社交方面的作用吧和思考
然后到了2022年
你当时看ChatGPT出来你激动吗
激动是激动
但是是焦虑
让我们觉得说我们的技术归零了
那时候是有可能归零
因为你看到差的GPT的那种交互效果
然后以及这个技术的发展方向
其实你很自然会判断说
原来的这种技术路线
就被拍死在沙滩上了
对那也就是说
我们所有的工作其实可能会归零了
那时候其实我们非常非常的焦虑
惊喜这个事情
因为本身并不是说GPT
类似这种技术方式
是2022年出来的
其实GPT3就早就出来了
对这个技术方向其实我们是知道的
只是我们并不知道
在这种scaling law出来过后
它有这样大的一个效果
所以你当时担心的是什么
你担心的是GPT这种产品形态
如果你们不跟上的话
它可能会把你们前面所有的努力
给覆盖掉
因为它足够强大
那时候已经不存在选择了
那时候我们的考虑是
我们自己还要投入
因为技术方向已经非常明确了
我们是自己自研
还是说
我们要跟一个做大模型公司去做合作
对因为2023年
其实有大量的这模型创业公司出来了
我们要不要去共建
这次我们当时面临选择
而不是说我们要不要走这个路线啊
你当时怎么选的
当时其实也摇摆了很多
其实也跟很多公司聊过这个事情
最终
我们还是选择了要自己做这个事情
第一个是说
我们在过去两三年积累下来的
关于这方面的一些认知
以及说我们本身的产品场景的差异性
那其实我们很难把这一套
完全迁移到其他的模型公司去
因为这才是我们最终交付产品的核心
我们交付产品其实不是交付模型
而是交付我们刚才说的那些
对AI社交的认知
对AI的效果的认知
因为它是一个评判的结果
对用户来讲
对我们没有办法说
我们标准化的输出给三方公司
因为三方公司它是交付的概念
它是交付模型
它不是交付产品
但交付模型就不是我们要的
其实我们希望它是交付产品
我们没有办法
标准化的把这一套给迁移过去
第二点是说
如果是说我们标准化的能够迁移过去
那说明一个问题
说明我们的产品其实没有办法差异化
你都能够标准化了
都能够给三方公司做标准化的迁移
那说明你的产品其实没有差异化的
你们是什么时候做的这个决定
其实就是在2023年上半年做的这个决定
时候要自己做这个事情
当时其实业界有几种方法
第一种是自己train模型
还有一种是用finetune的方式
还有一种是加rag的这种方式
你觉得后两种是行不通吗
你加rag也好
再做finetune也好
其实这是个plus
这个效果增强的过程呢
但你最终的基础的效果
其实你还是没有办法得到
就比如说你用三方的模型对吧
其实还有一个问题
就数据问题
就比如我们现在产生的
大量的文字的社交数据
和语音数据
这次真实人和人
在社交里面的数据范式和行为范式
其他的模型里
首先你没有办法拿到这样的数据
拿不到这样的数据
其实你很难做出非常稳定的效果
这就是我们一直是说
最开始我们有个思路
说我们在finetune方面的数据
或者说在强化这样的数据
我能够下沉到底层模型上去
能让我们的底座模型
其实就是为了社交服务的
那就是为了定义的
这是个垂类的大模型
而不是一个通用大模型
对你当时评估自己做这个事
你觉得它最大的难点是在哪呢
因为我觉得这可能是一个
非常大的决心
首先是要有钱
因为它很费钱
然后要有卡要有人
我们做决策的时候呢
并不是说这件事情有多难
然后我们再去做决策
我们是基于是我们跟三方公司去合作
没有办法达成我们想要的产品
做不到
这中间也找过
对对那只能是我们自己去做
那我们自己去做
就不存在说这难不难的问题
是我们一定要去做的问题
但是在做的过程我们要重新去梳理
如果要达到我们这个效果
我们有我们自己独特的数据
这是我们最大的优势
第二个优势是说在posttrain方面
其实我们知道怎么去构建安全
怎么去构建更好的效果
这是个优势
然后本质上其实还在模型层面
这模型层面
我们有没有一个很好的模型架构
那是我们做了个判断
模型架构
它在未来一段时间它会接近于收敛
到现在为止
其实大家在模型层面
也没有很大的变化
发表回复