单个机器人的成本
因为规模效应
因为统一的结构会导致它的成本极大降低
我觉得这些是从理性层面上
人性机器人终极上是非常好的一个原因
虽然今天可能看起来要实现非常高的人性
还需要蛮多的技术的突破跟进展的那我想说一个感性上面的一个感受
就是其实很多从小痴迷机器人或者关注机器人的这些
你说爱好者也好
极客也好
其实对于机器人是有非常强的情感的寄托跟憧憬的
我认为如果你是一个未来主义者
可能你不会排斥一个概念是未来人类的文明
人类的社会可能会逐渐由碳基的文明进入硅基的文明
也就是说我们未来人类社会可能有大量的机器人与我们共存
甚至超越我们
延续我们的文明
在整个宇宙或者说星际中进行探索
那个时候可能人性机器人会变成人类文明的一种化身
跟我们有更强的情感的映射
能够继承我们人类文明的各种美好的幻想
所以我觉得从情感来讲的话
我觉得人形也是承载人类文明的一个终极的一个心态
也是符合我们自己延续人类文明的一个美好的一个憧憬
所以虽然可能从今天的技术程度上讲
很多场景并不一定需要做成人形机器人
但是大家会为这个理想
或者为了这个感性上的一个想法去不断的做尝试跟努力
对我觉得有时候是不是人形机器人也可以更多的博取一些同情分
比如说有的时候我看到有人在踹一个人形机器人的时候
因为他的形状太像人了
所以就会有一种他会被疼的那种
虽然我知道他不会疼
就是看上去会有一点点心疼的那种感觉
但如果比如说有人在踹一个铁皮子或者箱子
大家可能就觉得还好
接下来其实有一个问题是问lily的
我们在谈到这些机器人的时候
他们对芯片或者GPU的要求会高吗
我觉得这个完全取决于他们的应用的功能诉求
就越通用对芯片的要求越高
对
是的
因为他需要对场景有一个非常充分的理解
需要多模态的一个输入
所以他就会会对GPU的要求会越高
也就是说他对AI的能力要求越高
他就会对GPU的能力要求越高
那在软件层面
NVIDIA它会提供哪些解决方案呢
其实刚才提到的三层
就包括训练仿真加端侧
inference
其实这三个部分是分别有硬件和软件的解决方案
就拿训练来讲
我们有本身自己做生成式AI的一些框架
提供给大家来搭建一些快速的大模型应用
然后仿真的部分
我们的Isaac Sim其实就是一个软件平台
搭配我们的一些相应的做渲染的一些GPU就可以跑起来
整个仿真的环境
对于端侧的开发
我们除了嵌入式的硬件
也就是机器人的大脑的芯片之外
我们也会有一些基础的算法
包括一些感知类的
决策控制类的
还有就是对场景的一些理解
比如说像一些基础模型类
像视觉的检测和抓取的一些基础模型的一些应用的部署也会在端侧
所以这一类也是软件类的一些赋能
所以我觉得简单来讲的话
就这三层训练仿真和端侧的部署
我们都提供了硬件加软件的方案
跟你们合作的一些中国客户
他们通常最关心的问题是什么
什么时候能拿到GR00T这个可能是现在大问的最多的一个问题
因为我们所有的客户
包括开发者
大家也都在这个平台上做各式各样的一个开发
但是他们就很好奇
比如说我们这次GTC发布的像这个GR00T到底什么时候能用
然后以及我们最新的这样我们还有两个概念
一个叫做perception
一个叫做manipulator
其实这两个都是软件的部分
Perception主要是给移动机器人做纯视觉的一个解决方案
Manipulator主要就是赋能机械臂的端到端的一些应用
所以大家对这部分的这种非常具体的一些解决方案非常感兴趣
非常希望能有一些早期的一些测试
然后我们的perception应该是在五月中旬
就这个月中旬就会开放给大家
那manipulator的话也会在五月底六月左右
具体时间可以关注一下NVIDIA的平台
完全的可以给大家下载使用发布的话其实我们在GTC是进行了发布
包括GR00T,GR00T的话相对来说会比较早期一些
那还是得大家持续的关注我们的一些动态
所以大家对于这些比较细分的解决方案
比如说像基础的抓取类或者通用的这种机器人的模型会非常感兴趣
你们的客户里面是偏专业跟垂直的更多
还是更加通用的更多
或者你有没有看到什么趋势类的变化
其实都有
只不过是大家现在更希望自己做的机器人的方案更通用一些
这样可以适配于更多的一些行业场景
大家现在会更倾向于把机器人大脑做的更通用
也就是说他在可能以前只是执行单一的任务A就还是拿那个抓苹果
可能以前他只能抓苹果
但是现在大家希望做的这个机器人
除了抓苹果
还可以抓杯子
还可以拿钥匙
就是处理更复杂的一些通用的一些任务场景
其实你是有看到这个趋势的
以前可能他也是做比较垂直跟专用的场景
但是他希望他们的场景能够扩展
其实只要涉及到扩展
可能就涉及到任务的泛化了
因为之前的机器人
我们觉得更多的是叫做single purpose robot
单一的一个目的的一个机器人
现在包括像人形
包括像具身智能
我们更希望的是他可以执行多个任务在一个机器人上
所以就像您说的
它会更具有任务的泛化性
对于NVIDIA本身来说
因为我知道Jensen他是特别看好这一块的
你们自己对这个机器人投入的一个时间线
包括你们研究这个平台的时间线是怎么样的
为什么会说在这么多的AI会改变的行业里面
你们会把重点放在机器人领域
其实NVIDIA在各行各业都有赋能
包括医疗
工业制造
汽车游戏
我们做的最早的也时间最长
所以这些都有
只不过是今天我们可能重点聊的是机器人的板块
但是机器人他其实在我们看来是没有行业属性的
也就是它可以用于医疗
也可以用于工业
也可以用于汽车制造
所有的场景都可以用
所以机器人在NVIDIA它相当于是一个水平的一个解决方案
然后来赋能纵向的每一个行业
您可以这样理解
所以我们认为机器人为什么这么重要
其实NVIDIA做机器人做了很久了
包括我们的Isaac也推出了很多年了
一直在做不断的版本的迭代
然后不断的把更的一些AI的一些能力给集成进来
做一个更完整的机器人解决方案
我们也是认为现在第一点
我们认为整体劳动力的缺乏
以及工业自动化
包括智能制造的自动化的一些快速发展
包括人类日常生活中的需要助力的一些环节
所以在我们看来
机器人绝对是未来大量载体的应用的一个典范
所以这也是为什么对我们会推出很多或者发力很多在训练仿真
还有端侧帮大家完整的迭代一个开发的一个工作流
帮大家来打造一个更通用的一个机器人本体
这样子就是像我刚才提的一些行业类
那他就可以快速的做一些应用
这就是为什么您看到我之前可能您问我一个问题
就是关于端侧就是载体类的
我们有哪些形式
您看到机械臂、AMR,四足、割草机
无人机包括自动矿卡这些我们都有
也是因为我们的机器人的计算芯片从20 tops其实最早是0.5 tops
包括现在最新的orange从20 tops到275 tops全部都有
而且都是统一的软件架构
所以这就会方便大家来打造不同种类的机器人的应用
不管你是非常简单的一些也像桌面机器人
开发者机器人
或者是一些消费类的
或者到一些非常大的
像自动驾驶矿卡之类的非常复杂的一些大型的重工机械
那我们都是有全栈的软硬件都可以进行赋能
刚刚我们也在很多次的播客中提到了仿真环境
其实我一直有一个疑问
机器人他到底是应该更多的抓取与物理世界的数据
还是在仿真的环境中训练
因为我们有的时候知道仿真环境的训练
它肯定对机器人它的输出的结果是有帮助的
但是我们真的把它放到一个物理环境里面了
可能它的光线
它各种传感器的布置
包括比如说有一个传感器
它可能路线稍微出了一些故障
或者太阳光稍微让它这个投影
发生了变化
他可能就抓不到那个苹果或者那个杯子了
比如说大家在用NVIDIA的仿真系统的时候
他对这个机器人他实际的效果提高有多少
大家到底是应该多在物理世界中训练
还是在仿真环境中训练呢
我觉得这你这个问题问的非常好啊
这个其实也是我们NNVIDIA仿真平台我觉得比较突出的几个技术优点
就是因为我们把物理世界做的非常逼真的一个描述
这个积累于我们之前在图形图像处理相关领域的一些技术积累
同时对于各个光线的追踪以及物理属性
比如说一个物体
假如说它是苹果还是海绵
它的触觉其实是完全不一样的
发表回复