E197_一位动漫制作人的日本之旅_七大模型多模态之争(3)

包括你给之前的话
提出过的这些建议
包括你写的这些脚本
我们把它丢给ChatGPT
然后我们就告诉ChatGPT
你现在假装自己是这个动画导演
对一个新的项目进行评估
所以他们最终
有用吗
怎么样
我非常需要
这个还真有用
而且觉得有用的
并不完全是他们自己
而是导演本身
尤其是大项目的动画导演
他面临的工作量实际上
是非常非常不是个人
能够完成的一个量级
而且其实他是所有的项目
都会汇总到他这里
对
他要去做决定
他要去看整个项目的审美
对
每一个环节行不行的人
对
所以说很多时候
比方说看到有些地方
画的不好的时候
我们叫作什么作画崩坏
很多人会觉得那个导演不行
这个不正确
因为导演尤其是在
动漫的这种产品当中
他永远不可能去亲自的
把每一帧的画都拿出来去修正
那不可能
这完全不是一个正常人
能够完成的一个工作量
所以他为了保持一个优秀的质量
那个导演下面他会去组建
他信任的这些原画师也好
这些修正的专职人员也好了
他会需要一个团队
而这些团队当中
如果有人掉链子了之后
其实反而比导演本身更容易
产生作画上的质量问题
而导演本身因为
他需要反馈的东西太多了
故事板怎么样
脚本怎么样
我画的这个风格怎么样
颜色对不对
我画的这些动作时间上的安排
合不合理
情节好不好
他作为一个总的策划人来说
实际上他的精力也是非常有限的
对吧
所以这个公司他们的产品卖的好吗
其实蛮好
就是相当于是一个导演助理的角色
对这个是一个动画工作室在做
这个动画工作室
他是做给自己用
还是他的产品
做给自己用
他们完全是在自用
挺好的这个想法非常棒
对他们完全是在自用对吧
所以他的意思就是说ok
导演我现在给你做了一个
ChatGPT的一个虚拟助理
如果接下来有下面任何
一个环节需要你提供反馈了
要不你先把它
给ChatGPT过一遍对吧
然后ChatGPT要说这不行
你看看它说的有没有道理对吧
然后他们也是这样试验了一下
最后这个导演觉得还不错
其实在动漫行业这些导演
和制片人的这一类人当中
很多人对AI有着更开放式的
这种研究探讨的态度
我个人认为很多一方面
也是从他们的角度上来说
确实经常出现
心有余而力不足的情况
所以AI会帮他真的抠到每一帧
那你觉得AI给的意见靠谱吗
我觉得实际上甚至AI
也不一定能帮他抠到每一帧
但是在一些比较关键的一些节点上
其实AI即使能够帮到他
百分之四十五十
也是很有用的
至少作为一个观点
了解
比方说一个导演一天8到
12个小时
比如说其实真的生产起来
可能比这个多
是十八个小时吗
可能比这还多
但我们就假设说是10个小时
他在这10个小时当中
可能真的能够非常聚精会神的
修改的关键部分
可能每天我觉得不一定
会超过十个关键点
那有这个AI他即使每天能够
修的关键点能从10个变成15个
那这也是一个巨大的成功
那看起来质量提升了30%
那感觉是有这个希望对吧
对对对
然后你从日本回来之后
你觉得对你们如何做动漫
然后要不要使用AI工具
对你整体上的观点会有改变吗
我觉得改变还是相当大的说实话
大家对于AI
一方面来说就是更欢迎
然后另外一方面来说也是
更偏向于相信它未来的可能性
但是他如果真的作为一个工具
嵌入到平时的这种生产过程当中
那确实还要面对这样那样的
细节当中的魔鬼
所以你对AI就是日本之行之后
你反而对它的态度是更谨慎了
这个是我听出来的
这个是一方面
另外一方面也是因为我们看到
有很多现在以AI为核心的小团队
实验的出现
我们也觉得很激动人心
我一直觉得人类对于艺术
人类对于创作的追求
是一件永恒的事情
人类我觉得从上千年上万年前
就开始在洞窟上戳画画对吧
而这次从日本回来之后
我也更思考的一件事情就是
如果我们真的把AI
作为创作工具的本身
那么围绕AI
会不会有新的可能性产生
有没有可能说我们现在能够看到
以前完全做不出来的东西
比如说特别特别复杂的衣服
动漫的设计当中不太适合
出现特别复杂和华丽的服饰
因为这些服饰的制作
还有把它动起来
那就需要有大量的人力物力
我理解就是一个服饰
如果它特别复杂
上面还有花纹
那这个动画师在画它的时候
就要吐血了对吧
就每天28个小时的工作时间
就出现了
但是如果有AI的话
这可能就会成为
一种可行的视觉语言
但服饰也不重要
就是在整个动漫中
不好说
不好说吗
这个我一直以来
抱有一个很开放的态度
因为我们目前看到的
尤其是2D手绘的动画
它的服饰都相对简单
并不一定代表说
复杂的服饰它就不好看
而是因为制作上的原因
我们只能这么选
我能想象一些场景
比如说一些打斗
它还是需要一些复杂的服饰
或者在你体现一个
王这种概念的时候
对对对
或者是甚至说一个打斗的案例
一个中世纪的一个骑士
其实他的盔甲的结构是相当复杂的
而如果把这些全部复杂精密的
这种盔甲的结构
完全的用手绘的方法画出来
那可真的是不知道做到什么时候
也确实有可能得不偿失
比方说身上会挂很多挂饰
或者铃铛的这种角色
相对来说这种角色的服饰
在现代动画当中可能相对罕见一些
但如果有AI的话
这些变得更好做了
它会不会产生
新的一种创意上的可能性
对于这件事情
我其实抱有相当的开放式的态度
我觉得也是一个很值得期待的领域
与此相对应的
比如说动漫的这种上色的方式
现在是怎么上色的
AI是怎么上色的
基本上就是填充
没有了
这个就是开玩笑
这个有点半开玩笑的意思
听众朋友们可能在小时候
也玩过windows上面的涂鸦工具
然后里面有一个大家
可能都玩过的工具
叫做油漆桶是吧
就是你画一个圈
油漆桶一点
这里面突然一下都变成一个颜色了
其实现在大部分上色
就是这么上就是油漆桶
但你不觉得其实这就是人类
重复密集劳动的部分吗
这个就是技术与创意产品之间的
一种非常微妙的关系
对
这就是我们最想交给AI去做的
对就是技术的限制
它会产生一种形式的创意的结果
像希腊雕塑的这些大理石
大理石它本身就是一种限制
大理石上的上色
当时的颜料的技术实际上
非常的不成熟
所有的颜料都很难在历史的
化学反应当中被保存下来
那就导致了很多我们现在看到
希腊时期的这些大理石都是白色
但是就因为有这样的
技术上的这种限制
反而在后来
比方说我们新古典主义时期的时候
大家又来看
觉得白色反而是一种特色
但是后来当我们的这种印染的
或者对材料控制的技术
又上一层楼的时候
我们之前买的
这种变形金刚的玩具也好
哆啦A梦的这些小玩具也好
动漫的这些手办也好
由于我们人类对于塑料的
这种化学工业已经
到达了一种非常非常先进的程度
它又诞生了一种完全不一样的
美学的可能性和生产的体系
我希望AI它最应该做的事情
并不是说把已有的创意
给用AI自动化
但是AI它最美妙的
最有趣的地方应该是说
我因为产生的这个工具
有没有什么我以前因为
各种各样的原因做不到的事情
现在可以做得到了
如果我们有这样的愿景的话
那我觉得人类与AI
在文化艺术方面创意上的
这个未来应该是一个
非常另人期待百家争鸣
百花齐放的一种理想状态
如果我们说在此过程当中
艺术也好文化作品也好
它的创作上忽视了
这当中一个具体的艺术家
那这我觉得也是
一个很不应该的事情
是你能不能简单介绍一下
你现在每天的工作
然后你的工作中是怎么样
跟大模型发生这种
就是每天会使用它的
我们现在每天的工作
主要围绕动漫制作产生
比方说未来的项目
它写故事设计角色
然后跟进已有的项目
我们就去跟进它的产能的状况
有没有什么问题
还有一些是更偏向于商业上的
那就更典型的一些制片的职责
比方说项目的融资发
宣发制作资源的整合
对于我们来说可能比较特别的一些
因为我们本来这个 IP的起源
也比较奇特
它并不是一个漫画
也并不是一个小说
它是一套NFT的头像
所以我们也会尽可能的
会想着有没有什么AI
能够跟头像直接产生一些
有趣的化学反应的方法
AI是不是也可以直接
帮你们生成Azuki头像的作品
肯定是可以的
对因为我觉得其实你们是一个
非常典型的AI的应用场景
因为NFT它就是需要
有各种不一样的
符合你们风格调性的头像
但是每一张都要不一样
对也不对
一方面来说我们肯定跟AI生成
这方面是结合的非常的紧的
那另外一方面NFT它本身
有着比较强的收藏属性
我们人手工的制作以及它的稀缺性
可能会成为比它是由AI做出来的
这件事情要更重要
所以不能用AI做
在Azuki头像生成过程当中
我们肯定没有用过AI
为了保持它本身的
这种收藏属性的价值
我们也会控制它的供给量也好
也会有尽可能的
用我们的艺术家也好
设计也好
把它打磨到最好
所以就是AI如果足够发达的情况下
它会解决了一种生产上的问题
但是AI它不解决宣发的问题
比如说我现在拿AI
做出一个五分钟的短片
但这个短片怎么样宣发
它是否拥有商业价值
它是否能让一部分
看到它的人觉得感动
这些都不是AI
现在技术上正在做的事情
这些除了技术上的考量之外
又需要很多非技术的
对于动漫也好了
文化作品也好了
有着非常深层理解的
这些导演创作者
他们来去把这件事情给挖清楚
那你现在每天用到AI做生成
大概是一些什么样的环节
我们大部分的时候在实验
比方说你现在
有一个Azuki的头像
我们能不能把你
用AI把这个头像动起来
来作为一种技术上的尝试
有意思
这种情况下我们就不打破它
原则性的收藏性的基础上
提升了一些它趣味性
对然后你之前有提到
七个大模型每周都在进步
你追我赶
可能不止七个
现在已经不止七个了
对对
你觉得是哪些方向的进步呢
是从什么时候开始进入到
这种你追我赶的时间点的
我感觉这种万马奔腾的状态
真的很接近
可能是从七八个月前开始的我觉得
是有什么关键的模型发布吗
Sora
我觉得还不是Sora
实际上可灵
Pika还有Runway
在几个重大节点上的发布
可能比Sora还要更具有代表性
Sora当时一开始发布的时候
如果我没记错的话
好像还有一定的争议
因为大家对于它的漆面普遍偏高
但是最后生成出来的效果
还不一定有想象中的那么好
但是我记得
确实就从那个时间点开始
基本上这几家大模型
就进入了一个你追我赶的状态
你追我赶表现在什么方面呢
版本更新的频率
还有AI模型稳定性速度
对于关键词的理解上面
都在以一种非常惊人的速度进步
能不能举几个例子
这个变化实在是太快了
那我们就用ChatGPT来举例好吧
OK
它之前发布了吉卜力
大家去改的时候
这个是今年的事情
还是挺近的事情
两个月前四五月份
我记得当时在ChatGPT发布之前
谷歌的Gemini放了一个
实验性的feature
当中它就已经做到了
用文字来编辑单张图片
这个能力已经做到了
一种非常惊人的程度了
在Gemini和ChatGPT这一波之前
实际上如果我们单从图片考虑的话
可能大家用Mejourney
和Stable Diffusion还更多一点
但Mejourney和Stable Diffusion
对于文字逻辑的理解
坦率的说不是特别的强
比如说我给一张照片
然后我说把这个照片
变成一个吉卜力的风格
就这么简单的一句话
在谷歌的Gemini和ChatGPT上
一句话就能解决的事
而且效果还真不错
很厉害
迎头赶上是吧
几周之后ChatGPT
就出来类似的东西了
然后
就大家互相
我觉得还有一个因素
是当一个功能大家确定了
某一个方向可以这样做的时候
其实抄起来是很快的
确实现在明显有这个感觉
Luma我觉得也是一个很好的例子
Luma我觉得我之前印象非常深刻的
是它的给一个起点
给一个终点
你是说关键帧是吧
对
拿茶杯跟喝到水的关键帧
对对对
我们就比方说给一个起点
给一个终点
然后让它把中间给补全对吧
我记得去年年底的时候
他们有一版
这个效果整体就做的非常不错
很快我觉得甚至可能是同时
中国的可灵这个模型的关键帧
尤其是在动漫这个风格上面
它的那个补全的质量就更高
为什么现在很多大模型
它在动漫方向的进展
好像比它在真实的物理世界的
进展看起来是要快的
我感觉这个还存在
模型与模型之间的区别
就可能是训练员素材的问题
对而且有可能是跟这些团队
不同的侧重点有关
可能尤其是对于中国的团队上来说
因为大家都比较习惯
也比较喜欢动漫二次元的这种画风
那对他们来说去往这个方向做
是一个相对来说
比较自然而然的反应
而在美国方面
实际上现在很多
比如Pika Runway
像Luma他们我觉得
在特效上可能就做得非常的不错
也很难说技术上来说到底哪家
跟哪家之间是否存在
真正意义上的代差
所以你觉得
在视频模型上是没有代差的
包括中国的这些大模型
中国还有哪些做的比较好的
你刚刚提到了混元可灵
混元可灵在动漫方面确实不错
Vidu我记得是
Vidu对
也是动漫生成相当不错的一个
开源的模型
我记得是One wan I think
中国的这些模型
我觉得从生成质量上
完全不输于美国的模型
而且从迭代速度
甚至产品的终端用户体验上来说
甚至比美国的公司还要再好一些
所以我觉得
因为会做产品
我觉得真的是
我觉得真的是
而且生成更快而且更便宜一些
美国的这些按月付费的
这个其实真挺贵的
很快就能用完
我觉得最新一次视频模型的发布
其实是在Google IO期间
Google 发布的Veo3
它其实是在常规的
这种视频生成的基础上加入了声音
它有音画同步
包括有口型这个难吗
这个有点像我们刚才讲的
ChatGPT和Gemini
他说的单个语言文字
来去做图片的这种编辑
这件事情本身从技术上来说
当然是挺不错的一个成就
但如果真从模型本质上来说
我反而觉得应该没有那么的复杂
可能很快我们就会看到其他家
也会有类似的产品出现
音效生成
对
现在视频模型能生成的
最长的视频是几秒
目前很多的都在
10秒15秒 20秒这种区间
如果再往下生成的话
就确实会出现

E197_一位动漫制作人的日本之旅_七大模型多模态之争(3)

评论

发表回复取消回复

更多文章

聊聊2025 Google I_O与Gemini背后的灵魂人物(5)

聊聊2025 Google I_O与Gemini背后的灵魂人物(4)

聊聊2025 Google I_O与Gemini背后的灵魂人物(3)

聊聊2025 Google I_O与Gemini背后的灵魂人物(2)

E197_一位动漫制作人的日本之旅_七大模型多模态之争(3)

评论

发表回复 取消回复

更多文章

聊聊2025 Google I_O与Gemini背后的灵魂人物(5)

聊聊2025 Google I_O与Gemini背后的灵魂人物(4)

聊聊2025 Google I_O与Gemini背后的灵魂人物(3)

聊聊2025 Google I_O与Gemini背后的灵魂人物(2)

发表回复取消回复