作者: admin

  • 【人工智能】如何用LangChain和向量数据库打造语义搜索 _ LangChain CEO解读 _ 五个典型案例

    大家好,这里是最佳拍档,我是大飞
    近期大家应该都知道
    ChatGPT的访问量有所下降
    引发了很多激烈的讨论
    不过这并不意味着开发者对整个AIGC的热情有所减少
    因为从Google Trends的趋势可以看出
    LangChain的热度依然只增不减
    原因就在于LangChain作为大模型能力“B2B2C”的一个重要的中间站
    能够将大模型和其他的项目
    丝滑地连接在一起
    达到1+1大于3的效果
    大家现在也都比较清楚的是
    提高大模型应用性能的一个关键手段
    就是将大语言模型和外部数据相结合
    具体而言就是让大语言模型接入现成的数据集
    并且要求AI应用能够记住用户的对话
    通过“反思”对话上下文生成“新的记忆”。
    当用户在AI应用中进行检索时
    应用系统会先在现有数据集中提取相关信息
    然后结合用户查询以及记忆的上下文
    最终高效准确地返回检索结果
    因此LangChain+向量数据库就是一个最好的方式
    为了帮助开发者们深入理解使用LangChain和向量数据库
    进行语义搜索的原理及实例,最近
    LangChain的联合创始人兼首席执行官哈里森·蔡斯
    联合向量数据库厂商Zilliz
    进行了一次干货满满的直播讨论
    共同探讨了如何使用LangChain和向量数据库进行语义搜索
    以及在此过程中可能会遇到的一些典型案例
    由于视频较长
    大飞我对重点内容做了一些总结
    跟大家分享一下
    首先哈里森回答了一下
    什么是检索的问题
    他认为
    检索是指从内存或者其他存储设备中
    获取信息的过程
    那么
    如何利用检索技术、向量数据库、AI代理等技术
    来搭建一个接入外部知识库的大语言模型应用呢?
    哈里森表示
    尽管现在大语言模型功能强大
    但是在使用上还存在一些限制
    比如大语言模型只能记住预先训练时的信息
    这就意味着
    大语言模型并不能够做到实时更新数据
    举个例子,刚开始的时候
    ChatGPT的数据仅涵盖2021年及以前的数据
    因此当时ChatGPT无法回答2021年之后的信息
    只有等他开放了插件的系统之后呢
    才能够获取实时的数据
    除此之外
    大语言模型还缺乏特定领域的专业信息
    比如跟特定业务相关的数据
    在这种情况下
    检索技术就能够作为一种补充的形式
    帮助我们打破大语言模型本身的使用限制
    换言之
    检索技术能够为大语言模型应用提供更多信息上下文
    从而帮助它返回更准确的答案
    那么检索技术的主流用例之一
    就是语义搜索
    哈里森解释了语义搜索如何在CVP架构中
    也就是ChatGPT+Vector Database+Prompt
    架构里边
    来发挥它的作用,如图所示
    如果用户提出了一个一般的问题
    并且大语言模型可以回答
    那么它就会直接返回问题的答案
    但是
    如果用户提出的问题是特定领域的专业问题
    那么这个问题会被转化为向量
    并被发送到向量数据库中
    而向量数据库中已经预先存储了一些专业文档片段的embedding向量
    当用户的专业问题向量被发送到向量数据库后
    会在数据库中进行相似性搜索
    从而找到 “top-k”个最相关的结果
    这些找到的结果
    会与用户查询的问题
    一同经过类似LangChain这样的AI代理处理
    合并发送给大语言模型
    最终返回令人满意的响应结果
    由于语义搜索十分常用
    并且能够有效解决多种大语言模型应用的问题
    于是哈里森列举了5个语义搜索的典型案例
    并且详细分析了每种情况
    第一个案例,重复信息
    如果数据库中存有许多重复的文档
    检索信息会面临一些挑战
    这些重复的内容其实不适用于大语言模型
    会产生很多不必要的上下文
    对于这个问题
    哈里森提出了3种解决方案
    第一种
    通过语义搜索过滤掉类似的文档
    例如在将提示发送到ChatGPT之前
    LangChain会检索20-30个相似文档
    并通过向量检索技术过滤掉或者绕过重复的文本
    再将提示发送到ChatGPT
    第二种
    利用最大边际相关算法来优化多样性
    这种搜索侧重于从其他检索到的向量中
    获取相似和多样的结果
    第三种,在存储之前对文档进行去重
    但是,这种方法挑战性最大
    因为需要大量的时间和精力
    来确定一个相似性分数
    用来判定文档是否重复
    即便设置了一个相似性分数
    它也未必十分准确
    因为单个事物的单个向量维度差异巨大
    分数稍有偏差,结果就会大相径庭
    第二个案例是冲突信息
    如果对于同一个问题
    不同来源的数据会给出不同的回答
    这样会导致信息冲突
    如果将这些数据据全部都给到大语言模型
    可能会导致大语言模型产生混乱
    例如
    用户想要通过大语言模型应用查询公司的休假政策
    但是人力资源文件和一些临时会议记录
    给出了不同的答案
    对于这种情况
    哈里森提出了以下2种解决方案
    第一种是对来源进行优先级排序
    并将优先级打分权重
    加入到检索中
    第二种是将所有源信息都传入生成的步骤
    交由大语言模型来判断哪个信息源更可靠
    第三个案例是时效性
    我们都知道,信息需要不断的更新
    才能保证信息的时效性
    例如
    公司的休假政策可能会偶尔更新
    那么大语言应用需要能够确保给到用户
    更新后的正确信息
    对于这种情况
    哈里森提出了3种解决方案
    第一种
    在检索中对最近的信息进行加权
    从而完全过滤掉过时的信息
    第二种,给生成的信息带上时间戳
    这样就要求大语言模型优先选择更近期的信息
    第三种,不断反思
    也就是不断修订大语言模型对某一个话题的理解
    第四个案例是元数据查询
    在某些情况下
    用户提出的问题更侧重于元数据信息而非内容本身
    例如
    用户可能会查询“1980年间关于外星人的电影”。
    其中
    “关于外星人的电影”这一部分可以进行语义搜索
    而”1980年间“其实是需要通过精确匹配来筛选结果的
    对于这种情况
    哈里森建议在执行语义搜索检索之前
    先加入一个元数据过滤器
    这样一来
    当用户查询”1980年间关于外星人的电影“时
    其实会分为两个步骤
    第一个步骤是元数据过滤器
    通过精确匹配
    先筛选出年份为1980年的电影
    第二个步骤再进行语义搜索
    查询筛选结果中”关于外星人“的电影
    许多向量存储都允许在查询前
    先通过元数据过滤器筛选数据
    如果大家选择的向量存储器不支持在查询前进行元数据过滤
    那么在语义搜索之后
    再过滤数据也是一个可行的方案
    第五个案例是多跳问题
    用户可能会一次提出多个问题
    这就会给语义搜索带来挑战
    对于这种情况
    哈里森建议使用像LangChain之类的AI代理工具
    可以将问题分解为几个步骤
    并使用语言模型作为推理引擎
    来检索所需信息
    但是这种方法的一个弊端
    就是要多次调用大语言模型
    导致使用成本较为高昂
    对此
    Zilliz的工程师建议集成GPTCache与LangChain
    使用GPTCache来存储大语言模型生成的问题和答案
    这样在用户下一次提出类似查询时
    GPTCache会先在缓存中
    搜索是否是已经问过的重复问题
    之后如有必要
    再执行语义搜索并调用大语言模型
    这样一来
    可以大大节省大语言模型的调用成本
    那关于GPTCache
    这是Zilliz开源的一个大语言模型的缓存服务
    类似于Redis、MemCache这些服务的作用
    我们有机会也可以详细做一期视频介绍一下
    在最后的问答环节
    哈里森也回答了几个问题
    比如说对于如何写出好的prompt
    哈里森认为关键在于要先明确自己想要什么
    如果你无法清楚表达自己的意图
    那么大语言模型也是不知道该怎么做的
    这就和人类之间的交流一样
    LangChain后续也会添加一些功能
    帮助用户来优化Prompt
    那谈到怎么看当前的赛道和其他竞品
    哈里森认为整个文本检索和生成的赛道仍处于早期阶段
    发展非常迅速
    在文字检索阶段
    LangChain模块化的架构可以支持自定义向量检索系统
    更加具有灵活性
    Vectara是一套出色的端到端全托管的检索解决方案
    而LlamaIndex提供了一些更有趣的数据结构
    例如树型结构,可供实验使用
    在文字生成阶段
    LangChain可以和其他方案进行集成
    那谈到大语言模型正在不断放宽prompt的上下文字数限制
    这对检索会有什么样的影响
    哈里森认为
    虽然Anthropic推出了支持10万上下文长度的
    大语言模型上下文转换器插件
    但是向量数据库提供了一种更加高效的解决方案
    设想一下
    如果大语言模型负责所有计算的工作
    而向量数据库负责所有存储的工作
    那么计算开销就会飞速上涨
    这也就是说,处理的上下文越多
    成本越高
    这时我们就可以使用向量数据库来节省开销
    计算总是比存储更贵的
    有的甚至贵100多倍
    而且使用上下文转换器
    大语言模型仍有可能会忘记早期对话中的内容
    好了,以上就是大飞对这次谈话
    重点内容的总结归纳
    有兴趣的同学可以去看一下原视频
    地址我会放在视频说明里
    需要简单填写几个信息,即可观看
    本期的视频内容就到这里
    感谢大家的观看
    我们下期再见

  • 【人工智能】什么样的机器才会产生意识 _ Anil Seth _ 认知和计算神经科学家 _ 计算功能主义 _ 忒休斯悖论 _ 生物自然主义 _ 预测和控制 _ 凡人计算

    大家好,这里是最佳拍档,我是大飞
    今天我们再来聊一个充满争议的话题
    那就是机器能否真正的拥有意识?
    又或者说
    什么样的机器才能产生意识?
    最近
    意识领域的权威专家阿尼尔·塞斯Anil Seth教授
    在他的一篇论文中提出
    尽管技术进步迅速
    但是要想实现有意识的AI
    还需要满足一系列复杂的现实条件
    他着重指出
    意识与生物体有着本质上的联系
    并不是只要有足够的算力就能够产生意识
    传统基于冯诺依曼的机器和AI
    不太可能产生意识
    只有依赖于生命系统才可以
    我们先简单介绍一下阿尼尔·塞斯
    他是认知和计算神经科学教授
    也是萨赛克斯大学塞克勒意识科学及心理中心的创始人之一
    他不仅发表过100多篇科学论文
    更是经常为大众科普
    他在2017年发表的TED演讲
    仅在YouTube上就有将近1100万次的播放
    他的新书《意识机器》,
    不仅从神经科学的角度论述了意识
    还讨论了意识与人类对自我的概念理解
    以及对自我认识之间的关系
    有机会我们会再做一期节目介绍
    好了,接下来我们进入今天的话题
    这些年
    关于AI是否具备意识的讨论不断的升温
    大卫·查默斯David J
    Chalmers
    也就是“意识的困难问题”的提出者
    认为尽管目前AI模型还面临着很多的技术障碍
    但是这些障碍很可能在未来十年左右被全部克服
    未来
    下一代大型语言模型可能就会具备意识
    人工智能安全中心组织CAIS也在一份报告中指出
    尽管当前的人工智能还不具备意识
    但是许多神经科学理论已经提出了可行的、用来评估AI意识的指标
    其中就包括我们在意识大一统那期节目中提到的
    循环处理理论RPT、全局工作空间理论GWT、高阶理论HOT、注意力基模理论AST等等
    不过,在讨论AI是否具有意识的时候
    研究者们往往会不自觉地将AI人格化
    这种人类中心主义的观点会认为
    如果机器表现出了类似人类的行为
    满足某些理论框架下的意识指标
    那么就可能具备意识
    而这种基于计算功能主义的假设
    正是这次阿尼尔·塞斯质疑的核心
    我们先解释一下什么是计算功能主义?
    在古希腊哲学中
    有一个著名的忒休斯悖论
    如果逐渐更换一艘木船上的每块木板
    等最终换掉所有木板之后
    这艘船还是原来的那艘船吗?
    如果我们把木船换成大脑
    将人类大脑中的每个模块
    换成功能等价的硅基算法
    甚至通过仿真技术
    完全复制每个神经元之间的连接
    那这样的硅基生物
    能否被当成最初的大脑呢?
    它是否具有意识呢?
    这样的假设就被称为计算功能主义
    也就是只要满足给定的功能
    黑猫白猫都是好猫,意识是否存在
    只和是否具有特定的计算能力有关
    显然这种观点有些绝对
    反对者就指出
    即使神经元被硅基所取代
    内部运作方式以及整体行为也将不可避免地存在差异
    比方说
    碳基大脑的神经活动会受到代谢限制、电磁场以及其他因素的影响
    像一氧化氮这种神经递质
    能够自由扩散过神经元的细胞膜
    但是硅基的大脑只能模拟离散的时间点
    无法检测到物质不断变化的位置
    另外新陈代谢也会直接影响神经系统的通信
    而对于硅基算法,算法本身是不朽的
    不需要考虑新陈代谢
    虽然反对者的证据
    不足以推翻计算功能主义
    但是也说明计算功能主义还无法自圆其说
    虽然计算功能主义认为
    机器具有智能的基础是计算功能
    与它的物理特性无关
    但是如果大脑的计算过程与碳基的物理实现密切相关呢?
    我们之所以习惯将大脑看成是计算机
    是因为习惯了从大脑的认知功能出发来思考问题
    然而
    随着对大脑内部运行机制的了解越来越深
    神经科学界并没有发现
    生物脑的“心智”和“湿件”之间
    存在着像计算机软件和硬件之间那么明显的区别
    具体来说
    大脑的活动模式是在多个空间和时间尺度上持续展开的
    不断受到神经递质的扩散、神经网络自身的物理结构
    以及细胞基础设施的各种属性影响
    这些因素都与神经系统代谢活动释放的分子风暴
    紧密地交织在一起
    如果只是简单地将大脑视为执行正确计算的机器
    就会忽视它复杂的、多层面的生物活动
    相对于计算功能主义
    另一种称为非计算功能主义的观点则认为
    意识可能仍然会依赖于功能组织
    但并不依赖于计算
    这一派理论的支持者
    会大量使用类似于“动力学系统”的方法
    借助于微分方程等数学工具
    来模拟具身和嵌入式神经系统会如何随时间发生变化
    类似的还包括4E理论
    以及Gemma神经震荡及同步等等
    非计算功能主义的研究者们
    认为大脑是一个不断变化的动态系统
    反对将大脑视为纯粹的计算工具
    这就引出了阿尼尔·塞斯要提出的重要一点
    那就是生物自然主义(biological naturalism)
    这个术语来自于“中文屋”思想实验的提出者约翰·瑟尔John Searle
    生物自然主义认为
    意识是一种生物现象
    源自于大脑和身体中的神经
    以及其他可能的生物过程
    是一种只有生物系统才具有的属性
    阿尼尔·塞斯之后从预测和控制的神经科学视角
    对生物自然主义进行了论证
    先说预测
    预测性编码理论将大脑的感知、决策与行动
    看成是最小化预测误差的过程
    而大脑之所以要不断更新对外界环境的预测
    是为了保持它所属的身体的内稳定
    这个理论认为
    意识是大脑“最佳猜测”的产物
    是自上而下的感知预测
    对多感官产生的内容整合
    形象点说
    “意识是一种控制性的幻觉” ,
    其中“控制性”强调意识的内容是主动生成的
    而不是由外界体验被动赋予的
    而意识产生的基础
    是要具有一个能够像生命一样
    保持内稳态并且自我复制的身体
    如果没有生物体存在
    就无法形成对自身状态的预测
    也无法形成对外部世界的感知
    可以说
    意识和生物体维持自身是强绑定的
    对于生物体来说
    维持自身的内稳态是生存的必须
    即使是最简单的细胞
    也需要与外界进行物质交换
    从生物自然主义的视角来看
    这种交换是意识形成的先决条件
    此外,生物在自我复制的过程中
    不断重建自己的物质基础
    维持自身的完整性
    而意识则不断地参与到这个过程中
    在生物自然主义的框架下
    我们可以继续推导出
    意识是与生命系统密切相关的
    而这个所谓的生命系统
    并不一定局限于碳基生命
    甚至包括硅基的人工生命
    以及辛顿Hinton提出的凡人计算
    它们也都可能产生意识
    尤其是辛顿这几年提出的凡人计算(Mortal Computation)模型
    引发了对传统计算模式的深度反思
    标准计算机科学的一个核心原则
    是软件与硬件分离
    这样在不同的硬件上执行相同的算法
    会得到相同的输出
    这种模式突显了软件的“不朽”特性
    软件不依赖于硬件
    即使原始的存储介质损坏了
    也可以通过更换硬件继续使用软件
    然而,凡人计算挑战了这个传统观念
    它允许在执行相同任务、但是不同硬件上的神经网络之间
    发生显著而且事先未知的变化
    这些变化依赖于各自硬件的特性和学习过程
    也就是说软件与硬件是紧密绑定的
    一旦硬件损坏
    相应的软件也会丧失
    从而反映出生物大脑易逝性的计算特征
    Perishability
    凡人计算在硬件失效的时候会造成软件丢失
    这表面上看上去好像是资源的浪费
    但是实际上它揭示了传统计算模型中的一个重要缺陷
    那就是不朽的计算在能耗上十分昂贵
    它需要进行持续的错误纠正
    来确保存储中的1保持为1
    0保持为0
    随着算法复杂性的增加
    错误纠正的计算和能量成本也在迅速增长
    与此相比
    生物大脑因为它高效的能量使用
    因此生物执行的计算是“易逝“的
    不能和大脑“湿件”相分离
    这也正是生物自然主义的观点
    意识与物质基础不可分离
    由于当前的人工智能
    都是基于一个计算不朽的实现范式
    所以如今的人工智能不太可能具有意识
    而相比之下
    突破现有硬件约束的凡人计算
    更有可能具有意识
    为什么关于大模型是否有意识会有这么大的争议?
    是因为很多案例
    其实利用了人类的偏见
    包括人类中心主义、对机器的拟人化投射
    以及对语言的误解
    认为语言是思考的主要工具
    而其实语言的主要功能是沟通
    这些看似显示大模型具有意识的对话
    实际上是在混淆图灵测试和意识测试
    也是由于模型在训练时
    采用了大量包含关于意识讨论的文本
    这种我们认为有意识的AI系统
    还会引发重大的道德伦理问题
    它能够很好地利用人性的脆弱
    当我们感觉它好像更加理解、关心我们的时候
    可能会更倾向于盲目遵循它给出的建议
    甚至更愿意牺牲自己的数字隐私
    就像在美剧《西部世界》中一样
    即使知道某个系统实际上并无意识
    但是仍然感觉它好像具备意识一样
    在这种情况下,我们会面临两难选择
    一种是选择关心它
    赋予它某种伦理地位
    即便我们知道它们是无意识的;
    第二种是选择忽略它们
    放弃我们的同情心
    但是这两种选择都会有问题
    如果选择前者
    可能会将我们的注意力从真正需要关心的对象
    比如亲人身上转移
    如果选择后者
    可能会让我们对他人的感受变得麻木
    正如在《西部世界》剧中发生的事情
    在玛丽·雪莱的《弗兰肯斯坦》中
    弗兰肯斯坦真正的罪过
    并不是赋予他的创造物生命
    而是赋予它们意识
    这个创造物因此具备了痛苦、嫉妒和愤怒的能力
    引发了恐怖和屠杀
    显然
    我们不应该重蹈弗兰肯斯坦的覆辙
    最后
    我们来回顾一下可能出现有意识的AI的各种场景
    第一种,意识是一种计算形式
    随着AI变得越来越智能
    有意识的AI会在AGI到来的时候出现
    塞斯指出
    这个场景是基于我们的心理偏见
    以及对计算功能主义未经充分检验的假设
    因此不太可能
    第二种,意识是一种计算形式
    但是它必须根据意识理论
    被明确地“设计”到人工系统中
    塞斯指出
    这样虽然避免了混淆意识与智能
    但是仍然建立在计算功能主义的假设之上
    也不太可能
    第三种,意识是基于计算的
    但是相关计算只能由特定类型的物理基础来实现
    在这种场景中
    传统冯诺依曼架构下的AI可能无法成为有意识的AI
    只有更接近生物意识的系统
    比如基于神经形态计算的凡人计算
    才可能产生意识
    第四种
    意识依赖于神经系统而非计算功能组织
    计算功能主义不再成立
    在这种情况下,AI能否有意识
    要取决于是否可以在硅基等其它物理基础中
    实现神经系统中的非计算功能
    比如构建足够真实的人工生命
    这个场景也被称为弱生物自然主义
    最后一种是强生物自然主义
    在这个观点中
    意识必须依赖于真实的生命系统
    哪怕不是碳基的
    但是,有生命并不一定代表有意识
    这里塞斯想强调的是
    哪怕生物自然主义是错误的
    我们仍然应该通过理解生命体的本质
    来理解人类和动物的意识
    而不应该拿评价机器的指标
    来理解和考察意识
    将大脑视为计算机
    混淆智能(intelligence)与意识(consciousness)的概念
    不仅可能会让人们对有意识的AI抱有不切实际的幻想
    更是会阻碍我们对自身的清晰认识
    作为人类
    我们往往习惯于根据自己的形象来创造技术
    并将自我投射到所创造的技术中
    但是作为活生生的、呼吸着的、感受着的、行动着的和思考着的生物
    如果把人类的亲身体验只看做是处理信息的机器
    那我们就是廉价地出卖了自己
    也贬低了人的本质
    好了,以上就是阿尼尔·塞斯的观点了
    大家认为,意识是可以只靠计算获得
    还是需要依赖于生命系统才可以呢?
    欢迎在评论区留言,感谢大家的观看
    我们下期再见

  • 【人工智能】万字通俗讲解向量数据库 _ 什么是向量数据库 _ 有何不同 _ 如何选择 _ Vector Database _ Chroma _ Pinecone _ Milvus

    大家好,这里是最佳拍档,我是大飞
    我们做了很多期关于大模型的内容了
    但是不论是检索增强生成RAG
    还是代理Agent
    几乎每个大语言模型驱动的应用程序
    都可能会用到向量数据库
    那么,究竟什么是向量数据库
    它与传统数据库有何不同
    我们又该如何选择向量数据库呢?
    今天我们就来聊聊这个话题
    为了方便大家的理解
    整个内容并没有晦涩的术语或者复杂的数学公式
    大飞我希望尽量能够做到雅俗共赏
    在讲向量数据库之前
    我们首先需要理解什么是向量?
    应该说
    向量是基于不同特征或者属性
    来描述一个对象的数据表示
    每个向量代表一个单独的数据点
    例如一个词或者一张图片
    由描述其许多特性的值的集合组成
    这些变量有时也被称为“特征”或“维度”。
    例如
    一张图片可以表示为像素值的向量
    整个句子也可以表示为单词嵌入的向量
    一些常用的数据向量包括
    1、图像向量
    这是通过深度学习模型提取的图像特征向量
    这些特征向量捕捉了图像的重要信息
    如颜色、形状、纹理等
    可以用于图像识别、检索等任务
    2、文本向量
    这是通过词嵌入技术如Word2Vec、BERT等生成的文本特征向量
    这些向量包含了文本的语义信息
    可以用于文本分类、情感分析等任务
    3、语音向量
    这是通过声学模型从声音信号中提取的特征向量
    这些向量捕捉了声音的重要特性
    如音调、节奏、音色等
    可以用于语音识别、声纹识别等任务
    而向量数据库就是一种将数据存储为高维向量的数据库
    高维向量是特征或者属性的数学表示
    每个向量都有一定数量的维度
    根据数据的复杂性和粒度
    维度可以从几十到几千不等
    向量通常是通过对原始数据
    比如文本、图像、音频、视频等等
    应用某种变换或嵌入函数来生成的
    嵌入函数可以基于各种方法
    比如机器学习模型、单词嵌入、特征提取算法
    向量数据库会采用索引策略
    来简化向量相似的特定查询
    这在机器学习应用程序中特别有用
    因为相似性搜索经常用来发现可以比较的数据点
    或者生成建议
    向量数据库的主要功能包括三点
    管理、存储和检索
    向量数据库以原始数据形式处理数据
    能够有效地组织和管理数据
    便于AI模型应用
    而且它能够存储向量数据
    包括各种AI模型需要使用到的高维数据
    此外
    向量数据库特别擅长高效地检索数据
    这个特点能够确保AI模型在需要的时候
    快速获得所需要的数据
    这也是向量数据库能够在一些推荐系统
    或者检索系统中得到应用的重要原因
    向量数据库的主要优点是
    它允许基于数据的向量距离或者相似性
    来进行快速准确的相似性搜索和检索
    这意味着,可以使用向量数据库
    根据语义或上下文含义
    查找最相似或最相关的数据
    而不是使用基于精确匹配或者预定义标准的查询数据库的传统方法
    向量数据库可以搜索非结构化数据
    但是也可以处理半结构化甚至结构化数据
    例如,可以使用向量数据库
    根据视觉内容和风格查找与给定图像相似的图像
    或者根据主题和情感查找与给定文档相似的文档
    以及根据功能和评级查找与给定产品相似的产品
    接下来
    我们说说向量数据库的工作机理
    我们已经知道
    向量数据库的构建是为了适应向量嵌入的特定结构
    并且它们使用索引算法
    根据向量与查询向量的相似性
    来有效地搜索和检索向量
    向量数据库的工作原理
    我们可以通过CPU和GPU的工作原理进行类比
    CPU和GPU分别是计算机的运算和图形处理核心
    而向量数据库则是大模型的记忆和存储核心
    在大模型学习阶段
    向量数据库会接收多模态数据进行向量化表示
    让大模型在训练时能够更高效地调用和处理数据
    区别于传统数据库
    向量数据库主要有三点不同
    数据向量化,向量检索和相似度计算
    数据的向量化采用embedding技术
    嵌入作为一个桥梁
    将非数字数据转换为机器学习模型可以使用的形式
    使它们能够更有效地识别数据中的模式和关系
    一般来说,文本是一维向量
    图像是二维矩阵
    视频相当于三维矩阵
    这些嵌入实质上是存储数据的上下文表示的数字列表
    在存储层内
    数据库以m个向量堆栈的形式存储
    每个向量使用n个维度表示一个数据点
    总大小为m×n
    为了查询性能的原因
    这些堆栈通常通过分片的方式进行划分
    向量检索是指输入一个向量
    从数据库中查找与输入向量最相似的topN个向量返回
    要在向量数据库中执行相似性搜索和检索
    需要使用表示所需信息或条件的查询向量
    查询向量可以从与存储向量相同类型的数据导出
    或者从不同类型的数据导出
    使用相似性度量来计算两个向量在向量空间中的距离
    相似性度量可以基于各种度量
    比如余弦相似性、欧氏距离、向量内积
    hamming距离、jaccard指数
    其中
    向量检索算法是向量数据库的核心之一
    向量检索可以看为是近似最近邻搜索
    通过预先的索引构建来减小数据查询时的搜索空间
    加快检索速度
    目前主要的检索算法有几种
    包括基于树的方法
    例如KDTree和Annoy
    基于图的方法,例如HNSW
    基于乘积量化的方法
    例如SQ和PQ,基于哈希的方法
    例如LSH,以及基于倒排索引的方法
    向量数据库中的索引可以按照数据结构和压缩级别两个层次进行组织实现
    根据数据结构建立的索引
    可以分为基于哈希、基于树、基于图和基于倒排文件的几种
    而根据数据压缩方式建立索引
    主要包括平坦压缩和量化压缩
    平坦压缩是指以未经修改的形式存储向量的索引
    量化中索引的底层向量
    通常通过将浮点数转换为整数的方式
    被分解成由较少字节组成的块
    从而减少内存消耗和搜索过程中的计算成本
    相似性搜索和检索的结果
    通常是与查询向量具有最高相似性得分的向量的排序列表
    然后
    你可以访问与原始源或索引中的每个向量
    相关联的相应原始数据
    接下来
    我们再介绍一下目前向量数据库都有哪些种类
    市面上都有哪些向量数据库
    以及它们之间的一些差异点
    根据向量数据库的的实现方式
    我们可以将向量数据库大致分为4类
    分别是原生的向量数据库、支持向量的全文检索数据库、支持向量的NoSQL数据库
    以及支持向量的关系型数据库
    先说第一类原生的向量数据库
    这些数据库是专门为存储和检索向量而设计的
    包括Chroma, LanceDB, Marqo
    Milvus,也就是Zilliz, Pinecone
    Qdrant
    Vald, Vespa, Weaviate等等
    它们所管理的数据是基于对象或数据点的向量表示
    进行组织和索引
    我们今天只介绍其中的三种
    其他数据库的具体信息可以参考各自的官网
    第一个是Faiss,严格来说
    Faiss只是一个用于高效相似性搜索和密集向量聚类的开源库
    Faiss是用C++编写的
    带有完整的Python/numpy包装器
    一些常用算法都有GPU实现
    成为了很多开源向量数据库的基础
    Faiss能够构建不同的索引类型
    并提供了欧式距离或者点积的相似度计算功能
    有些索引类型是简单的基线
    比如精确搜索
    大多数可用的索引结构需要考虑搜索时间
    搜索质量
    每个索引向量使用的内存等等
    Faiss支持多种向量搜索技术
    提供了能够在不同大小的向量集中搜索的算法
    甚至可以处理那些超过内存容量的向量集
    Faiss的主要优势之一是速度和可扩展性
    即使在具有数十亿个向量的数据集中也可以进行快速搜索
    此外
    Faiss还提供了用于评估和调整参数的辅助代码
    第二个是Pinecone
    Pinecone是一个基于云的向量数据库
    可以开发实时相似性搜索应用
    能够以毫秒级的延迟存储和探索高维向量嵌入
    适用于推荐系统、图片和视频搜索以及自然语言处理等应用
    Pinecone的主要功能包括自动索引、实时更新、查询自动调整和用于与当前流程进行简单交互的REST API
    它的架构专为可扩展性和稳健性而构建
    可以轻松管理海量数据
    同时保持高可用性
    Pinecone是一个可以托管的向量数据库平台
    也就是说有商用方案
    也有免费使用方案
    它的主要特点包括
    支持全托管服务、高度可伸缩、实时数据摄取、低延迟的搜索、以及与LangChain集成
    Pinecone采用了多种安全措施来保护用户的数据安全和隐私
    包括多层次的访问控制机制可以控制用户的访问权限和操作权限
    同时采用了数据加密、传输加密等技术来保护数据的安全性
    还提供了数据备份和恢复等功能
    可以防止数据丢失和损坏
    Pinecone在性能方面表现非常出色
    它能够支持高达1百万次的QPS
    且具有低延迟和高吞吐量的特点
    还具有分布式部署、实时索引构建和高效的向量相似度搜索等优点
    可以帮助用户快速处理大规模的向量数据
    此外
    Pinecone还支持多种编程语言和框架
    比如Python、Java、TensorFlow 等
    使得用户可以轻松地将其集成到自己的应用程序中
    第三个是Milvus
    Milvus是一个开源的分布式向量数据库
    它具备高可用、高性能、易拓展的特点
    用于海量向量数据的实时召回
    Milvus 基于 Faiss、Annoy、HNSW 等向量搜索库构建
    可以轻松管理数百万个实体
    可以根据不同的数据特点选择最合适的索引算法
    核心是解决稠密向量相似度检索的问题
    在向量检索的基础上
    Milvus支持数据分区分片、数据持久化、增量数据摄取、标量向量混合查询、time travel 等功能
    同时大幅优化了向量检索的性能
    可满足任何向量检索场景的应用需求
    此外
    Milvus还具有分布式部署、高可用性和高扩展性等优点
    可以帮助用户快速处理海量的向量数据
    它也提供了多种安全措施来保护用户的数据安全和隐私
    支持 SSL/TLS 加密和访问控制等技术
    可以防止数据被非法访问和窃取
    还提供了数据备份和恢复等功能
    可以保护数据的完整性和可用性
    在客户端方面
    Milvus还提供了多种语言的SDK
    例如Python、Java、C++等
    使得用户可以方便地使用不同的编程语言来访问和操作Milvus
    第二类是支持向量的全文检索数据库
    这类数据库包括Elastic/Lucene、OpenSearch和Solr
    它们都具有丰富的文本检索功能
    比如可定制的标记器
    分词器,停用词列表和N-grams等等
    大部分都基于开源库
    并且有大型集成的生态系统
    包括了向量库
    例如
    Elasticsearch是一个支持各种类型数据的分布式搜索和分析引擎
    Elasticsearch在7.3版本中
    添加了对向量数据索引的支持
    支持混合查询
    但是向量检索采用的仍然是暴力计算
    性能损耗较大
    在8.0版本引入了knn search
    其实就是一种近似最近邻搜索算法
    相似度支持欧式距离
    点积和余弦相似性
    knn search底层其实使用的是HNSW
    不过遗憾的是
    这种方式无法进行混合检索
    第三类是支持向量的NoSQL数据库
    几乎所有这些NoSQL数据库
    都是最近才通过添加向量搜索扩展而具备向量能力的
    所以如果要是使用的话一定要做好测试
    Cassandra,Rockset
    Azure Cosmos DB和MongoDB等都纷纷宣布了增加向量搜索的计划
    NoSQL数据库的向量搜索性能可能差别很大
    这取决于所支持的向量函数、索引方法和硬件加速
    对于支持向量的NoSQL 数据库
    探索尝试未尝不可
    但在生产环境中使用要慎之又慎
    第四类是支持向量的SQL数据库
    这些大都数都是关系型数据库
    并且支持sql查询
    例如SingleStoreDB, PostgreSQL
    Clickhouse和Kinetica的pgvector/Supabase Vector等等
    它们都宣布包含了向量搜索功能
    比如点积
    余弦相似度
    欧几里得距离和曼哈顿距离
    并且使用相似度分数找到n个最近邻
    由于提供了混合查询
    可以将向量与其他数据结合起来
    从而获得更有意义的结果
    另外
    大多数SQL数据库都可以作为服务部署
    可以在云上进行完全的管理
    例如
    Postgres通过pg_vector和pg_embdding两个插件来实现向量数据库
    让PG数据库支持了向量索引检索的能力
    它的索引算法使用的是基于Faiss的IVF Flat索引
    提供了优异的召回率
    我们再简单对这些向量数据库做一些对比
    首先是编程语言支持方面
    Chroma目前提供了Python和TypeScript的包装器
    而基于C++编程语言的有OLAP数据库Clickhouse
    以及开源向量索引HNSWLib
    不过如今呢
    一些新的数据库通常都会使用更加现代的编程语言
    比如说Golang或者是Rust来编写
    比如Pinecone就是用Rust重写过
    目前呢只有Vespa是用Java来构建
    其次呢是开源方面
    Pinecone是完全闭源的
    而Zilliz也是一个闭源的
    完全托管的商业解决方案
    但是它是完全建立在Milvus之上
    而Milvus是开源的
    其他的向量数据库呢
    至少在代码库的方面
    基本上都是源代码可用的
    不过呢
    还要看一下具体的许可证
    这决定了代码的可许可性以及如何去部署
    在检索算法方面
    许多向量数据库的检索算法都采用了HNSW
    其中Milvus的检索算法支持得最为丰富
    大家可以暂停观看一下
    最后呢在部署方式上
    向量数据库的典型部署方式
    包括本地部署和托管云原生的方式
    二者呢都遵循CS架构
    还有一种新的选择呢是嵌入式的模式
    其中数据库本身与应用程序的代码是紧密结合的
    以severless的方式运行
    目前呢只有Chroma和LanceDB可以用作嵌入式的数据库
    综上所述
    有网友已经贴心的总结了
    主流的向量数据库的部分指标的对比
    此外呢在选择向量数据库的时候
    还需要特别考虑几个因素
    分别是第一点可扩展性
    它是否能够高效的处理高维度的大数据量
    而且能够根据数据需求的增长进行扩展
    第二点性能
    速度和效率对数据库至关重要
    需要在数据搜索、搜索性能
    和执行各种向量操作方面表现出色
    第三点灵活性
    需要支持广泛的数据类型和格式
    并且可以轻松地适应不同的应用场景
    第四点易用性
    数据库是否易于使用和管理
    易于安装和配置
    具有直观的API
    并且有良好的文档和支持
    第五点可靠性
    需要有可靠和稳定的声誉
    那对比完主流的向量数据库之后
    我们看一看与其他类型的数据库对比它们是怎么样
    那传统数据库呢
    比如说关系数据库
    它们的目的是存储结构化的数据
    这就意味着数据会被组织到一个预定义的表、行或者列中
    从而可以确定数据的完整性和一致性
    传统数据库呢往往会针对于CRUD的操作进行优化
    目的是高效的创建读取、更新和删除数据的条目
    让它能够适用于从Web服务到企业软件的各种应用程序
    但是一旦定义了数据库的结构
    进行更改的时候可能就会非常的复杂
    而且耗时
    这种刚性可以确保数据的一致性
    但是灵活性可能不如一些的现代数据库的无模式
    或者是动态模式的特性
    我大概总结了一下它们之间的区别放到这里
    此外呢
    在与行和列中存储多种标准数据类型
    比如说字符串、数字或者其他标量数据类型的方式不同
    向量数据库引入了向量这种新的数据类型
    并且围绕这种数据类型来构建和优化
    专门用来实现快速的存储检索和最近邻搜索语义
    而在传统数据库中则是使用
    查找完全匹配项的索引或者是键值对
    对数据库中的行进行查询
    并且返回这些查询的相关行
    在与图数据库的对比方面
    向量数据库在信息提取
    信息索引和信息检索方面有很大区别
    我们今天呢就暂时不多说了
    有时间呢再专门去介绍
    在最后呢
    我想简单介绍一下
    向量数据库在大语言模型中的应用
    基于大语言模型的应用经常会面临一些挑战
    比如说生成不准确或者是不相关的信息
    缺乏事实的一致性或者是常识
    重复或者是自相矛盾
    以及存在偏见或者是令人反感等等
    那为了克服这些挑战
    可以使用向量数据库来存储与所需的领域的
    不同主题、关键词、事实、观点以及来源的信息
    然后呢在使用大语言模型的时候
    通过AI插件从向量数据库中传递信息
    从而生成更具有信息性和吸引力的内容
    来符合用户的目标意图和指定的风格
    那借助于向量数据库
    我们能够快速的加载和存储事件作为嵌入
    将向量数据库作为指挥大语言模型的手段
    提供上下文信息、长期记忆
    检索语义上的数据关联等等这些功能
    向量数据库的典型使用一般包括这样几步啊
    第一步呢
    是使用embeding技术来创建向量
    第二步呢
    是将这些向量存储到向量数据库中
    第三步呢
    就是应用一些索引的策略来组织管理向量
    第四步呢
    是使用查询向量来执行相似性的搜索
    第五步呢
    是从向量数据库中取得相似的向量
    实际上呢
    向量数据库在自然语言处理
    计算机视觉、推荐系统
    以及其他需要对数据进行语义理解和匹配的领域呢
    都有很多的应用
    而在向量数据库中存储信息
    能够让大语言模型生成更加相关
    更加连贯的文本
    由于向量数据库将要查询的数据存储为嵌入向量
    并且大语言模型也是将它内部的知识编码为嵌入向量
    因此呢在生成式的问答应用中是天生的一对
    向量数据库可以充当知识库的功能
    而大语言模型可以直接在嵌入空间中去查询数据的子集
    所以一般的使用啊是这样的
    首先呢
    用户通过界面用自然语言提出问题
    问题的文本呢会被传递给嵌入模型
    然后返回一个句子的嵌入向量
    随后呢
    问题的向量会被传递给向量数据库
    通过ANN搜索返回与之最相似的前k个结果
    这一步呢非常关键
    因为它大大缩小了大语言模型在下一步中的搜索空间
    接下来呢
    基于开发者预定义的模板去构建一个大语言模型的提示
    将它呢转化成为嵌入向量并传递给大语言模型
    大语言模型呢在前k个结构中去搜索信息
    并且生成问题的答案
    再把这个答案呢发送给用户
    不过呢
    向量数据库也有一些潜在的限制
    比方说在搜索应用中
    他们不一定会优先考虑关键词短语的精准匹配
    来确定相关性
    而且呢存储和查询的数据必须适应
    所使用的嵌入模型的最大序列长度
    比如说在类似于BERT的模型中
    这个长度呢一般不会超过几百个词
    目前呢最好的方法是利用像LangChain
    以及像LlamaIndex这样的框架
    将数据分块
    或者是压缩成适合底层模型上下文的固定大小的向量
    同样呢向量数据库也面临着许多
    与其他数据库技术相同的一些挑战
    比如说提高可扩展性、近似精度、延迟性能和经济性
    许多向量数据库在核心的数据库能力方面都还需要提升
    比如说像安全性、弹性、运营支持和工作负载支持的多样化
    随着AI应用的成熟
    未来对向量数据库的需要
    一定不会仅仅只限于向量搜索的功能
    好了本期的视频内容就到这里
    感谢大家的观看
    我们下期再见

  • 【人工智能】Twitter开源核心推荐系统解读 _ 推荐系统架构介绍 _ 召回 _ 粗排 _ 精排 _ 重排 _ 混排

    大家好这里是最佳拍档
    我是大飞
    前一段时间呢
    推特开源了他的推荐系统源码
    目前已经超过了5.8万的star
    我们之前也做过一期节目
    简单介绍过一部分核心的代码
    准备再开个系列
    完整的去介绍一下这个代码
    其中会包括推特的整体推荐系统架构
    这部分会涵盖图数据挖掘
    召回、精排
    规则多样性重排、混排等等
    然后是推特的精排模型
    也就是这个Heavy Ranker
    这块会包括模型的结构
    特征工程 多目标建模
    多目标融合等等
    第三部分
    是推特的图模型预训练表征
    也就是这个TwHIN embeddings
    主要是基于社交异构图
    对用户推文做预训练
    大概整体上计划是分这三个部分
    那今天先跟大家梳理一下
    推特推荐系统的整体架构
    那在介绍架构之前呢
    要先说一下在推特的场景下
    推荐系统的问题定义是什么
    首先是输入即Twitter network
    这部分是由推文
    用户交互行为
    等等构成的一个超大规模的异构图
    其次呢是输出
    就是要预测你和推文
    或者其他用户交互的概率
    从而进行推文或者用户的推荐
    整体问题和常见的
    推荐系统其实差距不大
    特色地方在于
    推特比较关注于social graph的挖掘
    也就是社交图的挖掘
    那其中就会包括图特征、图预训练
    图召回模型等等
    推特的推荐系统的整体架构
    会包括数据、特征工程和推荐系统服务
    其中数据部分呢涵盖了社交图
    用户的交互行为
    用户画像数据等等
    那数据这块应该说是推特的核心资产
    也是我们刚才提到过的
    由用户推文和互动
    交互构成的超大规模异构社交图
    其次是特征工程
    那推特主要关注社交图的预训练
    聚类、社区发现等等
    这也是推特的这个特色所在吧
    那图预训练得到的向量呢
    可以用在向量召回
    精排特征等等这些方面
    此外还包括了一小部分安全相关的工作
    那第三部分
    是推荐系统的核心服务Home Mixer
    这是一个Twitter定制的Scala框架
    可以认为是一个算法工程
    那国内的大厂
    可能会用像Java、go、C++这些来实现
    这个服务由三大部分来构成
    第一个是召回就是Candidate Sources
    从不同的推荐源获取最好的推文
    类似于推荐系统的召回阶段吧
    核心的召回方式是图召回
    第二个是粗排和精排
    使用的是机器学习模型
    对推文进行打分排序
    推特分为Light Ranker和Heavy Ranker
    分别类比推荐系统的粗排和精排阶段
    第三个是重排和混排
    主要是运用一些启发式的规则
    例如过滤自己屏蔽掉的用户的推文
    NSFW内容和已经看到的一些推文
    保证这个作者的多样性
    以及负责广告、推文和作者混排等等
    那下面我们会重点来介绍这三个部分
    首先是召回
    推特有很多的召回数据源
    为用户去召回最新的
    最感兴趣的相关推文
    其中的输入是推文候选池的大小
    大概是亿万级别吧
    输出的是两类召回通道
    分别是你关注的用户圈
    叫in-network
    和你未关注的用户圈out-of-network
    整体上两者的比例大概是五五开
    即召回一半你关注用户的推文
    还有一半你没有关注的用户的推文
    当然
    不同用户召回的配比可能会不一样
    其中in network召回是主召回路
    也就是最大的候选推文来源
    目标是从你关注的作者推文中
    检索出最新你可能最感兴趣的推文
    给到你能够贡献大概50%的推文来源
    至少50%吧
    那这块推特是使用了自己研发的搜索引擎
    Earlybird来检索你关注的人的推文
    实际上它就是一个倒排索引
    只不过索引里边检索到的推文
    要再经过一个Light ranker
    海选粗排的模型
    进行该召回路的截断
    这个我们会在一会讲粗排的时候再去介绍
    那out of network召回
    是在用户关注的圈子之外
    再去寻找相关的推文推荐给用户
    这块推特是采取了两种召回的方法
    一种是UserTweetEntityGraph
    简称UTEG
    其实就是协通过滤
    通过分析你关注的人
    或者有相似兴趣的人的行为
    来预测你感兴趣的相关推文
    比如2跳的关系U2U2I
    那为了实现高效动态图的构建和游走
    推特内部自研了GraphJet的图引擎
    这个是发表在了VLDB 2016上
    GraphJet能够高效的
    动态的去维护一个实时的交互图
    这个图的节点是用户和推文
    它的边是实时的交互行为
    并且可以实现高效的地图游走
    整个方法大概能够涵盖到15%的推文来源
    这个方法得到的召回结果
    也要通过一个Light Ranker进行海选粗排
    第二种方法
    是Embedding Spaces,即嵌入表征学习
    他会构建一个更加通用的问题
    就是你对哪些推文
    以及哪些作者感兴趣
    表征学习的目标是训练
    得到一个用户表征向量
    和推文表征向量
    再通过计算user-user、user-tweet
    这个表征之间的相似性
    来预测用户的兴趣
    主要是会分为稀疏嵌入和稠密嵌入两种
    那前者稀疏嵌入
    就是通过聚类来做表征
    后者这个稠密嵌入
    就是基于图的学习来做预训练
    其中稀疏嵌入最有用的表征模型
    是这个SimClusters
    这个是发表在KDD 2020上
    是一个基于社区发现的异构表征模型
    利用矩阵分解算法
    基于social graph中比较有影响力的用户
    来进行社区发现
    并且根据流行度和用户的行为
    将推文和用户划分到不同的空间中
    那(推特)一共有14.5万个社区
    每三周会更新一次
    社区有的很大有的又很小
    一个用户也可以属于多个社区
    每个推文也可以用社区来做嵌入
    用推文在这个社区的流行度做表征值
    这样就能够计算用户和推文的相似性
    并用来进行召回
    而稠密嵌入呢
    则使用了TwHIN来做user、twitter的
    稠密嵌入表征
    通过异构图能够得到稠密表征的计算相似度
    这样就可以用于图的召回
    这个部分的源码
    开源在了the-algorithm-ml这个仓库中
    我们后续会专门再进行介绍
    那除此之外 还提到了这个CR-Mixer
    这是一个协调层
    是主要是代理执行Out-of-Network的多录召回
    并且调用底层的计算服务
    包括源信号的抽取
    召回结果生成
    过滤和粗排
    那这个服务主要是在多路召回以后
    在精排之前
    用来调用多种的召回服务
    多路合并和粗排
    那么除了推文的推荐以外呢
    还有推人的服务
    也就是following-recommendation-service
    简称FRS
    这个是用来推荐作者的
    也是一个小的推荐系统
    流程基本上跟主的推荐系统是一样的
    也包括了召回 排序
    过滤 推荐理由啊
    排序主要是预测这个关注的概率
    以及关注后进到作者主页
    去正向交互的概率
    二者再进行加权融合
    以上就是推特召回的几个核心组件
    接下来我们讲一讲这个粗排
    它本质上就是一个引擎侧召回通道的海选粗排
    包括了两个模型
    一个是Early Bird的in-network召回后的
    海选粗排模型
    一个是这个UTEG的召回
    也就是GraphJet在图游走之后的海选粗排模型
    两者差异不大
    只是特征不太一样
    那推特的海选粗排
    是一个很老的LR的模型
    逻辑回归的模型
    主要是用来预测
    用户会和推特交互的概率
    这个模型(推特)他们内部正准备重构
    LR的特征涵盖了用户侧的特征啊
    这块就包括基于pagerank算法来
    预估声誉的tweepcred模型等等
    还有这个推文的特征
    包括静态的文本质量
    实时转发回复关注等等
    以及上下文的特征
    这块就包括用户语言等等
    那对交互的正样本会进行加权的损失训练
    比如说点击的权重为1
    点赞的权重为2等等吧
    in-network召回的粗排模型中
    会用到了这个RealGraph
    这个是出自于推特在KDD 2014自研的一个工作吧
    本质上是一个LR的逻辑回归模型
    但是他预测的是用户和用户的交互概率
    其中的输入就是这个RealGraph
    这是一个有效的带权重的同构graph
    同构图
    节点是推特的用户
    边是用户与用户的交互关系
    这个是由历史行为来构成的
    那输出是一个预测用户和用户交互的概率
    本质上呢是一个链接预测的任务
    那这个模型会基于RealGraph以及边的特征
    使用逻辑回归模型来训练
    并且预测交互的概率
    基于预测得到的交互概率
    这个交互概率越高的用户
    他的推文就会更多的推荐给你
    目前来看
    推特并没有专门去构建一个多路召回的
    然后把他们合并后的一个粗排模型
    估计在推特的这个架构中啊
    核心召回路in-network out-network
    经过这个海选粗排模型之后呢
    会各自挑选750个结果
    一共1,500个结果进入到精排
    精排使用的是这个parallel masknet
    这个模型是出自于新浪微博发表在
    DLP-KDD 2021上的论文
    这个模型也是新浪微博在
    FiBiNet、GateNet、MaskNet、ContextNet
    等一系列精排模型中
    表现比较好的一个
    精排打分的候选级数量是1,500个
    是一个多目标的模型
    用48M参数的神经网络来实现的
    说实话现在可能就有点小了
    这个网络在推特交互数据训练
    优化点赞转发和回复等目标上
    考虑了数千个特征
    并且输出了10个level
    为每条推特去打分
    代表交互的一个概率
    根据这些分数
    再对推文进行融合排序
    一共有10个目标
    包括用户喜欢、回复、转发推文的概率等等吧
    找时间我们可以再详细解读一下
    推特的精排模型以及相关的源码
    预测的时候仅仅使用了一个简单的
    加权求和的融合排序
    看起来权重也应该都是手写的
    那到这里呢
    推特ranking的核心组件
    我们也差不多讲完了
    再来说一下这个重排和混排
    重排的主要目的呢是做过滤
    以及支持一些产品的Feature
    嗯属于一个启发式的规则导向
    那过滤的内容包括这个可见性
    比如去屏蔽的推文是吧
    屏蔽的作者
    以及(通过重排来保证)这个作者的多样性
    内容的平衡性
    就是这个控制in-network推文
    和out-of-network推文的比例
    然后就是基于反馈的疲劳内容
    就是当用户有一些负反馈的时候
    要需要做一些干预的策略
    还包括这个二跳的人脉过滤
    主要是排除跟这个推文没有什么二级关联的
    out of network的推文
    这样就不会推荐
    跳数过多的一些无用的用户
    专业的术语叫做这个social proof
    然后还包括推文以及回复的上下文展示
    以及更新检测
    这个更新检测
    就是用来确定当前设备上的推文
    是不是已经过时了
    并且发送指令把它替换成为编辑后的版本
    那混排主要是负责主页上的混排
    也叫这个Homepage Mixer
    包括推文、广告、关注的作者
    Onboarding prompts等等
    这个我们就不过多去介绍了
    大家有兴趣可以自己去看一下
    那上面介绍这些流程
    每天会运行大约50亿次
    平均完成时间不到1.5秒
    单个管道执行需要220秒的CPU时间
    几乎是在应用程序上看到的延迟的150倍
    那除了以上我们介绍的这些核心组件以外呢
    推特的推荐架构
    还包括一些基础设施服务
    包括模型的serving服务称为Navi
    是一个用Rust语言编写的高性能的
    机器学习模型的serving服务
    然后就是这个Feeds信息流推荐框架
    叫做这个product-mixer
    它是一个用来构建内容feed的软件框架
    最后就是这个机器学习训练框架
    叫twml,Twitter machine Learning
    基于的是TF-1
    是一个即将被废弃的机器学习框架
    目前呢主要是用来训练粗排的
    Earlybird light ranker
    那以上就是大概完整的
    推特推荐算法的架构了
    不得不说
    这个开源核心算法是一个
    的确是一个很大胆的一个举措
    在这个马斯克对于推特2.0的愿景中
    他也写道
    目标是尽可能去提高透明度
    算法透明度
    同时去掉一些可能
    会被不法分子利用的代码
    还去掉了一些广告推荐的算法
    并且出于安全的考虑
    没有发布与Twitter算法相关的训练数据
    或者是模型权重
    从技术角度来看呢
    推特开源代码提供了一个
    典型的大型推荐系统的案例
    不管是从个人还是公司的角度
    都能从中应该学到不少东西
    那从推特开源的角度来看呢
    他们应该也挺期待开源社区会如何去
    看待和分析这个推特的核心代码
    以及能够提供哪些比较有意思的建议和思路的
    从而给推特的推荐系统
    带来一些变化和革新
    不管结果怎么样呢
    我觉得都是一个共赢的举措
    好了今天分享内容呢就到这里
    因为个人能力也有限
    如果有不足或者是错误的地方还请大家指出
    有兴趣的小伙伴们
    也欢迎点赞和留言
    这样我也有动力把后面的两期节目给做出来
    感谢大家的观看我们下期再见

  • 【人工智能】Ilya Sutskever 2023伯克利大…回顾 _ 无监督学习的数学依据 _ GPT的核心原理 _ 压缩即预测 _ 柯氏复杂度 _ 形式压缩与内容压缩 _ 条件建模到序列建模

    大家好,这里是最佳拍档,我是大飞
    最近OpenAI遭遇了重大的人事变动
    联合创始人之一、OpenAI总裁格雷格·布罗克曼(Greg Brockman)
    宣布将延长休假时间
    另一位联合创始人兼关键领导约翰·舒尔曼(John Schulman)已经跳槽到了竞争对手Anthropic
    同时
    产品负责人彼得·邓(Peter Deng)也选择离开
    这让大飞不禁又想到
    再早之前离开OpenAI的首席科学家
    Ilya Sutskever
    在成立了名为SSI的新公司后
    一直还没有什么消息
    最近翻看Ilya早期的一些视频
    又有很多的感触
    Ilya曾经在伯克利大学做过一次演讲
    由于内容比较晦涩
    知道的人也不多
    但是我觉得它却是人工智能历史上的最重要的演讲之一
    不仅揭示了大模型的核心原理
    并且生动展示了Ilya对无监督序列学习的痴迷
    今天我就来带大家回顾一下这场演讲的内容
    在开始之前
    我们先来复习一下机器学习的基本概念
    大家都知道
    机器学习就像让计算机当学生
    人类当老师
    通过给计算机大量的“练习题”和“答案”,
    让它慢慢学会解题的能力
    这就是所谓的监督学习(supervised learning)
    但是,计算机真的能学到知识
    而不是死记硬背吗?
    Ilya告诉我们,是的
    如果把模型的训练数据比作题海
    模型训练就是疯狂刷题
    那么只要刷的足够多
    把题尽可能的作对
    那么模型如果上了考场
    表现就不会太差
    但是如果只是死记硬背
    缺少真正的应变能力
    那肯定是不行的,只有去总结规律
    提炼精华,才能从题海中学到真本事
    接下来,我们正式进入Ilya的演讲
    第一页,他先从监督学习讲起
    给出了理论上的保证
    所谓的理论就是统计学理论中著名的霍夫丁不等式(Hoeffding’s inequality)
    它的主要含义是
    当训练误差足够低
    而且训练样本数远大于“模型自由度”,
    也就是模型规模的时候
    测试误差也能保证足够低
    具体来说
    就是模型规模一定要小于数据规模
    否则
    它根本就不用进行“压缩”或者抽象
    也不用去寻找规律
    直接就全部死记硬背了
    而这样是没有泛化能力的
    所以在这个公式里面,模型的复杂度
    也就是模型的参数大小
    是个关键的变量
    只要低训练误差加上大训练集
    就能确保模型的泛化能力
    这就是监督学习背后的理论保证
    对于这一点,我们早已经知道的是
    第一
    “万能近似定理”(Universal Approaximation Theorem)早就已经论证了
    深层神经网络可以逼近任意函数
    第二
    12年前的深度学习革命就不断地证明
    只要有足够带有标注的数据
    神经网络就可以学到任何知识
    Ilya接着说
    虽然无监督学习似乎缺乏类似的理论支撑
    但是
    他发现了一种叫做“分布匹配”(distribution matching)的范式
    似乎能够让无监督学习也获得数学上的保障
    问题的关键在于
    我们要透过现象看本质
    像GPT这样的语言模型
    表面上是在学习预测下一个词(next token prediction)
    实际上,它是在匹配语言的分布
    学习语言中的隐含规律
    比如,在“我爱吃苹果”这句话里
    “我爱吃”后面更可能出现“苹果”,
    而不是“砖头”,
    这就反映了语言的内在知识
    Ilya认为
    这种分布匹配是一种特殊的模式规律的匹配
    不同的是
    它匹配的不是具体的字符串或者token序列
    而是词与词之间的关系
    也就是语言的规律性
    类似于语义结构
    而这种分布匹配
    才是无监督学习获得智能的本质
    不管是文本、图像还是语音
    它们都有内在的分布规律性
    而无监督学习就是要发现、匹配和对齐这些分布规律
    所以,训练用的数据集不能过于随机
    得有一定的规律性
    无监督学习才能抓住它们内部的隐藏共性
    而至于学到的知识对于其他任务有没有用
    那就要看这些任务的数据分布是不是相似
    比如从猫狗身上学到的特征
    可能还能迁移到其他动物身上
    但是如果是完全不同的领域
    比如说医学影像
    那可能就没什么参考价值了
    总之
    Ilya这里给了我们一个新的视角
    那就是无监督学习的本质是分布匹配
    是一种规律性的模式匹配
    那如果我们以机器翻译为例
    无监督学习又该如何实现呢?
    现在我们当然已经知道
    大模型可以轻松实现翻译功能
    那背后又是什么原理呢?
    Ilya解释道
    还是前面提过的分布匹配
    如果训练的数据集足够大
    包含了两种语言种的各种句型和语法
    那么它们的语言规律性就会显现
    就可以被无监督学习到
    比如,英语里出现”I”的上下文分布
    和汉语里出现”我”的分布
    应该有某种对应的规律性
    因此Ilya指出
    只要两种语言原生的数据足够丰富
    以一种语言的输入作为条件
    就能几乎唯一确定另一种语言的翻译等价物
    而且,这个原理不仅适用于机器翻译
    还适用于语音识别、图像转换等各种AI任务
    自从2015年Ilya发现这个思路之后
    就被它背后的数学原理给迷住了
    也就是柯尔莫戈洛夫复杂度
    简称柯氏复杂度
    Ilya把它称为压缩原理
    我们还拿翻译举例
    如果我们能找到一个方法
    既能最大限度地压缩英语数据
    又能最大限度地压缩汉语数据
    那这个方法就能抓住两种语言之间的共同规律
    而这些规律就是翻译的基础
    所以Ilya提出
    无监督学习其实就是在寻找最优的数据压缩方法
    这也为无监督学习的有效性
    给出了数学上的解释
    不过他也指出
    现实中的机器学习任务
    与这种理想化的分布匹配还是有些差距的
    接下来
    Ilya提出了他主要想说的观点
    那就是如果把无监督学习
    看作是一个数据压缩问题
    那么压缩和预测之间其实有一一对应的关系
    每个压缩算法都对应着一个预测模型
    反之亦然
    我们可以这样理解
    压缩的逆操作就是解压缩
    而解压缩的同义词就是预测
    所以,Ilya认为这都是一回事
    机器学习中的过程与逆过程
    只是推理阶段的指向不同而已
    从模型角度都看是一回事
    在这张幻灯片中
    Ilya提出了一个从压缩视角
    来形式化无监督学习的思路
    考虑一个机器学习算法A
    它试图去压缩数据集Y
    同时可以利用另一个无标注数据集X
    如果我们的目标是让A尽可能好地压缩Y
    那么怎么去衡量算法A的性能呢?
    Ilya引入了“遗憾(regret)”这个概念
    如果A的“遗憾”很低,就意味着
    我们已经充分利用了无标注数据X中的所有信息
    来帮助压缩Y
    换句话说
    没有人能比我们做得更好了
    对于X中存在的任何对Y有用的模式
    我们已经尽力去挖掘和利用了
    这样就提供了一个评估无监督学习算法的角度
    好的算法应该能够最小化这种“遗憾”,
    充分挖掘无标注数据的价值
    榨干海绵中的最后一滴水
    接下来,Ilya要谈计算理论了
    他先给了个警告
    说这个理论有点晦涩
    Ilya先是讨论了柯氏复杂度作为“终极压缩器”的性质
    以及它与无监督学习的关联
    简单来说
    我们可以把一个文件的柯氏复杂度
    看作是能够完整描述这份文件的最短指令
    其他人如果知道这个指令
    就能够完全还原出文件
    在Ilya看来
    一个好的无监督学习算法
    就应该能够找到数据的最简洁表示
    即柯氏复杂度
    同时又能够最大限度地利用这种表示
    来找到输入和输出之间的映射关系
    不过,从数学上讲
    真正的柯氏复杂度是不可计算的
    但是Ilya认为
    我们可以训练一个大型神经网络来近似这个过程
    因为理论上
    神经网络可以拟合任何函数
    包括“生成文件最短指令”的这个函数
    通过不断调整网络的参数
    我们就可以一步步逼近最优的压缩方案
    为了证明柯氏复杂度是最佳的压缩器
    Ilya还给出了一个数学论证
    大意就是,任何一个文件的压缩长度
    加上解压算法的长度
    以及制定和理解这套算法所需的额外信息
    一定会大于文件最短的“压缩长度”,
    即柯氏复杂度
    所以
    柯氏复杂度代表了压缩的理论极限
    任何实际的压缩算法都不可能超越它
    虽然这个极限不可达
    但是它为我们评判无监督学习算法提供了一个基准
    Ilya认为
    GPT这些大语言模型之所以有效
    正是因为它们能通过梯度下降等优化算法
    不断逼近这个基准
    学习到数据的高度压缩表示
    并且运用到下游任务上
    这就是柯氏复杂度和无监督学习之间的联系
    虽然有点抽象
    但是Ilya的核心思想是清晰的
    那就是压缩是无监督学习的本质
    而追求最简洁的压缩
    就是追求最优的无监督学习
    我们跳过复杂的数学证明过程
    直接来看Ilya演讲的最后一页幻灯片
    也是Ilya理论最精彩的部分
    值得我们好好的学习和品味
    前面我们已经讲过
    Ilya提出从数据压缩的角度来理解无监督学习
    也就是说,一个好的无监督学习算法
    应该能最大限度地压缩数据
    最简洁地表示数据的内容
    而一个数据对象的柯氏复杂度
    就是能够完整描述这个对象的、最短计算机程序的长度
    可以想象
    这个最短程序就像一个“压缩包”,
    里面包含了重构原始数据所需的全部信息
    从这个角度看
    无监督学习的目标就是寻找数据的最优压缩表示
    也就是柯氏复杂度
    但是在实践中
    我们往往需要处理多个相关的数据集
    比如在机器翻译中
    我们有源语言数据集X和目标语言数据集Y
    如果我们希望能够把X中的句子翻译成Y中的句子
    那么按照传统的思路
    这就是一个条件概率问题
    用柯氏复杂度来表示,就是求K(Y|X),
    即给定X的条件下,Y的最短描述长度
    然而,Ilya提出了一个不同的思路
    他说
    与其像监督学习那样将X和Y视为条件与结果
    不如将它们视为一个整体
    在一个巨大的模型里面一起进行压缩
    也就是说
    我们要寻找一个联合的柯氏复杂度K(X
    Y),即同时压缩X和Y的最短程序长度
    这就是无监督学习出来的预训练大模型
    这个联合压缩程序必须能够充分利用X和Y之间的相关性
    用X中的信息去自动对齐Y
    就像我们学习外语的时候
    会自然利用母语的知识
    去理解和记忆外语单词一样
    Ilya认为,这种联合压缩的思想
    才是无监督学习的真正威力所在
    因为现实世界的数据往往都是相互关联的
    存在大量深层次的共同模式和规律
    如果我们能够用无监督学习去发现和利用这些规律
    就能极大地提高学习的效率和泛化能力
    这也是GPT等大语言模型
    能够在各种任务上展现惊人性能的原因
    因为它们通过海量数据的无监督预训练
    学会了训练数据集的种种内在规律性
    而这种规律性在相关的数据上有通用性
    可以对齐
    虽然在现实中
    通过梯度下降等优化算法
    神经网络得到的最优压缩表示
    可能不是严格意义上的柯氏复杂度
    但是也足以捕捉到数据的本质特征
    和它的对齐规律了
    所以
    Ilya的理论可以看作是一个无监督学习的新范式
    它将传统的独立建模
    提升到了统一的关联建模的高度
    在这个范式下,无监督学习的目标
    不再是单纯地压缩单一群体的数据
    而是寻找数据之间的联系
    而这种跨模式、跨模态的学习
    才是通用人工智能的高级形态
    Ilya还在幻灯片中指出
    Conditioning on a dataset
    not an example
    也就是压缩的对象是数据集
    而不是数据点,这一点非常重要
    也是形式压缩与内容压缩的分水岭
    形式压缩只是一个机械过程
    产生不了智能
    只有内容压缩才能成就人工智能
    那么什么是形式压缩
    什么是内容压缩呢?
    举个例子
    我们把一首特定的歌曲做无损压缩
    保证压缩后可以100%还原成原来的音乐
    这就是传统意义上的形式压缩
    对象是数据个体,也就是那首音乐
    而如果我们对音乐的集合进行压缩
    无论是用GPT还是用Diffusion
    对象就变成了一个群体
    结果就是大模型了
    虽然群体是由个体组成的
    但是群体压缩勾勒的是群体的统计性形象
    因为大模型压缩的本意
    就是要找出数据集的特征和规律性
    总之,Ilya想强调的核心观点是
    条件柯氏复杂度 K(Y|X) ,
    提供了一种理论上最优的无监督学习解决方案
    它代表了从X中
    提取所有对预测Y有价值的信息的理论上限
    一个能够达到K(Y|X)的算法
    就是利用无标签数据X对Y进行预测的最佳算法
    然而,K(Y|X)在实际中是不可计算的
    于是Ilya提出了一种可行的替代方案
    也就是使用普通的柯氏复杂度 K(X
    Y)来联合压缩X和Y
    他认为,在实际的机器学习任务中
    K(X,Y)可以达到与K(Y|X)相当的效果
    最后总结成一句话
    那就是条件建模被Ilya换成了序列建模
    从而论证了GPT的大一统
    好了
    以上就是Ilya这次演讲的核心内容了
    他似乎真的如辛顿所言
    靠着自己天才般的直觉
    发现了无监督学习的天机
    背后呢更是隐含着深层的哲理
    用实际中GPT的遗憾
    来逼近理想中无遗憾的目标
    如今他再度出山
    建立安全超级智能公司SSI
    希望这次
    真的能够给人类
    带来一个足够安全的超级人工智能
    感谢大家收看本期节目
    我们下期再见

  • 【人工智能】AI的内部运行是怎样的?_ 机械可解释性 _ 特朗普神经元 _ 线性表征假说 _ 多义性 _ 叠加假说 _ 跨模态理解 _ 神经网络暗物质 _ Christopher Olah

    大家好,这里是最佳拍档,我是大飞
    在我们前两期做的一期节目中
    其中Anthropic的联合创始人克里斯托弗·欧拉提到了“机械可解释性”的概念
    很多观众很感兴趣
    所以我们今天这期节目
    就来带大家尝试探索一下人工智能的内部世界
    在当今时代
    人工智能无疑是最具影响力和颠覆性的技术之一
    它正在逐渐重塑我们的生活、工作和整个社会
    然而,讽刺的是
    尽管我们每天都在与各种AI应用打交道
    但是对于这些AI的内部运作机制
    我们却知之甚少
    它们就像一个个神秘的黑盒子
    我们输入数据
    它们输出结果
    可是中间到底发生了什么
    却无人能够准确的知晓
    随着AI越来越广泛的应用
    这种“黑盒”的状态也正在变得越来越危险
    想象一下,在医疗诊断领域
    AI系统做出的决策可能直接关乎患者的生死;
    在自动驾驶领域
    AI的决策会影响着道路上每一个人的安全
    如果我们无法理解AI的决策过程
    又怎么能确保它们不会做出危险或者有偏见的决定呢?
    这就是整个AI领域所面临的核心挑战
    它不仅关乎着科学探索
    更是与AI和我们每个人的安全息息相关
    传统的AI可解释性方法存在着很大的局限性
    往往只能提供一些粗略的解释
    比如指出哪些输入特征对输出的影响较大
    但是这显然远远不够
    曾经有一位匿名的AI安全研究员形象地比喻道
    这就像是在看一本用外星语言写的书的目录
    我们可能知道哪些章节很重要
    但是完全不明白内容是什么
    所以,我们迫切需要一种全新的方法
    能够深入AI的“大脑”,
    理解其中的每一个“神经元”是如何工作的
    于是
    “机械可解释性”(Mechanistic Interpretability)的研究应运而生
    这个新兴领域的目标是将AI系统完全“拆解”,
    如同生物学家去研究生命那样
    系统地分析AI的每一个组成部分及其功能
    不过
    研究人员要面临的挑战十分巨大
    他们需要开发新的数学工具和可视化技术
    设计创新的实验方法
    甚至重新思考我们对于智能的理解
    随着对AI系统内部的深入探索
    研究人员开始有了一个令人大为惊讶的发现
    尽管这些系统能够完成极其复杂的任务
    比如击败围棋世界冠军、创作逼真的图像等等
    但是它们内部的表征方式却出奇地简单
    这就是所谓的“线性表征假说”。
    简单来讲
    AI系统似乎是通过将不同概念
    表示为高维空间中的方向来理解世界的
    比如说在处理语言的时候
    “性别”这个概念
    可能对应着一个特定的方向
    而“男性”和“女性”则分别位于这个方向的两端
    这就解释了为什么我们可以用单词来做“数学运算”,
    就像那个著名的例子
    “国王-男人+女人=王后”一样
    欧拉和他的团队还在研究中发现
    这种线性表征不仅存在于语言模型中
    在处理图像的卷积神经网络中也广泛存在着
    他们在对Inception V1模型的研究中
    分析了大约10,000个神经元
    发现了专门用来检测曲线、边缘和颜色对比的神经元
    这些基本的特征随后被巧妙地组合起来
    形成更加复杂的概念
    比如“猫”或者“房子”。
    欧拉曾经回忆道
    当我们第一次看到这些结果的时候
    感觉就像是在解读外星人的图画书
    每一层神经网络都在学习越来越复杂的特征
    但是基本原理却出奇地简单
    更令人惊叹的是
    这种简洁的线性表征方式并非个例
    它似乎是各种AI模型的一种共性
    甚至在生物大脑中也有类似的发现
    例如,他们在不同的模型中
    都发现了类似的Gabor滤波器
    而这种滤波器在生物视觉系统中
    同样扮演着重要的角色
    而且
    研究人员在人工神经网络中发现的“高低频率检测器”,
    后来在老鼠的大脑中也被发现
    这种发现充分展示了机械可解释性研究的潜在价值
    这不禁让我们思考
    难道存在某种普遍的“智能原理”,
    无论是人工智能还是生物智能
    都要遵循这些原理吗?
    这个问题的答案
    或许会彻底改变我们对智能的理解
    也为开发更先进的AI系统指明方向
    随着研究的进一步深入
    当聚焦到单个“神经元”的层面时
    事情变得更加有趣和超乎想象
    研究人员发现
    许多神经元并不像我们之前认为的那样
    只负责一项特定的任务
    而是呈现出了令人惊讶的“多才多艺”。
    其中最著名的例子当属“特朗普神经元”。
    在多个AI模型中
    研究人员都发现了专门对唐纳德·特朗普的相关内容做出反应的神经元
    这些神经元不仅对特朗普的照片有反应
    还会对“特朗普”这个词、他的签名
    甚至是与他相关的新闻标题做出反应
    一位研究者半开玩笑地说
    这些神经元对特朗普的痴迷程度
    简直比某些政治评论员还要高
    但是其实“特朗普神经元”仅仅是冰山一角
    实际上
    许多神经元都展现出了“多义性”,
    也就是一个神经元可以同时对多个看似毫不相关的概念做出反应
    比如在欧拉的《Zoom In:
    An Introduction to Circuits》论文中
    提到了一个在InceptionV1模型中发现的神经元
    它竟然同时对猫的脸、汽车的前脸和猫的腿做出反应
    这个神经元不是在寻找这些概念之间的某种微妙联系
    而是明确地对这三种完全不同的视觉特征做出反应
    一位参与研究的博士后回忆道
    当我们第一次发现这个现象时
    我们以为是实验出错了
    我们反复检查了好几遍
    才确信这确实是模型的真实行为
    这完全颠覆了我们对神经网络工作方式的理解
    如果一个神经元同时表示多个概念
    我们又该如何解释它的作用呢?
    研究人员提出了几种可能的解释
    一种观点认为
    这种多义性可能是神经网络为了更加有效地利用有限的神经元而采取的策略
    另一种观点则认为
    这可能反映了现实世界中概念之间的某种潜在联系
    只是这种联系对人类来说并不是很直观
    无论如何,多义性神经元的发现
    为我们理解AI的内部工作机制提供了重要线索
    它暗示着AI系统可能采用了一种高度压缩和抽象的方式来表示信息
    而这种方式可能与人类大脑的工作方式有着本质的不同
    为了解释这种令人费解的多义性现象
    研究人员提出了一个大胆的假说
    叠加假说(Superposition Hypothesis)
    这个假说借鉴了量子力学中的概念
    认为AI系统能够在有限的神经元中
    表示远超过其数量的特征
    就如同量子比特可以同时表示多个状态一样
    具体而言
    AI系统可能将多个特征“压缩”到同一组神经元中
    通过巧妙的编码方式
    在需要时再“解压”出相关信息
    这就像是一种高效的数据压缩算法
    让AI能够用有限的资源表示来处理海量的信息
    为了验证这个假说
    研究人员精心设计了一系列的实验
    比如说
    他们创建了一个简单的神经网络
    训练它完成一个有更多输入特征的神经元任务
    令人惊讶的是
    网络确实学会了用每个神经元来表示多个特征
    这些特征被编码为近乎正交的方向
    一位参与实验的研究员兴奋地说到
    当我们看到结果时
    感觉就像是在见证一个魔术表演
    明明只有这么少的神经元
    却能同时表示这么多的特征
    简直不可思议!
    这个发现不仅解释了多义性神经元的存在
    还揭示了AI系统惊人的效率
    它暗示着我们观察到的神经网络
    可能只是一个更大、更稀疏网络的“投影”。
    正如同一位研究者形象地比喻
    这就像是我们一直在研究影子
    现在终于开始窥见投射影子的实体
    更有趣的是
    这个假说与压缩感知理论有着深刻的联系
    压缩感知理论告诉我们
    在某些条件下
    我们可以从远少于原始信号维度的测量中
    重建完整的信号
    这与神经网络的工作方式惊人地相似
    一位具有数学背景的研究者激动地说
    当我意识到神经网络可能在利用压缩感知的原理时
    我感觉自己仿佛触碰到了智能的本质
    这很可能是通向更深入理解AI的一把钥匙
    这些发现
    为我们提供了一个全新的视角来理解AI系统的内部工作原理
    它们暗示着
    与其将AI视为一个简单的函数近似器
    不如将它看作一个复杂的信息压缩和解压系统
    最后,让我们来看看AI的另一项能力
    跨模态理解
    最新的研究发现
    在像Claude 3这样的大语言模型中
    存在着能够同时处理文本和图像的神经元
    在Anthropic公司对Claude 3 Sonnet模型的研究中
    研究人员使用了稀疏自编码器
    从模型的中间层提取出了大约1000万个独特特征
    这些特征涵盖了广泛的概念
    从具体的人物和地点到抽象的概念
    比如性别偏见或者保守秘密
    这个发现展示了大语言模型内部表征的丰富性和复杂性
    其中一个特别有趣的发现是“后门”特征
    这个特征不仅能够识别代码中的后门漏洞
    还能识别图像中隐藏的摄像头设备
    一位研究员回忆道
    当我们发现这个特征的时候
    我们都惊呆了
    它竟然能在完全不同的领域中识别出相似的概念
    这种抽象的理解能力简直匪夷所思
    研究人员还发现
    通过放大或者抑制与特定特征相关的神经元活动
    他们可以显著地影响模型的行为
    例如,放大与金门大桥相关的特征
    会导致模型在每个回答中都提到它
    即使这样做并不合适
    一位研究员笑着说
    我们甚至让模型在讨论量子物理的时候
    也提到了金门大桥
    这种能力既令人兴奋,又有点可怕
    此外
    通过激活与垃圾邮件相关的特征
    可以绕过模型的限制
    让模型生成垃圾信息
    这个发现引发了研究团队的热烈讨论
    一位成员严肃地说到
    这提醒我们,在追求AI能力的同时
    也要非常小心地考虑安全问题
    而放大与阿谀奉承相关的特征
    可以诱导模型使用奉承作为欺骗的手段
    一位伦理学家研究员指出
    这让我们看到了AI可能产生的道德风险
    我们需要认真思考如何在赋予AI强大能力的同时
    也能确保它们遵循道德准则
    虽然通过操纵这些特征
    我们有望能够精确地控制AI的行为
    比如增强或者抑制某些特定的能力
    但是研究人员也强调
    我们目前提取的特征
    可能只是模型总特征的很小一部分
    更何况
    完全提取所有特征需要巨大的计算资源
    一位资深研究员也坦言道
    我们现在可能只是看到了冰山一角
    要想完全理解这些模型
    我们还有很长的路要走
    但是每一个新发现
    都让我们离目标更近一步
    随着对AI内部世界的探索
    机械可解释性研究为我们提供了一个全新的视角
    来思考AGI的实现
    传统上,许多研究者认为
    实现AGI的关键在于设计更复杂的模型架构
    或者收集更多的训练数据
    但是,机械可解释性研究告诉我们
    也许关键在于更好地理解和利用
    现有模型中已经存在的结构和能力
    一位长期从事AGI研究的科学家分享了他的深刻洞见
    过去
    我们总是在追求更大、更复杂的模型
    但是现在我开始意识到
    也许答案就藏在我们已有的模型中
    我们只是还没有完全理解它们
    比方说
    通过深入理解多义性神经元和跨模态特征
    我们可能能找到更有效的方法
    来整合不同类型的知识和能力
    同样,叠加假说告诉我们
    也许实现AGI不需要无限地增加模型的规模
    而是找到更有效的方法来利用有限的计算资源
    更重要的是
    机械可解释性研究为我们提供了一种可能的方法
    来确保AGI的安全性和可控性
    从而避免潜在的风险
    然而,通往AGI的道路依然充满挑战
    比如
    我们如何确保从简单模型中获得的见解
    能够推广到更复杂的系统?
    我们如何处理AI系统中可能存在的“暗物质”,
    也就是那些我们还无法观察或理解的部分?
    欧拉在他的最新研究中提出了“神经网络暗物质”的概念
    指出我们可能只观察到了神经网络总特征的一小部分
    他写道
    就像宇宙学家试图理解暗物质一样
    我们可能需要开发全新的工具和理论来探索神经网络的‘暗面’。
    这是一个巨大的挑战
    但也是一个激动人心的机遇
    除此以外
    我们还面临着如何在保持模型性能的同时
    增加模型可解释性的难题
    一位研究团队的负责人坦诚地说
    每解决一个问题
    就会出现十个新问题
    但是这正是科学研究的魅力所在
    我们正在探索未知的领域
    每一个发现都让我们离理解智能的本质更近一步
    正如欧拉在他的博客中所写到的
    我认为神经网络内部存在着极其丰富的结构和巨大的美
    如果我们愿意花时间去观察和理解
    就能发现这种美
    这不仅是一个科学问题
    更是一个哲学问题
    我们能否真正理解我们所创造的智能?
    好了,今天的分享就到这里
    随着我们对AI内部的理解不断加深
    我们可能会发现
    对AI的探索过程
    就如同我们对数学定理、对物理法则、对原子量子的探索一样
    本质上都是我们对这个世界的探索
    也许我们最终能搞懂它
    也许可能很长时间也没法完全搞懂
    但是不可否认的是
    我们将逐渐经历从使用AI、理解AI
    最终到与AI共存的阶段
    这也是对于我们每个人的挑战和机遇
    感谢大家收看本期视频
    我们下期再见

  • 【人工智能】AI时代下的数学变革 _ 菲尔兹奖得主陶哲… _ 纳维-斯托克斯方程 _ 流体计算机 _ AI缺少数学嗅觉 _ 形式化证明LEAN _ 孪生素数 _ 黎曼猜想 _ 永恒追问

    大家好,这里是最佳拍档,我是大飞
    1975年
    在澳大利亚阿德莱德的一个普通社区
    诞生了这样一个男孩
    他 3 岁半开始自学算术
    7 岁完成微积分课程
    8 岁参加 SAT 数学考试
    拿到 760 分
    这个被称为 “数学神童” 的孩子
    就是后来的菲尔兹奖得主陶哲轩(Terence Tao)
    当他在 24 岁成为加州大学洛杉矶分校(UCLA)历史上最年轻的正教授时
    人们惊叹于他对数学领域的全域掌控能力
    从调和分析到数论
    从偏微分方程到组合数学
    6月15日
    知名播客主持人Lex Fridman
    对陶哲轩进行了一场长达三个多小时的访谈
    在对话中
    陶哲轩深入探讨了三个核心命题
    包括那些困扰人类百年的数学难题
    究竟难在何处?
    当 AI 开始辅助定理证明
    传统的数学研究范式正在发生怎样的变革?
    以及在算法日益精进的时代
    人类数学家的独特价值又该如何定义?
    今天大飞就来试着给大家梳理一下这场对话的核心内容
    看看在这位号称“数学界莫扎特”的天才眼中
    人类、数学和AI的未来将会如何发展
    这场对话的起点
    还要从那个让陶哲轩在博士阶段
    辗转反侧的 “针尖转向” 问题说起
    1918 年
    日本数学家挂谷宗一(Soichi Kakeya)提出了一个看似很简单的几何问题
    那就是在平面上
    一根长度为 1 的针做 180 度转向时
    所扫过的最小面积是多少?
    传统的几何学家们设想了一个 “三点转向法”,
    针先绕一端旋转 60 度
    再绕另一端旋转 60 度
    从而形成一个等边三角形
    实际面积为π/8
    但是这个答案在 1928 年被苏联数学家阿布拉姆・别西科维奇(Abram Besicovitch)所颠覆
    他证明了通过构造无限多段的锯齿形路径
    转向面积可以趋近于零
    而陶哲轩在 1990 年代研究这个问题时
    并没有局限于二维平面
    而是将目光投向了三维空间
    如果针具有厚度 δ
    比如好像现实中的一台望远镜设备
    那么最小的转向体积该如何计算呢?
    他发现当 δ 趋近于零的时候
    体积衰减速率大概会与δ的对数相关
    这个发现看似局限在几何领域
    却意外地与流体力学中的 “奇点形成” 产生了联系
    在流体力学中
    有一个著名的纳维-斯托克斯方程(Navier-Stokes equations)
    这是一个描述流体运动的偏微分方程组
    包含了速度场、压力场和黏性力等多个物理量之间的复杂交互
    它的核心问题是
    对于给定的光滑初始条件
    是否会在有限时间内产生 “奇点”,
    也就是速度或者压力趋于无穷大的点
    从而引发“爆破(blow-up)现象”呢?
    陶哲轩指出
    这个问题之所以极端困难
    源自于它的“超临界”(supercritical)特性
    在流体系统中
    存在着两种相互竞争的力量
    一种是让系统趋于平稳的粘性耗散
    另一种是驱动能量输运的非线性效应
    在“超临界”的状态下
    当尺度越来越小的时候
    非线性效应会压倒性地战胜粘性效应
    他将这个过程比作是“麦克斯韦妖”的杰作
    麦克斯韦妖指的是,理论上
    一个微观的“妖精”可以巧妙地操纵能量
    将它不断地推向更小的尺度
    从而形成一个自相似的能量汇聚链条
    最终在有限的时间内形成奇点
    因此
    这个问题也被列为千禧年七大数学难题之一
    悬赏高达 100 万美元
    2016 年
    陶哲轩在《数学物理通讯》发表的论文中
    通过构造了一个 “平均化” 的三维纳维 – 斯托克斯方程
    首次严格证明了在特定的初始条件下
    能量会在有限时间内集中到非常小的尺度上
    引发爆破
    他的灵感来源于妻子的电路设计图
    那些由电阻、电容构成的分层能量耗散结构
    让他联想到流体能量在不同尺度间的传递机制
    就像工程师设计电路的时候
    需要考虑信号延迟一样
    陶哲轩在方程中引入了 “能量传输的时间滞后”,
    证明了当黏性耗散无法及时平衡能量的集中时
    就会形成类似于 “流体计算机” 的自相似坍缩
    在他的设想
    驱动计算的单元不再是电子
    而是一股股以特定速度流动的水流脉冲
    水流的不同形态可以代表二进制的0和1
    通过设计出特定的流体交互
    完全可以实现“与门”和“或门”等逻辑运算
    再将这些逻辑门串联
    理论上可以构建出一个完全由水构成的计算机
    甚至是创造出一个流体版的“冯·诺依曼机”,
    也就是一个能够利用流体资源
    进行自我复制的机器人
    这个“流体机器人”唯一的目标
    就是创造一个比自己更小的、处于“冷启动”状态的复制品
    一旦完成
    它就会将自身的全部能量转移给这个复制品
    然后自身断电并且消散
    这个全新的、更小更快的“机器人”将自行启动
    并且以指数级的速度重复这个过程
    从理论上讲
    这个无限迭代的自我复制过程
    就可以在真实的纳维-斯托克斯方程中制造出一个“爆破”。
    陶哲轩关于“流体计算机”的构想
    核心在于复杂的计算能力
    可以从简单的底层规则中涌现
    这个思想在数字世界中其实有着一个强大且经典的印证
    那就是约翰·康威的“生命游戏”(Conway’s Game of Life)
    陶哲轩明确表示
    他对元胞自动机(cellular automata)的了解
    深刻地影响了他对复杂系统行为的思考
    并且为理解人工智能系统的内在逻辑提供了关键类比
    “生命游戏”是一个由极简规则驱动的二维数字宇宙
    它的演化模式有时看起来极为混乱
    酷似流体湍流
    然而,陶哲轩指出
    研究者们在这个极简系统中发现了令人惊叹的、具有高度组织性的结构
    比方说
    他们发现了“滑翔者”(glider)
    一种能稳定向特定方向移动的微小模式
    这非常类似于陶哲轩在流体力学中思考的“涡环”(vortex ring)
    更加令人惊叹的是
    通过对这些基本模式的巧妙组合
    人们最终在“生命游戏”里构建出了更高级的计算组件
    设计出了能持续发射“滑翔者”的“滑翔者枪”,
    能够实现“与门”和“或门”等逻辑运算的复杂结构
    乃至一个庞大的、能够实现自我复制的冯·诺依曼机
    然而,无论是设想中的“流体计算机”,
    还是“生命游戏”中的复杂机器
    它们的涌现都有一个至关重要的共同前提
    那就是需要非常精心准备的初始条件
    他强调
    这些复杂结构必须通过“工程”的手段
    以一种非常特殊的方式精心设计
    才能够构建出来
    陶哲轩还讲了自己研究波映射方程的经历
    波映射方程(Wave map equation)是描述从一个时空区域到另一个黎曼流形的映射的波动行为的方程
    它在广义相对论、几何分析等领域有着重要的应用
    陶哲轩在澳大利亚探亲期间
    经常会在海滩上
    观察海浪撞击礁石时的波形变化
    他发现
    当水波在遇到障碍物或者进入不同深度的水域时
    会发生折射、反射和变形等复杂的现象
    在这些物理现象的启发下
    陶哲轩提出了一种名为 “规范变换” 的方法
    就像给波动安装了一个可调节的坐标系
    通过局部旋转向量场的视角
    将高度非线性的问题转化为近似线性的形式
    最终证明了临界波映射的全局正则性
    在这个过程中,他甚至躺在地板上
    想象自己变成了一个矢量场
    四处滚动,试图弄清楚如何改变坐标
    让各个方向的物体都能以合理的线性方式去运动
    随后
    对话转向了AI在数学研究领域的直接应用
    陶哲轩系统性地评估了AI当前的潜力
    并且明确指出了AI与顶尖人类智能之间
    目前难以逾越的一个本质鸿沟
    那就是他称之为“数学嗅觉”(Mathematical Smell)的缺失
    他认为
    人与AI在研究层面的合作已经初现端倪
    并且给出了一个具体的预测
    到2026年就会出现人与AI合作的数学研究
    成果或许还达不到菲尔兹奖的级别
    但会是真正研究层面的数学论文
    其中部分内容是由AI生成的
    他本人也经常使用代码补全等AI工具来加速研究工作
    并且把AI看做是出色的“计算助手”。
    然而
    当被问到AI能否独立完成菲尔兹奖级别的、类似格里戈里·佩雷尔曼解决庞加莱猜想那样的思想突破时
    他的回答是清晰而否定的
    他详细解释了佩雷尔曼的工作
    核心在于引入“里奇流”(Ricci flow)
    并且发展出“佩雷尔曼熵”等全新的概念
    将一个棘手的“超临界”问题
    转化为一个可控的“临界”问题
    并且最终对所有可能出现的奇点
    进行分类和“手术”。
    这个过程
    是长达数年、基于深刻物理直觉的探索
    是一条需要巨大毅力才能走通的、前无古人的道路
    陶哲轩对此断言
    这完全不是今天的Transformer架构的AI或者大语言模型所能做到的
    他进一步剖析了背后的原因
    一个AI或许能在其庞大的可能性空间中
    “碰巧”能生成佩雷尔曼用到的某个公式或概念
    但是它无法像佩雷尔曼那样
    凭借一种深刻的直觉
    坚信这是唯一正确的方向
    并且为之投入数年的光阴
    AI可以生成选项
    但是无法进行战略性的、具有长远信念的抉择
    不过,陶哲轩也指出
    大语言模型生成的数学内容
    最令人头疼的地方在于它们常常“看起来完美无瑕”,
    语法正确、逻辑链条完整
    但是内部却可能包含任何一个受过训练的人都不会犯的、荒谬的低级错误
    他将这种现象与编程行业中的术语“code smell”进行类比
    一个有经验的程序员能够凭借着直觉
    “闻到”一段代码中存在的问题
    同样
    顶尖数学家对一个证明策略、一个研究方向的好坏
    也有一种直觉性的判断力
    这就是所谓的“数学嗅觉”。
    而AI生成的文本
    由于它的训练目标是模仿正确的文本样式
    所以常常是“没有气味”的
    这使得发现其中的深层逻辑谬误
    变得异常困难
    所以,陶哲轩认为
    一个顶尖数学家的工作
    远不止是执行计算和逻辑推演
    更重要的是对研究方向的战略判断
    哪个问题值得投入精力?
    哪条证明路径更有前景?
    哪种问题的分解方式是化繁为简
    而非化简为繁?
    他将这种能力与AlphaGo在围棋领域的成功进行对比
    AlphaGo之所以能战胜人类
    并非只是因为它算得更远
    而是因为它通过海量的学习
    发展出了对“棋局”优劣的“嗅觉”。
    陶哲轩预言
    只有当AI也获得了对“证明策略”可行性的‘嗅觉’时
    它们才可能开始与人类水平的数学家一较高下
    在此之前
    一个理想的AI助手应该扮演什么角色呢?
    陶哲轩认为
    我们正进入一个全新的范式
    面对的是一个能理解复杂指令、可进行大规模工作
    但是同时并不可靠的助手
    这意味着人机协作的模式并非简单的任务分配
    而是一个动态的、需要人类扮演最终战略决策者和“嗅觉”验证者的过程
    人类的职责,是提出深刻的问题
    设定正确的方向
    并且利用自己深厚的“嗅觉”,
    来审视和引导AI强大的、但可能是盲目的计算和生成能力
    在被问到近年来积极投身到的形式化证明领域
    陶哲轩坦言,他投身这一领域
    是源于对传统研究方式低效的切身感受
    他看到数学家们花费大量的时间进行重复性计算
    或者在不熟悉的领域摸索
    这促使他不断探索新的工作流程
    几年前
    他就敏锐地捕捉到了计算机辅助证明的潜力
    并且组织相关研讨会
    当ChatGPT引爆了AI浪潮之后
    他进一步意识到自己不能只是停留在口头倡导
    必须亲身实践
    用行动来证实这个方向的价值
    正如他所说
    我不能仅仅凭借自己作为‘世界知名数学家’的权威
    去告诉大家‘相信我
    这将改变数学’,而自己却不投身其中
    于是,他所引领的这场变革
    核心在于用计算机可以完全理解和验证的代码
    来重写数学
    像Lean这样的形式化证明语言
    让数学定理不再仅仅是人类头脑中的抽象概念和纸上的符号
    而变成了可以被机器严格审查的、精确无误的数字化对象
    陶哲轩解释道
    这从根本上解决了一个困扰大规模数学协作的瓶颈
    那就是信任
    通过利用计算机的证明检查器
    来确保过程中的每一步都准确无误
    从而让证明的所有部分都能够兼容并且高度可靠
    在这种新范式下
    一个宏大复杂的证明可以被分解成数千个独立的、标准化的、可以被验证的“节点”或者“引理”。
    这就像一张详尽的“蓝图”。
    贡献者不需要通晓整个证明的全貌
    只需要领取并且攻克自己负责的那个小模块即可
    这种模式彻底改变了数学研究的生产关系
    让它从一门以孤胆英雄为主的学科
    演变为了像现代工业供应链那样
    可以进行大规模、分布式、可信协作的工程
    为了检验这个模式的威力
    陶哲轩还与合作者们
    发起了一个名为等式理论项目
    的宏大计划
    这个项目的目的
    是完整描绘抽象代数领域中
    大约4000条定律之间的相互推导关系
    从而构成了大约2200万个需要被证明或者证伪的子问题
    在过去
    仅靠人力处理十几个类似的问题
    就已经是极限了
    但是在Lean和GitHub等协作平台的加持下
    这个看似不可能的任务
    吸引了全球大约50位数学家和程序员的参与
    在访谈中
    陶哲轩透露这个庞大的项目已经接近尾声
    即将产出一篇有50位作者署名的论文
    这在传统数学领域是极其罕见的
    这次经历也让他深刻反思了科研协作模式的演进
    他回忆起十年前参与的、早期的众包项目“Polymath”。
    虽然这个项目的理念很先进
    但是因为缺乏Lean这样的自动验证工具
    所有贡献都需核心成员的人工审核
    导致效率受限于巨大的瓶颈
    当时团队采用了共同笔名的方式发表成果
    却也带来了署名权不清、功劳归属模糊等问题
    而在新的“等式理论项目”中
    他们采用了更精细的贡献归属机制
    所有的参与者都是正式作者
    并且通过一个详尽的“贡献矩阵”来申明各自在概念构思、编程实现、结果验证等方面的具体工作
    当AI拥有了形式化数学库和强大的计算能力后
    它能否攻克那些困扰人类数百年、似乎需要全新概念才能突破的终极难题
    比如孪生素数猜想和黎曼猜想呢?
    以孪生素数为例
    如果说素数是数学的原子
    而孪生素数,比如 3 和 5
    11 和 13,则是其中的 “双胞胎”。
    这个猜想认为
    存在这无穷多对相差 2 的素数
    也是数论中最古老的未解之谜之一
    2013 年
    张益唐证明了存在无穷多对相差不超过 7000 万的素数
    将问题推进了一大步
    陶哲轩随后发起的 “Polymath 项目”,
    通过全球数学家的协作
    将这个差距缩小到了246
    但是他也清醒地认识到
    真正证明差为2
    还需要突破 “奇偶性壁垒”,
    这是一个类似于量子物理中 “对称性破缺” 的数学障碍
    要想突破这个障碍
    需要的不仅仅是更强的算力
    而是一个全新的、可能来自完全不同领域的革命性思想
    AI或许可以通过强化学习
    将现有方法运用到极致
    但是它能否“发明”出一种能绕过“奇偶性障碍”的、全新的数学思想呢?
    陶哲轩对此持有开放但审慎的态度
    他指出,对于孪生素数猜想
    我们很大程度上仍然处于在“黑暗中摸索”的阶段
    缺乏像庞加莱猜想那样一个由哈密尔顿提出的、明确的“里奇流”攻击方案
    而对于另一个更著名的难题
    黎曼猜想
    这个猜想本质上是说,素数的分布
    在刨除掉一些已知的局部规律后
    会表现得和你所能期望的一样“随机”。
    陶哲轩解释道,证明这一点极其困难
    因为数学中我们恰恰缺乏有效的工具
    去证明某个具体事物“真正具有随机性”。
    任何可行的证明
    都必须极其精确、巧妙地避开所有已知陷阱
    不能有巨大的误差容忍度
    他认为,用来解决黎曼猜想的工具
    很可能与解决孪生素数猜想的工具截然不同
    当被问到黎曼猜想是否会在我们有生之年被解决的时候
    他坦率地表示
    如果非要下注的话,他会赌不会
    但是他真心希望自己会输掉这个赌
    此外
    陶哲轩还提到了其他几个尚未被解决的数学猜想
    首先便是科拉茨猜想
    1937 年
    德国数学家洛塔尔・科拉茨(Lothar Collatz)提出了一个看上去好像孩童游戏的问题
    给出一个任意正整数
    若为偶数则除以 2
    若为奇数则乘 3 加 1
    重复操作是否最终都会到达到 1呢?
    这个问题的魅力就在于它的简单性
    任何一个小学生都能理解它的规则
    却让最顶尖的数学家束手无策
    陶哲轩在 2019 年的突破
    在于证明了对于 “几乎所有” 的正整数
    迭代序列会在有限步内降到 1000 以下
    但是他也坦言
    我们离真正的证明还差得很远
    就像在大海中看到了一座岛屿
    却找不到登陆的地方
    这个问题的深层意义
    在于揭示了简单规则与复杂动态的矛盾
    就像气象学家爱德华・洛伦兹(Edward Lorenz)发现的蝴蝶效应一样
    科拉茨序列中看似随机的波动
    可能隐藏着尚未被发现的数学结构
    陶哲轩甚至开玩笑的说到
    如果我被外星人绑架
    他们要求用一个数学问题证明人类值得存活
    那么我会选 科拉茨猜想
    因为它足够简单,又足够深刻
    其次,在计算机科学的神殿中
    P=NP 问题占据着至高无上的地位
    是否存在一种算法
    能够在多项式的时间内
    解决所有可验证的问题呢?
    如果 P=NP 成立
    那么密码学、蛋白质折叠等难题将迎刃而解
    但是同时也意味着所有智力劳动都可以被算法替代
    陶哲轩对此的观点是谨慎的
    虽然目前所有证据都指向 P≠NP
    但是仍然缺乏数学工具来证明这一点
    这就像在量子力学中
    我们虽然知道波粒二象性存在
    却无法用经典的语言来完全描述它
    他参与的 “算法复杂性与数学证明” 项目
    正是试图通过分析定理证明的计算复杂度
    来找到 P 与 NP 之间的本质差异
    比方说
    证明一个数学定理可能需要指数级的尝试
    而验证证明只需要多项式时间
    这种不对称性可能是自然界的基本规律
    正如他在斯坦福大学的讲座中所说的
    如果 P=NP
    那么数学创造将失去意义 ,但是好在
    宇宙似乎更偏爱人类的创造力
    在访谈中
    陶哲轩与Fridman有几段对于数学家的精彩描述
    让我们更能够了解他们神秘的生活和精神状态
    首先是格里戈里・佩雷尔曼(Grigori Perelman)
    2006 年
    当它拒绝了菲尔兹奖和克莱研究所的百万奖金
    选择在圣彼得堡的森林中采集蘑菇的时候
    整个数学界为之震动
    他对庞加莱猜想的证明
    耗时七年闭门研究
    完全依赖传统的纸笔演算
    甚至拒绝使用电子邮件
    这种极端的孤独主义
    与陶哲轩的开放协作形成了鲜明对比
    陶哲轩对佩雷尔曼的选择
    表示了理解,他说
    每个数学家都有自己的认知节奏
    佩雷尔曼就像一个洞穴画家
    需要完全沉浸在自己的思维世界中
    才能捕捉到四维空间的几何轮廓
    而我更像一个城市规划师
    喜欢在不同的数学街区之间搭建桥梁
    这种多样性恰恰是数学进步的动力
    就好像有人负责凿开坚硬的理论岩层
    有人负责铺设连通的知识道路
    其次
    安德鲁・怀尔斯(Andrew Wiles)证明费马大定理的故事
    也是现代数学史上最具戏剧性的篇章
    他在阁楼中独自工作七年
    几乎耗尽了所有已知的数论工具
    最终在岩泽理论与模形式之间
    建立了前所未有的联系
    当陶哲轩在普林斯顿见到这位前辈的时候
    注意到他草稿纸上密密麻麻的计算痕迹
    那些被划掉的公式、重新开始的推导
    揭示了这项突破背后的艰辛
    陶哲轩说,怀尔斯的证明告诉我们
    有些数学高峰需要一代人的专注才能攀登
    但是现在的情况不同了
    我们有了Lean这样的登山装备
    有了全球协作的登山队
    这并不是要否定个人英雄主义
    而是要让更多的人能够参与到这场永无止境的攀登中来
    其实
    陶哲轩自己的研究风格也深受多元背景的影响
    他的父亲是儿科医生
    母亲是物理教师,妻子是电气工程师
    这种跨学科的家庭环境
    让他自然地将不同领域的思维模型相互迁移
    比方说
    他从妻子设计的集成电路中获得灵感
    在纳维-斯托克斯方程中构造 “能量隔离层”,
    还从父亲诊断病人的过程中
    学会了将复杂问题分解为可检验的子假设
    在加州大学洛杉矶分校的办公室里
    他的黑板上经常同时写着偏微分方程和机器学习公式
    这种看似混乱的思维碰撞
    实际则是刻意培养的 “认知流动性”。
    正如他在《跨界思维与数学创新》一文中所说
    当我们用流体力学的眼光来看数论
    用算法设计的思维来解几何
    数学的边界就会像融化的冰淇淋
    展现出全新的形态
    在AI技术浪潮席卷全球的背景下
    关于“人类何去何从”的讨论不绝于耳
    陶哲轩对此也有着自己深刻的思考
    他首先强调
    我们正在从个体英雄主义时代
    步入一个更加依赖于“集体智慧”的时代
    他以数学问答网站MathOverflow为例
    这个线上社区
    常常能够对极其艰深的问题
    给出惊人迅速且高质量的解答
    他评价道
    当基础设施和文化环境都健康的时候
    人类作为一个共同体
    所能达到的智慧、成熟和理性
    可以远超所有个体成员的总和
    作为一个整体的数学界
    它就是一个令人难以置信的超级智能实体
    这种集体智慧的涌现
    正是他对人类文明未来抱有希望的核心原因之一
    这为我们思考未来的AI系统提供了新的视角
    强大的智能或许并不体现在单一的、无所不能的“超级AI”上
    而是在于由无数AI Agent和人类专家组成的、能够高效协作的、类似蜂群一样的混合智能系统
    面对这样一个充满不确定性与巨大机遇的未来
    年轻人应如何装备自己呢?
    陶哲轩给出了自己的建议
    那就是专注在培养可迁移的核心技能上
    他警告说
    学习某一门特定的编程语言或者数学分支
    价值会随着工具的更新换代而衰减
    真正恒久不变、而且在人机协作中不可替代的
    是那些更根本的能力
    比如运用抽象概念进行推理的能力
    以及在面对全新未知问题时的解决能力
    这些更底层的能力
    是人类心智的基石
    无论未来的AI工具变得多么强大
    它们始终是驱动创新和解决复杂问题的核心
    他还对标准化教育提出了批评
    直言道
    进化并没有直接赋予人类大脑一个所谓的数学中心
    但是由于大脑的其他中枢足够精密
    以至于不同的人可以调用大脑的不同区域来处理数学
    比如有些人偏好视觉化思维
    有些人则偏好符号化和语言化思维
    但是标准化的教育模式
    可能会因为无法匹配个体的天生认知风格
    而过早地扼杀掉许多人对数学的兴趣
    在采访的最后
    当被问到 “数学是人类的发明还是发现” 时
    陶哲轩陷入了长时间的思考
    最终回答道,他倾向于认为
    数学真理是客观存在的
    就像等待被发掘的古代文明
    但是我们用来描述这些真理的语言和工具
    无疑是人类的发明
    AI 的出现
    让我们拥有了更强大的考古工具
    但是挖掘的方向、解读的意义
    仍然掌握在人类的手中
    这似乎也在呼应哥德尔不完备定理的启示
    数学永远存在无法被现有体系证明的真理
    而人类的使命
    就是不断扩展这个体系的边界
    回到故事的起点
    那个在澳大利亚地板上推演向量场的少年
    如今已成为了数学宇宙的领航者
    他的经历告诉我们,数学的魅力
    既在于黎曼假设的深邃神秘
    也在于挂谷问题的巧妙构造;
    既需要佩雷尔曼的孤独坚守
    也需要Polymath 项目的集体智慧
    也许
    当陶哲轩在 Lean 中输入最后一行的验证代码
    当 AlphaProof 在屏幕上生成新的证明路径
    我们不是见证人类的退场
    而是目睹一场更伟大的时代拉开序幕
    在这个时代
    人类的智慧与算法的力量相互赋能
    共同来书写宇宙最深刻的奥秘
    好了
    以上就是陶哲轩这次访谈的主要内容了
    建议大家有时间去看原视频
    感谢收看本期节目,我们下期再见

  • 【一席】刘汶蓉 :青年人的晚婚、不婚,是一种理性的选择,背后是婚姻价值的变革和纠结,以及在诸多结构性冲突中表现出的疲惫、拖延和无力感。

    大家好
    我叫刘汶蓉
    来自上海社会科学院社会学研究所
    一直从事家庭社会学研究
    非常高兴今天有机会来这里和大家分享
    我关于大城市青年人的婚恋趋势 困境
    和社会过程的研究和一些思考
    其实关于青年人结婚难
    以及结婚焦虑
    还有晚婚 不婚
    这一现象的讨论
    现在已经非常多了
    而我在这里希望跟大家分享的是
    带入我的代际关系研究
    把婚姻关系放在家庭这个场域中
    我们到底怎么来看待青年人现在这个问题呢
    青年人真的不再向往结婚
    也不再向往生育了吗
    首先我们来看一下宏观数据
    这张图描述的是我们国家的初婚年龄的趋势图
    在这里我想跟大家分享的是说
    中国人的结婚模式发生巨大变化
    是在2010年之后
    也就是说我们看到2010年之前的曲线
    还是相对于比较平滑
    2000年和2010年的时候
    我们看到是
    男女平均初婚年龄上升都只有0.7岁左右
    不到1岁
    但是在2010年到2020年这10年期间
    男性和女性的平均初婚年龄都上涨了4岁
    所以在曲线上发生了一个巨大的上扬
    在我2023年的调查中也发现
    北上广的青年人
    其实他们的理想结婚年龄已经到了31岁左右
    男女差别不大
    这个年龄已经和全球生育低洼的
    日本和韩国非常接近
    我们都知道中国的生育率一直在持续下降
    而这张图我想跟大家分享的是
    为什么我们的生育政策的调整
    未能起到预期的激励效果
    我们来看一下这里
    两孩政策三次调整的时候
    我们看到每一年出台之后
    都发生了生育率的上扬的一个效应
    但是到了2021年三孩政策出台的时候
    我们的生育率是没有上扬的效应
    一直下滑
    这背后其实是一种世代的更迭的效应
    也就是说两孩政策的出台
    作用对象是70后这一群人
    70后大多数都处在婚姻状态
    也有一定的生育意愿
    但是到了三孩政策出台的时候
    70后这一群已经过了生育年龄
    而它可能发生作用的对象是80后和90后
    但是80后和90后
    显然他的结婚都可能还没有进入
    那么在东亚社会
    我们的生育和结婚是密切挂钩的
    连婚姻都没有进入
    我们怎么生孩子呢
    所以这是反映了青年人
    在结婚上面的一种巨大的变化
    一些调查数据也反映
    我们的生育率下降不是二孩的低
    而是一孩就非常低
    那么在宏观数据上的这种
    青年人的晚婚和不婚
    在微观上具体的父母怎么看待呢
    在我的调查中
    父母说得最多的话就是
    他们懒
    这两个案例是说
    成功的父亲都不能理解
    自己有稳定和体面工作的儿子
    为什么在周末
    宁愿在家里弹琴 做咖啡
    甚至和自己喝酒
    也不出去找女朋友 恋爱
    那么他们表达得最多是说
    可能他们价值观出了问题
    那么这种价值观在他们看来
    主要是没有进取心
    他们安于现在这种比较舒适的生活方式
    那么是不是真的是因为懒呢
    我的调查发现
    确实青年人的价值观已经发生了巨大的变化
    最重要的是他们对于如何看待结婚这件事情
    已经发生了变化
    结婚不再是人生的必经之途
    我对北上广的2023年的调查发现
    青年人
    特别是青年女性
    她对于“结婚是个人选择,结不结都可以”
    这个认同率已经超过了八成
    而对于“结婚总比单身好”的认可率只有10%
    也就是说青年女性
    她似乎不再把婚姻
    视作人生幸福的一种必然归宿
    也反映出婚姻这个制度
    对女性来说的吸引力似乎更低
    我们这个数据和90年代的欧美的一些调查
    非常接近
    那么我们国家是否也会像欧美那样
    进入一种亲密关系多元化的一个时代
    也就是后现代家庭的时代呢
    我的答案大概是不会
    而且这幅图景肯定不会那么简单
    因为在我的调查中
    我发现了很多和家庭现代化理论
    预设相不一致的一些结果
    首先我们看到的似乎是
    未婚青年对婚姻中的爱情的期待在下降
    这个指标是说
    如果对方符合您的择偶标准
    但是您还没有爱上他
    你会和他结婚吗
    我们看到上海的数据是说
    在2001年答“会”的女性只有8%
    而到了2023年已经到了23.6%
    男女都有超过两成的人明确说
    我会和这样的人结婚
    而在90年代美国的青年人当中
    答“会”的只有2%的男性和13%的女性
    而他们几乎非常鲜明的八成的人是说我不会
    而中国人的回答显然会模糊得很多
    也就是说我们对于爱情和婚姻的关系
    显然和西方有不一样的理解
    这个指标是说“谈恋爱和结婚是两回事”
    有多少认可度
    我们看到2001年上海的未婚青年
    非常同意的比率是在6%左右
    而到了2023年
    这个比例大幅上扬到了四成以上
    女性到了46.5%
    也就是说曾经我们把
    谈恋爱和结婚是紧密挂钩的
    当时我们流行的一句话是说
    不以结婚为目标的恋爱是耍流氓
    但是到了今天
    似乎年轻人不这么想
    非常清晰地认为
    恋爱是恋爱
    结婚是另一回事
    而另外我的指标还发现了一个
    出乎我预期的一个结果
    也就是说青年人似乎更接受父母对婚姻的介入
    在婚恋决策中更重视父母和亲友的态度
    在这个指标中说
    我所爱的人,即使父母亲友都反对
    我也不在乎
    也就是八九十年代的青年人是说
    我为了爱情反叛家庭
    是一种自我个性的宣扬这样一个指标
    但是我们看到的是说
    和2001年相比
    我们现在不认同这个态度的比例在大大上升
    而上海的未婚青年女性
    有五成的女性都反对这个观点
    说明她们认可父母介入他们的婚姻
    认为自己如果得不到父母的祝福的婚姻
    是不可能继续的
    另外一个指标也超乎我预期的是说
    在10个理想结婚对象的条件中
    认为“对方父母通情达理 好相处”
    排在了第三
    相当靠前
    也就青年人开始主动把自己的婚姻
    认为是要和对方父母相处的
    是要考量对方父母是不是和我合得来
    在我的调查个案中
    甚至还有一些青年人会主动提到了
    新包办婚姻这个词
    这个上海的盛小姐她说
    包办也不是那么绝对了
    有点夸张
    但是也是可以自由的
    只是这个自由是在父母的
    一个大安排的大范围下的自由
    她说父母已经帮你筛了
    那些能够顺利结婚和长长久久的
    都是父母介绍的
    而她身边25岁左右能够结婚的
    也都是父母介绍的
    在她的大学里只有两对是自由恋爱
    但是这两对非常艰难
    所以在她看来
    如果接受父母的包办或者父母的安排
    是一种比较理性的选择
    这个结果也和我们社会学很多调查结果相近
    一项关于长三角的调查显示
    江浙沪地区有将近两成的婚姻是父母介绍的
    而且由于青年人接受父母的介绍这样的形式
    形成了同质婚
    以及防止江浙沪的独生女儿下嫁
    这样一个婚姻模式
    而我的2023年的数据也显示
    父母亲属介绍的比例
    是要高于2001年的调查结果的
    特别是在结婚伴侣的介绍上
    更多地依赖于父母和亲友
    比恋爱伴侣要高
    恋爱伴侣中朋友介绍的可能还比较多
    但是在婚姻伴侣中
    更多的是亲属介绍
    这个结果其实我们也不难理解
    因为现在的年轻人几乎没有人可以跟我说
    依靠他独自的力量
    就可以在大城市过上体面的生活
    从结婚前的买房
    到结婚后的带孩子
    都离不开父母的帮助
    所以在我们90年代社会学的调查中发现
    中国90年代的时候基本上就已经实现了
    青年人的婚恋自主
    但是到了21世纪我们看到的是
    父母的介入似乎又在上升
    那这种现象意味着什么
    我们背后看到的是青年人的一种无力感
    比如说在这个指标中
    您对自己能否找到
    满意的结婚对象(信心如何)的时候
    我们看到的是
    北上广有四成左右的青年人是没有信心的
    这个表里面显示的是
    上海的30岁及以下未婚的青年
    特别是上海的未婚女性
    有将近五成都没有明确地表达自己有信心
    而我的调查数据还发现
    婚恋信心和青年人自己的心理健康是显著相关的
    那些表达没有信心的青年人
    往往也表现了更低的自我效能感和自我评价
    所以我用懒婚这个概念
    更想是强调大城市青年人的晚婚不婚
    是出于一种理性的选择
    而且背后它是关于婚姻的价值的一种变革和纠结
    以及在诸多结构性冲突中
    表现出的一种疲惫 拖延和无力感
    那青年人为什么会懒婚呢
    这个案例比较有代表性
    小汤她在30岁还没有男朋友的时候
    她的母亲非常焦虑
    经常和她发生冲突
    而在她看来
    母亲完全不理解她
    她很委屈
    她说我平时上班就很累了
    我每个周末还要花时间
    和一个陌生人见面
    真的很费神
    她说还不要说在见面之前做那么多的铺垫
    微信上的联络要花多少心思
    我与其用这些时间和精力
    花在没什么结果的相亲上
    不如花在工作上
    工作上取得的进步
    给我带来的成就感
    远远要大于一次又一次的无果的相亲
    这是很多青年人表达的一种方式
    那么为什么这个时代青年人
    更愿意优先投资自己呢
    为什么职业身份比婚姻身份
    对他们的吸引力更大呢
    我总结了三个力量
    拉力 推力和拖力来分析这个现象
    拉力最重要的是社会的个体化
    这也是现代化进程中
    推动的社会的一个结构性力量
    而在个体化的背景下
    我们的教育制度
    我们的生活方式
    都是以一种
    自我导向和自我实现的价值观在驱动的
    很多青年女性在跟我表达时说
    我从小就非常努力地要实现自己的价值
    这是我受到的教育
    我的母亲
    包括我的父亲也是这样教育我
    但是当我离开了学校
    我就要变成另外一种选择
    我的母亲开始告诉我
    要我改变
    要变得更加地弱小
    要去结婚
    要去做一个母亲
    这种价值观对我来说形成一个很大的冲击
    另外一个能够支持他们努力的
    只要挣钱就能过好这样一个状态
    是消费主义
    他们从小的经验告诉他们
    只要有钱
    什么都能搞定
    甚至现在发展的单身经济
    也支持了他们这样的一种生活方式
    不仅是物质条件可以
    想要的想穿的想吃的都可以花钱来买
    而且他们的情感也可以通过经济来购买
    包括现在的情感消费的兴起
    以及AI恋人
    虚拟恋爱
    包括coser委托等等的发展
    都弥补了他们的情感上的空缺
    另外一个推力也是婚姻的风险化的状态
    一个非常有代表性的说法是
    结婚不再是跳跳脚就能够到的事情
    实际上在任何一个时代
    结婚对个人和对家庭来说都是一件大事
    也都是比较费力的
    但是这个时代似乎这个gap变得非常大
    首先是择偶标准在提高
    每个人都在为自己
    在婚姻市场上的形象和条件担忧
    另一个是恋爱成本在提高
    一个非常有趣的话语是说
    一位儿子跟他的父亲说
    我为什么要花自己的钱养别人的老婆
    这是他不愿意出去相亲
    或者谈恋爱的一个理由
    他父亲刚刚听到这句话非常不解
    我也很吃惊
    但是仔细分析又觉得还蛮有道理的
    因为在男性买单的恋爱文化当中
    男性他不得不算
    在大城市如此消费之高的成本之下
    我一次又一次地投入没有结果
    是为了什么
    是一件非常不划算的事情
    所以他们仔细衡量
    是不太轻易迈出这个脚
    去投入这个成本的
    另一个是协商成本也非常高
    当独生子女家庭
    不管是独生儿子还是独生女儿
    两家在江浙沪都有一定的经济条件的时候
    他们的协商
    不管是买房
    然后到买什么样的房子
    买什么样的车子
    以及到生几个小孩
    跟谁姓
    然后到后面养老
    谁养谁的父母
    怎么安排
    都是需要协商的
    所以在江浙沪有两头婚的这样一个现象
    也就是说男不娶女不嫁
    我们虽然结婚了
    但我还主要是和我的原生家庭
    要形成一个支持和互助的网络
    我们生两个孩子
    我们各自养各自的父母
    另外一个有代表性的说法是说
    以前一个人过日子难
    现在是一家人过日子难
    一个人过日子
    在当时
    我只有结了婚
    我才可能单位有一个房子
    我只有靠两个人的工资
    才有可能过下去
    养一个孩子
    但是到了现在
    在大城市
    可能我一个人有一份比较好的收入
    我可以自己过得很潇洒
    但我如果要买房子 结婚 生孩子 养孩子
    这个是非常艰难
    不可想象的困难
    在很多年轻人看来
    另外青年人一个很大的表达是说
    我自己都过得很艰难了
    我为什么还要生一个孩子
    把他带到这个世界上来受苦呢
    这种话语的背后是
    中国的亲子一体的文化
    和代际之间无限的责任
    把孩子的幸福终身都和自己挂钩的责任感
    深深地压迫在他们的身上
    他们一想到这个巨大的压力就很无力
    另一个就是婚姻的不稳定
    也就是你结了婚也没有保障可以一直过到头
    一些人跟我讲
    她说她的妈妈最近不催婚了
    是因为她的闺蜜已经离婚了
    所以她妈妈已经看到说
    婚姻确实没有那么靠谱
    那么有保障
    另外一个拖力是我想讲的代际关系
    代际关系在中国它既是一种支持也是一种束缚
    对于中国人来说
    只要孩子不结婚
    他就一直是孩子
    我一直会照料他的日常生活
    他没有钱的时候
    只要打一个电话
    我一定会给他给
    因为我害怕他出事
    他出的任何风险
    在父母看来
    都是不能承担的风险
    所以我要保障他
    所以不管父母怎么样推他去结婚
    其实在很多孩子来说
    他没有太大的动力
    我一定要建立自己的生活网络
    我因为有父母
    所以很多年轻人他会衡量
    如果我的结婚对象跟我合在一起
    不能让我过上更好的物质生活
    我就没有必要往前迈这一步
    男女都在做这个计算
    而支持的另一面
    代际关系给予支持的另一面
    它其实是一种隐性的掌控
    也就是我们现在的
    特别是大城市的中产阶级的父母
    对孩子的亲密亲职
    让孩子没有感受到非常大的压迫感
    这种隐秘的操控让他们也没有动力
    走出这个家庭
    走出自己的舒适圈
    去寻找和建立自己的社会网络
    另一个原生家庭的影响是说
    没有好的婚姻模板
    在我的那些迟迟不肯结婚
    或者说不能维持稳定的恋爱关系的青年人
    跟我讲述得最多的就是
    他们在父母的婚姻中
    看不到美好和幸福的影子
    在曾经普婚和早婚的年代
    由于婚姻嫁娶的规范非常强大
    所以人们还来不及处理
    原生家庭给自己造成的这些创伤
    就走入了婚姻
    但是到了晚婚和个体选择变多的时代
    今天青年人可能在进入婚姻前
    必须诚实地面对和处理
    自己内心深处这些隐藏的伤痛
    这个过程就必然造成年轻人
    在迈向人生结婚这个阶段
    变得迟疑和犹豫
    我和我的学生做了一个网络文学的分析
    我们发现
    青年人理想的婚恋模式
    倾心于一种纯粹的关系
    他们更期待的是平等的
    指向心理回报和自我成长的一种关系
    他们非常渴望被无条件地接纳和爱
    但是自己又没有力量
    去无条件地接纳和爱别人
    谁都不愿意先迈出那一步
    所以当爱情在现实世界无法落地的时候
    青年人当决心把他的爱
    永远留在虚拟世界的时候
    在现实世界中就一心搞钱
    所以他们看不到在现实世界中
    进入婚姻的意义
    这样我把懒婚
    也就青年人一边焦虑一边躺平的
    这样一个状态
    其实是因为结婚变得非常困难这件事儿
    加上了他们觉得现实的结婚又没有什么意义
    但是还有一个有趣的发现
    就说青年人把自己对无条件爱的渴望
    似乎又转向了父母
    这个时代的年轻人
    对父母的期待非常之高
    我2023年上海的调查数据比较发现
    青年人对与父母关系的满意度在下降
    比2001年显著下降
    这是出乎我的意料的
    因为这个阶段应该说父母对待孩子的态度
    养育投入都在更多
    都在变好
    但为什么子女的评价会降低呢
    其实我的反思是说
    青年人的期待在变高
    我们看到的是说
    在中国的社会转型中
    中国的家庭制度保持了强大的韧性
    帮个人度过了快速的社会的转型
    经济的危机
    等等一切
    但同时代际轴也承载了过大的压力
    包括工具性支持
    经济支持
    以及情感支持
    还有劳务支持
    都压在了子女和父母身上
    我们的家庭似乎有点
    代际轴变得重负不堪
    也反映了青年人的社会网络
    和社会发展空间的一种逼仄
    所以作为时代症候的一种镜像
    我认为懒婚在一定程度上
    反映了当下青年人发展的一种困境
    事实上这种困境也是全球性的
    我们先来看
    在我们社会学和心理学上有一个概念
    叫做成年初显期
    这是阿尼特在2000年正式提出的
    也就是他的研究发现
    进入21世纪以后
    人在从青春期到成年期中间
    出现了一个非常明确的过渡阶段
    对于那些经济发展越好
    以及福利程度越高的国家
    这个阶段越长
    有的是从20到25岁
    有的25岁到30岁
    甚至35岁
    而这个漫长过渡期
    最大的一个特征就是不稳定
    我的职业身份不稳定
    我的亲密关系不稳定
    我的父母身份没有
    其实它反映的是一种生理的成熟年龄
    和社会成熟的一种脱节和断裂
    因此也造成了一种四分之一人生危机
    也就说在这个时候
    你会表现出一种焦虑
    迷茫
    不确定性
    孤独
    甚至自我怀疑
    另一个值得说明的是
    婚姻它并不仅仅是一个价值观的问题
    它甚至成为了一个社会分层的指标
    因为在社会分化程度越高的社会里
    婚姻市场的竞争压力就越大
    婚姻资源总是会向优势群体集中
    那些性格内向
    不擅长交际
    缺乏颜值 金钱 地位等光环加持的青年人
    则面临着巨大的婚恋挤压
    另一个需要说的是
    其实在全球经济低迷的当下
    全世界的青年人可能都面临着一个难题
    就是他们难以依靠自己的努力
    超越父母的社会经济地位
    这个压力对他们来说非常之大
    而他们能否顺利地度过四分之一人生危机
    很大程度上取决于父母能给到多少支持
    而在中国的家庭主义传统之下
    紧密的代际支持
    其实是扮演了非常重要的角色
    极大地缓解了在我们社会转型过程中
    出现的青年贫困问题
    以及相关的经济贫困和社会问题
    但同时我们可能青年人
    也面临着更严峻的关系贫困问题
    在整个东亚的儒家文化圈我们都看到
    我们普遍缺乏与陌生人交往
    积极营造社区
    和建立个人支持网络的这种文化习性
    我们习惯的是躺在
    血缘和先赋的责任义务网络当中
    我记得在2015年左右
    同时出现了这样两本书
    一本叫《单身社会》
    一本叫《无缘社会》
    《单身社会》是在讲述个体主义文化下
    那些不结婚的人积极地投入社会的建设
    积极地建立自己的社交网络
    创造了更有活力的社会
    而日本的那些
    曾经在80年代经济繁荣的过程中
    在摇摆不定 观望之中
    滑入了终身不婚的这一群人
    到了四五十甚至六十岁
    当他的父母去世以后
    这个世界上似乎只有他
    而当他去世之后
    就变成了无缘死
    然后造成了巨大的社会悲剧和社会灾难
    成为一个社会问题
    当时这本书也是给我很大的一个震惊
    我们要反思的是
    在现代化的进程中
    我们的价值观可能一直往前推进
    会造成什么
    中国的社会到底会怎么样
    我们不知道
    我们的文化会断裂吗
    我们会发生像日本那样的悲剧吗
    不一定
    但是我们到底会怎样
    如今不管是东亚圈
    或者中国
    很多社会政策似乎都显得非常无力
    在促进青年人婚育这件事情上
    在我看来更多的是因为
    他们没有关照到青年人的生命体验
    没有出现一个让青年人能够接纳的
    新的婚姻家庭文化脚本
    但是文化总是在变动中传承的
    每一代人都会看到上一代人
    在上一代人的经验上
    来调整自己的人生规划
    总结上一代人的人生经验
    寻找自己的路
    就像戈尔丁在她的那本书里分享
    百年的
    美国女性的
    受过高等教育美国女性的人生规划一样
    从最早的只要要家庭就没有事业
    到后面要工作没有孩子
    到现在我们既要工作又要家庭
    虽然不完美
    做得非常挣扎
    但是她们都在不断地努力
    在寻找自己的方向
    我觉得中国的青年人也一样
    我希望可能每一代人在将自己的人生处境
    放在更宏大的结构中去理解的时候
    我们可能更有力量去行动
    也有可能找到更多的方向
    或者青年人本身只有迈出自己的脚步
    才能寻找到
    自己探索出一种新的婚姻文化脚本
    谢谢大家

  • 「為什麼中國必須封掉 Google?」20 分鐘拆解 GFW 黑歷史|YouTube 搜索 Gmail 都難逃|左耳故事

    大家好欢迎来到左耳故事
    大家先想一下
    过年给人拜年
    结果收到了2万多条同一个字“滚”
    是什么画面
    这不是开玩笑
    是2012年春节前夕
    北京邮电大学校长
    外号“中国防火墙之父”的方滨兴
    就在微博上遭遇了这事
    老方平时是不敢发微博的
    因为他发一发微博
    他知道自己肯定会挨骂
    但是当年 不是出了一个
    薄熙来和王立军的事件吗
    方滨兴曾于2011年12月
    邀请王立军担任北邮客座教授
    并称赞王立军是
    “铁血警魂,学术专家” 等
    笑死 从这也能看出
    方滨兴不是什么东西
    是没有道德情操
    只懂得攀附权势的一个人
    就这样在2012年4月25日的时候
    纽约时报的报道中提到了
    方滨兴可能受到薄王事件的牵连
    4月26日 方滨兴吓得
    赶紧现身媒体来澄清一下
    并表示要追究这些媒体造假的责任
    所以这次老方发微博
    也是想表示自己还活着
    没有被抓起来
    但是他不敢开评论
    关掉了评论区
    但是网民们有办法啊
    网民们转发
    每转发一次就在后面贴一个滚字
    短短48小时之内
    评论区就被“滚滚滚”刷到刷屏
    很多作家和学者也跟着吐槽
    还给他写了一副对联
    上联是:半生赢得千夫指
    下联是:一世修来粪土名
    老方这算是遗臭万年了
    为什么这么多人恨这位方校长呢
    简单的一句话说就是
    是他主持的中国的网络防火墙
    把中国的互联网变成了局域网
    直到今天 中国大陆的
    互联网还是个局域网
    大陆人民真惨
    于是网友的“滚”字
    就成了对封网的最大吐槽
    今天我们就把镜头从
    方滨兴往后拉
    看一下防火墙背后最轰动的一件大案
    Google被封的全过程啊
    大家知道 在2000年代初的时候
    Google作为全球最大的搜索引擎
    是人们获取信息的主要入口
    然而中国大陆的
    互联网生态自诞生之日起
    就带有浓重的管控色彩
    中国政府以“主权”和“稳定”为由
    对网络内容实行严格的审查
    对一些政治敏感话题和一些异见言论
    这些内容一概都在封锁之列啊
    在这样的背景下
    任何未经过过滤的搜索引擎
    都会被视为潜在的威胁啊
    因为通过它
    人们就可以接触到
    政府当局所忌讳的真相
    Google进入中国市场后
    也不可避免的撞上了这面高墙
    双方围绕着信息审查
    展开了一系列的博弈啊
    第一件有名的事情发生在2002年
    2002年的9月份
    Google网站在中国的大陆
    第一次被全面封禁
    当时中国官方也没有做出任何解释啊
    但毫无疑问
    这封锁是与政治敏感内容有关的
    通过Google能搜到一些
    对中国的领导非常不利的网站
    令当局非常恼火
    当时正是中共十六大前期
    官方为了控制舆论
    就暂时的封锁了Google
    许多中国网友
    突然无法使用Google
    当时用Google的主要是学术界人士
    他们对没法上Google查资料
    都感到强烈不满
    最终迫使政府解封了网站
    这次封锁可以看作中国政府
    针对外国搜索引擎的一次试探
    虽然后面Google的服务被恢复了
    但是中国官方已经释放出信号了
    不受控的搜索引擎
    在政治上是不可以接受的
    在这之后Google在中国的
    服务就一直是不稳定
    有时候能上去
    有时候上不去
    为了更好的进入中国市场呢
    Google做出了一个备受争议的决定
    就是准备接受审查
    所以在2006年4月的时候
    Google正式在中国成立了一个子公司
    也就是Google中国
    域名是google.cn
    但作为交换
    Google必须要对搜索的结果
    进行过滤审查
    这一做法
    在当时引发了很广泛的关注
    尤其是很多西方舆论和人权组织
    都在谴责Google帮着中国政府协助审查
    违背了互联网的自由原则
    而且Google的员工和高管
    对这一折中也也很矛盾
    因为这有违公司的信条
    Google的信条是Don’t be evil
    不作恶 帮助审查言论
    不让大众获取到真实的信息
    其实这也算是一种为虎作伥吧
    尤其是Google当时的联合创始人
    是谢尔盖·布林
    他出身于前苏联
    是对集权审查有亲身体验
    切身记忆的人
    他自己对中国政府的审查制度
    从内心就感到非常的抵触
    但即使如此
    为了商业
    Google还是做出了妥协
    在2006年 Google中国艰难的上线了
    并一度占据了三成的中国搜索市场
    在此后的三四年里
    Google中国一直在审查的红线内运营啊
    提供经过过滤的搜索服务
    同时也试图保留一些底线
    比如说中国政府要求Google
    提供用户的搜索记录
    但是Google拒绝啊
    但这段关系终究是
    难以长久的
    因为中国政府的要求会越来越多
    根据维基解密的一份文件
    在2009年的时候
    中国的政治局常委
    有一个主管宣传的叫李长春
    他有一次在Google中输入自己的名字
    搜索了一下
    发现很多批评他的内容
    然后他就气炸了
    于是他就把google.com
    定义为非法的网站
    并要求Google在
    google.cn的主页上
    删除google.com的链接
    2009年5月14日的时候
    Google中国的总裁李开复
    接到了美国大使馆的电话
    他说李长春怒了
    亲自要求Google把
    google.cn首页上那个
    通往未审查版的
    google.com的链接去掉
    Google不愿意
    因为那是给用户的一个出口
    政府的报复动作接着就来了
    李长春就让三大运营商
    停掉跟Google的合作
    大家都知道 中国大陆
    只有三家运营商
    电信 移动和联通
    没有这三家运营商之后
    基本上你就没法
    展开互联网相关的业务
    李开复一开始想找
    美国这边的政府相关的人员
    来帮忙谈判一下
    但是中国这边的情况就是
    只要有个高官开口了
    不高兴了
    就是没得谈
    除非你答应他的所有的要求
    李长春为什么那么在意
    除了面子
    还有他在河南当书记时
    搞出的卖血浆
    导致了艾滋病泛滥的丑闻
    当年的宣传口号是
    “要想奔小康,赶紧卖血浆”
    这段黑历史
    在Google上也能搜索到大量的资料
    他当然不想让国内的人看到这些东西
    总之一句话
    领导人自搜不爽 就要全国断网
    最终在2010年的时候
    Google决定退出中国市场
    是怎么回事呢
    在2009年年底的时候
    Google发现自家被
    一波中国IP的黑客攻击了
    这次代号为奥罗拉行动的网络攻击
    不仅窃取了Google的知识产权
    还入侵了数十位
    中国人权活动人士的邮箱
    很显然这与中国的官方是有关系的
    Google的高层终于火了
    2010年1月12日的时候
    Google的官方博客发表了一份声明
    这份声明叫新的中国策略
    Google表示将不再配合
    中国的审查要求了
    并考虑取消掉google.cn的内容过滤
    该声明中说
    出于黑客攻击和审查制度等原因
    公司不再愿意继续审查
    中国版的搜索结果
    否则就关闭在华业务
    这一宣称被视为
    Google对中共审查制度的公开挑战
    也是跨国科技公司
    第一次强硬的对中国政府说不
    很明显谈判是不会有什么结果的
    结局很快就来了
    2010年的3月23日
    Google正式关闭了
    google.cn网站的搜索服务
    将所有的搜索
    全部重定向到香港的Google域名
    通过设在香港的服务器
    Google向大陆用户
    提供未经审查的搜索结果
    这一举动标志着
    Google彻底退出了中国大陆市场
    不再接受审查
    不再受中国法律的管辖
    北京当局对此举表示强烈的不满
    指责Google违背承诺
    并将商业问题政治化
    其实不是Google违背承诺啊
    因为在建立Google中国的时候
    Google要向中国政府
    申请相关的运营许可
    申请的时候都是有相关文件的
    Google当时已经在文件里
    提出了三点要求
    一是不向中国政府
    透露用户信息或搜索记录
    二是当搜索结果被删减时
    会标注相关的通知
    三是在Google中国的网页上
    留一个不受审查的google.com的链接
    既然中国政府向Google发放了
    相关的运营许可证
    也就是说他已经
    对上述三个原则默许了
    但是后来李长春又想增加一些要求
    而且还命令三大运营商
    打压Google的经营
    明眼人一眼就能看出
    到底是谁违背了承诺
    而且将商业问题政治化
    这不是Google的做法
    Google只是如实的显示
    互联网上已经存在的信息
    他又不制造假消息
    就算有假消息也不是Google制造的
    他只是一个搜索引擎
    人家只是一家商业公司
    是谁在政治化也不言自明啊
    也就是从2010年开始
    普通用户就只能通过一些其他的手段
    来访问Google了
    最有意思的是
    早在1月
    Google宣布可能退出的时候
    就有大批的网友前往Google北京办事处
    献花致意啊
    感谢Google坚持原则
    保安甚至一度声称献花需要审批
    未获审批的献花属于非法献花
    然后引起了网友的嘲讽啊
    “非法献花”也成为
    当时网络上著名的黑色幽默的词汇
    象征着言论环境的荒诞
    3月份Google正式关停了大陆搜索
    越来越多的市民都聚到Google公司门口
    留下鲜花与卡片
    大家都在感谢Google
    将人权置于利益之上
    仿佛一场静默的送别仪式
    大家都知道
    Google除了搜索服务
    还有YouTube、Gmail
    Google play 等其他服务
    其实早在2007年10月份的时
    候YouTube在十七大期间
    就被短暂封闭过一段时间
    在2008年的3月份拉萨314事件后
    再次被封了一周
    但后来还是恢复了
    2009年的3月24日
    YouTube被永久下线啊
    起因是YouTube出现了一个
    武警殴打西藏僧侣的视频
    就是以这个视频为契机
    中国把YouTube给完全给封掉了
    直到今天都是没办法访问的
    Google退出大陆市场之后
    当时仍有部分服务在中国是可用的
    但是形势每况愈下
    2014年的时候
    被视为Google最后据点之一的Gmail邮箱
    也被封了
    而且在当年
    Google的搜索、YouTube
    Gmail、地图、Google play
    等所有的Google服务
    几乎在大陆都无法访问
    面对媒体关于Gmail被封的询问
    中国外交部的发言人称此事“不知情”
    次日环球时报发表社论
    如果封锁Gmail
    是出于国家网络安全的考虑
    那么公众应予以接受
    并强调中国会一直保持开放姿态
    欢迎包括Google在内的
    西方公司来华经营
    但前提是遵守中国的法律政策
    言下之意很明显
    要么要顺从中国的审查
    要么就滚出中国
    自此之后
    Google几乎所有的产品
    在大陆都被封禁了
    普通网民若想访问
    就只能够翻墙绕过审查
    可以说 2014年
    标志着Google服务
    与中国大陆用户全面告别
    昔日全球最大的信息入口
    从此在中国消失
    中国的互联网
    也彻底的变成了一个局域网
    后面还有一件有趣的事
    2018年的时候
    Google被曝正在秘密
    研发一款代号蜻蜓计划
    的审查版搜索引擎
    试图重新打入中国市场
    当时这个报道一出来
    舆论立刻就炸了
    包括Google的内部人士
    和社会舆论都炸了
    人们在质疑
    Google是不是要为了商业利益
    再次牺牲原则
    中国政府倒是很满意
    2018年8月份的时候
    人民日报在推特上和脸书上
    都发表贴文
    回应Google可能回归的消息
    全文称欢迎Google回归中国大陆
    但前提条件是
    必须遵守中国法律的要求
    而且还不忘宣称中国现在非常的开放
    未来会更加开放
    但潜台词是“服从审查才叫开放”
    但是Google内部的员工和民间的社会
    都不愿意了
    超过1000名的Google员工
    联名发表公开信
    要求公司立刻取消蜻蜓计划
    拒绝与审查和监视为伍
    同时国际上也有很多人权组织
    也发起了抗议
    11月的时候
    国际特赦组织的活动者
    在Google位于欧洲的办公室
    放飞了一个巨大的彩色蜻蜓气球
    并拉起横幅
    横幅上写着Google别在中国审查
    拒绝蜻蜓计划等字样
    最终这场拉锯战以Google让步告终
    蜻蜓计划被取消
    Google重返中国的计划再度流产
    在这之后
    Google在华的一些边缘的服务
    也都相继被关停了
    比如说Google翻译服务
    还有Google地图的域名服务等等
    Google与中国互联网的联系
    几乎彻底切断
    曾经那个熟悉的多彩的LOGO ——
    Google
    也只能在翻墙后的网络彼端相见了
    好了说了一下Google被封的整段历史
    中国政府的立场很明确
    中共要求对搜索引擎
    实施全面的内容审查
    过滤掉任何被视为
    不稳定或不适宜的信息
    这不仅包括色情暴力等
    通常意义上的不良内容
    也囊括了大量政治和思想领域的禁区
    诸如民主运动、政府丑闻
    人权维权人士乃至于历史真相
    这些都不能搜索
    这些关键词在中国官方的眼中
    都属于敏感信息
    一旦放任传播
    可能会挑战执政党
    对历史和现实叙述的垄断
    所谓的“国家安全”和“社会稳定”
    被反复强调为审查合理性的依据
    但是值得注意的是
    这些泛泛的名目下
    往往隐藏着具体的政治动机
    中国政府深知
    开放的搜索引擎
    意味着民众有机会
    接触未经过滤的全球信息
    这是非常不利于他们
    制造单一的舆论环境体制的
    Google方面的立场
    则植根于公司文化
    和普世的互联网价值
    Google的官方使命是整合全球信息
    使人人皆可访问 并从中受益
    这与审查制度天然是冲突的
    归根结底
    中国要求的审查意味着
    搜索引擎不再是一个中立的信息工具
    而要成为官方意识形态的工具
    在中国Google不是被市场打败
    而是被体制排斥
    那么针对Google被封这件事
    大家是怎么看的呢
    首先从中国民间网民的角度来看
    Google的退出让不少人
    感到遗憾 甚至愤慨
    大家都把Google
    视为获取真相的重要渠道
    但是现在没办法用了
    有人感叹 之后上网的孩子
    再也没有机会认识Google了
    事实也确实是这样
    中国的新生代网民
    很多只知道本土的 百度 微信
    却从来没有上过 Google YouTube
    在严密的信息过滤下
    一代人对外部世界的了解
    被局限在官方许可的范围内
    有很多人翻墙出来后
    才震惊的发现
    国外搜索引擎
    能查到如此丰富的资料和异见观点
    从而反思自己过去受到的信息封闭
    有的人一下子没法接受这么多
    和过去自己不一样的信息
    于是就开始骗自己
    外面的信息都是假的
    外面的世界很危险
    翻墙用户的亲身经历
    不断的佐证着一个事实
    就是审查制度的信息茧房
    正在塑造和扭曲人们的认知
    失去了自由选择和获取信息的权利
    我们还如何获知真相
    不过民间的声音也不都是一边倒的
    同样也存在一些
    小粉红和官方的支持者
    对Google的离开持无所谓
    甚至幸灾乐祸的态度
    在他们看来
    Google不肯遵守中国法律
    走了就走了
    中国有百度 不需要Google
    官方的媒体也在积极引导这种情绪
    像环球时报这些官媒都发表文章
    强调中国互联网的自主可控性
    淡化封禁Google的影响
    称国内已经有良好的替代品了
    有一部分被洗脑严重的网民
    也跟随这种论调
    指责Google不尊重中国
    认为被封建是自找的
    但这些看法这些声音
    往往都是与当局的宣传同频
    很难说是出自于理性思考和独立思考
    大部分都是被洗脑了
    相比之下真正切身感受到
    不便和损失的
    还是普通用户自己
    在海外华人 香港 台湾这些华语圈中
    Google被封一事
    更是引发了强烈的批判和共鸣
    许多身在墙外的华人
    对此表示愤慨
    痛斥中共当局为了一己之权利
    不惜剥夺全民获取知识的权利
    香港和台湾的媒体
    也做了大量的报道和评论
    一些评论指出
    Google的离开象征着
    中国向信息封闭倒退了一大步
    也敲响了对言论自由更大打击的警钟
    人权组织和新闻自由倡议
    纷纷发表声明
    谴责中国的网络审查
    认为中国政府无法容忍
    Google这样一个客观搜索工具
    其本质是对真相和普世价值的恐惧
    Google之所以被封
    是因为它代表了自由互联网的理念
    而这样的理念在一个集权体制下
    是无法生存的
    最后总结一下
    从2000年初尝试屏蔽Google
    到2010年Google决定退出中国
    再到2014年后全面封禁Google全线服务
    这一系列事件折射出
    中国大陆互联网政策的核心逻辑
    以信息封锁来巩固统治
    以真相黑洞来重塑现实
    Google之所以在中国大陆成为禁忌
    不是因为他有多么犯规
    而恰恰是因为他试图连接一个更广阔
    更真实的世界
    对于一个高度不安
    且渴求控制的体制而言
    Google所提供的自由搜索和全球信息
    意味着不可控的风险
    这种对真相的恐惧
    使得一个简单的搜索框
    都被赋予了颠覆的色彩
    封建Google的荒谬性在于
    它清楚的告诉世人
    这个体制容不下一家搜索引擎
    更容不下搜索引擎背后的真相
    那束在Google门前被称作“非法”的鲜花
    讽刺的说明了一个问题
    在一个正常的社会
    给心仪的公司献花
    怎么会非法呢
    但是在中国 这就是非法的
    在中国当真相本身被视为威胁时
    表达支持真相的行为
    也自然的被扣上非法的帽子
    Google的离去
    令中国互联网更加封闭了
    本土公司在审查高压下
    成为了官方意志的延伸
    整个网络空间
    呈现出前所未有的单一化和片面性
    长期看来
    信息垄断扼杀了创新与思想活力
    也让中国社会
    错失了与世界对话的机会
    然而信息自由是普世原则
    真相终究是压不扁关不住的
    今天依然有千千万万的中国网民
    通过各种方法
    努力接触被隐藏的事实和知识
    当他们重新打开Google
    在搜索框中敲下那些被禁的字词时
    便是在对抗着遗忘和封锁
    最后不妨把这个问题
    交给各位观众们
    如果连一个搜索框都不能自由打开
    我们还拥有多少了解世界的权利
    这是每一个关心自由的人
    都要扪心自问的
    在信息时代
    剥夺搜索真相的权利
    实际上就是在剥夺人们认知世界
    参与公共生活的基本权利
    当权力高墙阻挡在我们和知识之间
    我们唯有勇敢去翻越
    因为了解世界的权利
    不应该被任何政权垄断
    Google之殇也是时代之问
    希望有一天 每个人都能在
    无所畏惧的网络环境中
    自由的敲下问题
    平等的获取答案
    好了 谢谢大家

  • 「伊朗人为什么痛恨美国?1953:伊朗关键之年」穆…萨台 _ 中情局 _ 军机六处 _ 政变 _ 巴列维王朝 _ 英伊石油 _ 阿贾克斯行动 _ 国有化 #伊朗 #以色列 #特朗普

    大家好
    欢迎来到我的频道
    谈起伊朗啊
    我们可能都有印象
    伊朗好像在1979年之前有一个巴列维
    君主制政府
    是非常亲西方的
    跟英国和美国的关系非常好
    人民生活美满
    而且要搞现代化开放市场经济
    就跟中国在改革开放一样
    要逐步实现民主化进程
    对女性权益也有保障
    那个时候女性在伊朗的权利啊
    跟现在这样一个政教合一的国家相比
    简直一个天上一个地下
    结果呢 你发现啊
    伊朗人他好日子不愿意过啊
    非要在1979年的时候发动伊斯兰革命
    把清西方的皇室政府给推翻了
    搞成一个政教合一的国家
    结果呢 现在被制裁
    然后搞的又非常的严格
    女性在伊朗又没有什么权利
    这是什么样的人民配什么样的政府啊
    当时在1979年呢
    这场席卷伊朗的伊斯兰革命啊
    彻底改变了中东和世界的格局
    愤怒的学生占领了美国大使馆
    还将55名外交官扣为人质
    全世界人都在问啊
    伊朗人为什么这么憎恨美国
    要回答这个问题呢
    我们必须把时钟倒回26年前 1953年
    那一年 伊朗民选首相默罕默德
    穆萨迪克在一场离奇的政变中倒台
    多年以来呢
    西方的主流叙事
    把这场政变归因于冷战
    声称这样做
    是为了阻止伊朗堕入共产主义
    苏联的铁幕
    但是真相真的如此吗
    如果你像我过去一样
    对伊朗没有什么了解
    处于刻板印象和
    媒体的宣传
    肯定是认为伊朗人是因为历史原因
    落后愚昧
    没有办法支持民主自由选举宪政
    只能搞宗教那一套 而历史
    然而著名的历史学家
    埃尔德亚布兰汉米安的历史著作
    《1953,伊朗关键之年》
    给我们讲述了一个
    完全不同版本的故事
    这场政变无关意识形态
    无关民主自由
    有的只有赤裸裸的利益
    跟共产主义关系不大
    埃尔德亚布拉汉米安
    是伊朗裔的美国人
    毕业于名校哥伦比亚大学
    现在就任于纽约大学巴鲁克学院
    现在就任于纽约大学巴鲁克学院
    专长是伊朗和中东历史与政治
    2010年呢 他入选了
    历史悠久的美国文理科学院院士
    该机构
    堪称学术研究界的最高荣誉殿堂
    他也被公认是
    当代伊朗最重要的历史学家之一
    看完本期节目呢
    我希望你对这个国家
    为什么会走到今天这一步
    有一个新的认识
    他的作 我们这里可以看到他的照片
    在学院的网站上啊
    他现在正在写
    伊朗1979年为什么会发生革命
    那我们等他那本书出来
    就能够对伊朗两次革命
    有非常深刻的认知了
    关于1953年革命的故事呢
    首先
    要从一份近乎于掠夺的合约开始讲起
    《达西租让权》
    1901年呢 一位在澳大利亚
    靠黄金投机发家的英国人
    威廉达西
    用区区5万英镑的现金和一些股票
    从当时非常腐败的伊朗国王手中
    买下了一项长达60年的独占权
    在除了北部五省以外的伊朗全境
    勘探 开采 提炼 出口所有石油
    1901年的5万英镑相当于2025年约785万英镑
    或者是等于982万美元
    而这一个独占权的合理估值
    是在1,000亿美元左右
    这位英国人
    相当于用1/10,000的价格买到了这份资产
    可谓是赚的盆满钵满
    用比利时国王利奥波德二世的一
    用比利时国王利奥波德二世的一
    句名言条约必须尽可能简洁
    当地人必须在数个条款内
    把一切都交给我们
    达西
    这份合约堪称是这句名言的完美实践
    利奥波德二世本人
    是一个臭名昭著的
    刚果自由邦的私人拥有者
    他在刚果进行惨无人道的剥削和暴行
    导致数百万刚果人死亡
    他呢 从中获得了巨额财富
    主要是橡胶和象牙
    他这句名言呢
    这是其殖民政策的真实写照
    揭示了在帝国主义和殖民主义时期啊
    西方列强是如何用极低的成本
    通过表面上的简洁的条约
    来掠夺被殖民
    或半殖民国家的巨大利益的
    7年后 英国人在伊朗西南部沙漠里
    发现了石油
    一个名叫英波石油公司APOC的巨兽
    就此诞生了
    为了确保对这项战略资源的绝对掌控
    当时的英国海军大臣温斯顿丘吉尔
    力排众议
    推动英国政府
    收购了这家公司52.5%的股份
    成为了最大股东
    他后来无不得意的说
    这事就像是童话世界的奖赏
    我们做梦也想不到
    到二战结束以后
    这家公司改名为美伊石油公司AIOC
    它早已不仅仅是一家公司
    而是一个国中之国
    它是英国财政部稳定的提款机
    每年贡献数千万英镑的税收
    和近亿英镑的外汇
    他的阿巴丹炼油厂
    是当时世界最大的炼油厂
    供应着英国皇家海军在
    亚洲85%的燃油需求
    这家公司
    后来在1954年更名为英国石油公司
    也就是现代BP的前身
    而我们知道
    这份对于英国人来说
    是童话世界的奖赏
    对于伊朗人民来说
    是一场不折不扣的诅咒
    亚布拉罕米安教授在书中指出啊
    伊朗人很早就将石油描绘为诅咒
    而并非福气
    首先呢 是经济上的极度剥削啊
    多年来
    英伊石油公司支付给英国政府的税金
    远远超过他支付给伊朗的权利金
    合同规定呢
    伊方只能获得16%的利润
    英伊石油公司
    独占伊朗石油资源长达半个世纪
    这一分成比例极不公平
    例如 在1947年
    英伊石油公司
    税后利润达到4,000万英镑
    但是 按照协议
    伊朗只能获得700万英镑
    不足利润的18%
    在1949年这一年
    公司向英国缴纳了2,280万英镑的税
    分给股东710分给股东710万英镑的红利
    却只给伊朗1,350万英镑的权利金
    更讽刺的是
    公司拒绝公开账务
    伊朗政府根本就不知道
    所谓的净利润是如何计算出来的
    甚至连英国的外交部都私下承认
    他们也搞不清楚
    公司利润具体计算基础
    英国获取了伊朗石油的大部分收益
    用廉价的石油
    支撑起了自己的工业和战争
    而伊朗民众长期仅获得非常少的收益
    这种 收益的失衡
    引起了伊朗社会各界的不满
    其次呢 就是赤裸裸的种族歧视
    和恶劣的劳工待遇
    在公司的营地里呢
    英国人被尊称为老爷
    他们的妻子呢
    被称为夫人
    欧洲员工住在设施完善的区域
    而数万伊朗工人呢
    则被挤在临时搭建的简陋小屋里
    甚至有的时候住在沙漠的帐篷里
    一位公司内部的英国员工
    在给外交部的密信中抱怨啊
    公司内种族隔离可以说做的十分彻底
    试图结交伊朗朋友的英国人呢
    被视为是不当行为
    一位公司内部的揭弊者甚至形容啊
    公司高层把所有法国加莱以东的人
    都当成是外国佬
    在胡齐斯坦省
    公司的油田官员在英国领事的协助下
    甚至可以影响当地的总督
    警察首长乃至于部落首领的任命
    可见当时
    英国国企对于当地地方的影响
    是非常大的
    最终民怨的积累最终爆发
    早在1929年
    阿巴丹炼油工人
    就发动了上万人的大罢工
    要求8小时的工作制
    改善住房
    并且高呼所有年假
    包括劳动节都应该支付薪水
    罢工最终被军队镇压
    500名员工被开除
    1946年 更大规模的罢工
    再次席卷了整个石油工业区
    超过65,000名工人职工
    甚至理发师和厨师都参与其中
    一位女性发言人
    非常悲愤的控诉英伊石油公
    英伊石油公司花在狗粮上的钱
    都比我们的工资多
    这是伊朗人第一次
    大规模喊出石油国有化的诉求
    这场罢工
    最终在英国战舰的威吓
    和伊朗军队的镇压下
    再次结束
    但是仇恨的种子已经深深的埋下
    伊朗人对于英国的厌恶不仅仅是增加
    不仅仅是针对一家公司
    而是源于一个世纪以来
    作为大博弈棋子的屈辱历史
    即使是在礼萨·沙国王(Reza Shah)国王统治时期
    他在1933年废除旧租约后
    又签订了一份
    将租约期延长到1993年的新租约
    这让很多伊朗人相信啊
    就连他们自己的国王
    也只不过是英国人的工具
    这时候呢
    出现了一位
    带领伊朗人民走出困境的民族英雄
    他的名字叫做默罕默德
    穆萨迪克
    也有翻译呢把它称为摩萨台
    穆萨迪克呢
    出生于显赫的卡加尔王朝贵族家庭
    在法国巴黎政治学院学习法律
    后来在瑞士的纳沙泰尔大学
    后来在瑞士的纳沙泰尔大学
    获得了法学博士
    在欧洲
    接受过非常良好的法律和金融教育
    但他并非是一个守旧的贵族
    他的生活极其简朴
    据说只有两套西装
    他把多余的钱啊都捐给他母亲
    在德黑兰修建了一家慈善医院
    他以清廉 正直和敢于直言闻名
    是一位坚定的宪政主义
    者他曾经有一句名言啊
    完美的概括了他的政治理想
    君王君临天下
    但不统治国家
    但不统治国家
    很显然 他想推进君主立宪制
    推动伊朗的民主化进程
    增强议会和民选政府的权力
    削弱国王的干预
    据说他在任总理期间啊
    他坚持开自己的私家车上班
    从来不用政府配的公车
    这听起来可能没有什么大不了的
    但是知道在当时的伊朗是非常罕见的
    他甚至连自己的私人会计师
    坐了一次政府的车
    都要严厉批评
    他拒绝接受任何礼物
    不管是谁送的
    哪怕是最亲近的人
    他都一概不收
    所有的外交礼品呢
    他都让人直接送到皇室的财务办公室
    从不往自己家里拿
    这种做法呢
    跟我们现在美国总统特朗普对比一下
    简直令人唏嘘不已
    当时穆萨迪克出访美国的时候
    进行很多重要的外交活动
    他都坚持自己掏钱
    不仅仅是自己的开销
    甚至连同行的儿子和女儿的费用
    都是由他自己承担的
    甚至
    送给杜鲁门总统等外国人领导的礼物
    也是用他私人资金购买的
    他的生活是非常简朴的
    家里呢 没有一件像样的奢侈品家具
    后来政变发生时呢
    他的住所被洗劫一空啊
    但是所有财物加起来的价值都不高
    这就是一个国
    家总理所有的家当
    他本人是非常有个人魅力的
    也是很有原则的
    他坚决坚持法治啊
    主张建立非常独立的司法体系
    坚持言论自由和新闻自由
    以及宗教自由
    在生活上呢
    他非常尊重女性啊
    对妻子忠诚
    这在当时的伊朗的社会环境下
    是非常难得的
    他本身也是一个工作狂
    从早上工作到深夜
    后来他的办公室主任回忆啊
    从穆萨迪克的身上
    我学会了如何真正的热爱自己的国家
    并为之奉献一切
    我们可以看到
    穆萨迪克是非常有个人魅力的
    他被当时的他
    被当时伊朗的知识分子
    称为是德黑兰的绅士
    在二战后的伊朗政坛
    穆萨迪克凭借其雄辩的口才
    和不妥协的民族主义立场
    迅速成为了国家良心
    他提出了著名的负向平衡外交政策
    主张 伊朗不再像过去那样
    为了平衡英国和俄国两大帝国
    从而给予双方同等的利益
    所谓的正向平衡
    而是应该对所有强权一视同仁的拒绝
    不给予任何一方特殊的权利
    用来维护国家的真正独立
    很明显 他不想站队
    也不想依附
    任何一个大国
    时间到了1949年的10月
    为了抗议议会选举舞弊
    68岁的穆萨迪克效仿甘地
    带领着19名支持者
    在皇宫的花园里
    进行了长达4天4夜的静坐
    抗议这件事件
    这件事件
    直接催生了一个影响深远的政治联盟
    民族阵线national front
    它的核心成员呢
    大多是在法国受过教育的专业人士
    如律师 教授 工程师
    代表了伊朗的新兴的中产阶级
    此外呢
    民族阵线也吸纳了包括律师协会
    大学教授协会
    市级协会和零售商工会联盟
    等专业组织
    民族阵线的组成呢
    为沸腾的民怨提供了一个政治出口
    他们最核心的诉求有两个自由选举
    以及石油国有化
    在民族阵线
    和全国人民的巨大压力下
    局势发展的很快
    1951年3月
    公开反对国有化的首相
    拉兹马拉将军被伊斯兰敢死队暗杀
    拉兹马拉将军被伊斯兰敢死队暗杀
    拉兹马拉将军被伊斯兰敢死队暗杀
    紧接着
    震动世界的石油工人大罢工再次爆发
    5万多名工人参与其中
    整个国家的经济濒临瘫痪
    在这样的背景下
    1951年4月28号
    伊朗国会以压倒性多数 79票赞成
    12票反对
    选举穆萨迪克为首相
    他上任只有一个条件
    立即通过执行石油国有化法案
    他迅速废除了原定1993年
    到期的英国石油特许权
    没收了英伊石油公司的资产
    并且派出国有化委员会进驻
    石油区强制执行国有化
    穆萨迪克的石油国有化主张
    在伊朗获得了数百万民众的支持
    被视为是捍卫国家主权的英雄举措
    几天后呢
    年轻的国王被迫签署法案
    伊朗的石油在名义上
    最终回到了伊朗人的手中
    消息传出来呢
    德黑兰万人空巷啊
    举国欢腾
    穆萨迪克
    被人们视为是甘地式的民族英雄
    他的声望达到了顶峰
    时任的美国大使后来承认啊
    对于平民来说
    他们把穆萨迪克神话了
    在一个将政治腐败视为常态的国家
    出现了一位爱国心和财务诚信
    都无懈可击的人物
    然而
    穆萨迪克和他的人民没有意识到
    一场更大的风暴
    正在伦敦和华盛顿悄悄地酝酿
    在接下来的28个月
    是伊朗与西方的拉锯战
    这场战斗的核心只有一个字控制
    对穆萨迪克而言
    国有化意味着
    伊朗对于本国石油的勘探
    生产 销售拥有完全的主权
    但是对于英国和他的盟友而言
    这是绝对无法接受的
    正如一位英国官员在内部会议中所言
    啊 控制这项资产无比重要
    他们可以在口头上承认国有化的原则
    但是前提是
    石油的实际运营控制权
    必须牢牢的掌握在西方的公司手中
    一位美国代表更是直白的解释道
    国有化这个词不是问题
    只要运营控制权还是属于石油公司
    这就是这场所谓谈判背后
    精心设计的骗局
    英国当时的反应非常直接粗暴啊
    他们把这个案子告到了海牙国际法庭
    要求伊朗支付一份要去伊
    支付一笔天文数字的公平赔偿
    这笔赔偿金呢
    是基于租让权剩余的42年预期收益
    而计算的
    目的呢就是让伊朗根本付不起
    从而放弃对运营权的控制
    同时呢 他们实施严酷的经济封锁
    冻结了伊朗在伦敦的资产
    控制其必需品的出口
    并且派遣皇家海军在波斯湾进行巡逻
    威胁
    要扣押任何试图运载伊朗石油的邮轮
    一艘名为罗斯玛丽号
    而不是萝莉马斯号啊
    的游轮在亚丁港被扣押
    英国人很想通过这种方式
    来进行杀鸡儆猴
    1951年国有化之后呢
    英国立刻撤走了
    所有在炼油厂的英国技术人员
    导致当时世界最大炼油厂的生产
    几乎停顿
    同时呢 英国严禁任何关键物资
    同时呢 英国严禁任何关键物资
    如糖和钢铁出口到伊朗
    还扣押各种试图运送伊朗石油的邮轮
    声称呢
    这上面运输的是被盗的英国资产
    此举呢 让各国都不再敢购买
    此举呢 让各国都不再敢购买
    或者是承运伊朗的石油
    这些制裁让伊朗的经济遭受重创
    炼油生产下降
    大批工人失业
    国家收入锐减
    民生困苦
    国内呢
    对于穆萨迪克的不满也开始滋生啊
    英国政府内部
    一度考虑出兵占领这个炼油厂
    但是当时的工党政府呢
    最终放弃了直接动武啊
    从而转向经济战和情报行动
    美国呢则扮演起了诚实的中间人啊
    可以看出来
    那个时候英国唱红脸
    美国唱白脸
    美国政府在政
    变问题上的立场呢
    确实经历了从观望到介入的转变啊
    在杜鲁门总统执政的末期
    美国奉行的是谨慎态度
    他们不愿意在伊朗采取颠覆行动
    杜鲁门担心啊
    如果贸然动手失败
    伊朗有可能投向苏联的怀抱
    美国官员也批评英国在石油争端中
    显得过于强硬
    导致局势僵化
    难以收拾
    因此呢 当丘吉尔政府请求美国政府
    协助策划政变的时候
    杜鲁门以
    我们正在忙着收尾朝鲜战争呢
    不想在中东再起事端为由拒绝了
    丘吉尔当时非常不满
    抱怨英国在远东帮了美国这么大的忙
    美国却一点面子都不给
    不肯在中东帮下英国
    当时呢
    杜鲁门为了给丘吉尔一个面子啊
    派遣了两位特使前往德黑兰调停
    一位呢是企业家
    埃弗里尔哈里曼
    另一位呢
    是英国的大臣查理史托克斯
    是英国的大臣查理史托克斯
    哈利曼呢
    是一个富二代
    他爸呢是铁道大亨
    自己呢 也创办了投资银行
    后来哈利曼从政啊
    在杜鲁门时期呢
    担任商务部长
    负责马歇尔计划的实施
    他还担任总统的问题解决者啊
    专门去解决一些让总统头疼的脏活
    他们的任务呢
    看似是寻求妥协啊
    但其实是过来教育穆萨迪克的
    他们试图用非常复杂的商业用语
    和运营模式
    让穆萨迪克接受一个伪国有化方案
    成立一家新的
    由外国人管理的运营公司
    来代表伊朗国家石油公司经营业务
    说白了呢
    就是把英伊石油公司换个名字贴牌
    再重新请回来
    然后呢 给伊朗的民众营造一种
    伊朗已经获得主权了
    但实际
    这家公司的实际控制人还是外国人
    可以看到
    这两位来谈判的人长得都很帅啊,
    (只有左边的比较帅)
    那么摩萨迪克
    他作为一个在欧洲
    拿到博士学位的精英啊
    当然很轻松的就看透了这一切啊
    他坚定的拒绝了
    他坚定的拒绝了
    任何剥夺伊朗实际控制权的方案
    他亲赴联合国安理会
    和海牙国际法庭啊
    用他并不流利的法语
    开始向世界控诉英国帝国主义的行径
    1952年7月呢
    海牙国际法庭做出了最终裁决啊
    宣布对此案没有管辖权
    也就是我们这管不着
    你们自己解决
    这是穆萨迪克
    和伊朗的一场重大的外交胜利
    在华盛顿呢
    谈判似乎一度出现转机啊
    美国的驻华亲乔治麦基
    提出了一个
    穆萨迪克似乎可以接受的方案
    伊朗控制油田和原油
    但是把这个炼油厂
    卖给一家非英国的荷兰公司
    然而呢
    这个方案被刚刚上台的英国首相
    丘吉尔断然拒绝啊
    他们认为
    英伊石油公司不仅要回到伊朗
    还要拿回对于油田的控制权
    至此呢 所有的外交途径都被堵死啊
    英国从一开始的策略就是等
    他们坚信呢
    经济压力
    会让这个顽固的老头很快就倒台啊
    但是他们失
    算了 穆萨迪克在国内的威望
    尤其是在1952年7月
    因为他和国王
    争夺战争部长的任命权
    争夺战争部长的任命权
    而辞职 随后呢
    而辞职 随后呢
    引发了称为是七月起义的全国性示威
    啊 最后迫使国王妥协
    重新让穆萨迪克回到权力巅峰
    之后呢 已经达到了顶点
    那个时候
    穆萨迪克可以在国内是一呼百应啊
    当政治和经济压力都无法奏效的时候
    一项代号为阿贾克斯
    的秘密计划被提上了日程
    阿贾克斯行动
    是由中情局和英国的军情六处
    联合策划的政变计划
    英美两国在1953年密切合作
    制定了推翻穆萨迪克的秘密计划
    艾森豪威尔总统在1953年
    批准中情局拨款100万美金
    用于颠覆穆萨迪克政权
    1953年6月
    CIA的官员和MI 6的官员在黎巴嫩会晤
    CIA的官员和MI 6的官员在黎巴嫩会晤
    敲定了政变的细节
    1953年7月11号
    美国国务院批准了该计划
    7月25号 艾森豪威尔在行动简报上签字
    最终拍板
    他的目标很明确
    不惜一切代价推翻穆萨迪克
    这场政变有两个大核心
    一是心理战
    二是军事行动
    心理战 或者称为神经战
    是由中情局的考古学家
    间谍唐纳威尔伯负责
    他们的策略就是制造恐慌
    把穆萨迪克描绘成一个亲共产主义
    独裁 疯狂
    而且反宗教的危险人物
    手段之一呢
    就是散布谣言和黑色宣传啊
    用来抹黑穆萨迪克政府的形象
    他们还收买了伊朗的报纸 电台等媒体
    刊登反穆萨迪克的文章和漫画
    用来制造舆论
    系统性的散播谣言
    比如说指控穆萨迪克有犹太血统
    或者捏造文件
    证明他和大众党有秘密合作
    大众党 也就是当时的伊朗共产党
    是当时组织性最强的政党
    吸引了大量的城市工人
    现代的小资产阶级和知识分子加入
    反对英帝国主义的侵略 王权统治
    或者是地主阶级
    他(大众党)提出的主张
    包括国有化工厂
    矿山 银行 交通 水利等基础设施
    保护小生产者的权益
    并且将宗教 地产分给农户
    致力建立一个无阶级的平等社会
    但是亚伯拉罕米安在书中指出啊
    这完全是借口
    英美高层在私下的文件中承认啊
    大众党根本不构成直接威胁
    真正问题是穆萨迪克的中立主义
    中情局的第二个手段就是军事行动
    策划街头的骚动
    由CIA雇佣的特工和地痞流氓
    伪装成共产党员
    在公共场所制造混乱
    甚至是爆炸
    再嫁祸给伊朗的左翼势力
    用来制造穆萨迪克无力控
    制局面的印象
    同时呢 他们还拉拢了军方和宫廷
    美国中情局
    直接与伊朗亲王室的军官接触
    物色到了一个穆萨迪克的替代者
    扎赫迪将军
    并且起草好了
    国王签署的免职穆萨迪克任命扎赫迪
    的圣旨
    同时呢 中情局代表啊
    还秘密会见了伊朗国王的孪生姐姐
    公主阿什拉夫
    公主阿什拉夫
    劝其出面呢
    敦促巴列维国王合作政变
    中情局在德黑兰
    分发了100万美元的现金
    用来贿赂伊朗的议员 官员
    军人和街头组织
    确保各环节配合
    7月下旬到8月上旬
    克米特罗斯福
    指挥各路人马在德黑兰按计划行动
    为最终推翻摩萨迪克做好了准备
    为最终推翻摩萨迪克做好了准备
    这时候 你可能会考虑啊
    为什么美国一开始只是围观
    但是现在却选择积极下场呢
    这个形势啊
    要从1953年发生了变化
    当时呢 共和党人埃森豪威尔
    在1月就任美国总统
    他的国务卿约翰杜勒斯
    以及他的弟弟
    CIA的局长艾伦杜勒斯是一批
    是非常强硬的反共派
    他们掌权了之后呢
    对于伊朗的局势高度警惕
    英国呢 抓住了这一契机啊
    不断的强调伊朗的左翼人民党
    在苏联的支持下
    势力做大了
    伊朗有滑向共产主义的危险
    这些情报呢
    成功的说服了新政府
    埃森豪威尔认为
    穆萨迪克政府
    有可能导致伊朗向苏联倾斜
    威胁了中东安全
    所以呢 美国态度大变
    准备和英国密谋推翻穆萨迪克
    历史记录表明
    埃森豪威尔上任之后不久
    便同意了这项政变计划
    将其视为是冷战背景下
    遏制苏联的一步棋
    当然呢 也有学者认为啊
    美国政府所说的反共只是一个借口
    其实
    美国也想从伊朗的石油中分到一杯羹
    在伊朗当地呢
    军情六处启动了
    他们经营多年的网络
    核心人物是拉希迪安三兄弟啊
    一听就非常拉稀
    他们表面上呢是电影的进口商啊
    实际上是军情
    六处的钱袋子
    每个月将上万英镑的资金
    分发给收买的政客
    记者 甚至是部分传教士
    他们还与德黑兰集市的帮派头目如
    外号愚笨的夏哈帮等人建立了联系
    相当于是打通了伊朗的黑白两道啊
    同时 他们还搞定了政变的关键人物
    阿亚图沙卡沙尼
    卡沙尼呢
    他是一名著名的伊斯兰学者啊
    他16岁的时候就进入伊斯兰神学院
    学习文学
    阿拉伯语逻辑语义学和伊斯兰法学
    随后呢 他在纳杰夫的神学院
    继续深造古兰经和圣训
    并且在25岁就获得了法学学位
    他从多名著名的学者
    和实业派权威那里获得了
    伊智提哈德(宗教学术权威)
    也就是宗教学术权威的许可 他在
    卡沙尼呢
    在伊朗的宗教领域是非常受到尊敬的
    早年呢
    便表现出了反资本主义的倾向啊
    并且反对压迫专制主义和殖民
    因此呢
    他非常受到德黑兰贫困阶层的欢迎啊
    他还提倡伊朗应该回复伊斯兰政府
    卡沙尼呢
    曾经是民族阵线的盟友啊
    因为他们都有共同的敌人
    但是此时呢
    因为他和穆萨迪克进行权力斗争啊
    他不满后者把伊朗变得更加世俗化
    想要进行民主宪政
    那这怎么能行呢
    我们真正想要建立的是伊斯兰共和国
    因为这些矛盾呢
    他到1953年的时候
    就倒向了政变的策划者
    韩国大使韩德森
    和他多次秘密会面
    卡沙尼明确表示啊
    唯有一场政变才能真正的解救伊朗
    中情局呢
    则派出了老罗斯福总统的孙子
    克米特罗斯福
    担任现场总指挥
    他们的关键棋子
    就是早已被英美看中的扎赫迪将军
    1953年8月15号晚上
    政变的第一步开始了
    国王卫队试图逮捕穆萨迪克
    然而政变计划
    早就被大众党安插在卫队里的间谍
    胡马尤尼上尉提前泄露
    穆萨迪克早有准备
    第一次行动失败
    国王仓皇的逃往巴格达
    然后转飞往罗马
    双方在对方这里
    我们可以看到
    双方在对方的内部
    都已经安插了间谍啊
    所以你可以看到
    穆萨迪克也是有一些准备的
    一次政变失败之后
    华盛顿说哎呀
    不行算了吧
    准备放弃了
    克米特罗斯福和美国大使罗伊韩德森
    决定放手一搏
    接下来发生的
    将是整个政变最关键
    也最被掩盖的一幕
    8月18号晚
    韩德森紧急会见穆萨迪克
    根据韩德森自己的私人文件记录啊
    他以为了保护美国公民安全为由
    向穆萨迪克下达了最后通牒
    如果政府不能够恢复街头的秩序
    清除街上的示威者
    当时街上主要是庆祝政变失败
    穆萨迪克的支持者
    美国呢 将撤离所有侨民
    并且不再承
    认他的政府
    这是一个致命的威胁和欺骗
    为了避免和美国彻底决裂
    穆萨迪克
    做出了他一生最具灾难性的决定
    他下令军队和警察禁止一切示威活动
    清空街头
    他亲自解除了自己最重要的武装
    人民的支持
    做完这一个关键通牒
    之后呢 韩德森策略性的离开了伊朗
    之后呢 韩德森策略性的离开了伊朗
    并且在政变后返回啊
    祥装对此事一无所知
    时间到了8月19号清晨
    德黑兰的街头异常的空旷啊
    民族阵线和大众党的支持者呢
    都遵守了命令
    留在家里
    而中情局花钱雇来的暴徒
    在塔耶步等人带领下
    从南城出发
    手持的棍棒和刀具
    高喊着国王万岁的口号
    一路打砸抢烧
    这是一场冒牌的造反
    这批人人数不超过三四千
    为军队的介入提供了完美的借口
    那些本应该保护政府的坦克
    在保王派军官的指挥下
    调转炮口
    驶向了广播电台
    警察总部以及穆萨迪克的住所
    更具讽刺意味的是
    穆萨迪克在慌乱中任命了自己的侄子
    达夫塔里将军为军事总督和警察局长
    却殊不知他早已是政变的核心同谋之一
    这个穆萨迪克也挺可悲的
    自己的侄子也背刺他了
    穆萨迪克拒绝了支持者分发武器
    进行抵抗的请求
    他不想引发一场血流成河的内战
    傍晚时分
    在坦克的炮轰下
    他的官邸被攻破
    这位72岁的老人
    最终选择从邻居家的墙头翻过逃离
    并最终投降
    这场由中情局策划的政变最终成功了
    国王凯旋而归
    扎赫迪成为了首相
    西方媒体呢
    把这场由外国策划的政变
    美化成了一场人民的起义
    不久之后呢
    一份新的石油协议签署了
    一个由美英法荷公司组成的国际财团
    接管了伊朗的石油
    其中呢 英国石油公司
    也就是改名后的AIOC
    占股40% 五家美国主要石油公司海湾
    五家美国主要的石油公司
    包括美孚等首次进入伊朗
    也占有40%的股份
    作为他们这次帮助英国
    策划政变的回报
    策划政变的回报
    剩下的呢
    则由壳牌等其他公司进行瓜分了
    伊朗的石油实际上被去国有化了
    接下来面临民众的是大规模的镇压
    穆萨迪克在军事法庭上
    痛斥法官是外国的走狗
    最后他被判处死刑
    但是呢
    国王非常“仁慈”的给他免除了死刑
    国王非常“仁慈”的给他免除了死刑
    最终判成三年监禁
    余生呢 将在他的村庄里头被软禁
    面对军事法庭3年单独监禁的判决
    他略带讽刺的说道
    这个法庭的判决增加了我的历史荣耀
    我非常的感谢你们给我定了罪
    今晚
    伊朗人民真正的理解了宪政的含义
    他希望自己死后
    被安葬在七月起义的烈士身旁
    这样的遗愿也被国王拒绝
    他的外交部长
    亲切的战友
    法特米
    因为称国王为叛国贼而被处决
    数千名民族阵线和大众党的支持者
    被逮捕 监禁
    甚至处死
    在CIA和摩萨德的帮助下
    一个臭名昭著的秘密警察组织
    萨瓦克正式成立了
    萨瓦克正式成立了
    这个组织
    专门用来镇压和制裁这些反对者
    亚布拉罕米安教授在书中的结尾
    深深的指出
    1953年政变留下四个毁灭性的后果
    第一
    伊朗的石油工业权重回到西方之手
    伊朗人民继续回到被西方列强压榨
    剥削的境地
    第2
    伊朗世俗的民主的反对派被彻底摧毁
    造成
    了巨大的政治真空
    讲武德的
    想要建立西方宪政体制的领导
    被自诩占有道德制高点的英美政府
    通过卑鄙的手段给推翻了
    他们
    很多精英人士被迫流亡或者是被处死
    第三
    君主制的合法性被无可挽回的剥夺了
    国王的知己后来在日记中写到
    国王的余生
    都活在对穆萨迪克严重的自卑情结中
    第四个后果
    也是最为深远的
    他在伊朗的政治文化中
    植入了根深蒂固的
    偏执和阴谋论心态
    到了2000年
    美国的国务卿马德琳
    奥尔布莱特表示
    美国干预伊朗内政
    是民主政府的一个挫折
    他普遍认为
    这次政变
    极大的促成了1979年的伊朗革命
    那次革命推翻了亲西方的沙阿
    并以反西方的伊斯兰共和国
    取代了君主制
    美国总统奥巴马
    也曾经这样评价这场政变
    对许多伊朗人来说
    这次政变展现了美国的两面性
    美国自诩
    为自由的捍卫者
    却毫不犹豫的使用不光彩的手段
    推翻了一个民选政府
    以满足其自身的经济和战略利益
    从此 美国取代英国
    成为伊朗人眼中
    那一个操纵幕后一切的隐形的手
    国王在美国的支持下
    建立了长达25年的独裁统治 恰恰
    而这恰恰为25年后
    一位名叫霍梅尼的
    教士
    领导的宗教反对派提供了成长的土壤
    当1979年的革命者高喊打倒美国时
    他们的记忆正是回到1953年那个8月
    那场被掩盖的政变
    最终以一种所有人都始料未及的方式
    完成了对历史的复仇
    历史学家迈克尔贝施洛斯写道
    历史学家迈克尔贝施洛斯写道
    维纳先生论证说
    中情局糟糕的历史记录
    助长了我们当代许多最严重的问题
    一代伊朗人在成长过程中都知道
    是中情局扶植了国王
    最终
    该机构在德黑兰街头制造的混乱
    终将回过头来
    困扰美国
    那么相信看完这期节目
    你会对于伊朗为什么会如此的仇美
    有了更深层次的理解
    是关于穆萨迪克的故事
    是一个关于理想主义
    在冰冷的国际政治中
    悲壮失败的故事
    他提醒我们
    历史的真相
    往往隐藏在官方叙事的背面
    只有理解了1953
    我们才能真正的理解今天的伊朗
    以及他与西方世界那段复杂痛苦
    至今未能愈合的关系
    做完这期节目呢
    其实我觉得内心是非常沉重的
    其实你可以看到穆萨迪克这个人
    他是一个非常有理想主义
    而且非常有高的道德标准的
    但这样的人
    其实在国际政治中未必能够成功
    因为他选择不站边
    他太过清廉
    他不像那些腐败的官员可以被收买
    如果他当时直接倒向英美
    贪腐一些钱
    他的政府也可能不会被推翻
    但是他确实是太过高尚的人
    是没有办法玩政治的
    当然你可以批评穆萨迪克不懂变通
    或者是不够圆滑
    但是我觉得这个评价也就见仁见智了
    如果说英美当时没有对穆萨迪克
    进行这样的一个政变
    推翻 或许
    伊朗现在已经走向了民主宪政的道路
    可惜的是历史没有假设
    我们现在看到的是一个在神权领导下
    极度反美的一个政府
    那些在以色列空袭中
    死去家人的伊朗人
    会真正的接受一个
    由以色列和美国扶植的
    亲西方的政府吗?
    我想历史已经给我们答案了
    最后
    我想用美国最高法院大法官的一段话
    来结束这期视频
    美国最高法院大法官威廉
    道格拉斯在政变前后
    都曾经访问过伊朗
    他写道当穆萨
    他写道当穆萨
    迪克和波斯开始进行根本性改革时
    我们(美国)感到了警觉
    我们与英国联合起来摧毁了他
    我们成功了
    从那时起
    我们的名字在中东
    就不再受到任何人尊敬了