Andrej Karpathy 2小时访谈:未来十年,没有 AGI,只有 Agentai智能体十大龙头

这篇文章带来了一位重量级人物——Andrej Karpathy的深度访谈。Karpathy是OpenAI的早期成员,也是特斯拉AI总监,他在AI领域有着深厚的实战经验和独到的见解。kimi手机版

Andrej Karpathy 2小时访谈:未来十年,没有 AGI,只有 Agent

看了 Andrej Karpathy 的播客,信息量巨大a1官方免费下载

开篇泼冷水:未来十年没有 AGI,只有 Agentagent智能体

这里说一下,Karpathy 是 OpenAI 早期成员,参与过 GPT 背后的技术路线,在一线干了 15 年同时,Karpathy 也是前特斯拉 AI 总监ai开源什么意思

同时,我制作了一份中文版音频使用的工具,是大橘子的 ListenHub 的 API(我弄了一整个周日,非常良心)al解说大师下载

这里,我还准备了一份文字实录,中英双语智能体和ai的区别

Andrej Karpathy 2小时访谈:未来十年,没有 AGI,只有 Agent

中英双语,非常贴心kimi手机版

在 Andrej Karpathy 眼中,当前的 AI Agent,核心问题有三个:viggle ai

• continual learning:你告诉它一个事,它记不住al工具

• multimodal:真正的多模态还没做到百度ai虚拟聊天

• computer use:不能像人一样操作电脑龙虾ai下载

这三个问题,每一个都得花好几年解决商汤科技

AGI 还要十年ai无限制词,免费

有人说今年是 Agent 之年kimi手机版

Karpathy 表示:应该叫「agents 的十年」龙虾ai下载

在他的观点里ai无限制词,免费

我们未来十年没有 AGI,只有 Agent人工智能ia

业界有很多 over-predictionai智能找客户

对于 AGI 大家都太乐观了ai智能找客户

他举了个例子豆包打开

你现在有 Claude、有 Codex,对吧,很厉害智能体和ai的区别

但你会让它们替你干活吗?不会agent智能体

为什么?ai的可怕之处

因为它们就是不行豆包打开

智能不够、多模态不够、记不住东西、不能操作电脑a1官方免费下载

这些问题,每一个都是硬骨头智能体和ai的区别

要花时间一个个啃豆包打开

continual learning 这个事,很多人可能没意识到有多重要viggle ai

现在的 LLM,你跟它聊天ai无限制词,免费

它看起来「记住」了你说的话kimi手机版

但那只是因为对话历史还在 context window 里al解说大师下载

你关掉窗口,重新开一个对话,它什么都不记得百度ai虚拟聊天

这不是 bug,这是设计就这样ai智能体十大龙头

要让它真的「学习」新知识百度ai虚拟聊天

不只是记住,而是真正理解并融入已有知识体系商汤科技

目前没有好办法豆包打开

你可能会想,那就扩大 context window 不就行了ai无限制词,免费

问题是这治标不治本,学习不能只是把内容简单地塞进上下文ai的可怕之处

真正的学习,是要把新知识整合到模型的参数里al工具

这需要重新训练,或者找到新的架构,成本高得吓人kimi手机版

当前的AI, 无法真正学习新知识ai开源什么意思

强化学习:terrible, but everything else is worse可灵ai国际版

播客里有个特别有意思的部分智能体和ai的区别

Karpathy 说:千问是个什么软件

强化学习是个糟糕的选择al解说大师下载

但紧接着他又说:ai无限制词,免费

但其他方法更糟糕ai开源什么意思

这话听着矛盾,但其实是对现状最准确的描述豆包打开

RL 的问题主要是数据效率太低kimi手机版

你想让模型学会一个东西,得让它试错无数次ai的可怕之处

AlphaGo 下围棋,self-play 了几百万局agent智能体

才达到世界冠军水平al解说大师下载

这种训练方式,放在真实世界根本不现实ai的可怕之处

你不可能让自动驾驶撞车几百万次来学习ai智能体十大龙头

你也不可能让医疗 AI 误诊几百万次来进步agent智能体

所以:RL 在真实世界的应用,始终受限于数据效率kimi手机版

强化学习,需要海量试错可灵ai国际版

但为什么还要用 RL?ai智能找客户

因为 supervised learning 也有问题:kimi手机版

需要大量标注数据商汤科技

而真正难的任务,根本标注不出来千问是个什么软件

比如「写一个好的代码」、「做一个好的决策」a1官方免费下载

什么叫「好」agent智能体

人类自己都说不清楚人工智能ia

你让标注员去标注什么是「好代码」ai智能找客户

每个人的标准都不一样有人觉得简洁就是好,龙虾ai下载

有人觉得性能高就是好viggle ai

这种主观性太强的任务,标注成本高得离谱人工智能ia

而且质量还没保证即梦官网网页版

所以最后还是得回到 RL,让模型自己在反馈中学百度ai虚拟聊天

通过奖励信号,而不是人工标注,是目前唯一可行的路ai的可怕之处

Karpathy 的判断是:人工智能ia

未来会是 SL + RL 的混合ai的可怕之处

先用 supervised learning 学个大概,建立基础能力龙虾ai下载

再用 RL 精调,在具体任务上优化viggle ai

但这条路,还有很长的路要走龙虾ai下载

需要解决的技术问题一堆豆包打开

比如怎么设计好的奖励函数,怎么平衡探索和利用ai开源什么意思

每一个都不容易商汤科技

未来的训练方式:监督学习 + 强化学习龙虾ai下载

人类怎么学习,AI 为什么学不会龙虾ai下载

播客里有一段特别精彩al工具

主持人问:豆包打开

人类是怎么学习的,为什么 AI 学不会可灵ai国际版

Karpathy 给了个很有意思的观点:ai开源什么意思

人类的学习,是多模态 + embodied + continual 的即梦官网网页版

什么意思?千问是个什么软件

对于一个苹果,在人类的认识中:豆包打开

• 视觉上看到红色、圆形kimi手机版

• 触觉上感受到光滑、硬度龙虾ai下载

• 味觉上尝到甜味a1官方免费下载

• 听觉上听到咬下去声音ai开源什么意思

这些信息是同时发生的,互相强化的商汤科技

而且你一辈子都在学,不断更新认知即梦官网网页版

你小时候对「苹果」的理解百度ai虚拟聊天

和你现在对「苹果」的理解kimi手机版

肯定不一样可灵ai国际版

正如…豆包打开

小时候对「络腮胡」的理解al解说大师下载

和你现在对「络腮胡」的理解千问是个什么软件

也不一样(雾ai智能体十大龙头

这种持续的、多模态的学习方式,是人类智能的基础kimi手机版

人的学习能力,很牛逼a1官方免费下载

但 LLM 呢?它只有文本商汤科技

虽然现在有了 vision model,但那还不是真正的 multimodal豆包打开

真正的 multimodal,是所有模态在同一个 latent space 里龙虾ai下载

信息是融合的,不是翻译的ai的可怕之处

现在的做法,更像是把图片翻译成文本描述,再喂给 LLMviggle ai

这不是真正的融合ai智能找客户

就像你把一个视频的每一帧都写成文字描述ai开源什么意思

这个描述再详细,也不等于你真的看了视频可灵ai国际版

丢失的信息太多了智能体和ai的区别

而且,LLM 不能 continual learning豆包打开

你今天告诉它一个新知识,明天它就忘了ai开源什么意思

除非你重新训练整个模型,但那成本太高ai无限制词,免费

一个模型训练一次,可能要花几百万美元即梦官网网页版

你不可能每次有新知识就重新训练一遍ai无限制词,免费

Karpathy 说:ai开源什么意思

这是个根本性的架构问题龙虾ai下载

当前的 transformer 架构,就不是为 continual learning 设计的即梦官网网页版

它的参数是固定的,训练完就冻结了a1官方免费下载

要解决这个问题,可能需要新的架构viggle ai

能够动态更新参数,而不影响已有知识商汤科技

这是一个很难的问题可灵ai国际版

学术界在研究,但还没有成熟的方案智能体和ai的区别

Transformer 架构不支持持续学习人工智能ia

model collapse:AI 不能吃自己ai智能找客户

播客里还提到一个很有意思的概念:al工具

model collapseai的可怕之处

什么意思?ai智能体十大龙头

就是 AI 生成的数据,不能用来训练 AI商汤科技

为什么?商汤科技

因为会越来越糟商汤科技

人类可以从人类写的东西里学习,对吧viggle ai

你读别人写的书,你变聪明了ai智能找客户

代际之间互相学习,知识不断积累ai智能找客户

但 AI 不行ai智能找客户

如果你用 AI 生成的文本,再去训练下一代 AI,模型就会越来越偏百度ai虚拟聊天

最后输出变得越来越单调、越来越重复千问是个什么软件

这个问题其实挺严重的ai智能体十大龙头

现在网上越来越多 AI 生成的内容kimi手机版

文章、代码、图片、视频千问是个什么软件

如果下一代 AI 训练的时候,把这些内容也当成「真实数据」千问是个什么软件

那就完了百度ai虚拟聊天

模型会学到 AI 的偏见和错误ai无限制词,免费

然后放大这些偏见和错误豆包打开

循环往复,越来越糟al解说大师下载

这就是为什么 AI 不能像人类那样自我学习智能体和ai的区别

人类可以互相学习、代际传承al解说大师下载

但 AI 必须依赖人类产生的真实数据ai智能找客户

这是个很大的瓶颈ai无限制词,免费

而且随着 AI 生成内容越来越多ai的可怕之处

「干净」的人类数据会越来越少商汤科技

将来怎么办?值得思考千问是个什么软件

有人提出:ai无限制词,免费

可以标注 AI 生成的内容,训练时过滤掉ai的可怕之处

但这也不容易agent智能体

AI 生成的内容越来越逼真,很难区分龙虾ai下载

而且标注成本也很高ai的可怕之处

这个问题,目前还没有好的解决方案豆包打开

AI 生成内容,正在污染整个互联网ai的可怕之处

AGI 会是什么样:融入 2% 的 GDP 增长ai开源什么意思

很多人对 AGI 有个幻想豆包打开

觉得会有个奇点,突然爆炸ai智能找客户

某一天,AGI 出现了,然后世界完全变了ai的可怕之处

Karpathy 说:不会的可灵ai国际版

他的判断是:智能体和ai的区别

AGI 会融入过去 2.5 个世纪的 2% GDP 增长kimi手机版

什么意思?可灵ai国际版

过去 250 年,人类社会一直在以每年 2% 的速度增长人工智能ia

蒸汽机来了,2%ai的可怕之处

电力来了,2%a1官方免费下载

互联网来了,2%龙虾ai下载

为什么?al解说大师下载

因为技术革命不是一瞬间的智能体和ai的区别

它需要时间扩散、需要基础设施、需要人适应即梦官网网页版

蒸汽机发明了,不是第二天所有工厂都换成蒸汽动力豆包打开

需要几十年时间,建铁路、建工厂、培训工人可灵ai国际版

互联网也一样商汤科技

1990 年代就有了,但真正普及到每个人手机上,用了 20 多年al工具

AGI 也一样ai智能体十大龙头

它会逐渐渗透到各行各业ai无限制词,免费

但不会在某一天突然改变一切龙虾ai下载

先是一些简单的任务被自动化kimi手机版

然后是复杂的任务智能体和ai的区别

一步步来龙虾ai下载

期间会有阵痛,会有失业,会有适应期ai开源什么意思

但不会是突然的、剧烈的ai开源什么意思

Karpathy 说豆包打开

他不相信「hard takeoff」智能体和ai的区别

他相信的是:豆包打开

AGI 会像之前所有技术革命一样,缓慢、渐进地改变世界商汤科技

这个判断,其实挺重要的可灵ai国际版

如果 AGI 真的是这样,那我们有时间准备ai的可怕之处

不用担心明天醒来世界就变了龙虾ai下载

可以慢慢调整教育体系、社会保障、法律法规千问是个什么软件

这是一个好消息al工具

当然,2% 的增长也不是绝对的智能体和ai的区别

可能某些年份会高一些,某些年份低一些kimi手机版

但长期来看,会是一个相对稳定的、可预测的过程千问是个什么软件

而不是指数爆炸式的奇点可灵ai国际版

自动驾驶:为什么花了这么久即梦官网网页版

播客里还聊了自动驾驶ai智能体十大龙头

Karpathy 在特斯拉干了 5 年 Autopilot,他太清楚这里面的坑了豆包打开

主持人问:商汤科技

为什么自动驾驶这么难,为什么花了这么久ai无限制词,免费

Karpathy 给了几个理由ai智能体十大龙头

第一个,是 long tail problem即梦官网网页版

你以为自动驾驶就是识别车道线、识别红绿灯a1官方免费下载

太天真了,真实世界有无数种情况商汤科技

施工路段、临时路牌、突然窜出的小孩、逆行的疯子、路上的大坑、掉落的货物龙虾ai下载

这些「长尾情况」,占比很小,但每一个都可能致命kimi手机版

你必须把它们全部解决kimi手机版

不能说「我 99% 的情况都能处理」,剩下的 1% 就会是事故al工具

而且这个长尾,真的很长ai智能体十大龙头

你以为处理完 100 种情况就够了ai智能找客户

结果发现还有 1000 种a1官方免费下载

处理完 1000 种,还有 10000 种kimi手机版

永远有新的边缘情况龙虾ai下载

这就是为什么自动驾驶这么难可灵ai国际版

第二个,是 safety bar豆包打开

自动驾驶不是「比人类平均水平好」就行al工具

它必须远好于人类al工具

为什么?即梦官网网页版

人们对机器的容忍度,远低于对人的容忍度ai智能体十大龙头

人类司机每天撞车,大家习惯了豆包打开

美国每年 4 万人死于车祸,大家也接受了al工具

但如果是自动驾驶撞了一次kimi手机版

新闻头条、国会听证、股价暴跌viggle ai

所以 safety bar 特别高商汤科技

(所以… AGI Bar 呢?)商汤科技

不是做到人类水平就行,要做到远超人类水平ai智能找客户

这个标准,其实挺不公平的a1官方免费下载

但现实就是这样可灵ai国际版

技术要被接受,必须远好于现状即梦官网网页版

不能只是「稍微好一点」ai开源什么意思

第三个,是 data problem商汤科技

自动驾驶,需要海量的真实驾驶数据agent智能体

再次划重点:真实世界的al工具

这需要时间积累kimi手机版

特斯拉为什么现在做得好即梦官网网页版

因为它有几百万辆车在路上跑,每天收集数据豆包打开

这是花钱买不来的人工智能ia

你可以造一个很贵的实验室,雇一堆博士ai开源什么意思

但你造不出几百万辆车在路上跑的数据龙虾ai下载

这个优势,其他公司很难追上ai智能体十大龙头

Karpathy 说:商汤科技

自动驾驶花了这么久,其实是给 AGI 的一个预警龙虾ai下载

AGI 会遇到同样的问题viggle ai

long tail、safety、dataai开源什么意思

每一个都需要时间viggle ai

不是说模型做出来就完事了ai无限制词,免费

还要在真实世界里打磨,处理各种边缘情况kimi手机版

这个过程,可能比模型训练本身还要长智能体和ai的区别

教育的未来:untangling knowledge豆包打开

播客最后聊了教育ai的可怕之处

Karpathy 现在在做 Eureka Labs,一个 AI 教育公司商汤科技

他对教育有个很有意思的理解商汤科技

好的教育,是 untangling knowledgeai智能体十大龙头

什么意思?ai开源什么意思

知识本身是一团乱麻豆包打开

所有概念互相缠绕、互相依赖ai开源什么意思

但学习需要一个线性的路径即梦官网网页版

你得先学 A,才能学 B龙虾ai下载

好的老师,就是把这团乱麻理清楚ai智能找客户

让学生按照一个清晰的顺序,一步步往上爬al解说大师下载

每一步都只依赖前面学过的东西agent智能体

不会突然冒出一个新概念,让你措手不及千问是个什么软件

Karpathy 举了个例子百度ai虚拟聊天

他的 transformer 教程,为什么大家觉得好千问是个什么软件

因为他从 bigram 开始al工具

bigram 是什么?al工具

就是个 lookup table:上一个词是 A,下一个词是 Ba1官方免费下载

就这么简单商汤科技

一个 2 维表格,谁都能看懂龙虾ai下载

然后一步步加东西即梦官网网页版

加 embedding、加 attention、加 layer normai智能体十大龙头

好的教育,每一步都会解释:为什么要加东西,这是在解决什么问题这就是 untanglingal解说大师下载

比如,把复杂的 transformer 拆成一步步的演进,每一步都有章可循viggle ai

他还说了个特别重要的教育原则:kimi手机版

present the pain before you present the solutional解说大师下载

别上来就告诉学生答案,先让他们感受到问题,然后再给解决方案,这样学得才深人工智能ia

为什么?智能体和ai的区别

因为如果你直接给答案,学生不知道这个答案解决了什么问题al解说大师下载

就像你告诉学生「attention 机制是这样的」al解说大师下载

学生学会了公式,但不知道为什么需要 attentionagent智能体

如果你先展示问题:a1官方免费下载

之前的模型处理长序列有这个问题即梦官网网页版

先让学生自己思考怎么解决al工具

然后你再给出 attention 这个方案al解说大师下载

学生会恍然大悟:原来是这样解决的千问是个什么软件

这种学习,才是深刻的,才能记得住ai开源什么意思

这个原则,其实不只适用于技术教育ai的可怕之处

任何教育都一样al工具

先让学生感受到问题的存在,再给解决方案,这样学习效果ai智能体十大龙头

最好最后说两句龙虾ai下载

这个播客值得一看al工具

Karpathy 是一个在一线干了 15 年的人ai无限制词,免费

很诚实地说出他看到的东西ai智能体十大龙头

在 Karpaty 眼中,AGI 还需要十年a1官方免费下载

不是因为技术不行,而是因为问题太多、太难龙虾ai下载

continual learning、multimodal、safety、long tail、data龙虾ai下载

每一个都是硬骨头,需要时间一个个啃,但也不是遥不可及agent智能体

十年,听起来很长ai开源什么意思

但 iPhone 发布到现在,也就 17 年a1官方免费下载

不用焦虑,也不用盲目乐观商汤科技

踏踏实实做事就好即梦官网网页版

 ai智能找客户

作者【赛博禅心】,微信公众号:【赛博禅心】可灵ai国际版

© 版权声明

相关文章