谷歌机器人专家：机器人在现实中碰过的壁，AI也会碰

siyushenqi.com • 2025 年 8 月 13 日下午11:37 • 海外营销 • 阅读 95

机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中，随着它真正开始发挥作用，我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。

有人说，机器人领域进展缓慢，甚至和机器学习的其他子领域相比显得毫无进展。

谷歌 DeepMind 机器人科学家，SayCan、RT-1、RT-2 等具身智能项目参与者 Alex Irpan 同意这一说法。但他认为，这是因为机器人学是一个和现实紧密连接的领域，现实的复杂性决定了他们不免碰壁。他还指出，这些问题不是机器人技术所独有的。同样的问题也适用于大语言模型（LLM）等技术。这些模型在面对现实世界时，会遇到与机器人学类似的复杂性问题。

最近，他写了一篇题为「The Tragedies of Reality Are Coming for You（现实的悲剧正在向你袭来）」的博客来阐述这一观点。

现实的悲剧正在向你袭来

2023 年，我参加了一次 ML 会议。夜未央，酒酣耳热，话题转到了一个问题上：「如果你能把任何一个机器学习子领域的资源都给另一个子领域，你会砍掉哪个，把资源给谁？」

我不记得别人是怎么说的，但有一个人说他们会砍掉机器人。当我进一步追问时，他们说机器人技术进展太慢，相对于其他领域来说，什么都没有发生。

他们说机器人技术比纯软件的机器学习子领域进展缓慢，我认为他们说得没错，但我还想补充两点：

机器人学习进展较慢的原因是：如果不解决难题，就很难有所作为。
机器人技术的难题并非机器人独有。

在机器人技术领域，人们常说的一句话是「现实是混乱的」。相对于代码而言，我会将其延伸为「现实是复杂的」。在机器人技术中，你往往要将混乱的现实推向一个足够好的抽象层，以便代码能够在其上发挥作用。作为一个领域，计算机科学花了数十年时间在硬件和软件之间创建了良好的抽象层。代码描述了如何将电力输送到硬盘、处理器和显示器，它足够可靠，我甚至不需要考虑它。

这样做有很多好处。一旦你完成了这项艰巨的工作，并将你的工作进展转移到抽象的逻辑空间中，一切都会变得更容易。代码和数据的可复制性令人难以置信。我在 3 台设备上同步了代表这篇博文草稿的文件副本，甚至不用花费任何精力思考。

不过，就像 Joel Spolsky 所说，所有抽象在某种程度上都有漏洞，而我发现机器人技术中的漏洞往往更大。有很多出错的方式与代码的正确性无关。

这和这个学科的一些基本原理有关吗？有一点。很多机器人硬件比笔记本电脑或 Linux 服务器更具实验性。消费类机器人还不是一大产业。「实验性」往往意味着「奇怪的、更容易出现故障的状态」。

但是，我不认为硬件是造成问题的主要原因。现实才是问题的根源。Benjamin Holson 在他的「Mythical Non-Roboticist（神话般的非机器人学家）」一文中说得非常好：

第一个难点在于，机器人要处理的是现实世界中不完美的感知和不完美的执行。全局可变状态是一种糟糕的编程风格，因为它真的很难处理，但对于机器人软件来说，整个物理世界都是全局可变状态，你只能不可靠地观察它，并希望你的行动能接近你想要实现的目标。

机器人研究依赖于在现实与软件之间搭建新的桥梁，但这也发生在机器人研究之外。任何与现实对接的软件，对现实的了解都是不完美的。任何试图影响现实世界变化的软件，都必须应对现实的全局可变状态。任何软件，如果其行为依赖于现实中发生的事情，就会招致对抗性的噪声和复杂性。

游戏 AI 就是一个很好的例子。国际象棋 AI 是可靠的超人。然而，如果你以特定方式下棋，一些超人围棋 AI 是可以击败的，正如 Tony T. Wang 等人在 ICML 2023 论文「Adversarial Policies Beat Superhuman Go AIs」中发现的那样。对抗性技术找到了足够清晰以至于人类可以复制的策略。

在附录 G.2 中，我们的一位作者，一位围棋专家，能够在没有任何算法帮助的情况下，通过学习对手的对局记录来实现这种 [cyclic] 攻击。他们在 KGS 在线围棋服务器上以标准人类条件对局，在与作者无关的顶级 KataGo 机器人对局中取得了超过 90% 的胜率。

作者甚至在给机器人 9 个让子的情况下获胜，这是一个巨大的优势：拥有这些让子的人类职业棋手在面对任何对手（无论是人类还是人工智能）时，胜率几乎都是 100%。他们还击败了 KataGo 和 Leela Zero，二者每局棋的搜索次数都达到了 10 万次，这通常远远超出了人类的能力范围。此后，其他人类也利用 cyclic 攻击击败了其他各种顶级围棋 AI。

与此同时，几年前，OpenAI 创建了一个系统，该系统击败了 Dota 2 的卫冕世界冠军。在向公众开放该系统以测试其稳健性后，一个团队设计了一套策略，取得了 10 场连胜。

基于这一点，你可能会持一种悲观的观点，认为即使是连接 19 x 19 围棋棋盘或 Dota 2 这样一个简单的「现实」，其额外复杂性就足以使稳健行为具有挑战性。我认为这种观点有失公允，因为这两个系统都没有将稳健性作为最高目标，但我确实认为它们是一个有趣的案例研究。

最近，围绕 LLM 的炒作浪潮一浪高过一浪 —— 他们能做什么，他们能在哪里应用。这其中隐含的一个信念是，LLM 可以极大地改变人们在工作和休闲中与技术交互的方式。换句话说，LLM 将改变我们与现实交互的方式。事实上，我也加入了这股炒作浪潮，具体来说，我怀疑基础模型短期炒作过度，长期炒作不足。然而，这也意味着，对于一个历来不善于考虑现实的领域来说，现实的一切混乱都将到来。

就在这个人说机器人技术是浪费资源的同一个 ML 会议上，我提到我们正在用真实机器人进行基础模型实验。有人说这似乎有点吓人，我向他们保证这只是一个研究原型。但我也觉得 LLM 生成和执行软件有点吓人，我觉得他们隐隐担心一个却不担心另一个很有意思。硅谷的人有点自相矛盾。他们既相信软件能推动初创企业实现惊人的变革，又相信他们的软件不值得深思或反省。我认为，比特世界与原子世界一样，都是现实的一部分。它们在不同的层面上运行，但都是现实的一部分。

我注意到（有些幸灾乐祸），LLM 从业者也开始遭遇之前机器人技术碰到过的痛点。比如「我们无法复制这些训练，因为这太耗费资金了」。是啊，这个问题在机器人领域已经讨论了至少十年。再比如，「我没法让必应告诉我《阿凡达 2》的上映日期，因为它一直在调出关于自己的新闻报道，并在生成前进行自我修正。」

我们现在所处的世界，任何公开的互联网文本都会不可逆转地影响检索增强生成。欢迎来到全局可变状态。每当我看到有人声称 ChatGPT 的行为出现了倒退，我就会想起我和其他人为了解释机器人性能突然莫名下降而想出的各种「阴谋论」，以及问题究竟是出在模型、环境，还是我们的过度推断。

俗话说「所有的机器人 demo 都在撒谎」，人们发现所有的 LLM demo 也都在撒谎。我认为，从根本上说，这是无法避免的，因为人类的注意力是有限的。重要的是评估谎言的类型、大小和重要性。他们是否展示了模型 / 机器人如何泛化？他们有没有提到这些例子是如何精挑细选的？一旦将现实联系起来，这些问题就会变得更加复杂。梅西目前看起来是个不错的球员，但「他能在斯托克城寒冷的雨夜做到这一点吗」？

让问题变得复杂的是，这些问题的答案并不总是「否」。梅西可以在斯托克城的寒冷雨夜做到这一点。他足够优秀。这让问题变得困难，因为正确地回答一个「是」比正确地回答一个「否」要重要得多。随着 LLM 越来越优秀，随着 AI 在日常生活中越来越常见，作为一个社会，我们需要越来越善于判断模型是否已经证明了自己。我对未来的主要担忧之一，就是我们不善于评估模型是否已经证明了自己。

但是，我期望机器人学家会走在曲线的前面。在 LLM 操纵通用基准测试的说法出现之前，我们就在抱怨评估问题。早在「我们需要更好的数据覆盖率」成为基础模型预训练团队的口号之前，我们就在努力获取足够的数据，以捕捉自动驾驶的长尾效应。机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中，随着它真正开始发挥作用，我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。这些挑战是可以克服的，但会很艰难。欢迎来到现实世界。欢迎来到痛苦的世界。

本文源自「私域神器」，发布者：siyushenqi.com，转载请注明出处：https://www.firethy.com/33960.html

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

siyushenqi.com

11.6K 文章

0 评论

420 问题

16 粉丝

私域神器：海外私域营销拓客软件

美国AI芯片公司，疯狂融资

上一篇 2025 年 8 月 13 日下午11:37

AI争霸战开启！OpenAI急建10万块GB200超算，马斯克10万块H100月末开训

下一篇 2025 年 8 月 13 日下午11:37

海外营销

免缴VAT税、佣金下调、销售额暴涨95%，这个市场的新卖家正在闷声发财！

继墨西哥新税法不适用于中国跨境卖家的利好消息之后，6月17日，Mercado Libre平台开始实施新的佣金模式，将原17.5%固定佣金模式改成按类目收取佣金的模式。

siyushenqi.com
2025 年 8 月 13 日
76000
海外营销

徐福记“出海”按下加速键！

北美市场翻倍增长后，徐福记定下三年破亿的“小目标”

siyushenqi.com
2025 年 8 月 13 日
70000
海外营销

“电报”创始人在法国被捕，俄方发声

俄罗斯国家杜马副主席达万科夫25日凌晨呼吁俄罗斯外交部设法解救杜罗夫，他表示已经向俄罗斯外交部长拉夫罗夫发出了相应的请求。

siyushenqi.com
2025 年 8 月 14 日
86000
海外营销

痛丢700万首BGM，TikTok开创自己的音乐帝国

AI作曲，字节发行，TicToc专心搞音乐？

siyushenqi.com
2025 年 8 月 18 日
93000
海外营销

一周要闻NO.126丨周受资联系马斯克寻求破局之道；OpenAI获软银15亿美元新投资；东南亚多国加强跨境电商监管

一起看看这周有哪些出海圈值得关注的大事记吧！

siyushenqi.com
2025 年 8 月 14 日
64000
海外营销

隐私新政带来的变化——2021年全球应用内广告变现eCPM概览（Q3更新）

进入2021年的下半年，Appodeal对其全球移动eCPM和App内广告变现报告进行了Q3版本（也就是呈现Q2数据）的更新。

siyushenqi.com
2025 年 8 月 25 日
107000
海外营销

当头部游戏遇上广府文化，这可能是今年最“地道”的一场联动

这款产品的旺盛生命力究竟从何而来？

siyushenqi.com
2025 年 8 月 24 日
106000
海外营销

微软、IDC联合发布：企业级生成式AI，5大应用趋势

企业在生成式AI方面的投资可以获得3.7倍的回报，顶级AI领导者实现的回报更是高达10.3倍。

siyushenqi.com
2025 年 8 月 13 日
72000
海外营销

魔性玩具成爆款！TikTok上有26亿曝光

今年初，一款比几年前指尖陀螺更为魔性的玩具突然风靡 TikTok ，不仅引得众多用户跟风种草，还成为东南亚地区的现象级爆款玩具。

siyushenqi.com
2025 年 8 月 13 日
118000
海外营销

Sam Altman剑桥演讲遭抵制，MIT学者惊曝Llama 2开源能造毁灭人类病毒！AI大佬激烈对线战火持续

「AI灭绝人类」的全球讨论继续升级，Sam Altman在剑桥活动现场被抗议者当面抵制！而LeCun、吴恩达的「开源派」和Bengio、马库斯的「毁灭派」，也纷纷甩出言辞恳切的联名信，继续征集签名中。

siyushenqi.com
2025 年 8 月 13 日
98000
海外营销

拿着46个版号，股价暴涨180%，这家厂商赌对了一个新风口

今年准备大干一场？

siyushenqi.com
2025 年 8 月 24 日
108000
海外营销

这届越南年轻人，在中国互联网平台疯狂“淘宝”

今时不同往日，越南年轻人很“潮”

siyushenqi.com
2025 年 8 月 12 日
96000
海外营销

《青春有你2》出海记：攻克语言+抢滩市场+海外反哺，爱奇艺开启海外营销2.0时代

青春有你2》成功出海，并用国外热度反哺国内，在话题、流量、影响力等层面进行突破，这也为团体偶像选拔节目甚至整个国产综艺释放了一个信号：在综N代刷屏的情况下，综艺节目的

siyushenqi.com
2025 年 8 月 13 日
95000
海外营销

一个创意能做三个爆款？美国最火小游戏TOP10盘点

靠创意取胜的不仅仅是独立游戏，还有超休闲小游戏，这点已经成为当下业内的共识

siyushenqi.com
2025 年 8 月 26 日
107000
海外营销

Lazada要进军欧洲了？

上周，几家在新加坡的区域和国际媒体几乎同时报道Lazada进军欧洲的计划。我们还询问了相关媒体的朋友，似乎他们的消息来源还不一样。

siyushenqi.com
2025 年 8 月 13 日
109000
海外营销

会做策划，能写代码：聊天机器人ChatGPT将抢走更多游戏人的饭碗？

策划美术程序运营，一个也别想跑。

siyushenqi.com
2025 年 8 月 14 日
83000
海外营销

为了展现AI的价值，这家游戏公司让AI主持了一场财报电话会议

通常情况下，公司财报电话会议的形式不太会引起人们的特别关注，但最近，美国游戏公司PlayStudios公布第一季度业绩时的电话会议显然是个例外。

siyushenqi.com
2025 年 8 月 14 日
91000
海外营销

只测三天，主打4V4V4，腾讯做了一款大胆的射击游戏

本周末，一款名为《ALARA Prime》的射击游戏在Steam上开启了Alpha测试，又因为是由腾讯的海外品牌Level Infinite，所以引起了我的注意。

siyushenqi.com
2025 年 8 月 24 日
104000
海外营销

当中产女孩梦想“成为白女”

如果你有幸观察过小红书女孩的最新审美风向，恐怕你会一不小心踏进种族主义怪圈。一句雄伟的slogan正在小红书拔地而起—— 质疑白女，理解白女，成为白女。

siyushenqi.com
2025 年 8 月 18 日
111000
海外营销

《2024年东南亚手游市场洞察》- 2024H1东南亚手游下载量环比增长3.4%至42亿次，印尼市场高速增长，占总下载量的41%

2024年上半年，东南亚市场手游下载量环比提升3.4%至42亿次，印度尼西亚是东南亚手游下载量最高的国家，贡献了41%的总下载量。

siyushenqi.com
2025 年 8 月 17 日
98000
海外营销

增长近60%！2023，TikTok的造富神话仍在继续？

卖家：新年愿望，只有搞钱

siyushenqi.com
2025 年 8 月 12 日
88000
海外营销

哪些行业在海外需要用到海外社媒渠道的私域流量？

在海外，许多行业都需要利用社交媒体渠道的私域流量来提升品牌知名度、客户互动和销售转化。以下是一些主要行业： 1. 电子商务：跨境电商：通过Facebook、Instagram、WhatsApp等平台建立私域流量池，进行精准营销和客户维护。DTC品牌：直接面向消费者的品牌通过社交媒体建立私域流量，增强客户忠诚度。 2. 教育：在线教育：通过LinkedIn、F…

siyushenqi.com
2025 年 3 月 5 日
482000
海外营销

关于你的收入（一）谷歌的定价

隔一段时间需要刷新汇率。

siyushenqi.com
2025 年 8 月 3 日
100000
海外营销

最年轻的百亿富豪，“扶不起”直播电商

身价缩水5490亿元，扎克伯格离开直播间。

siyushenqi.com
2025 年 8 月 12 日
78000
海外营销

昆仑万维开源2千亿稀疏大模型天工MoE，全球首创能用4090推理

是首个完整将 MoE Upcycling 技术应用并落地的开源千亿 MoE大模型，也是首个支持用单台 4090 服务器推理的开源千亿 MoE大模型。

siyushenqi.com
2025 年 8 月 13 日
81000
海外营销

3个月完成两轮融资欢澄互娱CEO:用互动游戏再造社交类App的3.0时代

率先做出改变的人，才有可能成为头部玩家

siyushenqi.com
2025 年 8 月 24 日
94000
海外营销

怎么通过社交媒体平台找到外贸客户？外贸新人不得不知的步骤！

随着互联网的快速发展，社交媒体已成为外贸客户寻找和建立业务关系的重要渠道之一。以下是一些关于如何通过社交媒体找到外贸客户的建议： 1. 确定目标客户群体在开始使用社交媒体之前，需要明确自己的目标客户群体，例如年龄、性别、职业、兴趣爱好等等。只有明确了目标客户群体，才能更有针对性地使用社交媒体，提高客户转化率。 2. 选择合适的社交媒体平台不同的社交媒体平…

siyushenqi.com
2024 年 9 月 20 日
540000
海外营销

电商爆发连锁反应：沙特海外仓增加，导致金属货架成本上涨

沙特一家金属货架公司的老板在接受本地媒体报 Al Arabiya的采访时表示，由于疫情推动的电子商务繁荣，海外仓发展速度迅猛，导致本地仓库租金上涨，海外仓货架畅销，货架原材料的铁价“疯狂”上涨 120%。

siyushenqi.com
2025 年 8 月 13 日
86000
海外营销

干货荟萃丨时间在线/广大大/腾讯云齐聚深度探讨新社交风口下的模式升级

新社交风口下的模式升级

siyushenqi.com
2025 年 8 月 25 日
110000
海外营销

网易投资游戏健身公司PlayPulse，后者将推触屏动感单车

挪威健身游戏初创公司PlayPulse宣布获得网易游戏的投资，这笔钱将用于帮助其在2023年初推出首款产品PlayPulse One健身自行车

siyushenqi.com
2025 年 8 月 24 日
100000