Mozilla/5.0(compatible;Baiduspider/2.0; http://www.baidu.com/search/spider.html) 倘使“一品威客网”四面楚歌我见犹怜

谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰

2022-01-30 13:25:48 | 来源:一品威客网
小字号

“一品威客网” 谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰

机械之心报导编纂:张倩「机械进修一向糊口在一个令机械人专家、化学家、生物学家和神经科学家恋慕不已的泡沫中。我们所有人都将碰到其他人多年来一向在应对的一样的实际壁垒,跟着它真正最先阐扬感化。」有人说。机械人范畴进展迟缓,乃至和机械进修的其他子范畴比拟显得毫无进展。谷歌 DeepMind 机械人科学家、SayCan、RT-1、RT-2 等具身智能项目介入者 Alex Irpan 赞成这一说法。但他认为、实际的复杂性决议了他们难免碰鼻,这是由于机械人学是一个和实际慎密毗连的范畴。他还指出、这些问题不是机械人手艺所独有的。一样的问题也合用于年夜说话模子(LLM)等手艺。这些模子在面临实际世界时、会碰到与机械人学近似的复杂性问题。比来、他写了一篇题为「The Tragedies of Reality Are Coming for You(实际的悲剧正在向你袭来)」的博客来论述这一概念。实际的悲剧正在向你袭来2023 年、我加入了一次 ML 会议。夜未央、把资本给谁?」我不记得他人是怎样说的,你会砍失落哪一个,话题转到了一个问题上:「假如你能把任何一个机械进修子范畴的资本都给另外一个子范畴,酒酣耳热,但有一小我说他们会砍失落机械人。当我进一步追问时。相对其他范畴来讲,他们说机械人手艺进展太慢,甚么都没有产生。他们说机械人手艺比纯软件的机械进修子范畴进展迟缓,但我还想弥补两点:机械人进修进展较慢的缘由是:假如不解决困难,我认为他们说得没错,就很难有所作为。机械人手艺的困难并不是机械人独有。在机械人手艺范畴、人们常说的一句话是「实际是紊乱的」。相对代码而言、我会将其延长为「实际是复杂的」。在机械人手艺中、你常常要将紊乱的实际推向一个足够好的抽象层,以便代码可以或许在其上阐扬感化。作为一个范畴、计较机科学花了数十年时候在硬件和软件之间建立了杰出的抽象层。代码描写了若何将电力输送到硬盘、处置器和显示器、我乃至不需要斟酌它,它足够靠得住。如许做有良多益处。一旦你完成了这项艰难的工作,并将你的工作进辗转移到抽象的逻辑空间中,一切城市变得更轻易。代码和数据的可复制性使人难以置信。我在 3 台装备上同步了代表这篇博文草稿的文件副本。乃至不消破费任何精神思虑。不外。所有抽象在某种水平上都有缝隙,就像 Joel Spolsky 所说,而我发现机械人手艺中的缝隙常常更年夜。有良多犯错的体例与代码的准确性无关。这和这个学科的一些根基道理有关吗?有一点。良多机械人硬件比笔记本电脑或 Linux 办事器更具尝试性。消费类机械人还不是一年夜财产。「尝试性」常常意味着「希奇的、更轻易呈现故障的状况」。可是、我不认为硬件是造成问题的首要缘由。实际才是问题的本源。Benjamin Holson 在他的「Mythical Non-Roboticist(神话般的非机械人学家)」一文中说得很是好:第一个难点在于、机械人要处置的是实际世界中不完善的感知和不完善的履行。全局可变状况是一种糟的编程气概、由于它真的很难处置,全部物理世界都是全局可变状况,但对机械人软件来讲,你只能不成靠地察看它,并但愿你的步履能接近你想要实现的方针。机械人研究依靠于在实际与软件之间搭建新的桥梁、但这也产生在机械人研究以外。任何与实际对接的软件、对实际的领会都是不完善的。任何试图影响实际世界转变的软件、都必需应对实际的全局可变状况。任何软件、就会招致匹敌性的噪声和复杂性,假如其行动依靠于实际中产生的工作。游戏 AI 就是一个很好的例子。国际象棋 AI 是靠得住的超人。但是。正如 Tony T. Wang 等人在 ICML 2023 论文「Adversarial Policies Beat Superhuman Go AIs」中发现的那样,一些超人围棋 AI 是可以击败的,假如你以特定体例下棋。匹敌性手艺找到了足够清楚以致于人类可以复制的策略。在附录 G.2 中、一名围棋专家,我们的一名作者,经由过程进修敌手的对局记实来实现这类 [cyclic] 进犯,可以或许在没有任何算法帮忙的环境下。他们在 KGS 在线围棋办事器上以尺度人类前提对局,在与作者无关的顶级 KataGo 机械人对局中获得了跨越 90% 的胜率。作者乃至在给机械人 9 个让子的环境下获胜,胜率几近都是 100%,这是一个庞大的优势:具有这些让子的人类职业棋手在面临任何敌手(不管是人类仍是人工智能)时。他们反击败了 KataGo 和 Leela Zero、两者每局棋的搜刮次数都到达了 10 万次,这凡是远远超越了人类的能力规模。尔后,其他人类也操纵 cyclic 进犯击败了其他各类顶级围棋 AI。与此同时,OpenAI 建立了一个系统,该系统击败了 Dota 2 的卫冕世界冠军,几年前。在向公家开放该系统以测试其稳健性后、一个团队设计了一套策略,获得了 10 场连胜。基于这一点、你可能会持一种灰心的概念,其额外复杂性就足以使稳健行动具有挑战性,认为即便是毗连 19 x 19 围棋棋盘或 Dota 2 如许一个简单的「实际」。我认为这类概念有掉公允,由于这两个系统都未将稳健性作为最高方针,但我确切认为它们是一个有趣的案例研究。比来、他们能在哪里利用,环绕 LLM 的炒作海潮一浪高过一浪 —— 他们能做甚么。这此中隐含的一个信心是。LLM 可以极年夜地改变人们在工作和休闲中与手艺交互的体例。换句话说。LLM 将改变我们与实际交互的体例。事实上。具体来讲,我也插手了这股炒作海潮,我思疑根本模子短时间炒作过度,持久炒作不足。但是,这也意味着,对一个历来不长于斟酌实际的范畴来讲,实际的一切紊乱都将到来。就在这小我说机械人手艺是华侈资本的统一个 ML 会议上,我提到我们正在用真实机械人进行根本模子尝试。有人说这仿佛有点吓人,我向他们包管这只是一个研究原型。但我也感觉 LLM 生成和履行软件有点吓人,我感觉他们隐约担忧一个却不担忧另外一个很成心思。硅谷的人有点自相矛盾。他们既相信软件能鞭策草创企业实现惊人的变化,又相信他们的软件不值得沉思或检讨。我认为,比特世界与原子世界一样,都是实际的一部门。它们在分歧的层面上运行。但都是实际的一部门。我留意到(有些幸灾乐祸)。LLM 从业者也最先遭受之前机械人手艺碰着过的痛点。好比「我们没法复制这些练习。由于这太花费资金了」。是啊。这个问题在机械人范畴已会商了最少十年。再好比。并在生成进步行自我批改,由于它一向在调出关于本身的新闻报导,「我没法让必应告知我《阿凡达 2》的上映日期。」我们此刻所处的世界。任何公然的互联网文本城市不成逆转地影响检索加强生成。接待来到全局可变状况。每当我看到有人宣称 ChatGPT 的行动呈现了倒退。我就会想起我和其他报酬领会释机械人道能忽然莫名降落而想出的各类「诡计论」,和问题事实是出在模子、情况,仍是我们的过度揣度。俗语说「所有的机械人 demo 都在说谎」。人们发现所有的 LLM demo 也都在说谎。我认为。从底子上说,由于人类的留意力是有限的,这是没法避免的。主要的是评估假话的类型、巨细和主要性。他们是不是展现了模子 / 机械人若何泛化?他们有无提到这些例子是若何精挑细选的?一旦将实际联系起来。这些问题就会变得加倍复杂。梅西今朝看起来是个不错的球员。这些问题的谜底其实不老是「否」,但「他能在斯托克城严寒的雨夜做到这一点吗」?让问题变得复杂的是。梅西可以在斯托克城的严寒雨夜做到这一点。他足够优异。这让问题变得坚苦,由于准确地回覆一个「是」比准确地回覆一个「否」要主要很多。跟着 LLM 愈来愈优异,作为一个社会,我们需要愈来愈长于判定模子是不是已证实了本身,跟着 AI 在平常糊口中愈来愈常见。我对将来的首要耽忧之一、就是我们不长于评估模子是不是已证实了本身。可是、我期望机械人学家会走在曲线的前面。在 LLM 把持通用基准测试的说法呈现之前、我们就在埋怨评估问题。早在「我们需要更好的数据笼盖率」成为根本模子预练习团队的标语之前、以捕获主动驾驶的长尾效应,我们就在尽力获得足够的数据。机械进修一向糊口在一个令机械人专家、化学家、生物学家和神经科学家恋慕不已的泡沫中。我们所有人都将碰到其他人多年来一向在应对的一样的实际壁垒,跟着它真正最先阐扬感化。这些挑战是可以降服的,但会很艰巨。接待来到实际世界。接待来到疾苦的世界。原文链接:https://www.alexirpan.com/2024/07/08/tragedies-of-reality.html。

一品威客网本文心得:

作为一家专注于本地服务的在线平台,一品威客网近年来在当地一直走在最前沿。今天,我们将为大家介绍一品威客网最近推出的新功能和一些热点活动。

一品威客网一直致力于为用户提供高品质、可靠的本地服务。为此。以进一步提升用户的服务体验,他们最近推出了一系列新功能。

(责编:admin)

分享让更多人看到