杏彩体育登录2025年,跟着Claude 、ChatGPT、Gemini Pro等大模子才气的跃升,AI Agent成为科技周围最炙手可热的话题。这些Agent不再只是被动回应,而是呈现出惊人的主动性:它们能贯通丰富指令、剖析职分方针、一连追踪进度,乃至正在告竣职分时像人类帮手相似主动供应倡议。
采访中,李飞飞暗示:我本身也会用少少大型发言模子去贯通某个观点、读一篇论文,或者提出少少我不太懂的题目。举动斯坦福以人工本的人为智能研商院的开创者,她对AI Agent的贯通愈加求实,最让我兴奋的是看到别人,加倍是孩子们,也正在用它来进修和抬高本身。我以为,靠天然发言来分享学问,或者让人们通过天然发言去寻找、构想、进修,是一个出格壮大的格式。但她同时指引:不管AI何等壮大,都要确保人们保存本身的自决性(agency)。正在她看来,AI Agent的底子定位该当是器械而非主导者,是赋能者而非取代者。这种见解正在当下显得尤为主要:咱们既要拥抱AI带来的更动,又要维持苏醒的认知。
那么,正在2025年这个被称为AI Agent元年的期间,咱们真相须要什么样的AI Agent?又该怎么掌握时机?正在此次深度对话中,这位筹划机视觉周围的前驱者给出了她的谜底。
李飞飞:要说知道完全的谁人“要害期间”实在不太容易,但约莫是正在 2006 年前后。当时我出格参加地正在做研商,应用机械进修算法来试验贯通物体和图像。无论我如何做、如何看,都无法逃避一个数学观点:那即是机械进修中的“过拟合”(overfitting)。所谓过拟合,即是模子的丰富度和模子所用数据之间不可婚。加倍当数据——不但仅是数据量,还少见据的丰富度——并不行有用驱动模子的期间,这个题目就会出格卓绝。
当然,并不是全数模子都生而平等。咱们现正在理解所谓“NE 汇集模子”(注:此处原文中显露“NE Network models”,也许指的是神经汇集模子)拥有更高的容量和表征才气。但撇开这些术语不道,数据和模子之间必定是存正在彼此功用的。然而我当时呈现,多人只闭怀模子,却不闭怀数据,或者说只闭怀模子却以过失的格式对于数据。这恰是当时我出现灵感的源由——我认为咱们不但要闭怀模子,或者说不行只用一种格式闭怀模子,而是要闭怀数据,让数据来驱动模子。那时我恰巧到了早期职业生活的下一阶段,去普林斯顿大学任教。我正在那里接触到了一个叫做“WordNet” 的项目。WordNet 与筹划机视觉自己没有直接干系,但它是一种很好的格式来结构全国上的各样观点,并且我也很可爱“WordNet”这个名字。然后,一件事务饱吹着另一件事的成长,ImageNet 就云云降生了。它实在源自我对“大范畴数据以及对视觉全国多样化表征”的剧烈决心。
主办人:你正在 AI 职业生活的中段,创修了这个了不得的 ImageNet。现正在你们又有一个 World Labs(全国实行室),我思把这条线从 ImageNet 连续延迟到 World Labs。能不行和咱们道道 World Labs 的思法是什么?你正正在构修什么,这对咱们贯通 AI 的异日以及对 World Labs 自己,都拥有若何的要害旨趣呢?
李飞飞:确实云云。我整体人的研商生活——加倍是正在 ImageNet 之后——连续正在出格静心地推敲一个题目:什么是“智能”?咱们怎么正在机械中告终智能?归根结底,对我来说,它可能剖析为两个出格简陋的方面:假设咱们瞻仰人类智能,一方面,咱们会“言语”。咱们应用发言来疏通,来结构咱们的学问,来互换音讯。不过,智能又有另一个“半边”,对咱们来说同样深远,那即是咱们会“任务”。咱们会去做各样事务,好比做早餐煎蛋饼,或者去郊游;又或者跟诤友们一同游戏,享用互相的奉陪。这些手脚远远超越了咱们说出的任何发言。好比咱们可能惬意地坐正在对方眼前,手里拿着啤酒罐,这些都属于“智能”的一个别。
这一个别智能,实质上是创办正在咱们对三维全国的贯通之上——咱们可以感知这个三维全国,并把它转化为一套贯通、推理以及预测的进程,从而让咱们可以活着界里运动。正在我看来,这种才气就叫做“空间智能”(spatial intelligence)。它是拥有实体躯体的灵巧生物(好比人类)所固有的、最底子的本能——去向理三维空间的才气。ImageNet 之是以会显露,是由于我思要给二维图像中的像素贴上标签,而对待人类而言,二维图像是三维全国的投影。是以,从某种水平来说,ImageNet 是咱们去贯通所处的完美可视全国的“起步阶段”。这个起步阶段出格要害,由于无论对人、动物仍是机械来说,贯通并给这些图像和物体打标签,都是很主要的第一步。
不过现正在,天啊,一经过去 15 年乃至 14 年了吧?我认为咱们一经预备好去做一个更宏壮的方针了,简直可能说是一个“全垒打”式的方针:去解锁智能的另一半——也即是“空间智能”这个题目。让空间智能云云用意思的一点正在于,它实质上有两个层面:一个是物理的三维全国,另一个则是数字化的三维全国。而咱们过去连续都无法“生存”正在这两者之间。
主办人:不过现正在来看,空间智能可能成为一种联合的本事,既能贯通与感知“以三维为根本的物理全国”,也能贯通“数字化的三维全国”。我正在推敲空间智能的远景时,假设回到 1880 年,那期间有马车、土壤途——你会认为那真是个截然有异的全国。可假设只回到 1980 年,人们固然开的车不相似,但住房仍是同样的屋子,人们仍旧正在开车,总体来说物理全国的“运作机造”并没有爆发翻天覆地的变动。你认为咱们所说的这“另一半的智能”会不会正在异日几十年真正带来像过去几年数字全国所经验的那种“大改变”,并进而更动实际全国?
李飞飞:我认为会。并且我以为实际与数字之间的范围将首先变得朦胧。举个例子,我会联思本身正在高速公途上开车,假设车胎爆了,我固然是个本事从业者杏彩体育官网,但我仍是会认为这会是个棘手的题目。可假若我能戴上一副眼镜,或者仅仅用手机对着我的车、对着谁人爆胎,通过某个操纵来协帮我退换轮胎,无论是通过视觉指引、仍是对话格式,或者二者团结——我认为这即是一个最普通只是的生存场景,却可能打破物理三维全国和数字三维全国的界限。我脑中浮现出云云的科技图景:它能帮帮人们做任何事,从最简陋的换轮胎,到最丰富的心脏手术。这种联思真的让我兴奋不已。
主办人:你还说过,你常常用 LLM(大型发言模子)来进修各样东西。我认为这是个很唆使人的例子——我家孩子老是认为本身数学不错,就不思再学了,我就可能跟他们说:“看,F.F. 李飞飞都正在用大型发言模子来进修,你们是不是还可能再发愤一点?”只是,说到大型“全国”模子(Large World Models)和大型发言模子(LLMs),当你向别人注脚它们的区别时杏彩体育官网,你会如何讲?你认为它们异日会怎么成长?
李飞飞:从底子上说,就像我之条件到的,一种是“言语的智能”,另一种是“看”和“做”的智能。它们正在模态上有出格底子的区别。大型发言模子所收拾的根基单元是词汇——不管是字母也好,单词也好。而正在咱们所说的“全国模子”(World Models)中,根基单元则是像素(pixels)或者体素(voxels)。两者简直可能说是分歧的“发言”:发言模子对应的是“人类发言”,而三维全国对应的是“大天然的发言”。咱们的方针是让 AI 算法能让人去和“像素全国”举办交互,不管这个像素全国是虚拟的仍是物理的。
主办人:你刚刚的答复让我思起你援用过的一句名言:社会生物学家爱德华·威尔森(Edward O. Wilson)曾说,“咱们具有旧石器期间的心情、中世纪的轨造以及神相似的科技,这实正在是紧张至极。” 那正在云云一个具有天然发言思想、又须要训诲大家的情状下,你认为要若何“反转”这个说法?或者说,正在 AI 期间,人类有哪些时机?
李飞飞:我如故笃信威尔森的那句话,也正由于云云,你、我以及诤友们才一同开创了“以人工本的人为智能研商院(HAI)”。假设要说“反转”那句话,我也许会这么讲:“人类可以造造近似‘神相似’的本事,从而订正咱们所处的‘中世纪’式轨造,并超越、或辅导咱们那‘旧石器期间’的心情,让它们造成造造力、临蓐力仁慈意。”
主办人:那你认为咱们该当如何“构修”这种本事,来帮帮人类告终这些美妙的方针?要点是放正在“怜悯心”上吗?仍是说愈加重视人自己与本事之间的共生干系?假设思让科技和 AI 帮帮咱们成为更好的人,你认为下一步最该做的是什么?
李飞飞:我理解你主修过玄学与本事之类的专业(笑),能看出来你对此很感兴会。我也允诺你的见解。提到那句话,咱们往往把“旧石器期间”看作负面的东西,但实在它并不是一个贬义词,而是个中性的观点。人类的心情、咱们对本身地步的认知,都深深地植根于咱们的进化和 DNA 中,这是不会简单更动的。咱们的全国也正由于云云而既标致又繁芜。是以,当咱们正在研商本事,以及本事和人类异日的干系时,就要去敬佩这些最底子、真正正在“旧石器期间”就扎下来的东西。有几件事是本事成长必需敬佩的,敬佩得越好,对咱们就越有益。
我认为 AI 正在民多层面上的疏通题目之一,即是多人常常正在语句里把“AI”当成主语,近似它取代了人的自决权。好比说,“AI 会治愈癌症”,我有时也不幼心这么说过。可真相是,人类会“应用 AI”去治愈癌症,而不是“AI 本身”去治愈癌症;“AI 会攻陷核聚变”,实在是人类科学家和工程师“应用 AI 器械”去攻陷。更紧张的说法是“AI 会抢走你的办事”之类的。我认为咱们该当看到,这项本事实在有更多机遇去造造新的岗亭、带来更多的也许性,赋能人类的自决性。这是我出格崇拜的一个根基准则。
每局部都生气本身强健、有造诣感,并正在社会中受到敬佩。不管咱们若何研发和应用 AI,都不行轻忽这一点。轻忽它是紧张的,也会事与愿违。我认为光是这两条准则,就足以正在本事开辟的进程中起到指引功用。我之是以会云云辩论,背后的深层决心是:任何本事、任何革新的旨趣,最终都该当是“造福人类”。这也是人类文雅的走向:咱们发现每一种器械,最初都是思把它往好的偏向用。但这就像一把双刃剑,总会有人滥用它,是以咱们也不得不愈加发愤地去让它变得更好,愈加“以人工本”。这也是咱们正在斯坦福一同开创“以人工本的人为智能研商院”(HAI)的底子源由。咱们把 AI 视为一种极其壮大的器械——它是一种“文雅性”器械,是以越早就把一个“以人工本并供职于人类福祉”的框架搭修起来,就越能让咱们正在异日走得更稳。
对待“以人工本的 AI”这一理念,我以为最要害的个别之一,即是“赋能人类”。我生气每一家企业、每一个开辟者都能用命这个理念。
主办人:你正在人为智能周围做了这么多年,承担过各样脚色。我感受良多人现正在才首先迟缓通晓 AI。你对当下 AI 革新的近况如何看?征求咱们现正在所处的位子、开辟者所面对的离间等。你认为要思管理这些题目、再上一个台阶,咱们当下该做些什么?
李飞飞:这是一个非同凡响的期间。我认为这真的是一个强大“拐点”,由于 AI 的操纵现正在可能落到大凡人和大凡企业的实质应用当中。咱们这些早期的 AI 前驱,曾正在任业生活初期所等待的良多愿景,方今一经造成实际或即将成为实际。好比,民多往往说起“图灵测试”,而方今这简直一经是一个被攻陷的困难了。固然图灵测试并不是权衡智能的终极圭表,但它已经被视为一道极难的门槛,方今也可能说是被打破了。主动驾驶也是相似,固然还没做到百分之百完整,但和 2006 年比拟一经得到了壮大转机。是以,我认为跟着这些壮大的模子被真正用于临蓐境况,供应给大凡人和企业应用,咱们现正在正处正在一个令人旺盛的 AI 改善期间。只是我也出格知道,咱们身处硅谷这个“泡泡”之中吧。
主办人:我认为,环球大个别人实在都还正在发愤跟上 AI 的成长程序。咱们当然能看到异日,也理解异日会走向何方。是以我笃信良多 Possible 的听多也会对你所说的那些思法出现共识:AI 也许极大地擢升人类才气,也也许带来壮大的主动影响,但咱们确实须要忧郁那些负面后果,并生气能正在确切的轨道上辅导 AI。那从开辟的角度看,你认为咱们须要如何做才略确保 AI 走向主动的偏向?假设你以为当局或者跨行业的合营是须要的,也请道道这方面的思法。
第一点,我认为咱们该当用“科学”而不是“科幻”来指挥悉数。过去对 AI 的散布和舆论有良多夸诞,好比“AI 会导致人类枯萎”或者“AI 会带来全国安笑”——两种说法都更像科幻而非科学。是以,道到 AI 计谋或管辖时,咱们须要基于数据、基于科学真相和科学办法,这一点出格主要。
第二点,我真的笃信,就像其他良多本事和器械相似,咱们须要给 AI 的操纵场景加上“束缚门径”,即正在真正对人类出现影响的地方去管控,而不是去阻断其上游研发。思思汽车刚显露的期间,实在并不如何安详——最首先乃至没有安详带,没有车门,也没有限速等等。自后咱们确实付出了少少价钱,征求职员伤亡,但随后人们并没有央浼福特或通用“闭停工场”,而是通过立法和囚系,央浼装备安详带、协议速率局限等。本日的 AI 也相似:它是一种极具赋能潜力的本事,但它会带来某些危险,是以咱们该当闭怀它正在实质操纵中的囚系,好比当 AI 被用于医疗时,咱们怎么更新 FDA(美国食物药品监视执掌局)的相应原则;当 AI 被用于金融时,若何创立囚系护栏来确保安详。是以,操纵层面的囚系才是管辖重心所正在。
第三点(但并非不主要)是要理解到:要让 AI 的异日变得主动,须要有一个“主动的生态体例”。这个生态体例既须要私营部分,也须要大多部分。
私营部分既征求大型公司,也征求草创企业,它们都出格主要。大多部分则闭乎“大多产物”(public goods)的临蓐。我以为大多产物可能分两类:
基于好奇心的革新和新学问,好比说用 AI 做聚变研商、用 AI 治病、用 AI 赋能西宾等等。良多云云的思法和研商往来往自大多部分——就像 ImageNet 当年即是源自大多部分声援的研商。
人才(people)。咱们须要让更多年青人、更多民多通晓这项本事,而大多部分正在从 K12(根本训诲)到上等训诲的周围,负担着紧要的社会训诲义务。是以这些即是我出格珍视的几个 AI 管辖与计谋方面的重点。
主办人:你刚刚说的这些,我也思添加一点“AI for all”(让全数人都能接触并应用 AI)的话题。由于你连续都正在饱吹这件事,不生气 AI 只属于那些顶尖老师、从加州理工拿到物理学博士又正在斯坦福任教的精英,而是让全数人都有机遇接触它。能跟咱们道道 “AI for all” 这个项方针工作和功劳吗?
李飞飞:AI For All 是一个非营利结构,我与以前的学生和同事配合开创的。它的工作即是给来自分歧后台的 K12 学生供应机遇,让他们通过大学暑期项目或练习项目接触 AI。云云做的思法即是为了告终“大多产物”中的训诲个别。咱们都理解,AI 会更动全国,但“谁来更动 AI”?咱们生气让更多多元化的人群参与到 AI 的开辟和应用当中,把这项本事操纵到各样美妙的用处上。
正在这个项目里,咱们紧要面向女性、墟落地域或都会贫窭社区的学生,以及那些正在史籍上被低估或代表性亏损的族群。让他们来加入这些暑期课程后,也确实看到良多年青人用 AI 去订正救护车调换算法,或者用 AI 去检测墟落地域的水质题目。固然咱们的发愤目前还对照幼,但我生气它能不停成长。我真的以为,让更多、多元化的群体出席到 AI 里,是一项出格主要的方针。
主办人:你正在医疗周围也做了良多办事,多人该当也审慎到 AI 正在改进人类强健和生存方面大有潜力。能道道你正在医疗周围的研商,以及你对 AI 正在医疗保健(health care)异日成长的盼望吗?
李飞飞:是的,我正在我的书里也写到过,我对 AI 正在医疗周围的操纵充满热忱。源由有良多,此中最中央的是:医疗自己即是“以人工本”(human-centered)的中央周围。整体医疗行业出格宽阔,涵盖从药物研发或体表诊断(bioscience & diagnostics)到临床诊断与调整、到医疗供职(healthcare delivery)和大多卫生。这一强大的系统中,AI 正在每一个枢纽都有也许阐述壮大功用。
我自己出格闭怀的一个周围是“医疗供职”,也即是人与人之间的实质照护场景。好比说,正在美国,咱们的护士数目远远无法餍足病患需求,并且护士的办事负荷出格大,流失率也很高。又有少少惊人的统计数据,好比有的护士正在一个班次里均匀要走四英里的途,只是用来取药或拿修设;或者一个班次里要收拾 150 到 180 项职分。同时呢,病院里也显露了良多安详题目,好比患者由于缺乏足够垂问而从病床上跌落;对待急急的败血症(sepsis)病患怎么举办分诊也是个困难。再加上生齿老龄化题目,好比有些白叟正在家中独居,存正在颠仆危险或晚年痴呆的恶化……是以,正在过去十多年里,我连续全力于研商怎么应用“智能摄像头”(smart cameras)——一种非侵入式、非接触式的摄像头——来帮帮照顾职员更好地闭怀病人的景遇。比如,监测病人是否会从病床上摔下来;假设是正在家,可能监测他们的手脚、心绪或养分摄入;正在手术室里,可能监测手术东西的应用情状,让护士无须不停土地点东西,避免把物品遗留正在病人体内。咱们称这类本事为“嵌入式智能”(ambient intelligence),方针是帮帮医师和医护职员愈加整个地垂问患者,进而擢升集体照顾质料。
主办人:现正在多人也常常提到“AGI”(通用人为智能),但我记得你已经说过:实在你都不确定“AGI”究竟指的是什么,由于分歧人给它的界说都不相似,像是各自的“罗夏尝试”(Rorschach Test)。能不行道道你对“AGI”这场辩论的观念?或者说,咱们该怎么更理性地对于它,而不是要么认为“它太棒了”要么认为“它太恐惧”,似乎要毁掉全数办事或营救整体人类?
李飞飞:这确实既兴趣又令我悲哀。我真心不睬解“AGI”究竟意味着什么,由于我认为这个词最初是来自贸易周围,差不多十年前 AI 逐步成熟后,贸易界就首先更频仍地辩论它。实在,它最初的有意也许是为了夸大异日的 AI 须要“通用化才气”,而不是出格微幼的职分。好比说,现正在的主动驾驶汽车一经比过去那些只可识别“树木”的简单视觉模子要“通用”得多。微幼的 AI 只可告竣一个出格特定的职分,而更“通用”的 AI 能应对多种职分,这简直是个实实正在正在的区别。
我连续认为疑惑的一点是,假设回来 AI 的根源,约翰·麦卡锡(John McCarthy)和马文·明斯基(Marvin Minsky)这些早期涤讪者正在 1956 年那场知名的夏令研讨会上,所肚量的梦思连续都是“让机械能推敲,能帮帮人类计划,乃至能做到少少人类做不到的事”。他们素来没有说“咱们只思做一个只可识别树木的窄周围 AI”。从一开。