杏彩体育官网2024 年是 HPC-AI 墟市大放异彩的一年。SC24的出席人数创下了史册新高,劳伦斯利弗莫尔国度实践室的El Capitan正在Top500榜单上位居榜首, AI 墟市振奋兴盛,超大领域公司正在 2023 年的投资额是其本来高额投资的两倍多。
那么,为什么这扫数感触如许担心谧?跟着 2025 年的到来,HPC-AI 行业正处于一个转移点。不息膨胀的 AI 墟市盘踞了人们的议论话题,极少人费心它会耗尽 HPC 的生机,而另极少人(也许是统一群人)则正在等候 AI 泡沫瓦解。与此同时,政事改变正正在威吓近况,能够会改观 HPC-AI 的墟市动态。
Intersect360 Research正正在造订本年的筹议日程,并参考了HPC-AI 头领机合 (HALO)的私见。咱们造订了有帮于造订新五年预测的侦察,以下是 HPC-AI 墟市正在来日五年面对的五大题目。
正在咱们 SC24 之前的汇集研讨会上,Intersect360 Research 对其 2024 年 HPC-AI 墟市预测实行了庞大调动,公告咱们估计超大领域 AI 将衔接第二年完成三位数增进,而且来日几年将维持高增进率。咱们还抬高了搀杂、当地(非超大领域)HPC-AI 墟市的远景,但与超大领域的宏壮增进比拟,这种相对温和的增进显得微亏欠道。
AI 曾经成为数据核心底子措施议论的中央。比如,正在Hot Chips 2024上,少数几个没有真切合心 AI 的演讲还是提到了它。供应商们正正在竞相拥抱 AI 墟市看似无尽的增进。
超大领域人为智能墟市首要以消费者为主,况且已有先例。超大领域通过从以前不依赖企业准备的消费者墟市中创筑云数据核心墟市,完成了最初的增进。日历、舆图、视频游戏、音笑和视频过去都存正在于线下,社交媒体是一个亘古未有的种别。人为智能正正在开发正在全体这些情景的底子上,而且正正在创作新的情景。
没有哪个墟市是真正盛大无边的,但超大领域组件仍正在探索其上限。举个例子,Meta正在 2024 年 4 月的财报电话集会上公告,它将每年的本钱支付加添到 350 亿至 400 亿美元,以顺应其对 AI 底子措施的加快投资。扣除能够与 AI 无合的本钱支付,Meta 正在其各个平台上环球约 32 亿用户中,每位用户仍有约 10 美元的支付。
正在这种境况下,一家超大领域公司能够祈望通过操纵人为智能每年从每位用户身上出格赚取 10 美元的利润,这是有意义的。要思抵达更高的利润,公司要么须要更多的用户,要么须要更高的每位用户的预期价格。很少有公司具有抢先全国生齿三分之一的用户。单个用户的片面数据能由于人为智能而价格加添 20 美元吗?
除了经济成分除表,超大领域 AI 数据核心分娩中被提及最多的局限成分是功耗。AI 数据核心的设置领域每次都抵达数百兆瓦,以至数千兆瓦。各家公司都正在寻求更始办理计划,为这些设置供应电力。最污名昭著的是,微软与 Crane 洁净能源核心签订了一份合同,将重启宾夕法尼亚州三里岛核电站 1 号机组,该核电站于 1979 年产生过核熔毁事情。(1 号机组独立于产生事情的 2 号机组,从此 1 号机组不断运转。)
以是杏彩体育官网,超大领域人为智能与可连续性观念息息合系,况且环球限造内打发如许多的电力是否负仔肩也是个题目。然则,若是每年花费数百亿美元不是阻碍,那么寻找电力也不是阻碍,超大领域公司尚未找到他们或许获取和打发的电力的极限。
超大领域 AI 的迅猛兴盛最令人惊异的毕竟也许正在于,它并不是大大都数据核心议论的中央。相反,咱们追赶的是“企业 AI”的观念,即 AI 希望彻底改观企业准备。
这场革命无疑会产生。就像片面电脑、互联网和万维网都彻底改观了企业相同,人为智能也将如许。企业人为智能的墟市时机取决于预期的营业结果。要使人为智能成为一项有利可图的方法,有两条途可走:它可能消重本钱,也可能带来更多收入。
到目前为止,大一面重心仿佛都放正在本钱优化上,比如通过精简运营或(让咱们面临实际)裁人。这项投资受到一个纯洁的谜题的局限:你要花多少钱来减削一美元?假使将收益按年准备(每年美元),也给出了值得花费的实质局限。另表,这条途的收益递减。若是一家公司可能花费 200 万美元来每年减削 100 万美元,那么它不太能够正在接下来的 200 万美元中反复同样的本领,以同样的水准得到同样的收益。
至于加添收入,有两品种型:首要收入(总体上创作更多收入)和次要收入(从比赛敌手手中篡夺份额)。咱们以航空公司为例。通过履行人为智能,航空公司是否会吸引更多人乘坐航班?搭客是否会均匀每趟航班花费更多钱,异常是由于航空公司的人为智能?(附加题目:若是是如许,这会奈何影响其他墟市的消费者支付?仍是人们只是有了更多的钱?)
更有能够的是,咱们正正在探求一个比赛性墟市份额论点:因为航空公司 A 的人为智能投资,更多的客户会采取航空公司 A 而不是航空公司 B。正在这种境况下,实时做出改观能够很主要。亚马逊最初是一乡信店。若是 Borders 或 Barnes and Noble 早些投资汇集商务,亚马逊能够长远不会有如许的时机。
但这是一场零和博弈。若是航空公司 A 和航空公司 B 正在人为智能方面的投资类似,而各自的收入维持稳固,那么他们就花了需要的钱却没有成效。(这是微观经济博弈论中模范的“罪人逆境”。正在这个简化的例子中,若是两家航空公司都不投资,两家航空公司都邑受益,但无论对方做什么,每家航空公司实行投资都邑受益。)
最终,那些为人为智能修建硬件、模子和供职的人都寄生机于大领域的企业转移。若是人为智能走上汇集的道途,那么十年后,假使红利才略没有以是飙升,稳当的人为智能投资也将被视为规划本钱。如许一来,人为智能将成为 IT 预算的首要一面,但正在数目上能够与现有的 IT 预算没有太大区别。
正在企业AI的寻觅中,极少硬件公司能够对AI体例最终是放正在当地仍是放正在云端感觉冲突,但关于超大领域社区来说,扫数(包罗AI)即供职是来日的愿景。咱们曾经看到了消费墟市的云化。跟着超大领域数据的高度聚集,AI能够成为企业完成同样主意的杠杆。
Intersect360 Research不绝预测,云准备正在HPC-AI墟市的排泄率将抵达一个临界点,约莫占 HPC 总预算的四分之一。首要局限成分不是任何云阻碍,而是纯洁的本钱;关于任何或许抵达足够高诈欺率的人来说,租用比进货更低贱。另表,数据引力和主权题目正正在饱吹更多机合偏向于当地摆设。举个例子,GEICO的代表正在9月的OCP环球峰会上先容了其全系列利用(包罗HPC和AI)离开云的方法。
但若是云成为独一的采取会奈何?目前,抢先四分之三的 HPC-AI 底子措施(以及所稀有据核心底子措施)都被超大领域墟市所占用。顶级超大领域公司每年花费数百亿美元;它们各自都是一个墟市。正在产物打算和可用性方面,组件和体例筑造商天然会优先探求它们。
那些寻求 HPC-AI 办理计划的人能够会出现,最新技能根基无法得到,由于超大领域企业或许打发特定产物的齐备供应。Nvidia GPU(完成 AI 的绝对奇妙宝石)假使有,代价也很高,况且等候岁月很长。一心于 HPC 的存储公司同样参加了超大领域 AI 摆设。
AI 或许进一步向云准备倾斜。若是真是如许,那么 HPC-AI 技能的内部摆设墟市将陷入退步。HPE、戴尔、Atos/Eviden、富士通、思科、EMC 和 NetApp 等古板 OEM 企业产物和办理计划公司将抢夺较幼的墟市。(联思、Supermicro 和 Penguin Solutions 等其他公司曾经采用了搀杂 ODM-OEM 营业形式,以便有用地向高增进的超大领域墟市发售产物。)
正在人为智能的饱吹下,超大领域公司的兴盛曾经远远赶过了 Intersect360 Research 预测的水准。从史册上看,这种墟市聚集度水准并担心谧。五年前,正在预测超大领域墟市时,Intersect360 Research写道:“这种墟市气力活着界经济史上并非亘古未有,但正在消息技能时期,这种水准从未见过。”
从那时起,超大领域数据核心的兴盛速率大大加快。环球数据核心墟市聚集于少数买家。若是这种趋向连续下去杏彩体育官网,它将从根基上倾覆企业准备的进货和操纵办法,无论买家是否应允,扫数即供职的见解都能够成为实际。
多年来,盘绕 HPC-AI 才略的国度主权题目不绝正在加剧。环球HALO 讨论委员会比来将“HPC 民族主义”列为阻挡行业先进的症结题目。美国、中国、欧盟、英国、中国、日本和印度都基于当地技能提出了独立的 HPC-AI 主权发起。《》 报道,不丹国王吉格梅·凯萨尔·纳姆耶尔·旺楚克比来前去加州的 Nvidia 总部,议论设置 AI 数据核心。
特朗普总统曾经正在加快国度独立的过程。他的政事纲目是美国不同主义,他上任的第一天就表领略激动美国伟大的希图。值得贯注的是,特朗普夸大了星际之门项方针公告,“一家新公司准备正在来日四年内投资 5000 亿美元,正在美国为 OpenAI 设置新的人为智能底子措施。”特朗普称星际之门是“一家新的美国公司……它将简直当即为美国创作 10 多万个就业时机。”
星际之门项目很难被称为特朗普的劳绩,由于明显正在特朗普上任之前它就曾经正在策划中了。另表,投资并非来自美国当局。两家首要出资者软银(日本)和 MGX(阿联酋)都口角美国公司;MGX 是阿联酋当局比来才设立的。但特朗普能够会因创作一个将数据核心和合系做事留正在美国的境遇而得到表扬。
特朗普收拢了这一声明,并将其与他准备履行的战略干系起来。“这将确保技能的来日。咱们思做的是,咱们生机技能留正在这个国度。中国事比赛敌手,其他国度也是比赛敌手。咱们生机技能留正在这个国度,咱们正正在让技能可用,”特朗普指出。
至于星际之门的设置和发电,特朗普誓言要让事故变得纯洁。“我将通过垂危声明供应巨额帮帮,由于咱们有垂危境况。咱们必需筑造这些东西,”他说。“他们必老生产巨额电力,若是他们应允,咱们将让他们或许额表轻松地正在本身的工场竣事分娩。”
特朗普接纳的其他活动,比如当即退出《巴黎天色协定》,都说明他生机美国投资或许敏捷促进,无论表部成分奈何,比如其他国度的心绪或对境遇的忧郁。他允诺将通过松开管造为企业扫清阻碍,并激动美国的能源分娩。全体这些活动都应转化为对 HPC-AI 技能的支付净加添,不但是超大领域公司,况且是症结的 HPC 贸易笔直墟市,比如石油和自然气勘察、筑造业和金融供职。
民多部分支付更令人困惑。新设立的当局效果部 (DOGE) 是一个非官方的讨论机构,由埃隆·马斯克 (Elon Musk) 头领,特意承担缩减当局支付。极少超等准备城堡,如美国能源下属员的科学技能战略办公室 (OSTP),古板上不绝获得两党的大肆赞成。其他当局部分,如 NASA、NSF 或 NIH,能够会受到亲近合心,以至更糟的是,被裁人。
以美国商务下属员的国度海洋和大气照料局 (NOAA) 为例。谷歌上个月公告,其 GenCast 集成 AI 模子可能“比顶级操作体例欧洲中期气候预告核心 (ECMWF) ENS 提前 15 天供应更好的平居气候和十分事变预告”。正在来日四年内,DOGE 会发起缩幼(或打消)NOAA 领域,转而采用私营部分的 AI 合同吗?
美国产生的事故天然也会影响到表洋。欧盟委员会早就起源合心造订不依赖美国或中国技能的 HPC-AI 政策。欧洲 HPC 结合机合实践董事 Anders Jensen正在继承 Intersect360 Research 高级阐述师Steve Conway采访时体现:“主权还是是咱们采购的症结指点规则,由于咱们新收购的体例将越来越依赖欧洲技能。”跟着美国合税和出口局限威吓的加剧,这些尽力只会不息升级。
中国不绝正在尽力完成 HPC-AI 技能独立,中国机合已遏止向半年一次的 Top500 榜单提交体例基准测试。来日几年,中美之间能够会显露相像于上个世纪美苏太空竞赛的“人为智能竞赛”。澳大利亚、加拿大、日本、沙特阿拉伯、韩国或英国等领域较幼但 HPC-AI 势力还是显着的国度将面对挑拨,须要造订政策来跟上程序。
回到美国,值得斟酌的是,正在这种后台下,“美国头领力”意味着什么。固然欧盟一心于民多部分融资,而中国具有特有的国度驾驭本钱主义形式,但美国公司既不属于美国当局,也不受美国当局驾驭。全国上最大的超大领域机合总部设正在美国,但它们是依赖表国客户的环球性公司。同样,Nvidia、英特尔和 AMD 等症结技能供应商也是美国公司,它们也正在表洋发售产物。局限这些产物的分销会损害合系公司的甜头。
Nvidia当局事宜副总裁Ned Finkle正在博客中剧烈进击拜登当局正在总统任期结果几天通过的“人为智能扩散”法规,称其“亘古未有且拥有误导性”,并称其为“囚禁泥潭”,“有能够挥霍美国来之不易的技能上风”。探求到这些见解,特朗普当局面对着一个棘手的题目——既要饱吹操纵全国当先的美国HPC-AI技能,如Nvidia GPU,又要维持对其他国度(更加是中国)的头领身分,由于美国当局以为中国事比赛敌手。
Nvidia 高管层的私见很主要,由于正在 AI 范畴,Nvidia 驾驭着症结技能 GPU。GPU 也曾只限于图形执掌,直到 Nvidia 实行了长达十年的精美尽力,开发了 CUDA 编程模子,将 GPU 引入 HPC。当人们出现 GPU 额表适合为呆板进修供应动力的神经汇集准备时,Nvidia 才真正起源参加比赛。
以是,Nvidia 最天然的两个比赛敌手是美国当先的 CPU 供应商英特尔和 AMD。英特尔的最大上风正在于 CPU。英特尔的 Xeon CPU 还是是企业供职器的首选,数十年来的古板软件都针对它实行了优化。正在供职于古板科学和工程 HPC 代码以及新兴 AI 做事负载的搀杂做事负载境遇中,这些 CPU 的兼容性和本能额表主要。
这种根深蒂固的上风为英特尔供应了一条抵御 GPU 入侵的捷径。值得称赞的是,英特尔预思到了这一威吓并试图遏止它。正在 CUDA 的早期,英特尔公告了本身的准备 GPU,代号为 Larrabee。该项目正在构想不到两年后就被打消了,从未上市。
从那时起,英特尔测试了一个又一个加快器项目,但都以朽败实现,此中包罗集成多核 (MIC) 架构,该架构自后成为英特尔至强融核 (Intel Xeon Phi),无论是举动加快器仍是举动集成 CPU,都以朽败实现。英特尔最新的 GPU 加快器代号为 Ponte Vecchio,始末了一系列延迟,正在阿贡国度实践室的 Aurora 超等准备机中未能抵达本能预期。
英特尔现已放弃维琪奥桥 (Ponte Vecchio) 和之前安插的代号为里亚托桥 (Rialto Bridge) 的后续项目,以是那些盼望英特尔 GPU 的人只可等候一款名为Falcon Shores的产物及其继任者Jaguar Shores ,纵然正在首席实践官帕特·基辛格 (Pat Gelsinger)倏忽退息之后,英特尔全体产物的来日都变得不开朗。英特尔目前确实供应了一款非 GPU 的 AI 加快器英特尔 Gaudi,但尚未对 Nvidia 的主导身分出现庞大影响。
英特尔已放弃其中央 CPU 营业以表的其他测试。英特尔开辟了 Omni-Path 架构,以与 InfiniBand 比赛,成为 HPC 的高端体例互连。正在得到幼幅凯旋后,英特尔便放弃了;Cornelis Networks 从英特尔的垃圾堆中捡起了 Omni-Path,现正在将其发挥光大。英特尔、AMD、Cornelis Networks 和其他公司现正在都插足了超等以太网定约,该定约旨正在完成或许与 Nvidia InfiniBand 比赛的高本能以太网办理计划。
相反,AMD 的 AMD EPYC CPU 和 AMD Instinct GPU 都得到了宏壮的凯旋。正在三家首要供应商中,AMD 是第一个将 CPU 和 GPU 结合正在一道的集成体例推向墟市的公司。AMD 不断正在 HPC-AI 范畴得到份额,其最引人精明的两次成功是劳伦斯利弗莫尔国度实践室的El Capitan 超等准备机和橡树岭国度实践室的 Frontier 超等准备机,这两台超等准备机均由 HPE 头领。
当然,买家的采取不但限于 Nvidia、英特尔和 AMD。Cerebras、Groq 和 SambaNova 等公司都依赖其用于 AI 体例的加快器得到了明显的凯旋。但这些公司都亏欠以对 Nvidia 的墟市主导身分组成比赛威吓。若是此中一家公司或其同伙被一家超大领域公司收购,能够会成为一个成分。
Nvidia 正在 AI 范畴遥遥当先,对 Nvidia 的最大威吓(也能够是独一真正的威吓)是彻底的范式改观。超大领域公司不绝是 Nvidia 最大的客户。这些公司充沛认识到他们对 Nvidia GPU 的依赖,这些 GPU 正在环球限造内需求兴隆,以是代价腾贵且每每求过于供。亚马逊、谷歌和微软都正在内部打算本身的 CPU 或 GPU,要么正在本身的云供职中供应给其他人,要么供本身专用。
与此同时,Nvidia 还投资打造了以 GPU 为核心的新型云供职。CoreWeave、Denvr DataWorks、Lambda Labs 和 Nebius 只是供应 GPU 的云供职的少数几个例子。此中极少是新来者;另极少则是转型的比特币矿工,现正在他们正在 AI 中看到了更广大的远景。
这使得 Nvidia 正在两个方面与其客户开展比赛。起初,Nvidia 正正在打算完全的 HPC-AI 体例,与 HPE、戴尔、联思、Supermicro 和 Atos/Eviden 等供职器 OEM 公司比赛,这些公司以本身的摆设将 Nvidia GPU 推向墟市。其次,Nvidia 正正在资帮或以其他办法赞成 GPU 云,与本身的超大领域云客户比赛,这些客户本身也正在打算执掌单位,这能够会省略他们来日对 Nvidia 的依赖。
若是人为智能不断兴盛,超大领域不断盘踞主导身分,美国墟市的局限被取消,那么咱们能够谋面对一个新的比赛形式。到本世纪末,题目能够不是英特尔或 AMD 能否超越 Nvidia,而是 Nvidia 奈何与谷歌、微软和亚马逊比赛。
从这个角度看,比赛空间是广大的。关于星际之门项目,OpenAI 与甲骨文和微软结盟,将 Nvidia 举动首要技能协作伙伴,该项目声称将正在来日四年参加 5000 亿美元。去。