智东西(公众号:zhidxcom)
编译 | 王欣逸
编辑 | 程茜
智东西10月(yue)(yue)30日(ri)消息,10月(yue)(yue)29日(ri),AWS(亚(ya)马(ma)逊(xun)云科技)宣布与Anthropic合作开(kai)发的AI超(chao)级集群Project Rainier已投入使用,目(mu)前集成了近50万颗亚(ya)马(ma)逊(xun)自(zi)主研发的Trainium2芯片(pian)(pian),预计到今(jin)年(nian)年(nian)底,Anthropic的AI模(mo)型Claude将(jiang)在超(chao)过100万颗Trainium2芯片(pian)(pian)上(shang)运行。
AWS称(cheng),Project Rainier的规模(mo)(mo)比该公司以往任何AI计(ji)算平台(tai)都大(da)出约70%。去(qu)年12月,AWS宣布(bu)(bu)启动Project Rainier,旨在构建一(yi)(yi)个(ge)分(fen)布(bu)(bu)在美(mei)国(guo)多个(ge)数据中心的AI计(ji)算集群。距离项目(mu)首(shou)次宣布(bu)(bu)仅不到一(yi)(yi)年的时间,Project Rainier就正式上线。这一(yi)(yi)计(ji)划采(cai)用了近50万颗Trainium2芯片,提(ti)供的计(ji)算能力是Anthropic之前(qian)用于训练(lian)其AI模(mo)(mo)型的五(wu)倍以上。

▲Project Rainier(图源:Amazon)
Trainium2是(shi)一(yi)款(kuan)专门为(wei)训练AI系统而定(ding)制的AWS AI芯(xin)片,拥有极其(qi)强大的性能,单颗芯(xin)片每秒可完成数万亿次计算。区别于笔记本电(dian)脑或手机中的通用芯(xin)片,Trainium2专门为(wei)训练复(fu)杂的AI模型所需的海量数据而设计。
数千(qian)个Trainium2芯片将连接成一种(zhong)新型的Amazon EC2 UltraServer和EC2 UltraCluster架(jia)构,从而(er)实现(xian)整个庞(pang)大(da)系统内(nei)的超(chao)高速通信(xin)和数据共享。
Anthropic正在利用Project Rainier的计算集群(qun)来构建和部署其(qi)AI模(mo)型Claude,该(gai)公司计划(hua)在今年年底前,在Project Rainier上使用超过100万个Trainium2芯(xin)片(pian)。
目前,Project Rainier正被用(yong)于(yu)构建和部署升级(ji)版本的(de)Claude。AWS称,当用(yong)于(yu)训练(lian)大模型的(de)计算(suan)能力越强,训练(lian)出(chu)的(de)模型就会变得越智能、越精(jing)准。
结语:AWS押注AI超级算力工厂竞赛
AWS杰出工(gong)程(cheng)师(shi)兼Trainium首席架构师(shi)罗(luo)恩(en)·迪亚曼特(Ron Diamant)称(cheng):“这是一(yi)(yi)个(ge)规(gui)模庞大、独一(yi)(yi)无二的基础设施(shi)项目,它将引领(ling)下一(yi)(yi)代AI模型的到来。”
10月28日,亚马逊宣(xuan)布裁(cai)员(yuan)约3万人,据外媒CNBC报(bao)道,亚马逊正(zheng)在进(jin)一步调(diao)整资(zi)源结构,重新分配,优先向AI和Trainium芯(xin)片(pian)等(deng)倾斜。
亚马逊将于今日收(shou)盘后(hou)公布第三季度(du)财报,AWS的增长情况将备受关注。
来源:路透(tou)社、Amazon