机器人前瞻(公众号:robot_pro)
作者 |  许丽思
编辑 |  漠影

机器人前瞻9月8日报道,今天,自变量机器人宣布完成近10亿元A+轮融资。本轮由阿里(li)云、国科投资领(ling)投,国开金融、红杉(shan)中国、渶策资(zi)(zi)本跟(gen)投。老(lao)股东美团战投超额跟(gen)投,联(lian)想之星、君联(lian)资(zi)(zi)本持续追投。

这(zhei)是阿里云首次出手(shou)具身智能(neng)公司(si)。本轮(lun)资金(jin)将用于自(zi)变量(liang)全自(zi)研(yan)通用具身智能(neng)基(ji)础模型的(de)持续训(xun)练和硬件(jian)产品(pin)的(de)研(yan)发迭(die)代(dai)。

自变量机器人的上一轮融资发生在今年5月,自变量机器人完成数亿元A轮融资(zi),由美团战投(tou)(tou)领投(tou)(tou)、美团龙珠跟投(tou)(tou)。自2023年12月成立(li)以(yi)来,其已完成8轮融资(zi),投(tou)(tou)资(zi)方包括括德联资(zi)本、基(ji)石资(zi)本、啟(qi)赋资(zi)本、南山战新投(tou)(tou)、光速(su)光合、君联资(zi)本、华(hua)映资(zi)本、云启资(zi)本、广(guang)发信德投(tou)(tou)资(zi)等多(duo)家机构。

在硬件上,今年8月初,自变量机器人发布了适配多模态大模型控制的全自研轮式双臂仿人形机器人——量子(zi)2号(Quanta X2)。量子(zi)2号(hao)(hao)单手拥有 20 个自由度,能(neng)感知细微(wei)的压(ya)力变(bian)化(hua)。同(tong)时,基于臂手一(yi)体化(hua)外骨骼技术,自变(bian)量首(shou)创“仿人机械臂+高(gao)自由度灵(ling)巧手”一(yi)体化(hua)全(quan)身遥操(cao)方案(an),使得量子(zi)2号(hao)(hao)不仅能(neng)采集(ji)高(gao)质量数据反(fan)哺模(mo)型(xing)(xing)训练,也(ye)将与自研模(mo)型(xing)(xing)深(shen)度融合,真正进入到现实场(chang)景(jing)中落地应用。

近10亿!阿里云首次出手具身创企,红杉、美团、联想也看中了

自变量自主研发WALL-A系列(lie)VLA操作大模(mo)型,能(neng)(neng)够构(gou)建(jian)统(tong)一(yi)的认(ren)知(zhi)与行动框架。在统(tong)一(yi)表(biao)示空间中(zhong),模(mo)型(xing)同时处理感知(zhi)、推理和行动,直接进(jin)行跨模(mo)态的因(yin)果推理和行动决策,让(rang)机器人最终能(neng)(neng)够像人类一(yi)样思考和工作。当前,「WALL-A」模(mo)型(xing)已在部分完全未训练过的新任(ren)务类型(xing)中(zhong)展现出零样本泛化能(neng)(neng)力。

同时,该公(gong)司实(shi)现了端到端具身思维链推(tui)理(li)框架,基于多(duo)模态(tai)输入(ru)进行(xing)深度推(tui)理(li)并生成(cheng)多(duo)模态(tai)输出,形成(cheng)模型自主决(jue)策、执行(xing)、探(tan)索和反(fan)思的(de)完整(zheng)闭(bi)环。模型能够将语言(yan)理(li)解(jie)、视觉(jue)感知与(yu)动(dong)作执行(xing)紧(jin)密结合,形成(cheng)更(geng)接(jie)近人(ren)类思维的(de)推(tui)理(li)过程,成(cheng)功突破多(duo)步骤长序列任务(wu)瓶(ping)颈(jing),任务(wu)完成(cheng)度大幅提升,极(ji)大扩(kuo)展了机器人(ren)处理(li)复杂现实(shi)场景(jing)的(de)能力边(bian)界。

近10亿!阿里云首次出手具身创企,红杉、美团、联想也看中了

今天,自变量还开源了其面向开发者的具身基础模型Wall-OSS,并(bing)公开相关训练(lian)代(dai)码,便于全球(qiu)开发者(zhe)们(men)在(zai)自有本体上快(kuai)速微(wei)调和实(shi)际应用。

Wall-OSS是一个基于大规模(mo)真实(shi)数据(ju)训练的(de)开源具身基础模(mo)型(xing)(xing)。在模(mo)型(xing)(xing)架构(gou)上,创(chuang)新性设计“共享(xiang)注意力 + 专家分流 (FFN)”架构(gou),VLM预训练知识无损迁移到操(cao)作模(mo)型(xing)(xing),语(yu)言、视觉、动作等信息都嵌入在同一个表示空间中处理(li);在训练方式(shi)(shi)上,首创(chuang)“先离(li)散、后(hou)连(lian)(lian)续、再联(lian)合”的(de)三(san)阶(jie)段(duan)训练范(fan)式(shi)(shi),首创(chuang)“先离(li)散、后(hou)连(lian)(lian)续、再联(lian)合”的(de)多阶(jie)段(duan)训练范(fan)式(shi)(shi),保留了(le)VLM 的(de)语(yu)言与(yu)(yu)视觉理(li)解能力,又具备细粒度动作执行力;此(ci)外(wai),统一跨层(ceng)级(ji)思维链(lian)实(shi)现了(le)跨层(ceng)级(ji)抽象层(ceng)面的(de)前向任意映(ying)射,模(mo)型(xing)(xing)能够在单一可微(wei)分框(kuang)架内无缝切(qie)换高层(ceng)决策(ce)与(yu)(yu)底层(ceng)执行。

自变量(liang)机器人(ren)(ren)创始人(ren)(ren)兼CEO王潜毕(bi)业(ye)于清(qing)华大学(xue),是全(quan)球(qiu)最早在神经网(wang)络中引入(ru)注(zhu)意力(li)机制的学(xue)者之一。博(bo)士期(qi)间,王潜曾(ceng)在美国(guo)顶级(ji)机器人(ren)(ren)实(shi)验室参与了(le)多(duo)项Robotics Learning的研(yan)究(jiu),研(yan)究(jiu)方向覆盖了(le)机器人(ren)(ren)的多(duo)个前沿领域。

联合创始人兼CTO王昊是北大(da)计(ji)算物理博士,在粤港澳大(da)湾区数字经济研(yan)究(jiu)院(yuan)(IDEA研(yan)究(jiu)院(yuan))期间担任(ren)封神榜大(da)模型(xing)团队(dui)算法(fa)负(fu)责人,发(fa)布了国(guo)内首(shou)个多模态开(kai)源大(da)模型(xing)“太乙”,首(shou)批百亿级大(da)语言模型(xing)“燃灯”以及(ji)千(qian)亿级大(da)语言模型(xing)“姜(jiang)子(zi)牙”。

自变(bian)量机(ji)器人称(cheng),目(mu)其机(ji)器人已(yi)与(yu)头部服务(wu)业、工业客(ke)户达(da)成合作,在多场景中投入(ru)使用,未来也将与(yu)客(ke)户围绕模型和(he)硬件共建(jian)开放生态,推动具身智能的进一步发展。