智东西(公众号:zhidxcom)
作者|陈骏达
编辑|云鹏

智东西7月26日报道,今天下午,阿里巴巴发布了其首款自研AI眼镜——夸克AI眼镜的技术研发进展。据悉,阿里巴巴AI眼镜已完成研发,预计将于年内正式发布

智东西也在WAIC大会上发来夸克AI眼镜的实拍图,其采用双光机显示设计,镜腿前部相(xiang)较其他AI眼镜更为纤细(xi),大部分组件被放到了镜腿末端,

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

▲夸(kua)克AI眼镜实拍(pai)图(图源(yuan):智东西)

这一AI眼镜将与阿里及支付宝生态融合,可使用支付宝“看一下支付”,具备通义千问大模型夸克最新AI能力还支持高德导航、淘宝比价、点外卖、飞猪商旅提醒等功能。

阿里巴巴智能信息事业群终端业务负责人宋刚称,夸克AI眼镜搭载了高通骁龙AR1芯(xin)片+低功耗协处理(li)器的双芯设计以及安卓+RTOS双系统,实现动态的资源调度;另一方面,其使用了可换电的双电池系统,用户可通过热插拔主电池实现24小时续航

夸克AI眼镜支持调整合像距,避免了单光机方案带来的眼疲劳问题。其镜腿采用钛合金材料一体成型,保证轻量化。

一、换电仓仅有“耳机壳”大小,镜框镜腿重量比为1 : 1

宋刚在(zai)今天下午的WAIC人(ren)工智(zhi)能终端产业发展论坛上分享了(le)夸克AI眼镜的更(geng)多(duo)研发细节和参数。

他称,阿里巴巴认为,AI眼镜会是穿戴智能方向最重要的产品形态,头部设备可以捕获80%以上的人体感知输入,具有极强的场景穿透力,能同时(shi)覆(fu)盖办公、生活以及移(yi)动场景。AI眼(yan)镜有望成为继智能手机之(zhi)后最重(zhong)要的个人移(yi)动入口。

当前,AI眼镜尚未走到普及阶段,面临的主要问题包括不够智能、续航时间短、不够美观舒适等。为解决上述问题,研发(fa)团(tuan)队不仅为夸克AI眼(yan)镜配备常规AI眼(yan)镜所支(zhi)持的音乐、电话、翻译、纪要等功能,还增加了多种新配置和功能。

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

硬件层面(mian),阿里首先通过定制双音圈大振(zhen)膜的(de)小型化扬(yang)声器、定制一(yi)(yi)体化FTC排线、钛合金一(yi)(yi)体化成型镜(jing)腿让眼镜(jing)进一(yi)(yi)步轻量化,同时保(bao)证(zheng)功能。

其镜片也(ye)采(cai)用定制(zhi)方(fang)案,拥有高折射率和镀(du)膜工艺,观感上更(geng)为通(tong)透,也(ye)让镜框(kuang)能做到更(geng)窄、更(geng)薄。

设计鼻托和耳弯接触面时,夸克AI眼镜采用了仿生曲面的设计,实现压力均匀分布。同时将设备重心精准的控制在眼镜几何中心的位置,镜腿、镜框配重比为1 : 1,据说能(neng)提升佩戴(dai)的平(ping)衡感。

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

芯(xin)片方(fang)面(mian),宋刚称,高通(tong)骁龙(long)AR1和低功耗协(xie)处(chu)理器的方(fang)案,可以提升重度负(fu)载场景的功效,也能(neng)降低待机(ji)场景的功耗。

示意图显示,支持更换的主电池位于右侧镜腿,另一侧有一个更小的内置电池,这(zhei)(zhei)让这(zhei)(zhei)款眼镜具备了电池热插拔能力(li)。宋刚说,换电仓(cang)可(ke)随身携带,大小和无线耳(er)机盒(he)差不多大,帮助这(zhei)(zhei)款眼镜实现(xian)24小时续航(hang)。

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

二、拍摄算法针对暗光场景优化,拥有自研大模型中控系统

宋刚认为,AI眼镜行业在拍摄上最大的痛点就是在暗光下噪点偏高,动态范围不足,成片率低。为解决这一问题,夸克AI眼镜使用了自研的Super Raw超级暗光增强功能,可实(shi)现RAW域多帧融合以及自适应降噪。

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

还有不(bu)少AI眼(yan)镜因(yin)拍摄画质不(bu)佳、画面(mian)(mian)抖动(dong)等问题而饱受诟病。对(dui)此(ci),夸克AI眼(yan)镜的(de)解决方(fang)案是借(jie)助陀(tuo)螺仪检测线性(xing)角速度(du),进行实时运算处理,对(dui)抖动(dong)画面(mian)(mian)进行运动(dong)补偿,实现防抖。

眼镜拍摄的画面还会与云端的AI超分插帧算法融合,最终实现4K、60帧的拍摄效果

显(xian)示方面,夸克AI眼镜调(diao)整(zheng)了(le)显(xian)示区域的(de)(de)位置,最(zui)终(zhong)确(que)定了(le)避开主视(shi)区的(de)(de)视(shi)仰角,能(neng)在保证观看(kan)舒适的(de)(de)前提下(xia),尽(jin)量减小对(dui)现(xian)实(shi)世界的(de)(de)干扰。

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

夸克AI眼(yan)(yan)镜还(hai)拥有专门定制的字体,适合近眼(yan)(yan)显(xian)示,保障(zhang)了显(xian)示的识别度,同时提升了视觉舒适性,可满(man)足(zu)用(yong)户(hu)在翻译、导航等场(chang)景的使用(yong)体验。

AI眼镜主要的交互方式是语音,因此眼镜能否听得清用户的声音十分重要。夸克AI眼镜配备了5个麦克风加1个骨传导阵列设计,在噪声环境下也可以较为准确地唤醒。用于识别、理解语(yu)音(yin)(yin)指令(ling)的(de)是(shi)夸克语(yu)音(yin)(yin)大模型(xing),支持口音(yin)(yin)、方言识别。

以导航场景为例,夸克AI眼镜研发团队联合高德地图开发了适配AI眼镜的近眼显示导航(hang)系统,可实现在(zai)骑行(xing)、步行(xing)等移动场景下的导航(hang)功(gong)能。

刚刚,阿里正式进军AI眼镜,24小时逆天续航,通义夸克AI拉满

该团队(dui)还自研了Master Agent大模型中控(kong)系统,可(ke)以自主分解复(fu)杂指令,实现多意图、多轮对(dui)话。

在支付场景,虽然夸克AI眼镜的“支付宝看一下”支付方案具体细节尚未公布,但是同款方案已经落地到Rokid、小米、雷鸟等品牌的AI眼镜,可通过摄像头扫码,语音指定支付金额、确认支付等。

AI图像问答方面,除了使用AI图像增强技术让眼镜“看得清”之外,夸克AI眼镜拥有定制意图识别模型,这一模型让系统端到端耗时较行业平均水平优化了36%。夸克多模态大模型负责最终的回答,拥有百亿(yi)级的图像检索能(neng)力(li)。此外,夸克的视觉(jue)问答能(neng)力(li)、学习(xi)办公能(neng)力(li)都(dou)将提供原生适配。

宋刚称(cheng),除了融(rong)合(he)阿里(li)巴巴自有生态,夸克AI眼镜将会联合(he)全球领先(xian)的眼镜品牌,通过(guo)技术、渠道(dao)、服(fu)务以及C2M定制能力(li)的整(zheng)合(he),进一步提升(sheng)用户(hu)体验。

结语:国内大厂争相入局,百镜大战迎重大变量

2025年,随(sui)着配套供应链的成熟和AI模型能力的提升,AI眼镜产品(pin)迎(ying)来集中爆(bao)发。近(jin)期,随(sui)着阿里(li)、小(xiao)米等巨头的入局,百镜大战又迎(ying)来新的重大变量。

阿里(li)正(zheng)基于Qwen系列模型向Rokid、雷鸟创新等(deng)(deng)AI眼(yan)镜(jing)头部企业提供(gong)AI能(neng)力支持,并(bing)在上述合作中(zhong)探索了将支付(fu)宝、高德等(deng)(deng)阿里(li)生(sheng)态中(zhong)的应用与AI眼(yan)镜(jing)结(jie)合的方式。同(tong)时,阿里(li)自身也具备研发天猫精灵等(deng)(deng)智(zhi)能(neng)终端的经验。

不过,这些技术积(ji)累能否(fou)成(cheng)功(gong)转化(hua)为(wei)爆款产品,仍有待市场的验证(zheng)。