智东西(公众号:zhidxcom)
作者 | 三北
编辑 | 漠影

2024年,狂飙大半年的百模大战,打到了视频领域。疯狂进化的模型、暴力堆砌的算力,展现出变革的巨大能量。但同时,海量难以开发利用的视频数据,成为新的“瓶颈”。

“数(shu)据时代(dai),大(da)模型是(shi)核心工具(ju),场景化应用是(shi)价值变现的(de)关键(jian)。”大(da)华股份研发中心副总裁周文凯告(gao)诉智东西,“当下数(shu)据要素很(hen)火,但视频(pin)类数(shu)据生产、流通、交易仍有(you)(you)很(hen)多亟待解决(jue)的(de)问题,这(zhei)与(yu)视频(pin)数(shu)据的(de)隐(yin)私性、敏感(gan)性、安全性有(you)(you)很(hen)大(da)的(de)关系。”

作为(wei)AIoT领(ling)域龙头企业(ye),大华股份在视频领(ling)域有(you)长达(da)十几(ji)年的(de)深耕,周文凯认为(wei)基于场景(jing)化的(de)业(ye)务理(li)解(jie)来(lai)提取视频数据的(de)结(jie)构化信息,并与业(ye)务应用(yong)进行(xing)深度的(de)融合才能发(fa)挥(hui)更大价(jia)值。

作为(wei)以视频为(wei)核心的(de)(de)数据产业(ye)代表企(qi)业(ye),大华股(gu)份是如何(he)打造未来范本的(de)(de)?通过(guo)对(dui)话周文(wen)凯,本文(wen)试图从大华股(gu)份在千(qian)行百业(ye)的(de)(de)场景实战(zhan)经验中,寻找(zhao)这些问题的(de)(de)答案。

一、数据为王,以视频为核心的数据产业尤为重要

据知(zhi)名行研机构IDC预测,到(dao)2025年,全(quan)(quan)球数(shu)(shu)据总量将超过180ZB,其(qi)中中国数(shu)(shu)据总量将跃(yue)居全(quan)(quan)球首位。伴(ban)随这一(yi)(yi)趋势,数(shu)(shu)据交易市场(chang)的规(gui)模(mo)(mo)预计将达到(dao)2200亿元以(yi)上,若(ruo)进一(yi)(yi)步考(kao)虑其(qi)驱动(dong)的计算、存(cun)储、AI技术(shu)及软件等基础(chu)设施的全(quan)(quan)面发展,整体市场(chang)规(gui)模(mo)(mo)更是有(you)望突破2万亿元大(da)关(guan)。

这将展现出什么样的广阔发展前景呢?周文凯向智东西透露,目前产生的所有数据类型中,‌以视图为核心的非结构化数据占据数据总量的90%以上,围绕着视频的数据采集、流转、分析、计算和应用等每个环节都隐藏着巨大的价值。但打开视频数据产业链,我们看到还面临着很多挑战:如何在复杂的感知场景和泛杂的物联协议中,实现数据的精准采集和海量设备的跨网互联,在视频数据分析和加工服务中,当前对于视频等非结构化数据的挖掘程度还很低,视频类数据需要依赖行业智能算法和应用的进一步挖掘,当前中国人工智能渗透率还不足10%,只有通过将视频内容结构化后与业务结合才能发挥更大价值,而场景化应用是数据产业价值变现的核心关键。

“我国视频(pin)数(shu)(shu)据要素市场(chang)(chang)已(yi)构建起清晰的三(san)级(ji)架构:上游聚焦(jiao)于数(shu)(shu)据采集与治(zhi)理的一级(ji)市场(chang)(chang),中游专注于数(shu)(shu)据加工与分(fen)析的二级(ji)市场(chang)(chang),以及下游面向(xiang)数(shu)(shu)据应用评估的三(san)级(ji)市场(chang)(chang)。这一专业(ye)化分(fen)工体系不仅促进了视频(pin)数(shu)(shu)据产业(ye)链的精细化发展(zhan),还显(xian)著加速了视频(pin)数(shu)(shu)据向(xiang)产业(ye)化迈进的步(bu)伐。”周(zhou)文凯(kai)说

总的来看,海量数据资源和三级视频数据要素市场,都是数据产业的肥沃土壤。

二、发挥视频要素“乘数效应”,要迈过四道坎

今年1月4日,国(guo)家数据(ju)局等17部门(men)近(jin)日联(lian)合印发(fa)《“数据(ju)要(yao)素(su)×”三年行(xing)动计划(hua)(2024—2026年)》(简称:行(xing)动计划(hua)),提出选取工(gong)业(ye)制造、现代农(nong)业(ye)、商贸流(liu)通、交通运输、金融(rong)服务等12个行(xing)业(ye)和领(ling)域,推动发(fa)挥数据(ju)要(yao)素(su)乘数效应,释放数据(ju)要(yao)素(su)价值。

周文凯告诉智东西,行动方案提及的12个行业所涉及的数据,90%以上是视图为核心的非结构化数据。而发挥这些视频要素“乘数效应”,至少要迈过四道坎。

具体来说,这些视频数据包括用户生成数据、专业制作数据、公共资源产生数据、社交媒体分享数据等多种类型。相比于结构化的文本数据来说,这些视频数据在存储、处理、理解和计算四(si)大方面都更加复(fu)杂。

1、存储量大。视图数据有(you)(you)别于结构化的(de)(de)(de)文(wen)本(ben)数据,大量(liang)的(de)(de)(de)视图数据要做大量(liang)的(de)(de)(de)存(cun)(cun)储(chu)(chu)。这就对有(you)(you)效(xiao)的(de)(de)(de)存(cun)(cun)储(chu)(chu)空间(jian)利用提出更高要求(qiu),包(bao)括需要较强的(de)(de)(de)编解(jie)码技术(shu),以及有(you)(you)效(xiao)的(de)(de)(de)存(cun)(cun)储(chu)(chu)能(neng)力。

2、数据处理复杂。视频数(shu)(shu)据种类(lei)丰富,编码方(fang)式繁多,需要支持(chi)不同(tong)的(de)(de)分辨(bian)率、帧率、编码方(fang)式、格式的(de)(de)数(shu)(shu)据的(de)(de)处(chu)理,这就要求数(shu)(shu)据处(chu)理方(fang)积累这些不同(tong)数(shu)(shu)据的(de)(de)处(chu)理能力。

3、视频理解难度大。视频(pin)(pin)(pin)数据(ju)(ju)内(nei)容(rong)复杂多(duo)样,要去(qu)理(li)解场景化的(de)(de)内(nei)容(rong),最好(hao)是将小模(mo)型(xing)和大(da)模(mo)型(xing)结合(he)起来,去(qu)做(zuo)数据(ju)(ju)的(de)(de)解析,从而挖掘出视频(pin)(pin)(pin)数据(ju)(ju)中(zhong)有价(jia)(jia)值(zhi)的(de)(de)信息。这里(li)补充说(shuo)下,除了(le)训练(lian)模(mo)型(xing)所需的(de)(de)原始数据(ju)(ju),视频(pin)(pin)(pin)数据(ju)(ju)真正产生的(de)(de)交易价(jia)(jia)值(zhi),还是在于视频(pin)(pin)(pin)结构化后挖掘产生的(de)(de)数据(ju)(ju)价(jia)(jia)值(zhi),因此视频(pin)(pin)(pin)理(li)解好(hao)不(bu)好(hao),很大(da)程(cheng)度上决定了(le)视频(pin)(pin)(pin)价(jia)(jia)值(zhi)的(de)(de)大(da)小。

4、计算量大。视频数据的计算(suan)(suan)量非常大,大模型加剧了这一情况(kuang)。这就需要(yao)(yao)厂商在准(zhun)确率和效率之间找(zhao)一个平衡。视频解析模型的参(can)数量要(yao)(yao)适(shi)度,无法像文(wen)本大模型动辄有千亿参(can)数,不(bu)然计算(suan)(suan)量就太大了。

上述特征,也决定了视频数据定价、交易和流通难度更大。

周文凯表示,视频数据不像结构化的文本数据一样流通便利,而是规模巨大,且大多数机器不可读。如果要交易的话,巨量视频数据怎么上传和下载,对网络带宽、安全保护、结构化成本的要求都(dou)较高;基于成本和价值定(ding)价标准(zhun)如何定(ding),都(dou)是要解决的问题。

对(dui)此,周文凯认(ren)为,视(shi)(shi)频数(shu)(shu)据(ju)要(yao)素价值(zhi)的(de)开发,可以参考地产(chan)行业采取所有权(quan)、使(shi)用(yong)权(quan)、经营(ying)权(quan)“三权(quan)分(fen)立”。视(shi)(shi)频数(shu)(shu)据(ju)使(shi)用(yong)者(zhe)向数(shu)(shu)据(ju)所有者(zhe)付费,视(shi)(shi)频数(shu)(shu)据(ju)运营(ying)者(zhe)推动视(shi)(shi)频价值(zhi)得到最大限度的(de)安全挖(wa)掘,从而能(neng)够盘活视(shi)(shi)频数(shu)(shu)据(ju)要(yao)素市场。

而从技(ji)术角(jiao)度来说,让视(shi)(shi)(shi)频数(shu)据(ju)(ju)可交易(yi)使用,还有(you)赖于AI对数(shu)据(ju)(ju)的(de)理解(jie)。比如大(da)(da)华(hua)股份(fen)在视(shi)(shi)(shi)频编(bian)解(jie)码、大(da)(da)数(shu)据(ju)(ju)平(ping)台、数(shu)据(ju)(ju)治理、视(shi)(shi)(shi)觉大(da)(da)模型(xing)、安全合规(gui)等多(duo)方面都有(you)深入积淀,比如如何实(shi)现视(shi)(shi)(shi)频数(shu)据(ju)(ju)与文本数(shu)据(ju)(ju)的(de)异构(gou)数(shu)据(ju)(ju)融合计算等,以(yi)此降低视(shi)(shi)(shi)频数(shu)据(ju)(ju)开(kai)发利(li)用的(de)难度和成本。

三、数据价值变现,场景化应用落地是关键

在(zai)(zai)数(shu)(shu)字(zi)化时代,‌数(shu)(shu)据被(bei)视(shi)为新(xin)型生(sheng)产要素,数(shu)(shu)据的(de)价值(zhi)不仅仅在(zai)(zai)于(yu)其本身,‌更在(zai)(zai)于(yu)如何有效地利(li)用(yong)这些数(shu)(shu)据,场景化应用(yong)落(luo)地是实现数(shu)(shu)据价值(zhi)变(bian)现的(de)关键。大华(hua)股份自2017年(nian)起(qi)就开始构建大的(de)物联(lian)数(shu)(shu)智(zhi)平台(tai)(tai)(tai),2019年(nian)形成完整(zheng)的(de)平台(tai)(tai)(tai)体系架(jia)构,2021年(nian)发布Dahua Think #战略,推(tui)出(chu)“一(yi)体系、两平台(tai)(tai)(tai)”,即“物联(lian)数(shu)(shu)智(zhi)中台(tai)(tai)(tai)体系”和(he)“城市(shi)平台(tai)(tai)(tai)2.0、企业平台(tai)(tai)(tai)3.0”,助力各行各业挖掘(jue)视(shi)频(pin)数(shu)(shu)据价值(zhi)。

2023年,大(da)华股份全新升(sheng)级Dahua Think #2.0战(zhan)略,并全新升(sheng)级的物联(lian)数智(zhi)平(ping)台2.0,该平(ping)台全面融合(he)物联(lian)感知、算网融合(he)、视觉大(da)模(mo)型、数据(ju)智(zhi)能等(deng)技术(shu),完(wan)善(shan)软件工(gong)程化能力,赋能千(qian)行百业(ye)客(ke)户的应用。

在城市方面,大华围绕城(cheng)市高效治(zhi)理、运行自(zi)治(zhi)、安全体系(xi)升级、生态(tai)协同治(zhi)理拓展了各领域,覆盖(gai)了超过(guo)200个城(cheng)市场景。比如(ru)在交(jiao)通治(zhi)理场景,周文凯谈(tan)道,过(guo)去的小模型往往只能(neng)识别一些局部场景,如(ru)某个关口排(pai)队要多久等;在应用了大模型之后,某地(di)整个城(cheng)市交(jiao)通态(tai)势变(bian)得(de)可被全面(mian)掌控,交(jiao)通调配决策(ce)变(bian)得(de)更科学。

在企业方面,大(da)华则以助力企业(ye)(ye)构建大(da)安全体(ti)系、数智(zhi)生产力、提(ti)升经营(ying)决断力,为企业(ye)(ye)提(ti)供数字化管理工(gong)具,帮助企业(ye)(ye)解决业(ye)(ye)务(wu)痛(tong)点。比如能(neng)源领(ling)域,周文凯称一(yi)些客户(hu)的需求比较强烈,他们亟需通过视频(pin)去(qu)(qu)做(zuo)安全生产和降(jiang)本提(ti)效;另外智(zhi)能(neng)驾(jia)驶(shi)(shi)领(ling)域的客户(hu)需求也(ye)非常强烈,他们需要基于视频(pin)和雷达联合起来(lai)去(qu)(qu)做(zuo)智(zhi)能(neng)驾(jia)驶(shi)(shi)。

当然这(zhei)些应用(yong)的(de)(de)升级离不开大(da)(da)模(mo)型(xing)(xing)能(neng)力的(de)(de)加载,很多大(da)(da)模(mo)型(xing)(xing)并不适合直接拿来用(yong),而是(shi)需要结合场景去发挥价值。“无论是(shi)生成(cheng)式(shi)模(mo)型(xing)(xing)还是(shi)解析(xi)式(shi)模(mo)型(xing)(xing),这(zhei)些大(da)(da)模(mo)型(xing)(xing)都是(shi)基(ji)础模(mo)型(xing)(xing)(Foundation Model),本(ben)质(zhi)(zhi)上(shang)是(shi)比(bi)小(xiao)模(mo)型(xing)(xing)加强了理解和认知能(neng)力。当认知产生的(de)(de)时候(hou),人们在上(shang)面构(gou)建(jian)出面向各(ge)个场景的(de)(de)能(neng)力,这(zhei)才(cai)是(shi)大(da)(da)模(mo)型(xing)(xing)价值的(de)(de)本(ben)质(zhi)(zhi)。”

周文(wen)凯谈道,大(da)华做的大(da)模型(xing),是以视觉(jue)为核心,融合了多模态(tai)的能力(li),具(ju)备准确(que)性和泛(fan)化性跃升(sheng)、图文(wen)提(ti)示(shi)定义新功能、突(tu)破(po)视觉(jue)认知能力(li)、全(quan)场景自主解析、大(da)小模型(xing)与算力(li)协(xie)同(tong)五大(da)方面特征,目前已落地多个行业领(ling)域。

除了大模型外,这背后也离不开大华股份围绕视图在编解码、治理、分析、网络、存储等方面所做的一系列(lie)优化。

比如在数据分析方面,大华自建了超千台服务器规模的(de)数(shu)据(ju)中心,专门模拟大数(shu)据(ju)各种(zhong)场景(jing)需求(qiu),支持大华在数(shu)据(ju)存储、数(shu)据(ju)治理、数(shu)据(ju)分析(xi)等(deng)多方面去做全(quan)流程试验(yan),从而保证技(ji)术领(ling)先性和稳定性。

数据安全方面,大(da)华积(ji)累了众(zhong)多安全相关技术,在其(qi)一站式(shi)的(de)数(shu)据智(zhi)能引(yin)擎上提供了面向数(shu)据传输流转的(de)很多安全管控措施(shi),如实(shi)现项(xiang)目隔(ge)离、数(shu)据隔(ge)离,权限(xian)隔(ge)离、访问(wen)隔(ge)离、安全审计等。

结语:视频数据沃土,场景化数据要素价值凸显

当下(xia)正值(zhi)数据(ju)要素加(jia)速落地千行(xing)百(bai)业,深(shen)挖场景化(hua)数据(ju)价值(zhi)变得(de)尤为重(zhong)要。

从大(da)华股份的实践中,我们了(le)(le)解到国产(chan)玩家正在克(ke)服视频(pin)数据(ju)在存储(chu)、处(chu)理(li)、理(li)解、计算、定价、流(liu)通等环节面(mian)临的挑战,将视频(pin)数据(ju)处(chu)理(li)能与多样(yang)化场景(jing)应用(yong)深度融合。这(zhei)其中既(ji)包含了(le)(le)企(qi)业(ye)(ye)十几年(nian)的行(xing)业(ye)(ye)经(jing)验和数据(ju)处(chu)理(li)能力积淀(dian),更凝聚(ju)了(le)(le)跨越多个业(ye)(ye)务周期(qi)的宝(bao)贵行(xing)业(ye)(ye)知(zhi)识与专业(ye)(ye)洞察(know-how)。

数(shu)(shu)据为王时代(dai),在堆算(suan)力、炼(lian)模(mo)型的同时,如何让海量的视频(pin)数(shu)(shu)据要素发挥乘(cheng)数(shu)(shu)效应,成为我国数(shu)(shu)字产业(ye)实现(xian)领跑世界的一大关键。