2026年5月,貝斯特渦輪增壓器裝配產(chǎn)線上正進(jìn)行著一場(chǎng)大膽“嘗試”——熟練操作工頭戴、腕戴智能采集終端,保持常規(guī)作業(yè)節(jié)奏,相關(guān)視覺、操作的數(shù)據(jù)以30Hz的刷新頻率進(jìn)行收集與回傳。全產(chǎn)線全天產(chǎn)生的原始數(shù)據(jù)可達(dá)上百個(gè)GB。
而這僅是開始。以城市全域真實(shí)場(chǎng)景為訓(xùn)練場(chǎng),近期,一場(chǎng)“千企百萬小時(shí)”工業(yè)具身智能高質(zhì)量數(shù)據(jù)采集行動(dòng)悄然在無錫落地啟動(dòng),數(shù)采試點(diǎn)方案正批量進(jìn)入各個(gè)工業(yè)生產(chǎn)領(lǐng)域。牽頭單位無錫數(shù)據(jù)集團(tuán)相關(guān)人士介紹,數(shù)據(jù)經(jīng)標(biāo)準(zhǔn)化采集、專業(yè)化處理后,將匯聚形成全國(guó)首個(gè)工業(yè)級(jí)高質(zhì)量具身智能數(shù)據(jù)集,“計(jì)劃于2026年率先實(shí)現(xiàn)累計(jì)超萬小時(shí)的有效數(shù)據(jù)突破。”
整合本土多元產(chǎn)業(yè)資源
具身智能發(fā)展至今,最值得關(guān)注的價(jià)值領(lǐng)域在哪里?行業(yè)已用實(shí)際行動(dòng)“票選”出了答案——數(shù)據(jù)。4月29日,國(guó)家數(shù)據(jù)發(fā)展研究院聯(lián)合光輪智能等企業(yè),發(fā)起了“具身智能數(shù)據(jù)推進(jìn)計(jì)劃(北京)”;4月16日,京東宣布計(jì)劃發(fā)動(dòng)60萬人參與數(shù)據(jù)采集,兩年內(nèi)積累1000萬小時(shí)真實(shí)場(chǎng)景視頻數(shù)據(jù);4月10日,百度智能云聯(lián)合零次方等企業(yè)推出“具身智能數(shù)據(jù)超市(Beta版)”。
業(yè)內(nèi)公認(rèn):“數(shù)據(jù)量級(jí)決定模型下限,數(shù)據(jù)質(zhì)量決定模型上限?!毕噍^于通用大模型,工業(yè)領(lǐng)域長(zhǎng)期面臨嚴(yán)重的“數(shù)據(jù)荒”。工業(yè)生產(chǎn)環(huán)境復(fù)雜、專業(yè)門檻高,高質(zhì)量、多模態(tài)工業(yè)數(shù)據(jù)稀缺,成為制約工業(yè)具身智能迭代升級(jí)、落地應(yīng)用的核心瓶頸,而無錫此次的行動(dòng)正是瞄準(zhǔn)這一行業(yè)空白。
憑借完善的制造業(yè)基底,無錫具備培育工業(yè)具身智能的先天優(yōu)勢(shì)。本地不僅擁有具身智能本體研發(fā)企業(yè),還集聚華虹、新日等一批制造龍頭企業(yè),產(chǎn)業(yè)場(chǎng)景豐富、實(shí)操工位多元、技術(shù)應(yīng)用需求明確。無錫數(shù)據(jù)集團(tuán)戰(zhàn)略發(fā)展部高級(jí)投資經(jīng)理陳昊表示,“千企百萬小時(shí)”行動(dòng)將整合本土多元產(chǎn)業(yè)資源,深耕上百個(gè)典型工業(yè)操作工位,聯(lián)動(dòng)萬余名一線作業(yè)人員,打造具備標(biāo)桿性的“工業(yè)級(jí)、萬小時(shí)、千任務(wù)”高質(zhì)量工業(yè)具身數(shù)據(jù)集,破除產(chǎn)業(yè)發(fā)展數(shù)據(jù)壁壘,為智能制造深度賦能。
2026年4月,數(shù)據(jù)集團(tuán)子公司華智(無錫)人工智能科技有限公司牽頭申報(bào)的“具身智能行業(yè)基于無本體數(shù)據(jù)采集的柔性生產(chǎn)高質(zhì)量數(shù)據(jù)集建設(shè)項(xiàng)目”入選省工業(yè)和信息化領(lǐng)域行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)先行先試聯(lián)合體及項(xiàng)目名單。與此同時(shí),無錫引入的穹徹智能工業(yè)交付能力中心項(xiàng)目也在加速落地,其自研的Noematrix Brain具身大模型參數(shù)規(guī)模及性能全球領(lǐng)先。在行動(dòng)中,雙方強(qiáng)強(qiáng)聯(lián)手,穹徹智能將參與訓(xùn)練發(fā)布工業(yè)具身基座模型,華智AI則聚焦真實(shí)場(chǎng)景后訓(xùn)練與垂域模型打造,共同構(gòu)建深度理解工業(yè)語義的“具身大腦”。
形成“三真”數(shù)據(jù)質(zhì)量體系
需要什么樣的數(shù)據(jù)?數(shù)據(jù)又該如何用?無錫有著自己的理解。從去年開始,華智AI明顯感受到了職能的升級(jí)?!叭ツ晡覀冏⒅卦诰呱碇悄?制造落地過程中的實(shí)踐,今年,我們帶著經(jīng)驗(yàn),回過頭強(qiáng)化‘大腦’?!备笨偨?jīng)理李瑋說,真實(shí)場(chǎng)景應(yīng)用需要具身智能具備自主推理和決策的泛化能力。
“關(guān)鍵需要建立機(jī)械臂重、關(guān)節(jié)摩擦、電機(jī)電流與力矩關(guān)系、運(yùn)動(dòng)約束等‘物理直覺’?!比A智數(shù)采業(yè)務(wù)相關(guān)負(fù)責(zé)人王建介紹,具身智能需要在大腦中“認(rèn)識(shí)自己”,與大語言模型訓(xùn)練有海量的互聯(lián)網(wǎng)文本數(shù)據(jù)不同,具身智能從虛擬投向物理世界的相關(guān)數(shù)據(jù)尚無太多積累。
基于對(duì)基座模型的訓(xùn)練共識(shí),“千企百萬小時(shí)”數(shù)據(jù)采集形成了一套“三真”數(shù)據(jù)質(zhì)量體系——真實(shí)場(chǎng)景,采集環(huán)境為真實(shí)產(chǎn)線工業(yè)現(xiàn)場(chǎng);真實(shí)設(shè)備,操作對(duì)象為真實(shí)工業(yè)工件、工具和裝備;真人操作,采集人員為真實(shí)工人或技術(shù)員,同步建立包含專業(yè)性、通用性、稠密性、可解釋性在內(nèi)的“八維質(zhì)量評(píng)估體系”,確保數(shù)據(jù)可靠實(shí)用。
采集過程中,項(xiàng)目組借助便攜式無本體的采集設(shè)備,將難以量化的手感、力度與節(jié)奏實(shí)時(shí)解算完整運(yùn)動(dòng)軌跡。采集后,還要把數(shù)據(jù)視覺、動(dòng)作、物理本體參數(shù)等成組標(biāo)注、關(guān)聯(lián)建模。在華智AI數(shù)據(jù)治理中心,原始數(shù)據(jù)正經(jīng)歷層層抽絲剝繭:從自動(dòng)化的隱私打碼脫敏,到光影、視角等維度的多重評(píng)估,再到專業(yè)人員的精細(xì)核查,全流程的閉環(huán)管理確保了輸入模型訓(xùn)練的數(shù)據(jù)既具備工業(yè)純度,又符合安全合規(guī)要求。據(jù)悉,目前的數(shù)據(jù)采集方案可將單位數(shù)據(jù)采集成本降至傳統(tǒng)模式的1/3,采集效率提升3倍。
為智能化轉(zhuǎn)型深度賦能
行動(dòng)計(jì)劃的啟動(dòng)為傳統(tǒng)企業(yè)智能化轉(zhuǎn)型提供了新的機(jī)遇?!霸谡嚨慕M裝過程中,會(huì)涉及到一條產(chǎn)線上多種產(chǎn)品的混裝,很大部分還是需要人工??傃b過程中標(biāo)準(zhǔn)化生產(chǎn)的問題是整個(gè)行業(yè)的共性難題?!毙氯针妱?dòng)車股份有限公司董事、智能中心總經(jīng)理張晶晶介紹,標(biāo)準(zhǔn)化作業(yè)是產(chǎn)品品質(zhì)的生命線,數(shù)據(jù)采集從半年試點(diǎn)再到多產(chǎn)線鋪開,將為機(jī)械臂構(gòu)建起一套“工業(yè)教科書”。
基于在數(shù)據(jù)要素市場(chǎng)化改革的探索,數(shù)據(jù)集團(tuán)為這些意愿強(qiáng)烈的企業(yè)消解安全顧慮、提供全周期服務(wù)。“我們積極探索數(shù)據(jù)授權(quán)、收益分配及數(shù)字資產(chǎn)轉(zhuǎn)化的閉環(huán)路徑,推動(dòng)企業(yè)產(chǎn)線經(jīng)驗(yàn)從‘隱形資產(chǎn)’向‘可計(jì)量、可流通、可增值’的數(shù)字生產(chǎn)力躍遷?!毕嚓P(guān)負(fù)責(zé)人表示。
不斷有新的合作伙伴加入“生態(tài)圈”。近日,華智AI還和佩信集團(tuán)正式簽署戰(zhàn)略合作協(xié)議,聯(lián)合成立具身智能高質(zhì)量數(shù)據(jù)集創(chuàng)新聯(lián)合體,圍繞全行業(yè)社會(huì)化無本體數(shù)據(jù)采集、高質(zhì)量多模態(tài)數(shù)據(jù)集建設(shè)、行業(yè)標(biāo)準(zhǔn)制定、產(chǎn)業(yè)生態(tài)共建四大核心方向展開深度合作。
長(zhǎng)遠(yuǎn)來看,“千企百萬小時(shí)”行動(dòng)不止聚焦工業(yè)制造領(lǐng)域。華智AI副總經(jīng)理李瑋表示,無錫作為全國(guó)首個(gè)提出城市全域數(shù)據(jù)采集概念的城市,將依托本土城市特色,把數(shù)采場(chǎng)景延伸至文旅、公共服務(wù)、酒店服務(wù)、居家生活等非工業(yè)領(lǐng)域,吸納廣大民眾參與社會(huì)化數(shù)據(jù)采集,不斷擴(kuò)充數(shù)據(jù)維度、豐富數(shù)據(jù)場(chǎng)景。未來,海量、優(yōu)質(zhì)、多場(chǎng)景的全域數(shù)據(jù)集,將成為無錫人工智能產(chǎn)業(yè)的核心壁壘與硬核競(jìng)爭(zhēng)力,為國(guó)內(nèi)具身智能產(chǎn)業(yè)高質(zhì)量發(fā)展提供“無錫支撐”。