記者日前從北京市經(jīng)濟和信息化局了解到,北京人形機器人創(chuàng)新中心數(shù)據(jù)采集與訓(xùn)練基地投用4個月以來,內(nèi)部研發(fā)數(shù)據(jù)采集量已經(jīng)超過300萬條,開源數(shù)據(jù)超30萬條,已為多家頭部企業(yè)及科研機構(gòu)交付超數(shù)萬小時高質(zhì)量數(shù)據(jù)。這些數(shù)據(jù)究竟有什么用途?
作為全國最齊全場景覆蓋的機器人數(shù)據(jù)訓(xùn)練基地之一,北京人形機器人創(chuàng)新中心數(shù)據(jù)基地一期建筑面積近5000平方米,包括約200平方米的專業(yè)光學(xué)動作捕捉場地。記者在現(xiàn)場看到,120多臺機器人分別在家居、商超、辦公、工業(yè)、醫(yī)藥、康養(yǎng)等領(lǐng)域30余個典型場景中,進行現(xiàn)場的數(shù)據(jù)采集與訓(xùn)練。這些場景并非靜態(tài)的“樣板間”,其光照條件、物體擺放、人員動線均可按需調(diào)整,確保采集數(shù)據(jù)具備充分的泛化能力。

總臺記者 馬欣欣:在搭建的“兒童房”的場景中,模型訓(xùn)練師正在操控機器人去把這個反了的襪子給翻過來。完成這些動作的同時,也會實時采集這些機器人關(guān)節(jié)角度值、運行軌跡等多個數(shù)據(jù),一共300到1000次才能完成一個動作的數(shù)據(jù)采集。

針對初期機器人數(shù)據(jù)采集存在的場景碎片化、不同構(gòu)型機器人適配難、數(shù)據(jù)質(zhì)量參差不齊等瓶頸問題,基地也通過制定標準化的采集流程規(guī)范,確保整體數(shù)據(jù)合格率穩(wěn)定在95%以上。截至目前,內(nèi)部研發(fā)數(shù)據(jù)采集量已超300萬條,開源數(shù)據(jù)超30萬條。