近日,群核科技發(fā)布的開源數(shù)據(jù)集InteriorGS,登上全球最大AI開源社區(qū)HuggingFace趨勢榜榜首,英偉達推出的Nemotron-Post數(shù)據(jù)集緊隨其后,同時上榜的還有群核開源的另一個3D數(shù)據(jù)集InteriorAgent。
HuggingFace數(shù)據(jù)集趨勢榜,榜首為InteriorGS
當前,隨著具身智能技術(shù)加速向?qū)嶋H應(yīng)用滲透,行業(yè)正面臨一個關(guān)鍵瓶頸:高質(zhì)量訓練數(shù)據(jù)的嚴重短缺。AI 的進化離不開數(shù)據(jù),但機器人需要的 “空間數(shù)據(jù)”。而目前整體現(xiàn)狀是:不僅三維數(shù)量級遠遠不夠,而且存在真實感不足和缺乏精細語義標注的短板。
據(jù)了解,登上榜首的3D高斯語義數(shù)據(jù)集InteriorGS首次將3D高斯技術(shù)引入AI 空間訓練領(lǐng)域,并結(jié)合其自研的空間大模型能力,使該數(shù)據(jù)集兼?zhèn)湔鎸嵏信c語義性,成為全球首個適用于智能體自由運動的大規(guī)模3D數(shù)據(jù)集。InteriorGS數(shù)據(jù)集由1000個高斯場景組成,涉及80多種環(huán)境類型,并涵蓋超過 55.4 萬個物品標簽,分屬 755 個類別,每個物體都配有3D邊界框和語義標注。
而在榜單中的另一個群核開源3D數(shù)據(jù)集InteriorAgent,則專項用于IROS 2025“桃源”與真實世界機器人學習挑戰(zhàn)賽(機器人學習挑戰(zhàn)賽)。該大賽由上海人工智能實驗室主辦,群核科技與阿德萊德大學協(xié)辦,旨在打通仿真與現(xiàn)實壁壘,推動具身智能技術(shù)從“看起來能做”到“現(xiàn)實中能做”的關(guān)鍵跨越。目前該大賽已啟動報名,并將于10月20日在IROS大會上進行現(xiàn)場頒獎。
據(jù)悉,群核科技聚焦于室內(nèi)場景下的空間智能服務(wù),早在2018年就發(fā)布了當時全球最大的室內(nèi)空間深度學習數(shù)據(jù)集InteriorNet,該數(shù)據(jù)集共包含1.3億空間數(shù)據(jù)。該數(shù)據(jù)集一經(jīng)發(fā)布就引發(fā)全球關(guān)注,持續(xù)被用于AIGC、具身智能、XR等相關(guān)領(lǐng)域的智能訓練和研究中。
近期中國AI進展不斷霸榜全球引發(fā)關(guān)注,可以看到,不論是AI模型,還是數(shù)據(jù)集,中國企業(yè)紛紛站上全球創(chuàng)新前沿,這背后是中國數(shù)字經(jīng)濟迅猛發(fā)展的縮影,這過程中像阿里巴巴、快手、群核科技等中國企業(yè)承載了最復(fù)雜的場景、最多元的需求,進而沉淀了最豐富的數(shù)據(jù)。而這些都將是中國企業(yè)在AI進程中成為全球領(lǐng)先技術(shù)代表的基礎(chǔ)。