誠(chéng)然,隨著算法模型、技術(shù)理論和應(yīng)用場(chǎng)景的不斷突破,加之“新基建”浪潮下算力基礎(chǔ)設(shè)施的快速建設(shè),AI產(chǎn)業(yè)對(duì)數(shù)據(jù)“量”的需求在不斷增長(zhǎng),數(shù)據(jù)量“短缺”一度成為AI產(chǎn)業(yè)鏈條上的瓶頸問題。
但是,這可能并不會(huì)持續(xù)很長(zhǎng)時(shí)間,嗅到機(jī)會(huì)的科技巨頭、創(chuàng)新企業(yè)前些年在數(shù)據(jù)采集與標(biāo)注上廣泛布局,推動(dòng)合格數(shù)據(jù)的“量”快速增長(zhǎng),這也使得數(shù)據(jù)標(biāo)注行業(yè)作為AI上游基礎(chǔ)產(chǎn)業(yè)在短短數(shù)年間實(shí)現(xiàn)了爆發(fā)式發(fā)展。數(shù)據(jù)標(biāo)注行業(yè)市場(chǎng)規(guī)模為30.9億元、36億元左右,年均復(fù)合增長(zhǎng)率20%左右,預(yù)計(jì)到2025年,國(guó)內(nèi)數(shù)據(jù)標(biāo)注市場(chǎng)規(guī)模將突破100億元大關(guān)。
過去AI模型訓(xùn)練以一個(gè)個(gè)項(xiàng)目為主,做完項(xiàng)目、得出一個(gè)預(yù)期質(zhì)量的AI模型后,使用過的數(shù)據(jù)便被“丟棄”;而現(xiàn)在,企業(yè)傾向于持續(xù)把過去已有的數(shù)據(jù)利用起來,逐步形成屬于企業(yè)的數(shù)據(jù)池子,將數(shù)據(jù)在多個(gè)相關(guān)模型開發(fā)中進(jìn)行重復(fù)利用。
這就導(dǎo)致單個(gè)企業(yè)所積累的數(shù)據(jù)量越來越多,而眾所周知數(shù)據(jù)量的增長(zhǎng)又以非結(jié)構(gòu)化數(shù)據(jù)為主,企業(yè)所面臨的AI數(shù)據(jù)集管理的挑戰(zhàn)越來越明顯,甚至出現(xiàn)一個(gè)Excel表格管理數(shù)據(jù)的現(xiàn)象;數(shù)據(jù)隨意拷貝、傳輸,存在重大的資產(chǎn)損失風(fēng)險(xiǎn)等等。顯而易見,這時(shí)候,能夠幫助企業(yè)管理好AI數(shù)據(jù),就成了重要的創(chuàng)新機(jī)遇。
聲明:本網(wǎng)頁內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:0731-84117792 E-MAIL:11247931@qq.com