文本標(biāo)注:
文本標(biāo)注主要是為自然語言處理(NLP)的相關(guān)應(yīng)用提供數(shù)據(jù),包括文本分類、情緒標(biāo)注、知識點標(biāo)注等,也可以是一些專門領(lǐng)域的應(yīng)用標(biāo)注,比如家譜的譜系關(guān)系標(biāo)注。對知識點的標(biāo)注可以進(jìn)一步建立知識圖譜,并在此基礎(chǔ)提供更深層豐富的知識服務(wù)。下圖是一個基礎(chǔ)教育領(lǐng)域的知識點標(biāo)注項目界面:
下圖是家譜譜系人物關(guān)系標(biāo)注后的可視化展示圖:
音像/視頻標(biāo)注:
圖像和視頻的標(biāo)注隨著近幾年計算機(jī)視覺的強(qiáng)勁勢頭占據(jù)了整個數(shù)據(jù)標(biāo)注業(yè)務(wù)的主流。需要大量標(biāo)注好的數(shù)據(jù)對深度神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,它才能正確地理解場景。不論是人臉識別、路況感知、智能安防、無人超市、無人駕駛等應(yīng)用場景,由于視覺信息的多樣性和復(fù)雜性,沒有大量的數(shù)據(jù)訓(xùn)練作為基礎(chǔ),要正確地識別、理解幾乎是不可能的。
下圖為所作人物行為標(biāo)注項目的截圖,每個人物包含了面部關(guān)鍵特征、姿態(tài)、方位和動作等數(shù)十個屬性:
下圖是交通路況標(biāo)注截圖,包含了車輛的型號、顏色、角度、車牌、角度等信息,以及天氣、行人等相關(guān)信息:
音頻標(biāo)注:
語音數(shù)據(jù)標(biāo)注,包括文本、噪音、情緒、意圖等屬性。為了精準(zhǔn)標(biāo)注,語音信號被切分成小片段,并且通過雙人獨(dú)立標(biāo)注加上比對和質(zhì)檢以保證標(biāo)注質(zhì)量。
下圖為標(biāo)注時的音頻片段截取界面:
數(shù)據(jù)標(biāo)注平臺:
數(shù)據(jù)標(biāo)注是眾多人工智能應(yīng)用得以實現(xiàn)的重要基礎(chǔ),因為標(biāo)注好的數(shù)據(jù)正是這些人工智能系統(tǒng)的知識,有了知識人工智能才有力量。數(shù)據(jù)標(biāo)注實際上是一個將人類(數(shù)據(jù)標(biāo)注人員)的經(jīng)驗和知識注入機(jī)器智能的過程,好的數(shù)據(jù)標(biāo)注質(zhì)量對人工智能應(yīng)用的成敗至關(guān)重要。
點通公司基于自己多年的數(shù)據(jù)服務(wù)經(jīng)驗,開發(fā)了專業(yè)的人工智能數(shù)據(jù)標(biāo)注平臺,它集流程配置、數(shù)據(jù)分派、標(biāo)注軟件、質(zhì)量控制、進(jìn)度監(jiān)控、費(fèi)用結(jié)算于一體:
該平臺還集成了多種信息管理功能,如員工檔案管理、員工技能培訓(xùn)管理等;并提供了在線交流平臺,標(biāo)注員可以在平臺上實時溝通,方便員工之間的信息交流和有效溝通。依托于該數(shù)據(jù)標(biāo)注平臺,可將分布在全國各個數(shù)據(jù)加工中心的標(biāo)注人員匯聚到一起,實現(xiàn)人力資源、計算資源和網(wǎng)絡(luò)資源的最優(yōu)配置。
對于客戶而言,借助數(shù)據(jù)標(biāo)注平臺可以在數(shù)據(jù)質(zhì)量、項目進(jìn)度和成本費(fèi)用方面獲得全方位的控制。平臺可開放監(jiān)控接口給客戶,實時掌握數(shù)據(jù)標(biāo)注進(jìn)度。
合作方式
數(shù)據(jù)標(biāo)注的合作分以下三個簡明步驟: