

數(shù)據(jù)是現(xiàn)代機器學(xué)習(xí)應(yīng)用程序中最重要的組成部分,包括自動駕駛汽車的感知系統(tǒng)都是依靠數(shù)據(jù)進行訓(xùn)練的。目前汽車都配備了許多傳感器,這些傳感器收集信息并輸入到汽車計算機,然后信息必須進行實時處理和注釋,以便汽車了解行駛中道路前方的情況。但是,汽車計算機上的算法需要接受有關(guān)如何進行分類的訓(xùn)練,所以數(shù)據(jù)標(biāo)注的準(zhǔn)確性變得很重要。以下是Annotell公司在數(shù)據(jù)標(biāo)注上的一些探索。
帶注釋的數(shù)據(jù)至關(guān)重要,它有兩個目的:在汽車上的計算機上訓(xùn)練算法以解釋收集的信息,并驗證計算機確實已學(xué)會正確解釋收集的信息。由于注釋數(shù)據(jù)用于這兩個關(guān)鍵目的,因此注釋的質(zhì)量至關(guān)重要。最終,低質(zhì)量的注釋可能會導(dǎo)致汽車誤解道路上正在發(fā)生的事情。
注釋數(shù)據(jù)的過程始終包括一些人為的決定,第一個挑戰(zhàn)就是讓人們同意對記錄的數(shù)據(jù)進行正確的注釋,而創(chuàng)建這樣的注釋準(zhǔn)則有時并不像人們想象的那么容易。往往需要有效設(shè)計注釋準(zhǔn)則以提高質(zhì)量方面具有豐富的經(jīng)驗。第二個挑戰(zhàn)是在指南的指導(dǎo)下按比例執(zhí)行注釋。

