NVIDIA新創加速計劃會員為資料科學家打造更得力的資料標記AI助手

作者 Scott Martin

NVIDIA 新創加速計劃會員 Clarifai 的最新資料標註工具幫助資料科學家節省標記圖像的時間,推動工作流程的現代化。

為了用於訓練 AI 應用程式的標籤化資料集可能會阻礙公司加快產品上市速度。圖像和文字識別創業公司 Clarifai 旨在將障礙物抛諸腦後。

總部位於紐約的 Clarifai 近日公開發布了其稱為Clarifai Labeler人工智慧輔助資料標記服務。資料標記也是該公司的服務之一。

Clarifai 成立於 2013 年,很早便進入圖像識別市場。自那時起,利用非結構化資料獲得業務優勢的公司數量越來越多,掀起一股對資料科學家的需求熱潮。通過圖像和文本識別顛覆農業,零售,銀行,建築,保險等行業的行業規則,很多事情都面臨風險。

“高質量的 AI 模型始於預期的資料集註釋。採用 AI 技術,我們將傳統資料標記的速度提升了一個數量級。” Clarifai 資水深副總裁 Alfredo Ramos 說。

他還表示,在NVIDIA GPU Ventures的支援下, Clarifai 在零售,銀行和保險行業越來越受歡迎,也被更多的聯邦,州和地方機構採用。

AI標記的好處

Clarifai 的資料標記工具在標記的影片中大放異彩。該工具結合了統計方法,進而跟踪影片內部目標對象的移動軌跡(通過一個隨身移動的邊框)。

由於每一秒的影片由多幀圖像組成,因此跟踪功能實現了精度的提升,在大大增加了每個目標對象的標記數量的同時,明顯改變了對大量資料進行標記的時間。

新款標記工具 Labeler 最近被用作標記幾天的影片片段,從而建立一個用於檢測有人是否置於口罩的模型。僅用了不到四天的時間,這個工具完成了 100 萬個標記。

“以往依賴人力,這需要花費六個星期的時間才能完成對每個幀的標記,” Ramos 說,“通過 Labeler ,完成 100 萬次資料標記的速度提升了 10 倍。”

Clarifai 在本地可以實現NVIDIA V100 Tensor Core GPU進行模型開發,並利用雲端的 NVIDIA T4 GPU 進行推論。

星動力AI

執行長暨創辦人 Matthew Zeiler 在 2013 年的 ImageNet 挑戰中,用他的開發神經網路稱霸全場,這也造成了 Clarifai 的新生。

此後, Zeiler 逐漸轉向開發人員友好型產品,使企業能夠快速輕鬆地將 AI 整合到其工作流程和客戶體驗中。公司也不斷發布新產品吸引新客戶,例如最近發布的自然語言處理工具

雖然產業發生了很大變化,但 Clarifai 對於研究領域的堅持始終如一。

拉莫斯說:“我們擁有一支龐大的研究人員團隊,並且我們擅長在學術界發現卓越的研究並高效地將其商業化。”

Clarifai 是NVIDIA 新創加速計劃的成員,該虛擬加速器計劃旨在幫助人工智慧和資料科學領域的新創公司迅速進入市場。