應用深度學習技術來辨識鯨魚的故事

作者 Jamie Beckett

據傳過去北大西洋露脊鯨的數量非常龐大,先民們能踏著牠們的背行越科德角灣,但時至今日捕鯨活動使得北大西洋露脊鯨成為瀕臨滅絕的鯨魚,全球現存數量僅有500頭。

時間或許不能幫助露脊鯨生存下來,深度學習卻能派上用場。

一月有一場利用高空鳥瞰照片來開發辨別500頭露脊鯨的演算法競賽活動順利結束,美國海洋暨大氣總署(NOAA)將利用冠軍的演算法,將原本的人工辨識作業變成速度更快的自動化作業。

閱讀 NVIDIA 執行長黃仁勳先生最新的部落格文章,深入瞭解深度學習與 GPU 如何改變全球發展的內容。

這項由資料科學社群 Kaggle 主辦和設計的競賽活動,是 NOAA 東北漁業科學中心海洋生物學家 Christin Khan 的點子。Khan 及其他科學家通過露脊鯨頭部稱為「繭突」的大塊突起組織來找出和追踨每頭露脊鯨,以監視牠們的健康情況。

目前他們以人工方式將從飛機或船上拍攝的照片,與新英格蘭水族館製作之北大西洋露脊鯨圖片資料庫裡的圖片進行比對,Khan 表示這是一項曠日費時工作,讓科學家無法從事其它更具生產力的研究或田野調查工作。

在發現 Facebook 能自動辨識照片裡的影像後,Khan 想到可以運用類似方式來辨識鯨魚。

母露脊鯨及仔鯨。照片提供:NOAA 東北漁業科學中心 Christin Khan。

母露脊鯨及仔鯨。照片提供:NOAA 東北漁業科學中心 Christin Khan。

如何分辨每頭鯨魚

鯨魚不會擺姿勢等人來拍照,這在影像辨識方面成為一個棘手的問題,科學家從各種角度和距離拍攝照片,在許多照片裡海洋的比例甚至多於鯨魚。參與利用深度學習技術與 NVIDIA GPU 打造解決方案競賽,獲得冠軍的大數據分析公司
 deepsense.io 首席科學家 Robert Bogucki 表示:「分辨每頭鯨魚比分辨貓、狗、袋熊和飛機難多了。用在鯨魚身上的演算法得從或許在圖片裡佔極小比例的地方發現足以辨識的細節,像是鯨魚的頭部和繭突的特徵。」

深度學習技術用於訓練模擬人腦的多層次神經網路演算法,Deepsense.io 通過適用於影像辨識作業的卷積神經網路,加上 Tesla K80 GPUs 與 GRID K520 GPUs 加快訓練速度(在 NVIDIA 加速運算新聞中心裡第二名的 Felix Lau 說明他是如何在自行開發的解決方案裡應用 NVIDIA GPUs 與 cuDNN)。

Bogucki 說:「在解決此類問題時,得透過簡短的實驗週期來測試無數想法,所以使用 GPUs 來加快訓練速度是非常重要的。」

仍有許多因素取決是否使用 deepsense.io 的解決方案,或許其它技術有助於保護露脊鯨。在 Khan 與其他科學家已經採取警戒性保護活動的情況下,鯨魚依舊身陷危境,像是被船隻撞擊、受困在漁具內及低生育率等問題。

Khan 說 NOAA 打算使用 deepsense.io 的演算法來發展辨識鯨魚的軟體,而深度學習和影像辨識技術終於能用於協助保護座頭鯨、寬吻海豚和其他生存受到威脅或瀕危的物種。

閱讀 NVIDIA 執行長黃仁勳先生最新的部落格文章,深入瞭解深度學習與 GPU 如何改變全球發展的內容。