世界大賽會外賽:利用深度學習擊出全壘打

作者 Jamie Beckett

AI技術很快將能預測棒球比賽,判斷球員動作行為等細節

如果有美國職棒世界大賽的大數據分析競賽,Claudio Silva肯定排在先發陣容。

Silva是紐約大學資訊工程系、工程及數據科學系的教授,與大聯盟共同開發了Statcast系統。這個系統可謂是改變遊戲規則的分析引擎,負責在美國職業棒球聯盟扮演追蹤及分析數據的角色。由於能夠追蹤比賽中每個球員的個別動作,以及球的路徑及軌跡,Statcast系統已然改變了教練評估與訓練球員的方式,也改變了粉絲觀看比賽的習慣。

但是Silva仍打算放手一搏,準備使用GPU加速的深度學習技術,揭露球員行為的微小細節以及遊戲模式。如此做法很可能會大幅革新教練在球員管理以及策略規劃的思維,也很有可能讓他們擁有預測賽局的能力。

Silva解釋說,“我們能夠預測出特定投手或打擊者,可能的投擊球路徑,使得球員們知道該站在哪裡最有可能接觸到球。”

深度學習登板準備打擊

Silva表示,教練能夠運用深度學習工具,來偵測球員何時會倦怠或是失常,並利用這些資訊來避免球員受傷。同樣的分析方法,也可以幫助教練決定派出誰來對決,推測哪個投手的投球最可能導致安打,或是比較兩名擁有類似擊球風格的打者,是否有懸殊的酬薪。

“教練越了解球員的行為模式,就越能夠做出正確的決定,遣兵用將更有效率。”

Statcast:大數據棒球分析系統

從2002年開始,大聯盟的奧克蘭運動家隊(Oakland A’s)採用了Sabermetrics,也就是電影”魔球”中所描述的先進數據分析系統,此系統在管理及選擇球員上扮演了重要的角色。Statcast增加了大數據和機器學習技術,因此能夠追蹤從前無法評估的數據,尤其是外野手的表現。

Silva能夠快速地跳進深度學習領域,是因為已經利用GPU以及Statcast系統,在兩個賽季中收集了將近150萬筆資料。

Statcast的資料庫是由MLB Advanced Media創建維護的,擁有幾乎是全世界最詳細的運動資料庫。每一個打擊數都有詳細的文字說明、影片檔案、打擊結果以及球員的移動定位等等。

深度學習走向大聯盟

CarlosDietrich是MLB Advanced Media的顧問,也是Silva的共同開發者,他們現在將球員的動作模式採取平均值作為測量評估依據,但是他們想要超越目前的研究瓶頸。

他們的目標,是想要擷取並分析球員的細膩動作。最普遍的做法,可能是安裝更多的攝影機,運用更複雜的電腦視覺科技來分析,但是這樣所費不貲。NYU的研究團隊找到替代方案,打算使用深度學習技術,將Statcast中的資料,與動作擷取系統所得到的細膩人類動作進行比對。Silva表示,運用如此複雜而豐富的視覺資訊來訓練深度學習網絡,對CPU技術來說是不可能的。

NYU資料科學中心最近取得NVIDIA的DGX-1 AI 超級電腦,Silva的研究團隊得以用來進行深度學習訓練,運算效能等同於250台傳統伺服器。

Silva期望DGX-1的深度學習工具能夠在下一季中推出。

Silva表示,“棒球比賽存在已久,讓我驚喜的是,我們仍然能夠利用科技來讓它變得更棒。”