從了解資料背後看AI
這幾年來,好像只要AI或是ML就可以解決很多很多難題,尤其當各大公司,如Google與微軟紛紛推出ML的開源工具,都宣稱只要有它們,你可以輕鬆解決許多過去包含人的辨識或是無人駕駛等等的議題。對於一個年輕時就開始試著了解機器學習的多種架構,也同時經歷過ML這幾十年來的數度浮沈的我來說有點失落。 曾經,我也試著用ML來解決我在訊號分析上的問題,有時算成功,有時失敗。說算成功是因為效果差強人意,也出過論文,但是自己知道跟真的能用還有一段距離。這麼多年來,在訊號上,也開發過非ML的演算法,一般來說,因為是照著數學與訊號原理以及人怎麼解讀訊號來設計演算法,不太會比用ML差。不過,一個小小實驗室的能量畢竟有極限,過去即使花了再多力氣,總是有個天花板無法突破。然後看著這幾年AI/ML再次熱烈登場,一舉把過去學校多年來進步緩慢的領域的效果提昇了不少。剛開始有點驚訝,不過當知道這是用很多層的架構加上巨量資料配合非常大的運算能力才達成,也就不意外了。雖說,過去的類神經網路架構加上前端的Convolution 確實是一個非常不意外且有用的方法。 當紅的不管是語音辨識,臉部辨識與圍棋,在效能的進展上過去幾十年間都有過數度很長一段時間的停滯,但是並不代表過去的研究是無用的,不管有沒有用上所謂的AI。而這些領域,從開始有人提出研究論文以來,無一不是已經歷經了數十年間,無數學者專家投入,已發表的論文我想要以千與萬來計了。中文語音研究的專家台大的李琳山教授,交大的吳毅成教授對電腦棋的成就也是有目共睹。因為對於該領域的資料分析投入多年的研究,對於資料背後的意義多所了解,所以當遇到新的運算工具,很快就可以迎頭趕上。我相信吳毅成教授的團隊在圍棋上應該不輸Google,即使有也應當相距不遠。 當國家要投入AI的建置時,「理所當然」出現了很多AI的專家,因為他們應該都在各個資料領域或是機器學習領域浸淫多年了。我一直不覺得自己是屬於ML領域的,因為對我來說,不管是哪一類的ML架構,我都是拿來用而已,即使,當年我確實是開發了一個特殊的架構與訓練法,試著解決樂器聲學上的一個問題。 所以當有需求開ML的課程時,我很猶豫。要照著過去我教各式各樣ML的演算法的原理以及怎麼發展,怎麼推導與演算嗎?裡面有很多東西要硬著啃才會進入其核心。我一來怕學生會睡著,但是更怕的是,我們到底有沒想清楚我們是想訓練出未來開...