用符號表示動作
幾年因為相對沒有論文壓力,我習慣讓學生嘗試比較冒險的題目,當然也要看學生的狀況才行,不是每一個都可以這麼做。
幾年前的音樂合成與樂譜解讀之外,今年我又嘗試了一個新的方向。大概是對於符號的解析轉譯多了一點經驗,所以我在想如何有系統地產生一組符號來描述人體的動作,進而反過來進行辨識與合成。說是符號,比較準確的來說,希望是一種語言。查過文獻,不是沒有人想這麼做,不過一來實際應用方向與我們想的不同,二來大家都還在摸索階段,三來工具的使用各個不同。
這位學生從二月開始每週至少跟我討論一次,偶而兩次,我們討論的多數都無關理論,除了解讀論文時真的需要解釋那些公式是怎麼推導以及在講什麼之外。我一而再,再而三都在強調語言的形成與演進的要素,從字母,字根,字,子句開始,到段落與句子結構等等還有文法,也會反過來從複雜的句子一路回推倒字母本身。 我們會用一大串我們熟悉的文字,如中文或英文來形容走路與坐下等動作,但是我們的最終目的是創造一套簡潔的符號系統序列(其實可以視作為現行英文的變形),在目前文字間轉譯的工具日益成熟,這不見得做不到。
將近四個月的時間都沒在對這樣研究寫過code,這位學生有點惶恐,我的工作就是讓她安心並稱讚她的努力,偶而讓他去想一下也為別的事寫一點code練一下手感,但很快就會回來主題上繼續討論。
我的狀況已經不需要很快有產出,我在想的都是那些人家沒做過的,或是即使有人做了卻還做的很不好的,我們如何從一個全新的角度,用新的的工具來解這個問題。我的經驗是,如果學生終究無法在這個問題上有突破,過程中他已經學習到探究的精髓,隨時可以給他一個目標明確的題目讓他可以把論文寫完並畢業。當然,碩士生比較適合這麼做就是。
因為是新的做法,所以並不求與現階段最高技術比精準度。學生會糾結於想跟這些前輩比拼,我會勸學生,用深度網路解語音與影像辨識問題也不是一開始就可以吊打傳統方法的。對我來說,打開一扇新的門比較重要,比精準度這件事我過去已經做太多了,如今就讓其他人來吧!
這些新的研究卻必須有實際應用在實驗室目前所開發的應用與系統上的可能,所以是從應用倒推要做什麼研究,甚至是從這些不同人所開發的技術的整合以後是不是可以有一間新創公司為考量,即使多數時候根本不會有(新創真的不是人幹的)。
多數學生對於做研究不是以發表論文為目標還是有點疑惑的。而這階段的我已經走過那段路了,夠了,我在想的是,這些研究是不是真的對產業有幫助,剩下不多的學術生涯我能留下什麼。當然,重點是這些研究好玩嗎?好玩才會有用,至少有好玩的作用。
研究過程比較像是哲學的探討,這個探討與過程才是真正重要的所在,如果會有方程式產生,那真的是很後面的實踐階段的事了。
留言
張貼留言