林北不跟你們玩了。我決定下一次的技術成果報告與展示就是林北辦一場音樂會

「裡面有不好聽的話,不喜歡看的不要看」
2010年之前幾年,我還因為論文數太少,成果累積不足,被卡在門前,但是卻還是對系統設計與整合傾心,那應該是我覺得自己花最多心思的成果,但是結果讓我傷透了心,2010年決心要ㄔㄟˋ了。
2000年我開始熱衷從事Video Encoder的硬體設計,但是不久後我發現系統整合更能吸引我,所以2001年開始動手ESL(電子系統層設計)工具的設計。我從MPEG-4 Simple Profile一直做到AVC RDO Profile。如果要把AVC RDO做得好,Motion Estimation要佔很大的計算量。以當年的記憶體頻寬,要做到Real Time是很大的挑戰。為了最大程度減低記憶體存取,所以已經載入到晶片內的資料的重覆使用是一個重要手段,當時少有ME/MC演算法考慮系統記憶體頻寬的議題,更不必說把系統整合起來了。為了這個,我的博士班學生設計了一個ME/MC演算法,其目標是以最少的壓縮損失換取最大程度記憶體存取的減少以及最少的晶片面積。為了證明我們的演算法的優異與正確性,我們實作了多種匯流排架構,多種ME/MC的演算法,多種位元精準度,以及多種的晶片內與外的記憶體組織等等,其排列組合加起來可以超過100種,我們去除不可能的數十種,然後每一種都實作並且在最後把最佳的幾個組合放到FPGA上,並且把電路整合進我們自己研發的 ESL工具,不僅對標準的test sequences實測,也用USB相機拍攝的影像實測數天,這些得到的結果,都與使用官方的reference software所編碼出來的結果,bit-by-bit相同。
相信在這個領域的人都知道我這位博士生花了多大的力氣。當論文整理好投到最頂級的期刊,第一次只有一個reviewer稱讚這是一個很艱難的work,其他的reviewers的意見看得出來都僅侷限在他自己的小領域。例如,有一位說,我們的ME/MC會使PSNR下降少許,無法超越最好的方法,有的說在MC/ME的發展上不必考慮匯流排頻寬,更離譜的還說這樣的模擬根本不必要在ESL上要做到bit-by-bit以及接近Cycle Accurate,意思是做太好反而不能被接受,言下之意是懷疑我們真的有做出來嗎?類似的意見讓人哭笑不得。看了意見後,只好改,然後被退。再改,再投其他期刊。到後來,我已經覺得再投下去也沒意思了,我請學生隨便找個地方投算了,還好,後來學生有其他論文被接受,順利畢業了。
投稿的漫長過程裡,只有一位reviewer知道我們在幹什麼,但是僅只這一位並不能改變什麼。看得出來其他的reviewers根本沒有從事類似高複雜度的系統整合研究的經驗,因為最重要的計算架構根本沒人說,而罵的以及忽略的都是我們在論文一開始就做好的這個研究是為了要減少記憶體存取而必須在一些方面妥協的聲明。也許AE一開始就把論文給了不對的人審,而接到論文的人也沒想一下自己事實上沒能力就給它亂審一通。
真不知道那時心裡罵了多少次「靠他X」了!
那年頭,越是小,越是集中在一點的改進越容易出論文,但是我就對這種事沒多大興趣啊!
於是我認清了一件事,那就是繼續做下去的是笨蛋,所以經過這件事,我跟自己說,林北不跟你們玩了。不過,好在,我們還有 洪士灝 (Shih-Hao Hung)這種笨蛋。這國家沒笨蛋就一定會完蛋。
同樣的事最近幾年又發生聲音分析上。我們有一篇論文在偵測某種爵士樂四重奏裡的節奏樂器,這類四重奏的錄音很多,很多大師如John Coltrane都組有類似樂團,在這類樂團裡,鼓手根本不會採大鼓,我們在論文最前面也一再聲明,但是reviewers還是一再再問,為什麼沒有大鼓,讓我們實在是很沮喪。AE找了不合格的reviewers,連基礎爵士樂的常識都沒有,那麼至少也應該好好看一下論文摘要與簡介,再去找一下文獻與聽一下音樂吧!還好,在音樂研究這個領域,這種事的發生率比前面說的那個少多了。
還是那句話!林北不跟你們玩了。我決定下一次的技術成果報告與展示就是林北辦一場音樂會。
我沒有要抱「認真你就輸了」這種態度。而是要更認真,我把技術全部整合起來辦一次精采的發表會,這樣子就要整個系統都可以正確無誤地動起來才行。這樣不是比幾篇沒多少人會看的論文更重要嗎?
我常說,一個工程師最大的樂趣就是做的東西有人用,我的年紀已經快要到可以退休了,與其取悅那四五個reviewers,我還是對把東西做完整來取悅成千上萬個users更有興趣。

留言

這個網誌中的熱門文章

關於專題生

成功大學資訊工程系的特殊選才乙組上機考

讀書心得:你的獨特,我看見