看板 NTHU_NVLab 關於我們 聯絡資訊
下面這部分的文章一樣是轉貼自台大資管系主任莊裕澤教授的文章,這是他文章中的另一 主題,所以我論文把他貼成一篇新的文章。這篇文章主要講述了平常要怎麼做好論文蒐集 的工作,論文蒐集的工作其實每兩三個禮拜就要做一次,而且這樣的蒐集工作將是未來你 論文中第二章內容的奠基。跟實驗室相關的期刊論文還有研討會論文的連結我都已經整理 在前面的文章中,所以也請各位學弟要自己多學習找出跟自己有關的論文,而不是老是要 學長幫你們找出可以報的論文,甚至連論文要怎麼下載都不知道。 = = = Survey是做好論文的第一步,也是關鍵的一步。Survey的目的大家都知道,就是要對研究 的議題有個深入且廣泛的了解,這樣才知道目前在這領域裡研究的進展已經到什麼地步, state of the art是什麼,有那些的子題及技術已經被探討,從而也可以知道那些還可以 開發,那些技術可以被你的研究議題拿來應用。Survey 做的不好,最致命的打擊就是在 你對你的研究議題一頭埋入,花了許多心血,好不容易熬出一些成果之後,突然才發現別 人早已經發表同樣或類似的成果。 怎樣才能把survey做的深入且廣泛呢?我的方法是你要知道在這領域裡主要的國際會議是 什麼,然後把這些會議近幾年來(至少三年)所發表過的論文的title及abstract瀏覽一次 ,找出跟研究議題比較相關的論文(注意:是「議題」,不是「領域」)。這樣初步找出來 的論文大概從十來篇到二、三十篇,甚至也可能更多。接著,你得把這些論文的 Introduction看一遍,對它們做個初步的瀏覽,然後把這些論文依它們與你的研究議題的 相關性做個大致的排序。接下來就是依序把這些論文仔細的研讀,每篇論文的重點是什麼 ,關鍵的技術又是什麼,都得弄得很清楚。我的經驗是:因為剛開始對研究議題較不熟悉 ,前面幾篇念起來通常較吃力。可是隨著研讀的論文愈多,你就會發現愈來愈輕鬆。 在這個階段,你每篇研讀的論文大概都是夠水準的論文(因為他們是發表在主要的國際會 議)。在研讀這些論文的時候,你得看它們探討那些相關的文獻,這些文獻你大致都得知 道,並且就其中與你研究議題最相關的論文,你也得找出來仔細的研讀,並且重覆這樣子 的工作一直追溯下去。你不用擔心這樣做會無止無境,因為當你從最近的一篇論文開始往 前追朔,大概不超過三、四代,你就會發現不必再追朔,因為再往前追朔,你會發現它們 要麼與你的研究議題愈來愈遠,要麼就是你研究領域的基本知識。如果是你研究領域應具 備的基本知識,而你還不了解,那你應該回頭再修一些課把基礎打好,不該這麼早就進入 你想研究的議題上。 根據這個經驗法則,你會發現你在survey的階段只要把握一個原則:把與研究議題相關的 最近幾篇論文拿出來,看看這些論文所引用的文獻有沒有你不知道的,如果沒有,那麼比 這些論文早的文獻你大概都沒遺漏了。如果有,就把它們找出來仔細的研讀。隨著你研讀 的論文愈多,你的功力就愈增加。當你發現拿到一篇新論文時只要看完它的Introduction 之後,你就知道這篇論文的重點及猜出它用的主要技術之後,你的功力已經提昇到可以進 入研究議題的階段了。在這個階段,如果論文的研讀夠深入及廣泛,你往往也可以發現新 的研究議題。 你的survey還不能在這裡停止,因為你的觸角可能尚未含蓋所有關於研究議題的文獻。你 目前只有survey與研究議題相關的主要國際會議(以及會議論文所引用到的相關文獻),這 些會議通常不超三到五個。目前的國際會議相當多,而且有些會議的研討議題又廣,因此 有可能兩個會議的主軸不一樣,但卻含蓋類似的子題。舉例來說,假設你要研究的是 peer-to-peer系統上的資訊搜尋,你大概會找專門探討peer-to-peer系統的國際會議。這 個目前大概有二、三個。可是你知道那裡還有呢?我告訴你至少還有二、三十個可能:專 門討論分散式系統裡的國際會議(這至少有五到十個,其中first tier的約三、四個,其 餘為second tier),討論平行運算的國際會議(這至少也有五個),討論網路與通訊系統的 國際會議(這至少十個以上),討論資料庫與資訊檢索的國際會議(這至少也有五個),相信 了吧!而且還有好多新的workshop你從未聽過的。 你一定會問:一、我怎麼知道有那些可能相關的國際會議;二、我怎麼有辦法消化完這些 會議的論文? 第一個問題得從你第一階段的論文研讀著手。在研讀這些論文的時候,你得注意它們發表 在那裡,從而知道有那些可能相關的國際會議。 第二個問題:如何消化與你的研究議題可能相關的國際會議內的論文?你把與研究議題相 關的最近幾篇論文找出來,看它們是在那一年發表的。如果你研究的是熱門議題,你找到 的應該是去年或今年的論文;如果你的議題冷門,那最近一篇論文有可能是好幾年前的事 。不過不管是冷是熱,你都只需把相關的國際會議最近一、二年的會議議程拿來看看,有 沒有與你的研究議題相關的論文發表,有的話把論文找出來仔細研讀一下這篇論文有什麼 突破,另外,也注意一下這篇論文引用的參考文獻有沒有你尚未讀過的,沒有的話表示你 前階段的survey做的很仔細,有的話你就得把這些遺漏的論文找出來研讀,並且用前面提 到的方法再去追朔這篇論文三、四代以內的參考文獻,以及論文出處,找出是否還有其他 的相關國際會議,並且一樣得把這些會議近一、二年的議程拿來看看是否有相關的論文發 表。這些過程一定會收斂的,而當你發現沒有新的論文被你找出來之後,你的survey工作 大概已經做的差不多了,可以準備收工全心投入研究議題上。通常而言,你在第二階段找 到的論文不會太多,大多數的論文在survey的第一階段都會看到。收工之前,為防萬一, 你再到Google、Siteseer及幾個主要的 digital library,如IEEE,ACM,Springer等去 search一下,確定沒有漏網之魚。如果你survey的深入,你應當知道要下那些關鍵字去查 詢。這個步驟也可以確保如果你研究的是冷門議題,在你看到的最近一篇的論文,到近一 、二年的國際會議這期間,有沒有其他的論文你沒有注意到的(因為你最後一階段的 survey工作只注意相關會議最近一、二年的議程,而你看到最近的論文可能是好幾年前的 東西)。 在這裡我好像都沒提到期刊論文。一般而言,期刊論文通常比較完整,但刊登的結果往往 是二、三年前的東西。就資訊科技而言,二、三年內的研究進展可能很大,因此比較新的 結果通常先發表在國際會議上,發表之後,經過幾回合的修正才會投稿到期刊。所以你 survey的論文比較新的東西很少會在期刊上發現。但反之,比較久的成果,有可能已整理 發表於期刊上。如果是如此,那你在研讀這個成果時,最好是找已發表於期刊上的論文研 讀,這樣會得到比較完整清楚的資訊。 整個survey的階段會看完幾篇論文?這當然看你的研究議題而定。但三十篇以上是跑不掉 的。如果加上你只瀏覽Introduction 的部分,那可能在五、六十篇以上。 最後,我要你們做一件事情: 在一星期之內,把survey的工作按照我上面講的步驟重做一次。星期六之前,請你整理一 個清單摘錄下列資訊,並email給我 (記住:做完整之後再email給我;我不要片段片段的 接收你們的資訊): 1. 與你研究議題相關的國際會議及期刊有哪些。 2. 你找到哪些論文,論文格式請整理成bib檔格式(記住:我要的是bib檔格式,且要非常 完整正確。如何做到,可以問實驗室學長。我也會請他整理一份心得告訴大家。) 3. 在你找到的論文裡,請用另一份表格整理下列資訊:請就這些論文依其與你研究議題 的相關性分成三類:密切相關、相關、略為相關。同時請標記哪些是你已經仔細的研讀過 的,哪些是你只瀏覽Introduction ,但有把握住整篇論文的重點。若有尚未看完的論文 ,也請標記。 4. 請把你列出來的所有論文電子檔以下列方式命名: 年代-會議或期刊縮寫(若不知,請以第一作者的Last Name代之)-Title的摘要。 例如:2003-SIGCOMM-Peer-to-Peer Information Retrieval Using Self-Organizing Semanticverlay Networks.pdf 然後請你上傳這些檔案到ftp,你的個人目錄底下的paper 子目錄內。我會就你整理的清 單去判斷你的survey是否足夠,再來決定你的proposal及論文應該還要做哪些工作。 Joung -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.114.28.196