看板 NTUEE_Speech 關於我們 聯絡資訊
關於SS的summary已經弄出來了,檔案放在下列位置。 /share/data/cp/ntu_lectures/ss/summary/manual/ 裡面有slide和class兩個資料夾, slide中有針對各個slide不同比例的摘要(邱亮德看你覺得多少比例比較適合吧), 而class中是針對每一節課抽取固定term數的摘要(我覺得200個term應該差不多)。 PS. 裡面的摘要都是以句子為單位,要注意的是,我並沒有把句子按照原本順序喔~ 所以要處理到system上可能要多做一點點小處理,抱歉~ 同時我有train PLSA的model,是在transcriptions上, 以一張slide當作一個document去train出來的,model本身和voc都放在 /share/data/cp/ntu_lectures/ss/plsa_model/ 我使用的是其中topic數為32的(感覺比較合理XD),如果有要用的人可以用他。 最後要說一下,這邊都是manual transcriptions的結果, 因為我不知道辨識的結果到底是哪個XDDD~有人可以提供一下ASR的master位置嗎?? 我的script都寫好了,所以有了應該就很快可以把ASR的結果跑出來! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.169.225.77