關於SS的summary已經弄出來了,檔案放在下列位置。
/share/data/cp/ntu_lectures/ss/summary/manual/
裡面有slide和class兩個資料夾,
slide中有針對各個slide不同比例的摘要(邱亮德看你覺得多少比例比較適合吧),
而class中是針對每一節課抽取固定term數的摘要(我覺得200個term應該差不多)。
PS. 裡面的摘要都是以句子為單位,要注意的是,我並沒有把句子按照原本順序喔~
所以要處理到system上可能要多做一點點小處理,抱歉~
同時我有train PLSA的model,是在transcriptions上,
以一張slide當作一個document去train出來的,model本身和voc都放在
/share/data/cp/ntu_lectures/ss/plsa_model/
我使用的是其中topic數為32的(感覺比較合理XD),如果有要用的人可以用他。
最後要說一下,這邊都是manual transcriptions的結果,
因為我不知道辨識的結果到底是哪個XDDD~有人可以提供一下ASR的master位置嗎??
我的script都寫好了,所以有了應該就很快可以把ASR的結果跑出來!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 118.169.225.77