作者JLTChiu (隨風)
看板NTUEE_Speech
標題Re: [裝死] 很不幸的要麻煩大家了
時間Tue Nov 30 16:45:06 2010
資料已經齊了,麻煩
: 1.Train Language Model(哈密瓜)
: 4.Slide Segment Part 1(左晉恆,劉又誠)
開始進行,謝謝
附加一上Aaron學長回給我的信 請要作實驗的人注意一下
transcription file: /share/data/cp/ntu_lectures/ss/master
lexicon: /share/data/cp/ntu_lectures/ss/lex/lexicon
Everything is being generated as I write this, including MFCCs,
references, and *.scp files, using the same directory structure as
dsp.
(Slide和音檔transcription在/diska1/home/RA/SSS_Data裡面)
One change: all disfluencies and other OOVs have been mapped to a
single lexicon token (@REJECT@) whose pronunciation is the single, new
phoneme "garbage". You'll need to add this garbage phone to train your
acoustic model.
如果有任何問題歡迎來信詢問
本週日(12/4)前可以完成嗎?
※ 引述《JLTChiu (隨風)》之銘言:
: 有meeting的人應該有注意到本週三老師開始注意SS的進度
: 明天在Aaron學長修正完Transcription的錯誤之後,就有一個可以開始跑實驗的東西了
: 那接下來需要大家的通力配合才能完成這個龐大的工程
: 我大略規劃了步驟如下:
: 1.Train Language Model(哈密瓜)
: 使用的Lexicon在李宏毅學長的建議下,採用DSP的Lexicon加上在SS課程中出現的英文單
: 字,以此Lexicon生成Language Model。將Language Model交給葉青峰及李宏毅。
: 2.Train Acoustic Model(葉青峰)
: 使用哈密瓜Train好的Language Model,Lexicon及課程音檔生成Acoustic Model,並作
: Forced Alignment。將Acoustic Model交給李宏毅,Forced Alignment交給黃宥。
: 3.Retrieval System(李宏毅)
: 使用Language Model & Acoustic Model生成Retrieval 系統。
: 4.Slide Segment Part 1(左晉恆,劉又誠)
: 根據完整版Transcription和Slide,以人工方式先將每一堂課的投影片Segment標出來(
: 即每堂課從何投影片開始到何投影片結束),可以得到每一堂課的投影片範圍。(比方說
: 3/24第一堂課是由第2-3到2-17投影片所構成)
: 5.Slide Segment Part 2(碩一)
: 在確定每一堂課的投影片範圍之後,以人工方式將課程內容一一對應,完成投影片分割的
: 部份。
: 6.Key Term Extraction(黃宥)
: 根據Transcription和葉青峰提供的Forced Alignment生成Key Term。這可以分成兩部份
: ,每一堂課,每一張投影片各自生成Key Term。(先前的系統是,章的投影片就是每張投
: 影片的Key Term的集合,這次改為使用兩種素材)
: 7.Summarization(陳蘊儂)
: 根據Transcription生成Summarization,與Key Term一樣每堂課和每張投影片的
: Summarization是各自生成,和先前並不相同。
: 有任何問題歡迎發問,有建議也請不吝提出
: 每個單張的投影片都在home/RA/的SS_Slide裡面
: 抱歉 麻煩大家了
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.21.32
※ 編輯: JLTChiu 來自: 140.112.21.32 (11/30 16:47)
※ 編輯: JLTChiu 來自: 140.112.21.32 (11/30 16:48)
※ 編輯: JLTChiu 來自: 140.112.21.32 (11/30 17:26)
推 swallow0130:不太可能耶~離今天只剩3天而且我和宥12/3要出國了 12/01 00:27
推 hamigwa:工作站掛了......資料還沒抓...... 12/01 00:31
推 mnbv711:他指的應該是 1 跟 4 能否在 12/4前做完吧? 12/01 01:06
→ mnbv711:工作站掛了跟台大跳電是不是有關係啊? 12/01 01:06
推 hpttw:工作站好了 不過全部都變成唯讀了?? 不能寫入.. 12/01 01:39
推 swallow0130:喔喔原來不是說全部喔...sorry~誤會了! 12/01 02:24
推 hamigwa:我部分順利的話星期四晚上就可以給你了:) 12/02 01:12
→ JLTChiu:等等 哈密瓜先等一下 Aaron學長那邊還有東西要改... 12/02 02:33
→ JLTChiu:master file還會再更新一次= = 12/02 02:33
→ JLTChiu:更新了我會說~ 你可以先確認一下要跑的工具有沒有問題~ 12/02 02:33