推 aappjj:那洛天依是抓了哪些音?漢語拼音有甚麼基本單位嗎? 10/20 18:43
也是一樣先抓取漢語三十七個基本拼音,然後再一起數位化。
然而因為漢語拼音有許多拼音會因為拼法不同而有變形現象,外加中文有五種音調,因此
當初日本在研發洛天伊時也是煞費苦心的。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 18:45)
→ PrinceBamboo:頻率是音調高低 五十音不是頻率 10/20 18:45
就是是念法也是有頻率差別的,我只是講基本概念而已,至於技術我還是處於摸索狀態。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 18:46)
推 milkfox:原來洛天衣是用37個基本拼音 ~受教了 10/20 18:51
→ milkfox:話說37個該不會是ㄅㄆㄇ那37個吧 = =||| 10/20 18:53
→ PrinceBamboo:說音域會比初音少也不對 他根本就不是歌曲製作軟體 10/20 18:53
→ milkfox:但是洛天依必須使用中國的漢語輸入 和台灣的差很大~ 10/20 18:54
→ PrinceBamboo:アイウエオ的差異絕對不是頻率 DoReMi才是 別凹了 10/20 18:54
我可沒凹喔!因為我有向電腦音樂方面老師請教這個問題,而他們也講出電腦人聲軟體的
技術的基本概念。
而且每個人的聲音的頻率確實有差,就算是兩個人念ㄅ(b)的音,也會因為頻率不同而
有不一樣的聲音。
就像同樣都是講漢語,為何台灣人講話聲音跟大陸人講話聲音不一樣,也是這樣的道理。
總之我把我所知道告訴你們,至於你們看法如何就不在我的評論範圍。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 18:58)
→ PsycoZero:漢語拼音某程度上也是注音符號...某程度上 10/20 18:55
推 milkfox:不過我之前學認知發展時,ㄅㄆㄇ好像被歸於音節 10/20 18:58
→ w3160828:日本不可能用注音吧 用對岸的主流才正常 10/20 19:09
→ PrinceBamboo:還在凹 用機器發出同音高的ㄚ和ㄨ 頻率明明就相同 10/20 19:12
→ PrinceBamboo:你講兩個人用不同音高發同音 來證明五十音差異是頻率 10/20 19:13
→ PrinceBamboo:牛頭不對馬嘴 10/20 19:13
我該講的都已經講了,你要如何反駁我也無濟於事。
反正人聲虛擬軟體技術就是這樣的基礎概念,我講到這邊為止。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 19:17)
→ PrinceBamboo:"分析這五十音的聲音頻率"就是不合理的 偏要視而不見 10/20 19:19
很抱歉,我並沒有視而不見,我只是把我知道的基本概念講清楚而已。
如果你比我知道更多,你也可以發一篇專業文章來講,不過請用客氣的方式來講,我會全
盤吸收的。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 19:22)
推 CP64:一個音是由多個不同頻率音混成的 每個人在個頻率的比例不同 10/20 19:23
→ CP64:(看向等化器 10/20 19:23
推 kent0510:口氣好差... 10/20 19:24
我已經盡量客氣的回答各位了,我並沒有用激動的口語來講,只是把我所知道的盡量講出
來而已。
→ CP64:所以應該要改成"分析這五十音的聲音頻率"組成"" 比較合適:P 10/20 19:26
這方面我會改進用詞的,謝謝你的提醒。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 19:29)
→ PrinceBamboo:不是那樣改 五十音 跟頻率完全無關 頻率根本不能出現 10/20 19:31
推 kent0510:原po誤會了,我指口氣差的不是說你... 10/20 19:36
推 sdfsonic: 我是說在座的各位... 10/20 19:43
推 PrinceBamboo:誰都看得出kent是說我 但原po習慣對號入座也非第一次 10/20 19:44
推 boni:原po所謂的"分析五十音頻率"應該是指針對"波形",就像是鋼琴 10/20 20:20
→ boni:黑管或音叉都可以發出"DO~~~~",可是一聽就知道是不同樂器的DO 10/20 20:21
→ boni:一段話當中的"あいうえお"有可能都是接近的頻率,但因為波形 10/20 20:22
→ boni:不同,所以人耳分別得出來 10/20 20:23
→ boni:(接下來是猜想部份)"人聲歌唱"跟"樂器"的差異在光是一個人 10/20 20:26
→ boni:就會有不同波形,如"あいうえお,ㄅㄆㄇㄈ,ABCD",不像比方鋼琴 10/20 20:27
→ boni:只有噹噹噹(阿反正就是那個聲音),所以在"合成"這件事情上, 10/20 20:28
→ boni:要漂亮地呈現特定一首歌,就必須先取樣那首歌所屬語言的文字的 10/20 20:30
→ boni:"聲"跟"韻"在各個音階的信號"波形",然後在runtime(使用者使用 10/20 20:30
→ boni:這個軟體的階段)以這個資料庫去做合成 10/20 20:31
→ boni:可是這個資料庫的生成是大工程,因為音域,還有感情表現的因素 10/20 20:33
→ boni:都會讓成品顯得不自然 10/20 20:34
→ boni:(進一步猜想)這樣的不自然有可能會發生"恐怖谷效應" 10/20 20:35
→ boni:技術者越是想要擬真,卻讓聽者越排斥,除非真的真的很真很真 10/20 20:36
→ boni:wiki:"恐怖谷理論" 10/20 20:37
→ boni:以上個人淺見.... _m_ (超土下座) 10/20 20:38
非常感謝你專業上的講解,我受教許多。
※ 編輯: tarantella 來自: 163.30.65.220 (10/20 20:39)