精華區beta C_Chat 關於我們 聯絡資訊
作者: tarantella (Arithen Jacks Zhang) 看板: C_Chat 標題: Re: [新聞] 粉絲喊讚!初音不爽被山寨 拳揮大陸波霸 時間: Sat Oct 20 18:39:26 2012 ※ 引述《qazieru (=w=)》之銘言: : 粉絲喊讚!初音不爽被山寨 拳揮大陸波霸「東方梔子」. : http://www.ettoday.net/news/20121019/116503.htm#ixzz29p9WMhMP : 記者朱璟柔/綜合報導 : 日本最強的虛擬偶像「初音未來」紅到有「山寨版」,她是中國的虛擬明星「東方梔子」 : (網路誤稱為東方之子),一樣有及地雙馬尾、短裙、膝上靴和「絕對領域」,只是不同 : 的是「山寨初音」全身大紅色,還有初音望塵莫及的豐滿上圍,而最大的不同,是初音的 : 歌全是由軟體製作的「仿真人歌聲」,東方梔子的歌卻是由真人演唱再電音化。 這個我稍微講一下,初音也不是全部由軟體來發人聲,她是研發者先請配音員來念日本五 十音後,再由電腦來分析這五十音的聲音頻率,然後加以數位化,而因為人聲的聲音頻率 實在太多,以現有電腦的技術來全部數位化完全不可能,因此只能抓取主要的聲音頻率, 加以數位化後成為電腦合成音,因此初音未來可以唱出女低音最低的音律(在低音So), 可以唱出女高音最高的音律(在高兩個八度的Do)。 可是大陸這個東方梔子則完全是把歌手演唱一段歌曲,然後再加以電音化而已,因此雖然 成本上比初音還要便宜,但她的音域則會比初音還要少的可憐(以我聽她的聲音,大概在 Do至高音Do而以),如果要她唱女低音最低音及女高音最高音,則會完全變成機械音,比 初音還要更不自然。 大家如果有聽過有位音樂作曲家用Google發音者來唱歌的話,應該可以聽出他能使用的音 域有限,如果太高或太低,都會讓Google發音者的聲音嚴重變質。 所以電腦人聲模擬技術,中國還要走很長的路,絕對不可能速成辦到的。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 163.30.65.220
aappjj:那洛天依是抓了哪些音?漢語拼音有甚麼基本單位嗎? 10/20 18:43
也是一樣先抓取漢語三十七個基本拼音,然後再一起數位化。 然而因為漢語拼音有許多拼音會因為拼法不同而有變形現象,外加中文有五種音調,因此 當初日本在研發洛天伊時也是煞費苦心的。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 18:45)
PrinceBamboo:頻率是音調高低 五十音不是頻率 10/20 18:45
就是是念法也是有頻率差別的,我只是講基本概念而已,至於技術我還是處於摸索狀態。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 18:46)
milkfox:原來洛天衣是用37個基本拼音 ~受教了 10/20 18:51
milkfox:話說37個該不會是ㄅㄆㄇ那37個吧 = =||| 10/20 18:53
PrinceBamboo:說音域會比初音少也不對 他根本就不是歌曲製作軟體 10/20 18:53
milkfox:但是洛天依必須使用中國的漢語輸入 和台灣的差很大~ 10/20 18:54
PrinceBamboo:アイウエオ的差異絕對不是頻率 DoReMi才是 別凹了 10/20 18:54
我可沒凹喔!因為我有向電腦音樂方面老師請教這個問題,而他們也講出電腦人聲軟體的 技術的基本概念。 而且每個人的聲音的頻率確實有差,就算是兩個人念ㄅ(b)的音,也會因為頻率不同而 有不一樣的聲音。 就像同樣都是講漢語,為何台灣人講話聲音跟大陸人講話聲音不一樣,也是這樣的道理。 總之我把我所知道告訴你們,至於你們看法如何就不在我的評論範圍。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 18:58)
PsycoZero:漢語拼音某程度上也是注音符號...某程度上 10/20 18:55
milkfox:不過我之前學認知發展時,ㄅㄆㄇ好像被歸於音節 10/20 18:58
w3160828:日本不可能用注音吧 用對岸的主流才正常 10/20 19:09
PrinceBamboo:還在凹 用機器發出同音高的ㄚ和ㄨ 頻率明明就相同 10/20 19:12
PrinceBamboo:你講兩個人用不同音高發同音 來證明五十音差異是頻率 10/20 19:13
PrinceBamboo:牛頭不對馬嘴 10/20 19:13
我該講的都已經講了,你要如何反駁我也無濟於事。 反正人聲虛擬軟體技術就是這樣的基礎概念,我講到這邊為止。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 19:17)
PrinceBamboo:"分析這五十音的聲音頻率"就是不合理的 偏要視而不見 10/20 19:19
很抱歉,我並沒有視而不見,我只是把我知道的基本概念講清楚而已。 如果你比我知道更多,你也可以發一篇專業文章來講,不過請用客氣的方式來講,我會全 盤吸收的。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 19:22)
CP64:一個音是由多個不同頻率音混成的 每個人在個頻率的比例不同 10/20 19:23
CP64:(看向等化器 10/20 19:23
kent0510:口氣好差... 10/20 19:24
我已經盡量客氣的回答各位了,我並沒有用激動的口語來講,只是把我所知道的盡量講出 來而已。
CP64:所以應該要改成"分析這五十音的聲音頻率"組成"" 比較合適:P 10/20 19:26
這方面我會改進用詞的,謝謝你的提醒。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 19:29)
PrinceBamboo:不是那樣改 五十音 跟頻率完全無關 頻率根本不能出現 10/20 19:31
kent0510:原po誤會了,我指口氣差的不是說你... 10/20 19:36
sdfsonic: 我是說在座的各位... 10/20 19:43
PrinceBamboo:誰都看得出kent是說我 但原po習慣對號入座也非第一次 10/20 19:44
boni:原po所謂的"分析五十音頻率"應該是指針對"波形",就像是鋼琴 10/20 20:20
boni:黑管或音叉都可以發出"DO~~~~",可是一聽就知道是不同樂器的DO 10/20 20:21
boni:一段話當中的"あいうえお"有可能都是接近的頻率,但因為波形 10/20 20:22
boni:不同,所以人耳分別得出來 10/20 20:23
boni:(接下來是猜想部份)"人聲歌唱"跟"樂器"的差異在光是一個人 10/20 20:26
boni:就會有不同波形,如"あいうえお,ㄅㄆㄇㄈ,ABCD",不像比方鋼琴 10/20 20:27
boni:只有噹噹噹(阿反正就是那個聲音),所以在"合成"這件事情上, 10/20 20:28
boni:要漂亮地呈現特定一首歌,就必須先取樣那首歌所屬語言的文字的 10/20 20:30
boni:"聲"跟"韻"在各個音階的信號"波形",然後在runtime(使用者使用 10/20 20:30
boni:這個軟體的階段)以這個資料庫去做合成 10/20 20:31
boni:可是這個資料庫的生成是大工程,因為音域,還有感情表現的因素 10/20 20:33
boni:都會讓成品顯得不自然 10/20 20:34
boni:(進一步猜想)這樣的不自然有可能會發生"恐怖谷效應" 10/20 20:35
boni:技術者越是想要擬真,卻讓聽者越排斥,除非真的真的很真很真 10/20 20:36
boni:wiki:"恐怖谷理論" 10/20 20:37
boni:以上個人淺見.... _m_ (超土下座) 10/20 20:38
非常感謝你專業上的講解,我受教許多。 ※ 編輯: tarantella 來自: 163.30.65.220 (10/20 20:39)