精華區beta C_Chat 關於我們 聯絡資訊
看到這篇我想以我和搭檔目前所做的研究來簡單講一下。 原波講得是聲碼的相關技術,也就是聲音用數位號碼來標示。 這方面目前最熱門得是把聲音〈WAV〉變成MIDI,並進而轉化為樂譜〈最常見的是五線 譜〉。 以前所有的音樂老師〈包含電腦音樂老師〉都會跟我們說聲音無法轉換成MIDI,這是因為 聲音要用數位號碼來標示會牽涉到電腦判讀的技術。 簡單來說一個聲音出來不是只有一種,而是會有兩個以上的聲音來互相交疊,就連最簡 單辨識的樂器鋼琴在進行辨識時,也需要人工來進行校正。 目前我們的技術是可讓鋼琴的音樂直接變成五線譜,但需要半電腦半人工的方式來編寫, 才能達到客戶要的標準。 而通常一首普通的四分鐘抒情鋼琴音樂,用我們的技術都要耗費四個小時,而如果是炫技 特強且快速的鋼琴音樂,就非要耗費十個小時以上。 以下是我們相關的技術,不方便貼我們部落格網址〈有牽涉到商業〉,就直貼youtube 網址。 這是我的搭檔親自演奏的版本〈我們不能張貼其他鋼琴手作品,怕會觸犯智慧財產權〉: https://youtu.be/HThMdakk3KU
而這是由電腦辨識後,還沒人工校正的版本〈五線譜〉: https://youtu.be/621ya-wW8xk
所以上篇文章當中所說技術還不足就是這個原因,因為這牽涉到人工智能部分。 ※ 引述《extemjin (extemjin)》之銘言: : ※ 引述《D600dust (一世六百塵)》之銘言: : : 你的問題就好像台灣的老闆 : : 只考慮到成本 : : 沒想過價值 : : 一般聲優的薪水是能多高? : : 高到你覺得他是個費用而不是資產 : : 高到讓你忽略他除了配音以外的工作 : : 可以帶來多少額外的收入? : : 我這樣反問你一個問題好了 : : 有了初音 是不是歌手都可以去死了? : : 沒有音域的限制 唱再多喉嚨也不會受損 : : 而且初音跟歌手一樣能開演唱會呢 : : 更不用說初音不會老 : : 永遠不會退出舞台 : : 喔 對了 只要你喜歡 他長什麼樣子都可以 : : 有了初音是不是就可以取代歌手 : : 甚至明星和偶像了 : 你的回文就好像反年改的暴民 : 只考慮到價值 : 沒想過實際面 : 甚至無知到連改甚麼都不知道 : 順便連前一兩篇一起回, : 我先重複一次我本文說的東西,不要看到"AI"兩個字, : 就只想到電腦語音這方面去好嗎? : 不是你給電腦一句話然後電腦唸出來唱出來那樣。 : 我說的是"變聲器"、變聲科技,跟"初音"這套軟體根本是不同的東西好嗎。 : 我說的是把任意A來源的聲音,變成任意目標B這樣的概念。 : 我舉個簡單的例子,一般常見的大眾化變聲器,很難拿來唱歌,為什麼? : 因為唱歌中人聲會有不同的音域,普通的數學轉換在不同音域無法及時的調整, : 勢必得仰賴人工作業。 : 而這個作業本身應該是可以自動化,利用解析目標聲音 > 取得資料庫 > 解析來源聲音 : >訓練AI來進行合成或調整,取代人工作業。 : 我說的是這樣的一套"工具"。 : 跟「棒讀感」甚麼的,要嘛也請聲優來演聲優就不行了, : 請池田來演釘宮搞不好還能玩出甚麼意外的新花樣, : 但前提是得有這個「變聲蝴蝶結」的存在。 : 至於說"初音"這樣的東西能不能全面取代聲優歌手,我不認為可以, : 最起碼現在的技術還不行。 : 但是在"個人製作"的某些領域上,聲優跟歌手真的差不多已經可以去死了。 : 例如遊戲、實況、導航、小型動畫等等。 : 對於一些純粹只需要聲音演出,聲優本人長甚麼樣子有差嗎? : 我想變聲器要是如果真的發展到一個成熟的階段,說不定"聲音"本身就可以是一個 : 專利或資產,任何人只要購買某B小姐的聲音使用權,就可以變成B小姐的聲音, : 隨著科技的進步發生這樣的變化也說不定。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.161.83.222 ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1503304097.A.CC6.html
hizuki: 簡單說wav只有頻率和幅度兩個特徵,這個比較難識別 08/21 16:36
arrenwu: 如果只有單一樂器的話 Fourier Tranform後會很難識別嗎? 08/21 16:37
arrenwu: 感覺頻率的部分還好,是時間長短的部分比較難界定? 08/21 16:37
hizuki: 不行吧,Fourier Tranform用來識別有哪些樂器還比較好吧 08/21 16:38
目前依我們的相關技術,是可識別鋼琴和古箏,吉他比較難辨別,管樂器比吉他難一點, 而弦樂器又比管樂器更難,最難辨別的是人聲。 但如果對方的聲音是由電腦midi轉出來的,那辨識度會大幅提高。
arrenwu: 你這樣說好像滿有道理的 08/21 16:39
arrenwu: 差那一點點頻率可能真的容易搞錯 08/21 16:39
※ 編輯: RueiRing (118.161.83.222), 08/21/2017 16:44:10
zxcmoney: 對我這種人來說,兩個聽起來差不多 08/21 17:46