作者Zenta (忙碌的接線生)
看板Headphone
標題Re: [問題] 我不要心理作用~~~
時間Sat Jun 27 12:50:49 2009
很簡單地補充一下MP3壓縮中關於聽覺心理學的部分,
對於音訊壓縮技術已有涉獵的人可以直接略過這篇,
有錯誤或不清楚的部分願意補充當然更感激。
MP3 以及其他音訊壓縮法,演算法的設計不盡相同,
其中除了資料壓縮技術外,很重要的一環在於聽覺心理學模型的使用,
也就是
"盡可能捨棄人耳不敏感的部分,將信息量保留人耳易感知的部分"
以mp3壓縮為例,這並不是單純地在頻率響應上砍掉極高頻跟極低頻,
有兩個主要的聽覺特性會被考慮,
(1) ?(Absolute threshold of hearing) 不知道怎麼翻...
這個指的是對於不同頻率的聲音,感知能力不同,
如果把"可以聽到"的音量對頻率做成一張圖,
它的曲線類似一個不對稱的碗公,人耳在2~4khz最敏感,所以可感知音量最小,
越往極高頻跟極低頻的感知能力越差,也就是可感知音量越高;
所以對於mp3是砍極高頻跟極低頻的說法,
其實只對了一部份,因為基於此效應,極高頻跟及低頻的訊號確實較容易被捨棄。
(2)遮蔽效應(masking effect)
音量大的聲音,會遮蔽音量小的聲音,這又可分為頻率上跟時間上兩種。
頻域上,
大音量的單頻率訊號出現,可能為遮蔽者(masker),會造成鄰近頻率較小聲的訊號無法被察覺,
也就是說,對於鄰近頻率訊號的敏感度,因為這個大音量的單頻訊號而降地了,
遮蔽的範圍又會遮蔽者發生的頻段不同而有差異。
時域上,
一個大音量的訊號,會遮蔽前後數十微秒內的小音量訊號,
向後遮蔽的時間長短又會受該遮蔽者存在時間影響。
所以,
MP3壓縮演算法中,有一部份是對原音訊作傅立葉轉換(Fourier Transform),
將之從時域轉換至頻域上分析,也就是:
聲量對時間的分佈 --> 聲量在頻率上的分佈
依聽覺心理學模型去分析並計算出會被遮蔽、人耳難以察覺的部分,
再行捨棄,當然,使用的bit rate越高,需要被捨棄的也就越少。
除了這兩個效應外,
MP3壓縮其實還有一些其他演算法設計,會盡量將訊號量用在比較多訊息的部分;
而這篇提到的聽覺心理學模型,也只是一個統計的結果,
每個人的聽覺能力跟傾向都略有差異,但大致上不會離這個模型太遠。
講這麼多,針對原po的問題,
有損壓縮技術一定會帶來失真,但聽不聽得出來就不一定了,
這跟壓縮演算法、音樂類型、錄音品質、壓縮轉檔品質、器材、個人聽力都很有關係!
以我個人感覺,
例如一些流行音樂不是現場收音,較少空間訊息存在,
如果編曲不要太複雜,使用合成樂器多一些,
事實上壓縮所造成的差異並不會很大。
最後,
不需要看到有損壓縮就認為一定要聽出差異,
也不是聽出差異的就是金耳朵,(更甭說可能有誇大的成分在內)
音樂重播品質的影響因子很多,除了忠於自己的耳朵之外,
多涉獵一些基本知識,尤其聽覺心理學,可以更瞭解人耳的限制與特性,
而避免落入人云亦云或是無謂強求的情況。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.224.43.76
推 terry0201:首推 06/27 13:49
→ sniper0710:推最後一段 06/27 13:49
推 mathtokyo:推推推~ 06/27 15:18
推 john0312:推. 06/27 15:31
推 kyleks:大推 06/27 15:45
推 snd:很多錄音的空間系效果器也是用演算的 06/27 15:51
→ snd:這種錄出來的用mp3壓縮差異就會很不明顯 06/27 15:52
※ 編輯: Zenta 來自: 118.168.47.84 (06/27 17:05)
推 amurorei:看耳機版除了掉坑之外還能長知識! 06/27 18:10
推 csstalker:長知識推 06/27 19:15
推 johnnycgi:好文 06/27 19:23
推 a0936370689:感恩原PO的指教:)~ 我大約懂了! 06/27 19:32
推 Selkirs:absolute threshold 指的是"絕對閾值"也就是分辨無刺激跟 06/27 23:38
→ Selkirs:有刺激的最低刺激強度。 06/27 23:39
→ Selkirs:所以absolute threshold of hearing可稱作 聽覺的絕對閾值 06/27 23:41
→ Zenta:喔~~感謝樓上,一直找不到threshold對應的中文詞彙,閥值啊~ 06/28 01:00
推 yuukaze:看耳機板長知識 06/28 01:31
推 laca:好文!! 長知識 ! 06/28 02:00
推 xellence:zenta大 是唸作閾(ㄩˋ)值 不是閥(ㄈㄚˊ)值喔 06/28 11:19
→ Zenta:感謝樓上...我真是眼殘啊...po文長知識 06/28 12:23
推 skiOMG:聽覺的絕對底限值(門檻、閾值) 06/28 22:04
→ skiOMG:囧 有人推了...... 06/28 22:04
推 hankckh:長知識推+1 06/29 11:46