用聽眾的語音質(zhì)量意見取平均值并評分
MOS | 質(zhì)量 | 雜音 |
5 | 非常好 | 感知不到失真 |
4 | 好 | 能感知到失真但不反感 |
3 | 一般 | 能感知到失真但稍微反感 |
2 | 不好 | 能感知到失真且反感 |
1 | 差 | 能感知到失真且非常反感 |
多年來,國際電信聯(lián)盟和其他種族攜手?jǐn)M制方法和建議,利用設(shè)備測試從感知上評估通信通道的語音質(zhì)量,從而提供可比較人類聽眾報告結(jié)果的MOS語音評估以及其他結(jié)果以供其他原因分析。
POLQA與PESQ均無需大量聽眾即可生成MOS語音評估結(jié)果,將預(yù)錄的語音樣本通過被測設(shè)備(DUT ), 并與原語音樣本比較。算法評估參考音頻和劣化音頻之間的差異并生成結(jié)果。
ANST采用兩大建議書POLQA和PESQ,提供適用于8192D電聲綜合測試儀的語音感知音頻評估測量法。2001 年P(guān)ESQ獲批成為ITU-T(國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門)推薦方法,至今仍在使用中。POLQA于2011年獲國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門批準(zhǔn)并于2014年修訂,較PESQ有很多改進(jìn)。
通過特殊藍(lán)牙"“配置、電話網(wǎng)絡(luò)、( VolP )連接和其他依靠有損語音的編的通道的語音非常適用于感知音頻評估,正如包括聲學(xué)傳感器和聲空間的信號通路。
POLQA和PESQ如何選擇
本技術(shù)說明主要介紹POLQA,這是目前推薦使用的一種感知音頻測量模型。為兼容傳統(tǒng)設(shè)備、法規(guī)要求,部分用戶可能需要使用PESQ。
以下簡單對比了POLQA與PESQ:
POLQA彌補(bǔ)了PESQ模型的缺點,可以處理頻帶更寬的音頻信號。其他改進(jìn)還可以處理時間呼叫信號和含延遲變化的信號。
PESQ支持涵蓋公用通話頻帶的窄頻帶測量(8kS/s采樣率,300- 3400 Hz)和涵蓋更廣范圍的寬頻帶測量(16kS/s采樣率,100- -7000Hz )。
POLQA增加了超寬頻帶模式( 48 kS/s采樣率,50--14000Hz),以調(diào)節(jié)的高清語音編和網(wǎng)絡(luò)。國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部門的一項評估表明POLQA在窄頻帶和寬頻帶模式下表現(xiàn)均超越PESQ。
POLQA能更精確地評測電平差(與主觀聽感相比)。
POLQA根據(jù)人類感知衡量線性頻率失真,而PESQ往往對此類失算不敏感。
PESQ對轉(zhuǎn)換器之間的鐘差比較敏感,而POLQA可以補(bǔ)償鐘差和其他時間效應(yīng)。
POLQA全面支持聲學(xué)測量,包括在模擬頭部和軀干、模擬人嘴和模擬人耳上使用聽筒和換能器進(jìn)行測試。