什么是錄音芯片 / Record IC是什么 / 錄音IC芯片的定義
錄音芯片(Record IC)又叫被叫做錄放音芯片,錄放音IC,錄放音語音芯片。是一種能夠錄音又能夠放音的語音芯片,常規(guī)的語音芯片都是放音芯片。
語音芯片是將語音信號通過聲音采樣轉(zhuǎn)化為數(shù)字信號,存儲在芯片的ROM中,再通過電路將ROM中的數(shù)字信號還原成語音信號的集成電路。
常規(guī)語音芯片的語音信號輸出方式有兩種:脈沖寬度調(diào)制(PWM)輸出和數(shù)模轉(zhuǎn)換輸出(DAC)。
脈沖寬度調(diào)制(PWM)輸出,是利用微處理器的數(shù)字輸出來對模擬電路進行控制的一種非常有效的技術(shù)。其相對于DAC輸出,其特點是應(yīng)用廣、成本低。是玩具行業(yè)主要的聲音輸出應(yīng)用方式!
數(shù)模轉(zhuǎn)換輸出(DAC):普通語音芯片是指單獨具有放音功能的集成電路,實質(zhì)上是一個DAC過程,而ADC過程資料是由電腦完成,其中包括對語音信號的采樣、壓縮、EQ等處理。
ADC=Analog Digital Change 模數(shù)轉(zhuǎn)換
DAC= Digital Analog Change 數(shù)模轉(zhuǎn)換
音質(zhì)的優(yōu)劣取決于ADC和DAC位數(shù)的多少。有的ADC和DAC均為32bit,接近真人音質(zhì)。而有的ADC和DAC為16bit,接近CD音質(zhì)。而一些普通的DAC為8bit,為普通音質(zhì)。
錄音芯片包括ADC和DAC兩個過程,都是由芯片本身完成的,包括語音數(shù)據(jù)的采集、分析、壓縮、存儲、播放等步驟。
錄音芯片語音信號的量化表述:
(1)語音信號的量化
采樣率(f)、位數(shù)(n)、波特率(T)
采樣:將語音模擬信號轉(zhuǎn)化成數(shù)字信號。
采樣率:每秒采樣的個數(shù)(byte)。
波特率:每秒鐘采樣的位數(shù)(bit)。波特率直接決定音質(zhì)。Bps: bit per second
采樣位數(shù)指在二進制條件下的位數(shù)。一般在沒有特別說明的情況下,聲音的采樣位數(shù)指8位,由00H--FFH,靜音定為80H。深圳市環(huán)芯半導體有限公司
(2)采樣率
耐奎斯特抽樣定理:要從抽樣信號中無失真地恢復原信號,抽樣頻率應(yīng)大于2倍信號最高頻率。抽樣頻率小于2倍頻譜最高頻率時,信號的頻譜有混疊。抽樣頻率大于2倍頻譜最高頻率時,信號的頻譜無混疊。
嗓音的頻帶寬度為20~20K HZ左右,普通的聲音大概在3KHZ以下。所以,一般CD取的音質(zhì)為44.1K和16bit,如果碰到某些特別的聲音,如樂器,音質(zhì)也有用48K和24bit的情況,但不是主流。
一般在我們處理針對普通語音IC的時候,采樣率最高達到16K就夠了、說話聲一般取8K(如電話音質(zhì))、6K左右。低于6K效果比較差。
在應(yīng)用單片機的過程中,采樣越高,定時器中斷速度越快,會影響到其他信號的監(jiān)控和檢測,所以要綜合考慮。
(3)語音壓縮技術(shù)。
由于語音數(shù)據(jù)量龐大,對語音數(shù)據(jù)進行有效壓縮是很必要的,能夠使我們在有限的ROM空間里錄入更多的語音內(nèi)容。有以下幾種方式:
語音分段:將語音中可以重復的部分截取出來,通過排列組合將內(nèi)容完整地回放出來。
語音采樣:一般我們使用的喇叭頻響曲線在中頻部分,較少用到高頻,所以,在喇叭音質(zhì)可以接受的情況下,適當降低采樣頻率,達到壓縮效果,這種過程是不可逆的,無法恢復原貌,叫有損壓縮。
數(shù)學壓縮:主要是針對采樣位數(shù)進行壓縮,這種方式也是有損壓縮。例如,我們經(jīng)常采用的ADPCM壓縮格式,是將語音數(shù)據(jù)從16bit壓縮到4bit,壓縮率是4倍。MP3是對數(shù)據(jù)流進行壓縮,涉及到數(shù)據(jù)預測問題,它的波特率壓縮倍率為10倍左右。
通常,以上幾種壓縮方式都是綜合起來使用的。
(4)常用語音格式
PCM格式: Pulse Code Modulation 脈沖編碼調(diào)制,它將聲音模擬信號采樣后得到量化后的語音數(shù)據(jù),是最基本最原始的一種語音格式。同它極為類似的還有RAW格式和SND格式。它們都是純語音格式。
WAV格式:Wave Audio Files 是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,被Windows平臺及其應(yīng)用程序廣泛支持。WAV格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,但WAV格式對存儲空間需求太大不便于交流和傳播。WAV文件里面存放的每一塊數(shù)據(jù)都有自己獨立的標識,通過這些標識可以告訴用戶究竟這是什么數(shù)據(jù),這些數(shù)據(jù)包括采樣頻率和位數(shù),單聲道(mono)還是立體聲(stero)等。環(huán)芯語音芯片IC
ADPCM格式:是利用對過去的幾個抽樣值來預測當前輸入的樣值,并使其具有自適應(yīng)的預測功能與實際檢測值進行比較,隨時對測得的差值自動進行量化級差的處理,使之始終保持與信號同步變化。它適用于語音變化率適中的情況,而且聲音回放過程簡短。它的優(yōu)點是對于人聲的處理比較逼真,一般達到90%以上,已廣泛地應(yīng)用于電話通信領(lǐng)域。
MP3格式: Moving Picture Experts Group Audio Layer III,簡稱為MP3。它是利用 MPEG Audio Layer 3 的技術(shù),采取了名為“感官編碼技術(shù)”的編碼算法:編碼時先對音頻文件進行頻譜分析,然后用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,最后形成具有較高壓縮比的mp3文件,并使壓縮后的文件在回放時能夠達到較接近原音源的聲音效果。它的實質(zhì)是vbr(Variant Bitrate 可變波特率)可以根據(jù)編碼的內(nèi)容動態(tài)地選擇合適的波特率,因此編碼的結(jié)果是在保證了音質(zhì)的同時又照顧了文件的大小。
mp3壓縮率10倍甚至12倍。是最初出現(xiàn)的一種高壓縮率的語音格式。
Linear Scale格式:根據(jù)聲音的變化率大小,把聲音分成若干段,對每段用線性比例進行壓縮,但是它的比例是可變的。SUNLINK公司和ALPHA公司的Linear Scale格式為5bit。
Logpcm格式:基本上對整個聲音進行線性壓縮,將最后若干位去掉。這種壓縮方式在硬件上很容易實現(xiàn),但音質(zhì)比Linear Scale差一些,特別是音量較小聲音比較細膩的情況下效果較差。主要用于pure speech方面。
語音ROM空間的表述
語音芯片為表述的形象化,由語音長度來表示
a)普通語音芯片以6K采樣率為語音長度計算標準。
b)錄音IC以4K采樣率為語音長度計算標準(以AC6006,AC6009,AC6012為例)。
即:以6k(4k)采樣率芯片可以播放的長度。
語音芯片的要素
相同品種的芯片成本與芯片的大小成正比。
a)I/O口的分配和ROM的大。ㄕZ音秒數(shù))決定芯片成本。低秒數(shù)語音芯片其I/O口較少。
b)音質(zhì)提高,采樣提高,語音秒數(shù)縮短。
音質(zhì)降低,采樣降低,語音秒數(shù)變長
c) 語音秒數(shù)的計算方法:M/(n*f)
M---ROM大。╞it) n*f---波特率
實用的計算語音芯片傻瓜計算方式, 音樂IC和語音IC是不同的哦 : -_-
語音IC的秒數(shù)=ROM(bit)除以/10(工業(yè)算法標準)=Byte(理論上是除以8)/再除以3=語音芯片的秒數(shù),比如512kbitROM/8/3=21秒左右,芯片的內(nèi)部壓縮比不同,秒數(shù)長短稍有偏差,以上算法是以6K采樣率為基準的。
音樂IC的秒數(shù)=ROM(bit)除以/除以3=音樂IC的秒數(shù),比如512kbitROM/3=210秒左右,芯片的內(nèi)部壓縮比不同,秒數(shù)長短稍有偏差。
以上資料有環(huán)芯公司整理提供,轉(zhuǎn)載請注明出處
語音芯片 / Voice IC定義
語音IC / Speech IC定義
音樂IC / Music IC定義
錄音IC / Record IC定義
語音芯片/語音IC相關(guān)常用術(shù)語
語音芯片存儲與時間長度的關(guān)聯(lián)
語音芯片時間長度和采樣率
OTP(一次性可編程)的定義
MASK(掩膜)的定義及優(yōu)勢
語音芯片系列下單流程
上述資料都是個人經(jīng)驗總結(jié),屬原創(chuàng),轉(zhuǎn)載請注明出處.
如有錯誤的地方,還請各路朋友不吝指教,先行謝過. |