完美世界有声小说,盗墓笔记有声小说

環(huán)芯公司

知識學(xué)堂

下載中心

產(chǎn)品展示

會員中心

聯(lián)系我們

地圖路線

公司分站

付款方式

	什么是語音芯片 / 語音IC是什么 / 語音芯片的定義

什么是語音芯片 / Voice IC是什么 / 語音芯片的定義

語音芯片直觀的從名稱上來看,就是與語音有關(guān)的芯片,語音就是存儲的電子聲音,凡是能發(fā)出聲音的芯片,就是語音芯片,俗稱聲音芯片,英文準(zhǔn)確些來說應(yīng)該是Voice IC.

在語音芯片的大家庭中,根據(jù)聲音的類型不同可分為語音IC(Speech IC)和音樂IC(Music IC)兩種.這兒應(yīng)該算是語音芯片專業(yè)的區(qū)分方法.

日常生活中,語音芯片應(yīng)用場合和行業(yè)不同,又被大家分為玩具芯片(玩具行業(yè)使用的,如AC80E5),門鈴芯片(AC8DM32),OTP語音芯片(AC8040),兒歌IC(AC8DE12), 童車IC等等.當(dāng)然這種分類里面她也同時存在著語音IC(Speech ic)和音樂IC(Music IC) .

語音芯片有根據(jù)IC本身的物理結(jié)構(gòu)的多個通道(同時發(fā)出多個通道的聲音)可分為多種類型:

一, 單通道的:
1, 單通道的語音IC(Speech IC)(這種語音芯片不支持音樂IC音樂存儲方式); 常見的語音IC是單通道的語音芯片,AC8020-OTP20秒和AC83E12動物叫聲是最典型的單通道語音芯片了,
2, 單通道的音樂IC(Music IC),同一單位時間內(nèi)只能發(fā)出一種音樂的音樂IC, 電子聲音文件是只有一個通道的.Mid后綴文件.
常說的單音片,是一種最基本的音樂IC,由一定時間內(nèi)音符輸出的多少,決定了單音片的效果,有64音符多,128音符等等. 單音片應(yīng)用場合廣,價格極其低廉,最常見的有單音片有生日快樂賀卡單音片.典型的有AC8SE07等
嚴(yán)格的說,單通道的音樂IC和單音片的兩者結(jié)構(gòu)是不相同的

二, 2通道:
    1, 2通道的語音IC, 2通道和多通道的語音芯片,實際應(yīng)用中語音播放時一般會按規(guī)定固定在某一通道內(nèi)進(jìn)行聲音的播放(等同于單通道),但是這類產(chǎn)品比單通道的語音IC(Speech ic)成本要高,價格會高些,語音芯片廠家在設(shè)計時為了平衡產(chǎn)品價格和應(yīng)用,一般來說,功能支持和聲音效果方面都會做得更完美一些.
這種結(jié)構(gòu)也許是因為產(chǎn)品和方案實際應(yīng)用領(lǐng)域和價格所決定的, 語音芯片輸出一般都是單通道的聲音輸出,支持立體聲的產(chǎn)品很少, 要高端一些的產(chǎn)品就要選MP3主控芯片之類的方案了
    2, 2通道的音樂芯片, 通俗叫法是雙音片(Music With Dual Tone IC), 故名思義,同一單位時間內(nèi)二個通道都可以發(fā)出音樂的音樂IC. 電子聲音源文件一般為.Mid的二通道文件.常見的圣誕系列音樂IC如:AC8DC12.
    這里得多補充兩句,市面上還有一個叫melody的音樂芯片,她是個什么定義呢?簡單的來說,比單音片的效果要好比和弦音樂芯片的效果要差的一種音樂芯片,所以雙音片也有被叫成是melody音樂芯片,melody結(jié)構(gòu)應(yīng)該來說是一種更高級的單音片,或者可以說是二倍效果的單音片.

三, 4通道,8通道或以上:
三通道以上的聲音.又稱為和弦音樂.常說的4和弦音樂IC就是指4通道的音樂IC...
一般多通道的語音芯片都是同時支持音樂IC(Music IC)和語音IC(Speech IC)功能的.

怎樣區(qū)分有沒集成MCU的語音芯片

    先看MCU(Micro Controller Unit)的定義，又稱單片微型計算機(Single Chip Microcomputer)，是指隨著大規(guī)模集成電路的出現(xiàn)及其發(fā)展，將計算機的CPU、RAM、ROM、定時數(shù)器和多種I/O接口集成在一片芯片上，形成芯片級的計算機。
    語音芯片有兩種,一種是集成MCU的,如AC4060,AC5080可編程OTP系列,功能比較強大,從物理結(jié)構(gòu)上簡單的說,它集成了RAM(隨機存儲器和定時計數(shù)器等)和ROM兩種存儲器。而另一種是不集成MCU的,它內(nèi)部只有一個ROM(不具體運算和隨機存儲計時器等一些功能),如AC9020,AC8040,AC3030系列芯片,但是價格會相當(dāng)便宜一些.
    簡單一些的說吧,有RAM的OTP語音芯片是集成MCU的,由于RAM隨機存儲器的特性,讓芯片能完成更多復(fù)雜的功能。

根據(jù)語音芯片專業(yè)的物理特性的定義:

語音芯片是將語音信號通過聲音采樣轉(zhuǎn)化為數(shù)字信號，存儲在芯片的ROM中，再通過電路將ROM中的數(shù)字信號還原成語音信號的集成電路。

常規(guī)語音芯片的語音信號輸出方式有兩種：脈沖寬度調(diào)制(PWM）輸出和數(shù)模轉(zhuǎn)換輸出（DAC）。

脈沖寬度調(diào)制(PWM）輸出，是利用微處理器的數(shù)字輸出來對模擬電路進(jìn)行控制的一種非常有效的技術(shù)。其相對于DAC輸出，其特點是應(yīng)用廣、成本低。是玩具行業(yè)主要的聲音輸出應(yīng)用方式。　　

數(shù)模轉(zhuǎn)換輸出(DAC)：普通語音芯片是指單獨具有放音功能的集成電路，實質(zhì)上是一個DAC過程，而ADC過程資料是由電腦完成，其中包括對語音信號的采樣、壓縮、EQ等處理。

ADC=Analog Digital Change 模數(shù)轉(zhuǎn)換

DAC= Digital Analog Change 數(shù)模轉(zhuǎn)換

音質(zhì)的優(yōu)劣取決于ADC和DAC位數(shù)的多少。有的ADC和DAC均為32bit,接近真人音質(zhì)。而有的ADC和DAC為16bit，接近CD音質(zhì)。而一些普通的DAC為8bit，為普通音質(zhì)。

錄音芯片包括ADC和DAC兩個過程，都是由芯片本身完成的，包括語音數(shù)據(jù)的采集、分析、壓縮、存儲、播放等步驟。

2、語音信號的量化表述：（分類：語音IC 和音樂IC）

(a) “語音IC”介紹：

（1）語音信號的量化

采樣率（f）、位數(shù)（n）、波特率（T）

采樣：將語音模擬信號轉(zhuǎn)化成數(shù)字信號。

采樣率：每秒采樣的個數(shù)（byte）。

波特率：每秒鐘采樣的位數(shù)(bit)。波特率直接決定音質(zhì)。Bps: bit per second

采樣位數(shù)指在二進(jìn)制條件下的位數(shù)。一般在沒有特別說明的情況下，聲音的采樣位數(shù)指8位，由00H--FFH，靜音定為80H。深圳市環(huán)芯半導(dǎo)體有限公司

（2）采樣率

耐奎斯特抽樣定理：要從抽樣信號中無失真地恢復(fù)原信號，抽樣頻率應(yīng)大于2倍信號最高頻率。抽樣頻率小于2倍頻譜最高頻率時，信號的頻譜有混疊。抽樣頻率大于2倍頻譜最高頻率時，信號的頻譜無混疊。

嗓音的頻帶寬度為20～20K HZ左右，普通的聲音大概在3KHZ以下。所以，一般CD取的音質(zhì)為44.1K和16bit，如果碰到某些特別的聲音，如樂器，音質(zhì)也有用48K和24bit的情況，但不是主流。

一般在我們處理針對普通語音IC的時候，采樣率最高達(dá)到16K就夠了、說話聲一般取8K（如電話音質(zhì)）、6K左右。低于6K效果比較差。

在應(yīng)用單片機的過程中，采樣越高，定時器中斷速度越快，會影響到其他信號的監(jiān)控和檢測，所以要綜合考慮。

（3）語音壓縮技術(shù)。

由于語音數(shù)據(jù)量龐大，對語音數(shù)據(jù)進(jìn)行有效壓縮是很必要的，能夠使我們在有限的ROM空間里錄入更多的語音內(nèi)容。有以下幾種方式：

語音分段：將語音中可以重復(fù)的部分截取出來，通過排列組合將內(nèi)容完整地回放出來。

語音采樣：一般我們使用的喇叭頻響曲線在中頻部分，較少用到高頻，所以，在喇叭音質(zhì)可以接受的情況下，適當(dāng)降低采樣頻率，達(dá)到壓縮效果，這種過程是不可逆的，無法恢復(fù)原貌，叫有損壓縮。

數(shù)學(xué)壓縮：主要是針對采樣位數(shù)進(jìn)行壓縮，這種方式也是有損壓縮。例如，我們經(jīng)常采用的ADPCM壓縮格式，是將語音數(shù)據(jù)從16bit壓縮到4bit，壓縮率是4倍。MP3是對數(shù)據(jù)流進(jìn)行壓縮，涉及到數(shù)據(jù)預(yù)測問題，它的波特率壓縮倍率為10倍左右。

通常，以上幾種壓縮方式都是綜合起來使用的。

（4）常用語音格式

PCM格式： Pulse Code Modulation 脈沖編碼調(diào)制，它將聲音模擬信號采樣后得到量化后的語音數(shù)據(jù)，是最基本最原始的一種語音格式。同它極為類似的還有RAW格式和SND格式。它們都是純語音格式。

WAV格式：Wave Audio Files 是微軟公司開發(fā)的一種聲音文件格式，也叫波形聲音文件，被Windows平臺及其應(yīng)用程序廣泛支持。WAV格式支持許多壓縮算法，支持多種音頻位數(shù)、采樣頻率和聲道，但WAV格式對存儲空間需求太大不便于交流和傳播。WAV文件里面存放的每一塊數(shù)據(jù)都有自己獨立的標(biāo)識，通過這些標(biāo)識可以告訴用戶究竟這是什么數(shù)據(jù)，這些數(shù)據(jù)包括采樣頻率和位數(shù)，單聲道(mono)還是立體聲(stero)等。環(huán)芯語音芯片IC

ADPCM格式：是利用對過去的幾個抽樣值來預(yù)測當(dāng)前輸入的樣值，并使其具有自適應(yīng)的預(yù)測功能與實際檢測值進(jìn)行比較，隨時對測得的差值自動進(jìn)行量化級差的處理，使之始終保持與信號同步變化。它適用于語音變化率適中的情況，而且聲音回放過程簡短。它的優(yōu)點是對于人聲的處理比較逼真，一般達(dá)到90％以上，已廣泛地應(yīng)用于電話通信領(lǐng)域。

MP3格式： Moving Picture Experts Group Audio Layer III，簡稱為MP3。它是利用 MPEG Audio Layer 3 的技術(shù)，采取了名為“感官編碼技術(shù)”的編碼算法：編碼時先對音頻文件進(jìn)行頻譜分析，然后用過濾器濾掉噪音電平，接著通過量化的方式將剩下的每一位打散排列，最后形成具有較高壓縮比的mp3文件，并使壓縮后的文件在回放時能夠達(dá)到較接近原音源的聲音效果。它的實質(zhì)是vbr（Variant Bitrate 可變波特率）可以根據(jù)編碼的內(nèi)容動態(tài)地選擇合適的波特率，因此編碼的結(jié)果是在保證了音質(zhì)的同時又照顧了文件的大小。

mp3壓縮率10倍甚至12倍。是最初出現(xiàn)的一種高壓縮率的語音格式。

Linear Scale格式：根據(jù)聲音的變化率大小，把聲音分成若干段，對每段用線性比例進(jìn)行壓縮，但是它的比例是可變的。SUNLINK公司和ALPHA公司的Linear Scale格式為5bit。

Logpcm格式：基本上對整個聲音進(jìn)行線性壓縮，將最后若干位去掉。這種壓縮方式在硬件上很容易實現(xiàn)，但音質(zhì)比Linear Scale差一些，特別是音量較小聲音比較細(xì)膩的情況下效果較差。主要用于pure speech方面。

（b）“音樂IC”介紹：

（1）音樂的通道與音色：

包絡(luò)（envelope）方波(patch) 通道（channel）

包絡(luò)：合成音色的一部分，單位時間內(nèi)音符輸出的變化，常見有“ADSR”

方波：合成音色的一部分，單位時間內(nèi)音符方波電流的變化。（另見三角波等）

通道：在同一時間內(nèi)，IC輸出的最多音符個數(shù)，即“單音樂器”的個數(shù)。

PCT：模擬音色的一種，通過采樣256個點的樂器聲音來模擬出各個音符的音高。(音色柔和，占空間小，但不夠真實)

FULL WAVE：通過采集一種樂器聲音來模擬各個音符音高。（樂器聲真實，但占用空間大，且采集音色音質(zhì)要求高）

（2）音樂的壓縮：

由于音樂數(shù)據(jù)量龐大，對音樂數(shù)據(jù)進(jìn)行有效壓縮是很必要的，能夠使我們在有限的ROM空間里錄入更多的音樂內(nèi)容。有以下幾種方式：

音樂分段：將音樂中可以重復(fù)的部分截取出來，通過排列組合將內(nèi)容完整地回放出來。

音色：根據(jù)音樂的豐滿程度、需求程度，來確定Full wave，PCT、dual tone的選擇，各個音色占用空間不同，音色質(zhì)量也不同。。

數(shù)學(xué)壓縮：主要是針對采樣的音色（Full wave）進(jìn)行壓縮，這種方式也是有損壓縮，對于要采集的音色進(jìn)行降采樣、處理等減小采集音色的大小（同語音類的修音）。

（3）常用音樂格式：

MID格式：MIDI(Musical Instrument Digital Interface)樂器數(shù)字接口，是20 世紀(jì)80 年代初為解決電聲樂器之間的通信問題而提出的。MIDI 傳輸?shù)牟皇锹曇粜盘? 而是音符、控制參數(shù)等指令。

WAV格式：（相見語音IC類介紹）采集音色的格式。

3、語音ROM空間的表述

語音芯片為表述的形象化，由語音長度來表示

a)普通語音芯片以6K采樣率為語音長度計算標(biāo)準(zhǔn)。

b)錄音IC以4K采樣率為語音長度計算標(biāo)準(zhǔn)(以AC6006,AC6009,AC6012為例)。

即：以6k（4k）采樣率芯片可以播放的長度。

4、語音芯片的要素

相同品種的芯片成本與芯片的大小成正比。

a)I/O口的分配和ROM的大�。ㄕZ音秒數(shù)）決定芯片成本。低秒數(shù)語音芯片其I/O口較少。

b)音質(zhì)提高，采樣提高，語音秒數(shù)縮短。

音質(zhì)降低，采樣降低，語音秒數(shù)變長

c) 語音秒數(shù)的計算方法：M/(n*f)

M---ROM大�。╞it） n*f---波特率

實用的計算語音芯片傻瓜計算方式, 音樂IC和語音IC是不同的哦 : -_-

語音IC的秒數(shù)=ROM(bit)除以/10(工業(yè)算法標(biāo)準(zhǔn))＝Byte(理論上是除以8)/再除以3＝語音芯片的秒數(shù)，比如512kbitROM/8/3＝21秒左右,芯片的內(nèi)部壓縮比不同，秒數(shù)長短稍有偏差，以上算法是以6K采樣率為基準(zhǔn)的。

音樂IC的秒數(shù)=ROM(bit)除以/除以3＝音樂IC的秒數(shù)，比如512kbitROM/3＝210秒左右,芯片的內(nèi)部壓縮比不同，秒數(shù)長短稍有偏差。

5、常見聲音處理軟件:

1）SoundForge , 功能強大的聲音處理軟件，上手稍難一些

2）Cooledit，功能強大的畫圖聲音處理軟件，上手容易

3）goldwave，功能強大的聲音處理軟件

4）Cakewalk，用于MID音樂文件圖形化編輯的處理軟件

以上資料有環(huán)芯公司整理提供，轉(zhuǎn)載請注明出處

語音芯片/語音IC相關(guān)常用術(shù)語

語音芯片存儲與時間長度的關(guān)聯(lián)

上述資料都是個人經(jīng)驗總結(jié),屬原創(chuàng),轉(zhuǎn)載請注明出處.

如有錯誤的地方,還請各路朋友不吝指教,先行謝過.

環(huán)芯公司,深圳專業(yè)的語音IC,OTP語音芯片,錄音語音IC,玩具語音芯片,門鈴語音IC,音樂IC開發(fā)-環(huán) 芯

			Copyright © 2008 \| 深圳市環(huán)芯半導(dǎo)體有限公司 All Right Reserved.		[粵ICP備11088568號]
			地址Add: 深圳市龍崗區(qū)平湖街道新木路欣悅廣場A座2207		環(huán)芯網(wǎng)絡(luò)語音芯片網(wǎng)制作
			電話Tel: 0755-29058191 / 28149272 傳真Fax: 29058191 Email: sales@atchip.com

環(huán)芯公司,深圳專業(yè)的語音IC,語音芯片,OTP,錄音IC,玩具IC,門鈴IC,音樂IC開發(fā)設(shè)計代理公司