VCM.TXT 聲控模組使用說明 V1.0 4.22.02 1.簡介 2.VCM 聲控模組功能 3.系統配備 4.操作說明 5.如何提高辨識率 6.硬體說明 7.控制程式 8.功能擴充 1. 簡介 ------- 聲控系統可以聲音來控制電腦,完成某些特定的工作,如此一來可以取代部份按鍵輸入 來執行指令,也就是說電腦也可以聽懂人們的聲音,並且加以處理後可以完成特定的 工作,更進一步可以讓人與電腦交談。 本語音辨識聲控系統----聲控模組(以下簡稱 VCM ),是由單晶片 8051 控制語音辨識 專用晶片 RSC 364, 8051 只用 4 條I/O 線便可以控制聲控晶片動作,系統採用模組 化設計,擴充性佳,本身控制板可以適合不同的硬體工作平台。整套系統可做跨平台聲 控應用,可由串列介面來下命令到 VCM 做聲控處理。系統提供有基本的 8051 組合語言 應用控制程式實例,及 PC VB RS232 控制原始程式,使得您若想自行開發聲控系統不 必要從頭開始摸索起,可以減少您嘗試錯誤的次數,節省您保貴的時間,同時並備有完整 技術資料提供廠商進一步技術合作,一起開發更好的聲控產品。 2.VCM 聲控模組功能 ----------------------------- □ 利用本套系統可以自行設計獨立操作型特定語者聲控系統,產品附加價值高 □ 系統由 89C2051 及聲控晶片 RSC-364 (TQFP 64 PIN包裝) □ 89C2051 只用 4 條 I/O 線來控制聲控晶片 □ 本系統適合特定語者的單音、字、詞語音辨識 □ 不限定說話語言,國語、台語、英語皆可 □ 具有自動語音輸入偵測的功能 □ 特定語者辨識率可達 95% 以上,反應時間小於 1 秒 □ 系統參數及語音參考樣本一旦輸入後資料可以長久保存 □ 系統採用模組化設計,擴充性佳,可適合不同的硬體工作平台 □ 線上訓練輸入的語音可以壓縮成語音資料而由系統說出來當作辨認結果確認 □ 系統可以獨立操作,不必倚靠 PC □ 系統包含有英文的語音提示語做語音動作引導 □ 系統展示 5 組語音辨認功能 □ 最多可以擴充控制到 60 組語音辨認 □ 需外加+ 5V 電源供電 □ 內建 DTMF 信號產生功能,可做電話撥號的實驗 □ 內建 4 只按鍵開關及 RS232 串列通訊介面 □ 提供完整 8051 控制介面及聲控晶片電路圖 □ 含 8051 組合語言串列應用範例原始程式及 PC VB RS232 原始程式 □ 可擴充軟硬體功能做進一步產品設計或聲控專題製作 □ 可另購完整 8051 技術程式原始碼 VCMA □ 可應用在各種相關的聲控專題製作中,包括聲控家電、聲控紅外線家電、 聲控遙控車、聲控機器人、聲控電子寵物、聲控撥號.....等多種聲控應用場合 都可以使用。 □ RSC-364 聲控晶片原始網站 : www.sensoryinc.com =============================================================== VCMA 聲控模組 8051 原始技術資料: 1.含完整的 8051 控制聲控晶片組合語言 vc3.asm 原始檔(技術授權) 2.含詳細原廠技術資料 PDF 檔 =============================================================== 3. 系統配備 ----------- 聲控系統組成如下: □ VCM 控制板 □ +5V 直流電源線 □ 小型喇叭 □ 系統工作磁片 □ 展示操作說明書 □ 完整電路圖 4. 操作說明 ------------ 在使用本系統前請先詳閱使用說明,您可以享受聲控的奇妙技術!!!! 1.準備一 +5V 電源。經由 2 PIN 電線接至 +5V 接點J7,紅色+5V,黑色 GND。 2.或是準備一 +9V 電源。經由 2 PIN 電線接至 +9V 接點J6,紅色+9V,黑色 GND。 3.喇叭接線接至接點 J5 SP,打開電源,電源 LED 燈 D2 亮起,工作 LED D3 閃爍,表示 開機正常。或是按下 8051 RESET 鍵 S6。 4.注意:系統已錄有測試語音(例如1,2,3),先按 S3 鍵,聆聽系統已存在的語音內容,做為欲辨識 的字詞。多按幾次 S3 鍵,聽聽內建已經訓練的語音。 5.按 S4 鍵:說出欲辨識的字詞來辨認。系統會以英文說出"WHAT NAME"當提示語, D3 LED 燈亮起,則對著麥克風說出語音,如說 '1',系統辨認出來後會說'1' 6.因為為特定語者語音辨認,男生來辨認會準確些,誰來訓練語音,辨認會很準確 (辨識率可達 95% 以上)。 7.語音輸入操作技巧: <1> 訓練及辨認時周圍環境不宜太吵雜 <2> 語音輸入前會有提示語,LED 亮起,等提示語說完才語音輸入 <3> 語音輸入時與麥克風的最佳距離為 30 公分,有效距離為 100 公分 距離越遠則音量要大點,若太小聲系統會以英文說出"PLEASE LOUDER" 要您說話大聲點 8.S1--S4 功能鍵如下: <1>按鍵 S1: 做語音參考樣本訓練輸入,一次訓練一組,展示系統為 5 個辨認的單音。 已訓練的語音會永久保存在 FLASH 的記憶晶片中,即使關機還是有效, 語音訓練輸入需要輸入 2--3 次,一般正常情況輸入 2 次語音便可 按下 S1 鍵,操作過程如下: 系統說出"SAY NAME" (說一單音) ----> 第1次錄音 系統說出"REPEAT NAME" (重覆一遍)(非必要) ----> 第2次錄音 系統說出"REPEAT NAME TO RECORD"(重覆一遍錄音用)----> 第3次錄音 第1 2 次錄音做為產生語音參考樣本,第3次錄音則是做聆聽已存在的語音內容用。 若訓練成功後,系統會說出您剛剛輸入的語音,以做確認。 <2>按鍵 S2: 修改原先已存在的語音參考樣本 先按 S3 聆聽系統已存在的某組語音內容。再按 S2 則該組內容會先被刪除, 再執行語音輸入訓練過程來建立新的語音參考樣本。若在語音輸入訓練過程中 失敗,可以使用 S1鍵來輸入新的語音樣本。 <3>按鍵 S3: 聆聽系統已存在的語音內容。展示程式為編號 0--4,重複循環。 <4>按鍵 S4: 進行辨認。 <5>RESET+S1 (RESET S6 鍵 與 S1 鍵同時按住,RESET 先放開): 清除所有已訓練的語音,或是做聲控晶片系統重置用,系統會"嗶" 3 聲 來回應。此情況是在系統當機,完全不聽使喚時非必要的動作,一旦執行 聲控晶片的系統重置後,原先存在晶片內的所有語音樣本資料全部應除, 使用者需要重新輸入語音,才能辨認。 9. 做內建 DTMF 信號產生實驗: RESET+S3 鍵 ,則工作 LED 燈會持續閃動,進入DTMF 信號實驗模式,可做電話撥號 的實驗,按 S3 鍵則產生 DTMF 信號"117"撥號音,則會接通電話,進行報時的動作, 需按 RESET 才能回到辨認的功能。實際電話撥號的電路設計,請參考附件中的電路。 由 J3 的 PWM0 單點送出撥號音(DTMF 信號)至電話耦合介面,達成撥號的動作。 10. 其他說明: □ 當使用者第一次使用此系統時,不必輸入新的語音樣本,以原來的辨認單音, 例如 "1"、"2"、"3" 便可以進行辨認,一般男生應可以辨認正確,如果是辨認自己的 聲音,則可以高達 95% 以上的辨識率。 □ 您可以依自己喜好來重新輸入新的語音樣本,如 "JOHN"、"NANCY"、"PETER"、 "MARY"、"SANDY"。 □ 展示系統為 5 個辨認的單音,當辨認到相對的音(編號 0--4) 則原先輸入對應的 語音會說出來當作確認用。 5.如何提高辨識率: ----------------- 本聲控系統可以讓使用者以 8051 組合語言或 PC 來自行設計屬於自己的聲控程式, 適當的操作本控制系統可以使整體辨認率達到 95% 以上。至於如何提高辨識率 以下有一些建議提供給使用者做參考: 1. 儘量避免使用容易混淆的音當做辦識的字詞,如中文數字 "1" 和 "7"。 2. 同一辨識對象使用多組參考樣本。 例如: 說 "美國","America","USA" 均辨識為美國。 3. 不限使用語言,講方言、國語、台語、英語皆可。 4. 語音輸入品質十分重要,太大聲、太小聲、背景雜音太吵皆不宜。 5. 由於語音輸入的麥克風是使用電容式麥克風,為無指向式麥克風,因此您可以對著 麥克風,以適當的距離( 30 公分 )說話即可。 6. 語音訓練與辨認時說話的距離請一致,以免聲音輸入的準位偏差太大。 6.硬體說明 ---------- □ U1 RSC364 : 聲控晶片 □ U2 FLASH : 29C020 2M,內存語音樣本及語音壓縮資料 □ U3 EPROM : 存聲控晶片程式碼,RSC364 執行檔 □ U4 89C2051: 存 8051 聲控程式碼 □ U5 LM386 : 聲頻放大器 □ U6 ICL232 : RS232 位準轉換晶片 □ U7 7805 : 5V 穩壓 IC □ J1 : 電容式麥克風 □ J2 : 外部電容式麥克風擴充接頭輸入 □ J3 : PWM 語音輸出(DTMF 信號產生,電話撥號信號輸出) □ J4 : DAC 語音輸出 □ J5 : 喇叭輸出接頭 □ J6 : 9V DC 輸入接頭........ □ J7 : 5V DC 輸入接頭,紅色+5V,黑色 GND □ VR1: 喇叭輸出音量控制 □ J8 : 89C2051 串列介面 I/O 輸出接頭----自行設計專題 8051 由此處來控制 □ J9 : 89C2051 I/O 輸出接頭 □ J10 : RS232 D9 PIN 公接頭 ---------自行設計專題 PC 部分由此處來控制 □ J11 : RSC364 聲控晶片控制信號 □ J12 : RS232 3 PIN 接頭 7.控制程式: ------------------- VCM 上的控制程式分 3 部分來做說明: A. 89C2051 核心程式 B. 8051 應用範例程式 C. PC WIN98 VB 應用範例程式 自行以 VCM 來設計聲控專題,建議以 8051 應用範例程式 V51.ASM 來作修改,避免 直接控制及對 VCM 做硬體修改,以免損壞聲控晶片 RSC364,此晶片為 TQFP 包裝, 維修較為困難。除非使用者本身能力很強,對 8051 也熟悉才進一步修改 89C2051 核心程式 VCM.ASM。 A. 89C2051 核心程式 -------------------- VCM 上的 89C2051 控制程式是以 8051 組合語言寫成,以 2500 A.D.組譯器組譯 相關檔案如下: □ 364.PDF : RSC-364 PDF 檔(請自行下載 ADOBE PDF 瀏覽器來觀看檔案) ADOBE 網址 www.adobe.com □ VCM.ASM : 展示原始程式 I/O 檔 □ VCM.TSK : 2 進位可執行檔 □ VC3.OBJ : 8051 控制聲控晶片低階程式 OBJ 碼(原始碼可另購,品名 VCMA) □ VCM.LNK : 8051 連結命令檔 □ VCM.BAT : 使用 EPM89 快速組譯、連結、載入檔案、燒錄、直接模擬的批次檔 組譯 VCM.ASM 時會將相關檔案自動載入一起進行組譯 □ EPM89.EXE : 89CXX 燒錄模擬程式 使用者需要有2500 A.D.組譯器 X8051.EXE 及 LINK.EXE 程式修改: 可以使用 89CXX 燒錄模擬器 EPM89---學生專題製作的利器 程式下載後可以直接模擬 20 PIN 8051 單晶片 89C2051 不必取下IC,免拆排線馬上進行模擬,操作簡單免學習。 放入 89C51 以燒錄晶片用來模擬 89C2051,連接 20 PIN 排線到 VCM 上, 操作簡單: VCM VCM 直接測試 OK 後,取下 89C51,放入89C2051 來燒錄便大功告成。 B. 8051 應用範例程式 ----------------------- 1. VCM 可以做跨平台聲控應用,可由串列介面來下命令到 VCM 做聲控處理。不是 使用 8051 的系統,也可以來控制 VCM。 主要是以串列通訊方式來控制 VCM。 VCM 的串列通訊格式為 <9600 N 8 1> 傳輸率 9600 BPS,不做同位檢查,傳輸 8 個資料位元,1 個停止位元 系統提供有基本的 8051 組合語言串列通訊應用控制程式實例,使用者可以 100 行 8051 程式碼來寫聲控程式,展示程式是 V51.ASM,以 IO51 控制板來做控制實驗 2. IO51 8051 IO 控制板特性 □ 一片全方位設計的控制板可供一般學生實習、專題製作及專案設計使用 □ 單晶片可以使用 89C51 系列晶片及 LO51晶片(ISP 型 8051 晶片) □ 使用 LO51晶片可以擴充簡易 ICE 模擬器功能 □ 使用 LO51晶片免燒錄,免 ICE 可由串列介面下載程式碼來執行 □ 8 個顯示 LED 及電源指示 LED □ 4 個按鍵輸入及一組 4X4 鍵盤輸入 □ 壓電喇叭或一般喇叭輸出 □ 有 RS232 通訊介面 □ 含文字型 LCD 介面(16X2) □ 含 AD0804 A/D 介面及 DA0800 D/A 介面 □ 含斷電資料保存介面 93C46 □ 含 2組 5V 繼電器界面 □ 可擴充 4合一4 位 7 節顯示器介面 □ 可擴充紅外線接收模組介面 □ 可擴充 DALAS 1 WIRE 溫度介面 DS1821 □ I/O 接腳可擴充圓孔針座連接方便與麵包板連接來做實驗 □ 含洞洞孔可做額外的硬體擴充 □ 需外加 +5V 電源或是 +9V 電源 □ 含完整電路圖 及 8051 組合語言範例程式及專題製作實例 LO51晶片特性及規格: □ 以最新 ISP (In System Programming) 技術設計的8051 相容單晶片 □ 內建程式載入程式可以由串列埠連接 PC 而下載程式,快速,方便 □ 程式一旦下載後程式碼永久保存在 LO51 內 □ 學習 8051 單晶片程式最佳方式,免燒錄,免 ICE,免拆排線 □ 可下載程式碼容量: 64 KB □ 程式碼下載速度快:1KB->1.2 秒/4 KB->4.2 秒/32 KB->33 秒/64 KB->66 秒 □ 8051 P0 P1 P2 P3 完全可以做自由的 I/O 控制 □ 執行速度最快至 40 MHz □ 內部下載程式碼最大容量為 64 KB □ 內部 RAM 512 位元組 □ 可以外接 64 KB EPROM 做程式碼執行及 64 KB 資料容量 □ P0 P1 P2 P3 4 組 I/O 埠 □ 3 組 16 位元計時計數器 □ 1 組 全雙工串列埠 □ 6 組中斷源 □ 內建電源管裡工作模式 □ 指令碼 8051 完全相容 3.VCM 串列介面 聲控指令控制碼如下:(使用者也可以自訂,修改 VCM.ASM 便可以達成) * 控制碼 't' : 語音訓練,操作同上 * 控制碼 'm' : 語音修改,操作同上 * 控制碼 'l' : 語音聆聽,操作同上 * 控制碼 'r' : 語音辨認,操作同上,IO51送出控制碼後,等待約 1 秒後, VCM 送出控制碼 '@ab' 用以表示辨認結果,ab 為所辨認的語音樣本編號編碼。 實際辨認結果編號為 no no=10xa+b no 有效值為 0--59 若辨認錯誤則會傳回'X'做回應。 例如辨認出語音樣本編號 1,則會傳回 '@01',使用者可以再修改程式做進一步 應用控制。 IO51 在收到辨認結果後也會以內建的 LED 排燈來表示,LED 動作是反向亮滅指示, 一次亮,一次滅。順序由左而右對應編號 0--5。 IO51 控制板上操作如下: 按下 K1 鍵:IO51 送出控制碼 't',語音訓練 按下 K2 鍵:IO51 送出控制碼 'm',語音修改 按下 K3 鍵:IO51 送出控制碼 'l',語音聆聽 按下 K4 鍵:IO51 送出控制碼 'r',語音辨認 4. VCM 與 IO51 連接方式如下: VCM J8 IO51 J12 TXD RXD RXD TXD GND GND +5V +5V VCM 及 IO51 兩邊的 RS232 控制晶片 ICL 232 要先取下來,以避免信號干擾。 5.V51.ASM 控制程式是以 8051 組合語言寫成,以 2500 A.D.組譯器組譯相關檔案如下: □ V51.ASM : 展示原始程式 I/O 檔 □ V51.TSK : 2 進位可執行檔 □ T.LNK : 8051 連結命令檔 □ X.BAT : 使用 EPM89 快速組譯、連結、載入檔案、燒錄、直接模擬的批次檔 組譯 VCM.ASM 時會將相關檔案自動載入一起進行組譯 □ EPM89.EXE : 89CXX 燒錄模擬程式 使用者需要有2500 A.D.組譯器 X8051.EXE 及 LINK.EXE 程式修改: 可以使用 89CXX 燒錄模擬器 EPM89---學生專題製作的利器 程式下載後可以直接模擬 40 PIN 8051 單晶片 89C51 不必取下IC,免拆排線馬上進行模擬,操作簡單免學習。 放入 89C51 以燒錄晶片用來模擬 89C51,連接 40 PIN 排線到 IO51 上, 操作簡單: X V51 直接測試 OK 後,取下 89C51,放入 89C51 到 IO51 上便大功告成。 C. PC WIN98 VB 應用範例程式 ------------------------------ 1. VCM 可以做跨平台聲控應用,可由串列介面來下命令到 VCM 做聲控處理。系統提供 有基本的 PC WIN98 VB 應用控制程式實例,使用者可以 VB 程式碼來寫 聲控程式。 2. 使用者要對 WIN98 下的 VB 有基本的程式設計基礎。當然您的系統必須安裝有 VB6.0 專業版,因為使用 MSComm (Miscrosoft Comm Control) 此一控制項來對 串列介面做控制。 3. 使用者可以使用檔案總管來開啟 VB 相關檔案,以滑鼠雙擊 PROJECT1.VBP 便可以 自動進入 VB 整合開發環境中,按下 F5 便可以執行程式。選擇串列阜 com1 或 com2後,在命令輸入區中輸入以下指令便可以做辨認: * 控制碼 't' : 語音訓練,操作同上 * 控制碼 'm' : 語音修改,操作同上 * 控制碼 'l' : 語音聆聽,操作同上 * 控制碼 'd' : 產生 DTMF 信號"117"撥號音,操作同上 * 控制碼 'r' : 語音辨認,操作同上,PC 送出控制碼後,等待約 1 秒後, VCM 送出控制碼 '@ab' 用以表示辨認結果,ab 為所辨認的語音樣本編號編碼。 若辨認錯誤則會傳回'X'做回應。 例如辨認出語音樣本編號1,則會傳回 '@01',使用者可以再修改程式做進一步 應用控制。 8.功能擴充 ---------- 1.展示版軟體內定為 5 組語音樣本,如何擴充? 將原控制程式 VCM.ASM 中辨認總數 RNO 修改便可以取消此限制 2.I/O 控制擴充如自行以 VCM 來設計聲控專題,建議以 8051 應用範例程式 V51.ASM 來 作修改,避免直接控制及對 VCM 做硬體修改,以免損壞聲控晶片 RSC364,由自行設計 的 8051 經由串列介面 RXD TXD GND 三條線來做聲控的應用 3.廠商的進階應用,請購買 VCMA 聲控模組原始 8051程式碼,來進一步研究聲控模組 4.整合各種特殊介面則可以設計各種聲控應用,包括聲控家電、聲控紅外線家電、 聲控遙控車、聲控電子寵物、聲控機器人、聲控撥號.....等多種聲控應用場合。 5.聲控實例如下: 聲控家電 : VCM + 繼電器介面 聲控紅外線家電 : VCM + 紅外線家電學習介面 聲控遙控車 : VCM + 紅外線介面 + 自製遙控車 聲控機器人 : VCM + 紅外線介面 + 自製機器人 聲控電子寵物 : VCM + 紅外線介面 + 市售現成的紅外線電子寵物 聲控撥號 : VCM + 電話撥號介面 6.想要進一步了解最音聲控的技術應用及實例及實際產品展示 請上偉克多微電腦工作室網址 : vic.seeder.net 7.請上聲控晶片原始網站,了解全世界最新的聲控技術報導 聲控晶片網站 : www.sensoryinc.com -------------------------------------------------- 電子郵件技術諮詢: ufvicwen@ms2.hinet.net 偉克多微電腦工作室 網址 : vic.seeder.net -------------------------------------------------- 檔案結束