實現一個簡單易部署的ASR服務端和客戶端
我們在之前的文章中介紹過VOSK,KALDI等具有前后傳承的ASR( Automatic Speech Recognition),見前文:《快速使用kaldi等模型的工具-VosK用于ASR》,同時在前期實現了用于智能客服、智能外呼的相關模塊,但是把VosK做實現部署時還是相對復雜《FSGUI智能客服和智能外呼與VosK集成于一體》,于是我們繼續努力,讓伙伴們都可以解壓即可用,而不是要折騰來折騰去。
在這里先感謝下Nickolay Shmyrev,是他把kaldi封裝得更簡單易用,也感謝kaldi的團隊為ASR及相關樣本、模型、算法等做出的一系列的努力。
-
本次下載的包
鏈接:https://pan.baidu.com/s/1Gdgl8FiUfrUMlCMFTyIwSA
提取碼:1234
可以基于CentOS7、CentOS8、Debian10使用,我沒有測試過Debian 11,從道理上來說應是支持的,祝大好運。
-
服務端
包名 nway_asr_server.tar.gz
其它的系統優化等,我們就不用管它了,只要下載下來解壓就可以使用了,如:
在自己喜歡的以上操作系統中執行
tar zxvf nway_asr_server.tar.gz
,當然我以前截圖是我自己用的zip,這個道理類似。
使用ls -l 列出這個路徑
那么我們調用 ./start.sh就可以啟動asr server啦!
-
啟動
-
查看是否啟動成功
是由于不同操作系統中,進程名太長會cut掉后續的一些字符,所以如果要檢查其是否運行
netstat -anp | grep nway_asr
即可。
-
客戶端
包名 nway_asr_client.zip
其中包含了基于windows系統的AsrNway.exe和基于*nix的AsrNway,配置文件 為nway.ini,里邊即配置nway_asr_server的ip和端口,這里端口必須是20035,uri必須帶 /nway_asr
[server]
ip=ws://10.0.0.25:20035/nway_asr
在windows上調用.exe程序,*nix上直接調用AsrNway,切記一定要讓它擁有執行權限,比如: chmod +x AsrNway
調用方式為:
./AsrNway.exe "" filename.wav
中間為兩個引號代表一個參數,現在不具備具體含義。
filename.wav需要注意的是,一定是電話系統的,單聲道8khz,8bit的錄音。
比如:
至此我們的易部署的ASR_SERVER和ASR_CLIENT就完成了,結合實際的應用就可以進行ASR轉寫等。