一直在寻找一个好的语音替换方案,在Windows Phone On Devices出现之前,还需要很长一些时候,找了很久,从TTS到其他什么的,最后算是找到了Jasper
,在几天的努力之后终于编译成功了。。
虽然是这样的,但是我们需要的大概就是
这个算是还好,复杂的地方在于编译可能要几天的时间,除非你正好放假。。
这里用的是steelseries
的西伯利亚USB声卡。
sudo apt-get install vim git-core espeak python-dev python-pip bison libasound2-dev libportaudio-dev python-pyaudio --yes
还有其他的必要软件
sudo vim /etc/modprobe.d/alsa-base.conf
注释掉
options snd-usb-audio index=-2
或者改为
options snd-usb-audio index=0
重启声卡
sudo alsa force-reload
这里需要麦克风和耳机(或者音箱)
arecord temp.wav
上面的命令是用来录音的,用于测试
aplay -D hw:1,0 temp.wav
播放录音文件
将下面的PATH添加到~/.bash_profile
export LD_LIBRARY_PATH="/usr/local/lib"
source .bashrc
再把下面的代码添加到~/.bash_profile
或者~/.bashrc
LD_LIBRARY_PATH="/usr/local/lib"
export LD_LIBRARY_PATH
PATH=$PATH:/usr/local/lib/
export PATH
Sphinx是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。 PocketSphinx是一个计算量和体积都很小的嵌入式语音识别引擎。在Sphinx-2的基础上针对嵌入式系统的需求修改、优化而来,是第一个开源面向嵌入式的中等词汇量连续语音识别项目。识别精度和Sphinx-2差不多。
因为pocketsphinx
依赖于库Sphinxbase
,先安装Sphinxbase
下载sphinxbase
wget http://downloads.sourceforge.net/project/cmusphinx/sphinxbase/0.8/sphinxbase-0.8.tar.gz
解压sphinxbase
tar -zxvf sphinxbase-0.8.tar.gz
编译和安装sphinxbase
cd ~/sphinxbase-0.8/
./configure --enable-fixed
make
sudo make install
下载Pocketsphinx
wget http://downloads.sourceforge.net/project/cmusphinx/pocketsphinx/0.8/pocketsphinx-0.8.tar.gz
解压Pocketsphinx
tar -zxvf pocketsphinx-0.8.tar.gz
编译和安装Pocketsphinx
cd ~/pocketsphinx-0.8/
./configure
make
sudo make install
关于CMUSphinx
Open Source Toolkit For Speech Recognition
语言模型生成工具 cmuclmtk
编译所需要的工具
sudo apt-get install subversion autoconf libtool automake gfortran --yes
编译安装CMUCLMTK
svn co https://svn.code.sf.net/p/cmusphinx/code/trunk/cmuclmtk/
cd cmuclmtk/
sudo ./autogen.sh && sudo make && sudo make install
OpenFst is a library for constructing, combining, optimizing, and searching weighted finite-state transducers (FSTs).
wget http://www.cs.nyu.edu/~allauzen/openfst/openfst-1.3.4.tar.gz
openfst编译和安装
cd openfst-1.3.4/
sudo ./configure --enable-compact-fsts --enable-const-fsts --enable-far --enable-lookahead-fsts --enable-pdt
sudo make install # come back after a really long time
!!需要注意的是这里的编译和安装可能会出错,需要修改swapfile
的大小
下载软件包
wget https://mitlm.googlecode.com/files/mitlm-0.4.1.tar.gz
wget https://m2m-aligner.googlecode.com/files/m2m-aligner-1.2.tar.gz
wget https://phonetisaurus.googlecode.com/files/phonetisaurus-0.7.8.tgz
wget http://phonetisaurus.googlecode.com/files/g014b2b.tgz
解压
tar -xvf m2m-aligner-1.2.tar.gz
tar -xvf phonetisaurus-0.7.8.tgz
tar -xvf mitlm-0.4.1.tar.gz
tar -xvf g014b2b.tgz
cd m2m-aligner-1.2/
sudo make
cd mitlm-0.4.1/
sudo ./configure
sudo make install
cd phonetisaurus-0.7.8/
cd src
sudo make
sudo cp ~/m2m-aligner-1.2/m2m-aligner /usr/local/bin/m2m-aligner
sudo cp ~/phonetisaurus-0.7.8/phonetisaurus-g2p /usr/local/bin/phonetisaurus-g2p
为了给下面这个很大的文件编译
cd g014b2b/
./compile-fst.sh
最后重命令
mv ~/g014b2b ~/phonetisaurus
然后我们就接近,接近我们想要的核心了。
围观我的Github Idea墙, 也许,你会遇到心仪的项目