推荐文章 New Blog
使用Python进行语音识别三
最后的语音识别本来想发完第二篇的时候就隔天发第三篇的,但是发现一个问题要想使用K临近需要具有相同的向量长度,这个问题想了一天,本来想定一个标准的长度,然后用线性插值(采样频率比较高所以影响不大,采样率低时可以使用非线性插值),但是算法写了一天,最后发现scipy中有这个库,代码如下,白写了很大的一段代码。def normal_time(data,windowsNum): '''规整到的窗口数目''' voiceLen=windows*windowsNum x=np.linspace(0,voiceLen,len(data)) f_lin...April 12, 2015, 10:24 p.m.作者:zachary分类:语音识别阅读(1688)评论(0)
使用Python进行语音识别二
获得MEL滤波器 本来这一篇就想把识别做完的,但是搜了一些文献,发现如果简单的使用能量和过零率识别率不高,而如果直接使用原生采样数据计算量有点大,所以就准备按照大多数文献说的将MFCC作为其中的一种特征参数,从而使用K临近算法好了,识别率会不会好不知道,这篇文章就简单的说一下如何用python获得MEL滤波器吧,后面的东西后面在做。直接贴代码:#encoding=utf-8 import wave import pylab as pl import numpy as np samprate=44100 filterNum=12 def mel2freq(mel_vec): '''mel频率变为线性频率&...April 8, 2015, 9:44 p.m.作者:zachary分类:语音识别阅读(1855)评论(0)
使用Python进行语音识别(一)
基于能量与过零率的端点检测一直想尝试着做语音识别的东西,就是简单的识别几个特定的声音也好,但是感觉网上的东西要么太水,要么太难,不过这几天突然有了一点灵感,借用机器学习进行识别不知道可不可行,于是就有了现在这篇博客了。这篇博客算是语音识别的第一步,对语音进行端点检测。写代码之前首先确保安装了必要的环境,这里说一下我的环境,window7,python2.7,numpy,scipy,pyaduio, Matplotlib。安装了这几个库就可以进行这里的实验了。下面正式进入实验。第一步,录音。这里使用pyaudio,首先将声音保存为文件。import pyaudio import wave p=pyaudio.PyAudio() stream=p.open(format=pyaudio.paInt16,#格式 &n...April 6, 2015, 10:47 a.m.作者:zachary分类:语音识别阅读(3629)评论(4)