Después de haber investigado las posibles lineas de desarrollo he llegado a la conclusión de que voy a partir de la base de la librería Sphinx2.
La decisión ha sido meditada, pues diseñar desde cero un sofware encargado del reconocimiento de voz escapa a mis posibilidades.
Así pues voy a comenzar a trabajar esta librería. Lo primero que voy a hacer es una documentación detallada de las funciones de las tres librerías más importantes de su API:
ad.h : Esta librería se encarga del acceso a bajo nivel del audio.
cont_ad.h: Esta librería contiene una serie de filtros para los ficheros de audio. Es un paso intermedio.
fbs.h: Aquí es donde se pasa el discurso guardado y manipulado mediante las librerías anteriores a texto.
Este proyecto tiene como objetivo desarrollar una aplicación que sea capaz de controlar las funciones de un escritorio kde, así como la posibilidad de control sobre otras aplicaciones o periféricos.
Hay en la red varias aproximaciones al resultado esperado, entre las que cabe destacar perlbox-voice (http://www.perlbox.org). Para los que lo quieran probar decirles que es necesaria la instalación perl-tk (se puede obtener mediante apt-get -install perl-tk) y la librería sphinx2 (http://cmusphinx.sourceforge.net/html/cmusphinx.php).
Un saludo a todos.
Este es el blog del Proyecto “Control Por Voz”.
