El perfeccionamiento de los diferentes desarrollos de software ha permitido su inclusión en diferentes estilos de vida, principalmente en el ambiente de oficina -a nivel de usuarios de PC-. Uno de desarrollos que han facilitado, todavía más, el trabajo de elaboración de documentos, es el reconocimiento de voz (voice recognition). Una técnica que permite hablarle a la computadora para que ésta realice la operación de transcripción.
stas operaciones se basan en la captura de las ideas, en texto
digital como documentos de texto que pueden ser editados.
Jesús Salinas actuario de Telsa, empresa que ofrece soluciones para
sistemas y equipos de cómputo y comunicaciones, señala que el
desarrollo para el reconocimiento de voz, "es una herramienta
que propone reducir los tiempos de trabajo, debido que a la
velocidad a la que puede dictársele a la computadora es de 160
palabras por minuto", refiriéndose al software Dragon Natural
Speaking, un desarrollo que tiene la capacidad para captar palabras
con 98% de precisión. Lo que permite este software, además de
capturar voz, es hacer todas las aplicaciones que se hacen con el
teclado o el mouse, como abrir archivos, salir o cerrar
aplicaciones.
Hacia la demanda
El funcionamiento de este tipo de desarrollos se basa en una
tecnología de redes neuronales que aprende en el tiempo,
reconociendo diferentes tipos de voz o ambientes, entre otros
factores, asegura Joel Gómez gerente de software de IBM en México,
la transnacional que tiene cerca de 40 años desarrollando
soluciones de voz y más de 150 patentes de tecnología de voz. Y
las primeras ofertas en el reconocimiento de voz fueron para temas
de dictado, oferta que en su momento tuvo IBM con el software
ViaVoice el cual puede ser utilizado en Windows, Macintosh y
plataformas para computadoras de bolsillo (handhelds).
Orientación e-business
Después de cubrir el segmento de usuario dentro de la oficina y el hogar, el reconocimiento de voz ha tomado el enfoque empresarial ya que industrias buscan que la interacción entre las personas y los sistemas sea lo más natural posible. "Esto facilita que las empresas puedan mandar instrucciones a los sistemas y así poder agilizar sus procesos", agregó el gerente de software de IBM.
Para esto empresas tecnológicas como IBM están investigando y
trabajando en este campo. En la actualidad este tipo de desarrollo
va más allá del uso común, como la simple captura de la voz, para
ir al uso empresarial, la idea es que se pueda dar instrucciones a
los sistemas, donde lo más importante el reflejo de la reducción de
costos.
Dentro de las herramientas de IBM, WebSphere Voice Server cuenta
con elementos como el reconocimiento de voz (voice recognition),
que puede facilitar la lectura de correo electrónico, por ejemplo.
La otra parte es texto a discurso (text to speech), un desarrollo
mediante el cual la PC convertirá el texto en voz sintetizada que
interpretará el texto en palabras para el usuario, de tal manera
que se pueda consultar el correo sin necesidad atender la PC
directamente. De esta manera y en el sentido empresarial, el
usuario podría comunicarse con el sistema de la compañía e incluso
escuchar mensajes de utilidad en el momento, añadió Gómez.
Comandos y acentos
Se puede añadir formato (estilo) mientras se dicta, como añadir
comillas, texto en negritas, subrayar, signos de admiración,
tamaños, todo con los comandos de formato, con la diferencia que
ahora se le ordenará a la PC verbalmente.
Este software puede ser usado a pesar de los diferentes acentos en
las regiones de varios países, mediante un entrenamiento (práctica
con el software) con la voz de la persona.
Para la inclusión de nuevas palabras con las que se tiene
práctica, como modismos, o palabras personalizadas por el usuario,
este tipo de desarrollos cuenta con la opción para especificarle al
software que cuando la persona emita un modismo, por ejemplo, el
software se familiarizará con la palabra y cada vez que se nombre
la palabra el programa habrá de reconocer el nuevo vocablo.
Una de las exigencias que hace este software, no es una buena
dicción sino la claridad de lo que se habla, es decir que no se
encimen palabras. Para el tono de voz el software reconocerá
cualquier tono de voz.
Cuenta con tecnología que elimina el ruido innecesario mientras se
dicta, ya que este software no interpretaría sonidos ajenos de las
palabras (un silbido, azote de una puerta).
Los comandos con los que trabaja el software son sencillos,
ordenarle a la máquina un simple "corregir eso", hace que
el programa se regrese a las últimas palabras dictadas y ofrece
palabras opcionales para hacer la corrección.
Si quieres recibir cada semana las noticias más interesantes suscríbete a nuestro boletín.
Basura!!!!!!!!!
Quisiera mas informacion referente al reconocimiento de voz
porque un peruano tiene que decir malas palabras? peruano, no nos hagas quedar mal a todos los peruanos por tu ignorancia