Que é o recoñecemento de voz?

Uso da túa voz como método de entrada

O recoñecemento de voz é unha tecnoloxía que permite a entrada escrita en sistemas. Vostede fala co seu ordenador, teléfono ou dispositivo e usa o que dixo como entrada para provocar algunha acción. A tecnoloxía emprégase para substituír outros métodos de entrada como escribir, facer clic ou seleccionar noutras formas. É un medio para facer máis amigables os dispositivos e software e aumentar a produtividade.

Hai moitas aplicacións e áreas onde se usa o recoñecemento de voz, incluído o militar, como unha axuda para persoas con discapacidade (imaxinar unha persoa con mans ou dedos debilitada), no campo médico, na robótica etc. Nun futuro próximo, case todos estarán expostos ao recoñecemento de voz debido á súa propagación entre dispositivos comúns como ordenadores e teléfonos móbiles.

Algúns teléfonos intelixentes están facendo un uso interesante do recoñecemento de voz. Os dispositivos iPhone e Android son exemplos diso. A través delas, pode iniciar unha chamada a un contacto simplemente recibindo instrucións faladas como "Call office". Tamén se poden entretar outros comandos, como "Activar Bluetooth".

Problemas co recoñecemento de voz

O recoñecemento de voz, na súa versión coñecida como Speech to Text (STT), tamén se usou durante moito tempo para traducir palabras en texto. "Falas, escribe", como diría ViaVoice na súa caixa. Pero hai un problema con STT como o coñecemos. Máis de 10 anos atrás, probei ViaVoice e non durou unha semana no meu computador. Por que? Foi completamente inexacto e terminei gastando máis tempo e enerxía falando e corrixindo que escribir todo. ViaVoice é un dos mellores da industria, así que imaxina o resto. A tecnoloxía madurou e mellorou, pero o discurso ao texto aínda fai que as persoas fagan preguntas. Unha das súas principais dificultades é as inmensas variacións entre as persoas na pronuncia de palabras.

Non se supón que todos os idiomas son recoñecidos por voz, e os que fan moitas veces non son compatibles e tamén o inglés. Como resultado, a maioría dos dispositivos que executan o software de recoñecemento de voz actúan razoabelmente só co inglés.

Un conxunto de requisitos de hardware fai que o recoñecemento de voz sexa difícil de implementar en certos casos. Necesitas un micrófono que sexa o suficientemente intelixente como para filtrar o ruído de fondo, pero ao mesmo tempo o suficientemente poderoso como para capturar a voz naturalmente.

Falando de ruído de fondo, pode causar que todo o sistema falla. Como resultado, o recoñecemento de fala falla, en moitos casos, debido a ruídos que están fóra do control do usuario.

O recoñecemento de voz está mellorando como un método de entrada para novos teléfonos e tecnoloxías de comunicación como VoIP, que como ferramenta de produtividade para a entrada de texto masivo.

Aplicacións do recoñecemento de voz

A tecnoloxía está gañando popularidade en moitas áreas e foi exitosa nos seguintes:

- Control de dispositivo. Só dicir "OK ​​Google" para un teléfono con Android incendia un sistema que é todo oído para os teus comandos de voz.

- Sistemas de coche Bluetooth. Moitos autos están equipados cun sistema que conecta o seu mecanismo de radio ao seu teléfono intelixente a través de Bluetooth. Pode facer e recibir chamadas sen tocar o seu teléfono intelixente, e ata pode marcar números só dicindo.

- Transcrición de voz. Nas áreas onde a xente ten que escribir moito, algúns programas intelixentes capturan as palabras faladas e transcriben o texto. Isto é actual en certo software de procesamento de palabras. A transcrición de voz tamén funciona con correo de voz visual .