baidureconocelavozmejor1

baidureconocelavozmejor1

Tecnología

La tecnología de Baidu reconoce la voz mejor que los humanos

Deep Speech 2 de Baidu es el sistema que reconoce la voz mejor que algunas personas.

20 diciembre, 2015 16:23

Noticias relacionadas

Deep Speech 2 de Baidu es el sistema que reconoce la voz mejor que algunas personas.

Si las afirmaciones de Baidu son ciertas, que todo apunta a que lo son, asistentes de voz como Google Now, Siri o Cortana tendrían los días contados, pues el gigante chino Baidu asegura que su sistema de reconocimiento de voz sobrepasa las capacidades del resto reconociendo idiomas como el inglés o el mandarín.

Desde que la compañía china Baidu decidió plantarle cara a gigantes como Google, tanto con su motor de búsqueda, como con sus propias gafas inteligentes e incluso un coche autónomo, no ha parado de amenazar la prosperidad de la tecnología norteamericana.

Deep Speech 2, un paso más en reconocimiento de voz

baidureconocelavozmejor2

baidureconocelavozmejor2

El nuevo sistema de Baidu, llamado Deep Speech 2, está basado en aprendizaje profundo, y según la compañía, es capaz de reconocer inglés y mandarín mejor incluso que algunas personas que dominan tales lenguajes. La segunda versión de Deep Speech de Baidu pronto sería integrada en la propia app de Baidu para servir como asistente de voz en países en los que se utiliza el conjunto de dialectos del chino.

La potencia demostrada por la tecnología de Baidu puede tener un gran impacto en sociedades que utilizan cualquiera de las formas del mandarín, dado que la dificultad de algunos habitantes para transcribir el idioma con caracteres latinos, hace mucho más útil la asistencia mediante voz que en el mundo occidental.

Sobrepasando al propio ser huamano

“Las capacidades de Deep Speech 2 nos permiten experimentar con el reconocimiento de voz a una escala mucho mayor” asegura Jesse Engel, de Baidu USA desde California. “Ahora podemos reducir la tasa de errores de reconocimiento de palabras hasta en un 40%“. Además “frente a frases cortas, fuera de contexto, Deep Speech 2 sobrepasa los niveles de reconocimiento humano” continúa afirmando el equipo de Baidu USA. Es cuestión de tiempo que la segunda versión del sistema Deep Speech sea implementado en Duer, el asistente de voz de la compañía china representado por un simpático robot blanco. ¿Conseguirá la evolución de la asistencia por voz que algún día la sociedad deje de avergonzarse por hablarle a un smartphone?

Vía | MIT Technology Review