Mostrando entradas con la etiqueta RECONOCIMIENTO DE VOZ. Mostrar todas las entradas
Mostrando entradas con la etiqueta RECONOCIMIENTO DE VOZ. Mostrar todas las entradas

miércoles, 21 de marzo de 2018

Inteligencia Artificial lee los labios con el 93.4% de efectividad.

Ya ha llegado el día en que podemos ser simplemente filmados y una maquina puede transcribir palabra por palabra lo que hablamos. La tecnología es fundamental para el control masivo de la población, imaginemos el día en que se prohíban decir ciertas palabras o emitir ciertas opiniones, cuando este momento llegue la AI (Inteligencia Artificial) tendrá un rol muy importante.
Facebook ya nos puede reconocer simplemente por la ropa que usamos, posee también una tecnología capaz de reconocer rostroscon un 97.53% de precisión, la CIA puede anticipar actividades gracias a lo así llamado: “inteligencia anticipatoria“, y la tecnología biométrica sigue avanzando cada día a un ritmo asombroso (ver noticias sobre Identificaciones Biométricas).
lector de labios.gif
Ahora nuestros labios pueden ser leídos por computadora, ¿qué seguirá después?, no lo sabemos…  Preparando el camino al Gobierno Mundial.

AI ha vencido a los seres humanos en lectura labial

Investigadores muestran que el aprendizaje de una máquina se puede utilizar para distinguir el habla de clips de vídeo -sin audio- con más eficacia que los lectores profesionales  de labios. Un equipo del departamento de Informática de la universidad Oxford ha desarrollado un nuevo sistema de inteligencia artificial llamada LipNet.
Se ha utilizado un conjunto de datos para entrenar una red neurológica, similar a la que se utiliza para realizar el reconocimiento de voz. En este caso, sin embargo, la red neuronal identifica las variaciones en la forma de la boca al mismo tiempo que aprende a enlazar esa información para lograr una explicación de lo que se dice. La IA no analiza las imágenes en fragmentos sino que lo hace en un todo, lo que le permite obtener una comprensión del contexto de la sentencia que se analiza. Eso es importante, porque hay menos formas producidas por la boca que las que hay en sonidos producidos por la voz humana.
Una vez finalizada la prueba, el sistema fue capaz de identificar el 93,4 por ciento de las palabras correctamente. Voluntarios humanos de lectura de labios fueron solicitados para realizar las mismas tareas, identificando solo el 52,3 por ciento de las palabras correctamente. [Fuente]

martes, 25 de abril de 2017

60 segundos de tu voz son suficientes para que esta tecnología pueda imitarla y decir lo que sea

Una startup en Canadá ha desarrollado un nuevo algoritmo de programación que es capaz de imitar la voz de cualquier persona con tan solo escuchar 60 segundos de su voz. Luego, es capaz de decir con esta voz lo que se le indique mediante texto.

Similar al algoritmo presentado por la gente de Adobe, pero técnicamente más avanzado, la gente detrás de Lyrebird, utiliza inteligencia artificial y machine learning para sintetizar el habla basado en muestras de audio. Sorprendentemente, es capaz de replicar hasta las emociones a través del habla, haciéndola mucho más natural.

Pero el trabajo detrás de Lyrebird no termina con imitar las voces de las personas. Su algoritmo puede ser utilizado para crear nuevas voces a partir de otras. Una vez identifica la clave de voz de cada persona en las muestras proporcionadas, esta es utilizada para generar palabras desde cero. Puede variarse la entonación de cada palabra, por lo que es posible hacer que una misma oración pueda sonar de diferentes formas.

Todo lo anterior parece de ciencia ficción cuando lo leemos, pero la gente detrás de Lyrebird ha preparado una presentación basándose en las voces de el presidente Barack Obama, el presidente Donald Trump, y la ex-candidata demócrata Hillary Clinton. En el corto de audio podemos escuchar a los tres explicando la tecnología de Lyrebird:






Según la empresa, el objetivo es de mejorar las voces que se utilizan en los asistentes virtuales. Con la tecnología de Lyrebird, las empresas podrían desarrollar sintetizadores de voz más naturales y adecuados para personas con discapacidades.

La empresa advierte además, que han liberado su API con el objeto de que seamos conscientes de que imitar la voz de una persona es posible. Claramente, este tipo de tecnología podría tener serias consecuencias si tomamos en cuenta que hay entidades bancarias que están utilizando la voz como alternativa a las contraseñas.

Esto a la vez pone de manifiesto que el uso de grabaciones como evidencia en juicios puede volverse inútil si tomamos en cuenta que la tecnología para imitar voces puede ser fácilmente aplicada. Al respecto Lyrebird no ofrece garantías que ayuden a solventar dicho problema hipotético.


Por Francisco Espinoza - Abr 25, 2017
fuente/www.tekcrispy.com