‘Common Voice’ de Mozilla: una base de datos de colaboración colectiva para mejorar el reconocimiento de voz

Recibo muchos elogios por mi profundo acento escocés, pero cuando se trata de aplicaciones de voz como Siri y Alexa, mi voz es más una desventaja que una ventaja. Cuando Apple y Amazon estaban haciendo sus asistentes de voz, no parecían tener un consultor de acento escocés en la marcación rápida.

Si se supone que el reconocimiento de voz es el camino hacia el futuro, y supuestamente es hacia donde debemos dirigirnos, entonces los motores de búsqueda y los asistentes de voz deben comenzar a comprender mejor los acentos difíciles. No todos tenemos acentos escolares en inglés público.

Mozilla (creadores del navegador Firefox) están intentando resolver el problema pidiendo a las personas que envíen voluntariamente sus voces a una base de datos llamada “Voz común“. Al hacer coincidir las voces con las frases establecidas, Mozilla espera que su base de datos eventualmente sea una herramienta invaluable en el futuro para cualquier aplicación que dependa del reconocimiento de voz.

Registrarse en ‘Common Voice’

Antes de continuar, primero eliminemos los problemas de privacidad, ya que ya puedo escucharlos.

Si bien es posible que se registre con su cuenta de Firefox, cuenta de Github o cuenta de Google, en su lugar puede registrarse por correo electrónico. Simplemente abra una cuenta de correo electrónico anónima y desechable y nadie se dará cuenta de que usted está hablando.

Una vez que haya creado una cuenta e iniciado sesión, ver su tablero.

Hay dos secciones: Hablar y Escucha. los Hablar sección es donde se le pide que contribuya con su propia voz. Escucha es donde escuchas las voces de otras personas y las comparas con la frase que tenían que decir. A continuación, indicará si es correcto.

Hablar

Para participar en la sección de oratoria, necesitará un micrófono que funcione y que capte su voz con claridad. También debe dar acceso al sitio de Mozilla a ese micrófono.

Cuando haces clic en el Hablar sección, se le dará un conjunto de cinco frases aleatorias para hablar. Las instrucciones están muy claras en la pantalla y son fáciles de seguir.

Simplemente haga clic en el ícono de micrófono a continuación y luego lea la oración en su tono de voz normal. No pongas un acento poco natural ni hables muy despacio.

El objetivo del ejercicio es que la base de datos aprenda a comprender los acentos de las personas de la forma en que se hablan normalmente. Hablar de otra manera hace que todo sea inútil.

Cuando haya terminado la primera frase, verá en la esquina superior derecha las opciones para reproducir el clip y volver a grabar el clip si no está satisfecho con él.

Si está satisfecho con él, pasa al siguiente y continúa hasta que se terminan las cinco frases. Luego haga clic en el botón azul Enviar para enviar sus clips a Mozilla para su verificación.

Si ahora vuelves a tu tablero, verá que se le ha acreditado por esas frases.

Entonces es un simple caso de enjuagar y repetir. Cuantas más contribuciones y diferentes acentos pueda obtener Mozilla en su base de datos, más éxito tendrá el proyecto.

Escucha

Una vez que las personas han enviado sus frases a Mozilla, deben comprobarse para asegurarse de que el clip de voz coincida con la frase. Esto es algo que también se está subcontratando a voluntarios.

atrás en el tablero, verá el Escucha sección de la derecha. Puedes ver desde el Mayores contribuyentes sección que se han acumulado algunas estadísticas importantes.

Para comenzar a validar frases de voz, vaya a la Escucha sección y se le dará una frase y un botón de reproducción.

Haga clic en el botón de reproducción (¡asegúrese de que sus altavoces estén encendidos!) Y escuchará la voz grabada. Si decide que la frase se dijo correctamente, haga clic en si. Si hubo una mala pronunciación, se dijo algo más o cualquier otro error, haga clic en NO.

Conclusión

Este es solo uno de los muchos proyectos que Mozilla tiene en marcha en este momento (vaya a la sitio web principal de Mozilla y haga clic en Proyectos en la parte superior, cambia todo el tiempo). El crowdsourcing es una excelente manera de que sucedan proyectos valiosos y siempre vale la pena donar su tiempo para ayudar a construir algo útil para el futuro.

Santiago
Los ordenadores siempre han sido una gran parte de mi vida. Decidí crear este sitio para plasmar todo lo aprendido durante tantos años trasteando con estás maquinas. Cuando no estoy editando mi web, me dedico a reparar aerogeneradores.

Deja un comentario