23326

Noticias
BHTV TECNOLOGÍA

La Curva de Aprendizaje, parte 3: evolucionando los datos de IA de buenos a excelentes

Samsung Research en Vietnam es parte de una serie sobre las personas y las innovaciones que permiten que la IA móvil mejore más vidas

Samsung es pionera en experiencias premium de IA móvil. Para saber cómo Galaxy AI está maximizando el potencial de sus usuarios, visitamos los centros Samsung Research en todo el mundo. Galaxy AI, que ahora admite 16 idiomas, permite que más personas amplíen sus capacidades lingüísticas, incluso sin conexión, gracias a la traducción en el dispositivo con funciones como Traducción Simultánea, Intérprete, Asistente de Notas y Asistente de Navegación. Recientemente, visitamos Jordania para conocer las complejidades del desarrollo de un modelo de IA para el árabe, un idioma con muchos dialectos. Esta vez, vamos a Vietnam para explorar cómo se preparan los datos para entrenar modelos de IA.

¿Cuál es la diferencia entre fantasma, tumba y madre en vietnamita? Para una lengua hablada por 97 millones de personas en todo el mundo, es muy poco. Cada palabra se traduce como “ma”, “mả” y “má”, respectivamente, y solo se puede distinguir por el tono. Esto ilustra lo difícil que puede ser para los modelos de IA aprender un idioma, considerando que no pueden reconocer de primera mano el contexto y las emociones de las conversaciones ni las intenciones de quienes hablan.

El Instituto de Investigación y Desarrollo de Samsung (SRV) de Vietnam utilizó datos finamente revisados para ayudar a que su modelo de IA reconociera adecuadamente incluso las diferencias más sutiles en el lenguaje.

La calidad de los datos utilizados afecta directamente la precisión del reconocimiento automático de voz (ASR), la traducción automática neuronal (NMT) y la conversión de texto a voz (TTS), procesos que ayudan las funciones de Galaxy AI como Traducción Simultánea, Intérprete, Asistente de Escritura y Asistente de Navegación a romper las barreras del idioma.

Un tifón de desafíos

«El vietnamita es un idioma complejo y diverso con expresiones ricas, muchas de las cuales son difíciles de capturar», dice Ngô Hồng Thái, líder de NMT en SRV. De los 16 idiomas que admite Galaxy AI, el vietnamita fue particularmente difícil de desarrollar.

«Personalmente, ¡crear un modelo de IA para el idioma vietnamita fue más desafiador que nuestros tifones!» añade antes de explicar los obstáculos enfrentados durante el proceso de desarrollo.

El vietnamita es un idioma tonal con seis tonos distintos. Como es evidente en el ejemplo anterior de “ma”, pequeños matices en la vocalización pueden alterar drásticamente el significado de las palabras. Por lo tanto, era necesario un enfoque meticuloso y detallado.

«Cuando se desglosan palabras que suenan similares, una palabra consta de varios segmentos cortos o ‘conjuntos de cuadros'», dice Bui Ngoc Tung, líder de ASR en SRV. “El modelo de IA diferencia entre cuadros de audio cortos de alrededor de 20 milisegundos para reconocer qué palabras corresponden a un determinado conjunto de cuadros consecutivos. Como tal, es fundamental poner un gran esfuerzo en las primeras etapas del proceso de aprendizaje de la IA”.

Además, los homófonos y los homónimos son comunes en vietnamita. Normalmente, las personas pueden confiar en el contexto y los elementos no verbales en las conversaciones para diferenciar entre palabras que suenan o que se escriben igual, pero tienen significados diferentes. Sin embargo, es necesario enseñar a los modelos de IA a identificar y diferenciar con precisión entre tonos y palabras similares.

«Esta no es una tarea sencilla», explica Thái. «Aparte de la cantidad, los datos deben ser precisos para garantizar que sean capaces de reconocer los matices lingüísticos que existen en vietnamita».

Preparación rigurosa

El proceso de refinamiento de datos consta de tres pasos. Primero, se deben revisar y corregir el audio y el texto utilizados para entrenar el modelo de IA. Luego, este conjunto de datos pasa por controles aleatorios de calidad general. Finalmente, el conjunto de datos se normaliza y limpia antes de su uso en el entrenamiento.

«Realizamos minuciosamente una serie de pruebas para comprobar la precisión de nuestro conjunto de datos», afirma Nguyen Manh Duy, líder de TTS en SRV, quien supervisa la creación de bases de datos. “Nos enfrentamos a una serie de problemas inesperados, como palabras mal escritas en los guiones y ruido de fondo o pronunciación incorrecta durante las grabaciones de audio. Dedicamos mucho tiempo a perfeccionar y mejorar nuestros datos de entrenamiento”.

Además de los desafíos lingüísticos únicos del vietnamita, existe una falta de datos universalmente accesibles en comparación con los idiomas más hablados. «Ésta es otra razón por la que la etapa de refinamiento de los datos es tan importante», añade. “Como teníamos fuentes limitadas, cada dato tenía que ser totalmente fiable. No había margen de error”.

El modelo de IA para vietnamita debe considerar diferencias tanto de tono como regionales. Para mejorar la precisión del modelo de IA, el equipo recopiló grandes cantidades de datos con los acentos del norte, centro y sur de Vietnam, lo que resultó en una enorme cantidad de información para refinar y verificar.

Mejora continua

Los desarrolladores de SRV completaron el proyecto después de meses de arduo trabajo y el vietnamita se convirtió en uno de los primeros idiomas admitidos por Galaxy AI. A pesar de este éxito, el equipo trabaja incesantemente para mejorar la experiencia con el idioma.

«Seguimos mejorando el modelo de IA incorporando comentarios de los usuarios sobre la relevancia de las palabras y frases en Galaxy AI», dice Tran Tuan Minh, líder del proyecto de desarrollo del lenguaje de IA en SRV. «Acabamos de dar nuestros primeros pasos hacia un mundo más abierto y tenemos mucho más que explorar juntos».

Acerca de Samsung Electronics Co., Ltd.

Samsung inspira al mundo y diseña el futuro con ideas y tecnologías transformadoras. La compañía está redefiniendo los mundos de las TV, los smartphones, los wearables, las tablets, los electrodomésticos, los sistemas de redes y las soluciones de memoria, sistemas LSI, semiconductores y LED y ofrece una experiencia conectada perfecta por medio de su ecosistema SmartThings y la colaboración abierta con sus socios.

Noticias Recomendadas

Desde 2004 se estableció que cada 21 de julio se conmemora el Día Mundial del Perro, una fecha para generar conciencia sobre el abandono y la adopción responsable, a la vez permite generar conciencia sobre la tenencia responsable con estas mascotas. MSD Animal Health, compañía dedicada a la investigación, desarrollo, fabricación y comercialización de productos innovadores y de gran calidad para la salud animal, conocedora de esta importante fecha, comparte cinco consejos importantes para darle calidad de vida a estos amigos de cuatro patas. 1. Alimentación adecuada: La alimentación debe ser equilibrada y adaptada según su edad, tamaño, actividad física y condiciones de salud. Ello con el fin de que nuestra mascota cuente con los nutrientes necesarios. Recibir la cantidad adecuada de comida es una parte esencial para su cuidado. Importante, no alimentarlos con comida cruda, sobras o huesos, dado que estas dietas, dependerán mucho de la condición corporal de la mascota, el Médico Veterinario es el más indicado para recomendarlas. 2. Desparasitación regular: Los parásitos internos pueden causar una serie de problemas de salud en los perros. El desparasitante interno para perros ayuda a prevenir enfermedades que pueden ser transmitidas a los humanos, como la zoonosis, al igual que el de uso externo. Además, al eliminar los parásitos, tu perro tendrá una mejor absorción de nutrientes, lo que se traduce en más energía y un pelaje más brillante. Un perro desparasitado es menos propenso a desarrollar infestaciones severas que puedan requerir tratamientos más agresivos y costosos. 3. Uso de productos antipulgas: Las pulgas pueden transmitir parásitos como la tenía, bacterias que pueden causar infecciones, además de lesiones por rascado excesivo. Mantenerlos libres de pulgas evita estos problemas. Además, los protege tu entorno y a otros animales que vivan contigo, ya que las pulgas pueden infestar no solo a tu perro, sino también tu hogar. 4. Vacunas: Con las vacunas, proteges su salud de tu perro y la salud de otros al evitar la propagación de enfermedades contagiosas para animales y humanos. Además, las vacunas de perros fortalecen el sistema inmunológico de tu mascota, preparándolo mejor para enfrentar posibles infecciones en el futuro. Se debe cumplir con el calendario de vacunas, dado que las dosis y los tiempos específicos son cruciales para la eficacia de las mismas. Recordemos que las vacunas solo deben ser administradas por un Médico Veterinario, colegiado y habilitado. 5. Ejercicio regular: El ejercicio es vital para la salud física y mental de tu perro. Ayuda a mantener un peso saludable y a prevenir enfermedades relacionadas con la obesidad. Además, reduce el desarrollo de problemas de comportamiento como ansiedad o destructividad. Pasear o jugar con tu perro refuerza el vínculo entre ustedes, creando una relación más cercana y positiva. “Cuidar a tu perro de manera integral no solo prolonga su vida, sino que también mejora su calidad de vida, permitiéndole ser un compañero saludable y feliz. Celebremos este Día Mundial del Perro, reforzando nuestro compromiso con su bienestar y agradeciéndoles por la alegría y amor incondicional que nos brindan. Desde MSD Animal Health trabajamos bajo el enfoque ‘One Health’, desarrollando nuevas estrategias, productos innovadores y soluciones tecnológicas para los principales desafíos sanitarios que afectan tanto a los animales como a las personas y el medio ambiente”, comentó Silvia Panta, Especialista y Técnica de Animales de Compañía en MSD Animal Health en Perú.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *