Xiaomi revoluciona el futuro del audio con su visión de inteligencia artificial

hace 2 meses · Actualizado hace 2 meses

Xiaomi ha innovado en inteligencia artificial con su modelo de argumentación de audio, alcanzando una precisión del 64.5%, superando a OpenAI y Google en esta área.

La compañía busca acelerar la comprensión del audio mediante un enfoque de código abierto, permitiendo a desarrolladores globales mejorar la tecnología, aplicable en dispositivos como teléfonos inteligentes y IoT.

Hiperai

Xiaomi ha logrado un avance significativo en la inteligencia artificial. Su innovador modelo está en la cúspide de la tecnología de argumentación de audio. Este notable logro evidencia las crecientes capacidades de la compañía en la investigación de frontera de la IA. El último modelo de gigantes de la industria como OpenAI y Google ha superado una crucial comprensión de audio.

El equipo anunció a través de su cuenta de tecnología oficial que presentó la famosa lista de calificación de MMAU (comprensión y discusión masiva de audio de múltiples tareas). Su modelo alcanzó una precisión récord del 64.5%, superando de manera significativa al GPT-4O de OpenAI (57.3%) y al Gemini 2.0 Flash de Google (55.6%).

Índice

Enfoque de aprendizaje de refuerzo revolucionario

El ritmo de este avance es particularmente notable. Después del liderazgo de Deepseek-R1, los investigadores de Xiaomi ampliaron los algoritmos de aprendizaje de refuerzo. Esto se realizó en un tiempo récord de una semana.

A2B1E0E8 9A1E 48B7 AE60 1B24B4E927D8

Los científicos implementaron el método GRPO (optimización relativa de políticas). Con este enfoque, los modelos de IA pueden aprender de forma autónoma mediante un mecanismo de "experimento y error en la recompensa". Este método facilita la creación de habilidades de argumentación similares a la reflexión humana y la verificación a través de múltiples pasos.

El Dr. Zhang Wei, investigador principal del proyecto, comentó: “El refuerzo de aprendizaje es excepcional para cerrar la gran brecha entre generar y verificar resultados. El argumento de audio es precisamente una de esas tareas donde el pensamiento activo produce resultados más eficientes que los patrones”.

Más que simplemente reconocer sonido

Las aplicaciones de IA en la actualidad requieren más que una simple detección. El avance de Xiaomi permite a la IA:

  • Determinar posibles errores en un vehículo analizando los registros de la cabina.
  • Captar el estado de ánimo de un compositor escuchando actuaciones musicales.
  • Prever riesgos de colisión en lugares concurridos como las estaciones de U-Bahn.

La prueba MMAU consta de 10,000 clips de audio, que abarcan desde el lenguaje hasta sonidos ambientales y música. Incluye preguntas anotadas por humanos para evaluar el modelo en 27 habilidades.

Perturbación de enfoques de IA tradicionales

Los experimentos realizados por Xiaomi han mostrado resultados sorprendentes que desafían la sabiduría convencional en desarrollo de IA:

  • El aprendizaje del refuerzo ha superado notablemente al aprendizaje tradicional, utilizando un registro de datos de solo 38,000 elementos.
  • Su modelo con 7B parámetros demostró una capacidad superior en argumentación, a pesar de ser mucho más pequeño que otros modelos competitivos que superan los 100B parámetros.
  • La fuerza del modelo para generar procesos de argumentación explícitos en realidad redujo el rendimiento en un 3.4%.

Aunque la precisión del 64.5% es alta, sigue siendo inferior al 82.23% de referencia de expertos humanos. Esto indica que hay un amplio margen para mejoras.

Compromiso con el código abierto

La organización abraza la filosofía de innovación de Xiaomi. Los parámetros del modelo serán accesibles. Con este enfoque altruista, la compañía permite que desarrolladores e investigadores de todo el mundo expandan su innovación.

"Al abrir nuestros esfuerzos a la comunidad global de IA, buscamos acelerar el proceso hacia una verdadera comprensión inteligente del audio", expresó Lei Jun, fundador y CEO de Xiaomi. "Este es otro paso en nuestra misión de hacer que las tecnologías innovadoras sean accesibles para todos".

Para quienes estén interesados en experimentar con esta tecnología:

Este avance, cuando las funciones de Xiaomi KI se integren en su línea de productos, abarcará desde teléfonos inteligentes hasta productos de IoT para el hogar inteligente. Esto convierte a la empresa en un competidor serio en el ámbito global de la investigación en IA.

Gracias por confiar en nosotros y recuerda que puedes seguirnos en nuestras redes sociales tanto en nuestro grupo de ayuda en Telegram, Instagram ,Facebook y Twitter para estar al tanto de las últimas noticias y novedades de Xiaomi. Si tienes alguna consulta estaremos encantados de poder ayudarte.

Últimos lanzamientos de la semana en Xiaomi:
Xiaomi se posiciona en el tercer lugar del creciente mercado de tabletas en China
Xiaomi se posiciona en el tercer lugar del creciente mercado de tabletas en China
El mercado de tabletas en China creció un 19.5% en el primer trimestre de 2025, con Xiaomi destacando al lograr ...
La solución al problema de Calock en Xiaomi HyperOS ya está aquí
La solución al problema de Calock en Xiaomi HyperOS ya está aquí
Los inconvenientes de la barra de estado en los Redmi Note 14 fueron resueltos con la nueva actualización de HyperOS ...
Android 16 llega en junio y Xiaomi lanza más de 30 nuevos dispositivos
Android 16 llega en junio y Xiaomi lanza más de 30 nuevos dispositivos
Google ha anunciado el lanzamiento de Android 16 para junio, incluyendo nuevas funciones y actualizaciones para dispositivos Xiaomi. Se están ...

Ana

Soy Ana, mexicana de 28 años que disfruta de la vida al máximo. Desde mi infancia, he sido una entusiasta de la tecnología y disfruto mucho probando productos nuevos y me encanta estudiar sus características.La marca Xiaomi y su ecosistema me ofrecen ese gran abanico de posibilidades!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Subir