Xiaomi revoluciona el futuro del audio con su visión de inteligencia artificial
hace 2 meses · Actualizado hace 2 meses
Xiaomi ha innovado en inteligencia artificial con su modelo de argumentación de audio, alcanzando una precisión del 64.5%, superando a OpenAI y Google en esta área.
La compañía busca acelerar la comprensión del audio mediante un enfoque de código abierto, permitiendo a desarrolladores globales mejorar la tecnología, aplicable en dispositivos como teléfonos inteligentes y IoT.
Xiaomi ha logrado un avance significativo en la inteligencia artificial. Su innovador modelo está en la cúspide de la tecnología de argumentación de audio. Este notable logro evidencia las crecientes capacidades de la compañía en la investigación de frontera de la IA. El último modelo de gigantes de la industria como OpenAI y Google ha superado una crucial comprensión de audio.
El equipo anunció a través de su cuenta de tecnología oficial que presentó la famosa lista de calificación de MMAU (comprensión y discusión masiva de audio de múltiples tareas). Su modelo alcanzó una precisión récord del 64.5%, superando de manera significativa al GPT-4O de OpenAI (57.3%) y al Gemini 2.0 Flash de Google (55.6%).
Enfoque de aprendizaje de refuerzo revolucionario
El ritmo de este avance es particularmente notable. Después del liderazgo de Deepseek-R1, los investigadores de Xiaomi ampliaron los algoritmos de aprendizaje de refuerzo. Esto se realizó en un tiempo récord de una semana.
Los científicos implementaron el método GRPO (optimización relativa de políticas). Con este enfoque, los modelos de IA pueden aprender de forma autónoma mediante un mecanismo de "experimento y error en la recompensa". Este método facilita la creación de habilidades de argumentación similares a la reflexión humana y la verificación a través de múltiples pasos.
El Dr. Zhang Wei, investigador principal del proyecto, comentó: “El refuerzo de aprendizaje es excepcional para cerrar la gran brecha entre generar y verificar resultados. El argumento de audio es precisamente una de esas tareas donde el pensamiento activo produce resultados más eficientes que los patrones”.
Más que simplemente reconocer sonido
Las aplicaciones de IA en la actualidad requieren más que una simple detección. El avance de Xiaomi permite a la IA:
- Determinar posibles errores en un vehículo analizando los registros de la cabina.
- Captar el estado de ánimo de un compositor escuchando actuaciones musicales.
- Prever riesgos de colisión en lugares concurridos como las estaciones de U-Bahn.
La prueba MMAU consta de 10,000 clips de audio, que abarcan desde el lenguaje hasta sonidos ambientales y música. Incluye preguntas anotadas por humanos para evaluar el modelo en 27 habilidades.
Perturbación de enfoques de IA tradicionales
Los experimentos realizados por Xiaomi han mostrado resultados sorprendentes que desafían la sabiduría convencional en desarrollo de IA:
Te puede interesar:
- El aprendizaje del refuerzo ha superado notablemente al aprendizaje tradicional, utilizando un registro de datos de solo 38,000 elementos.
- Su modelo con 7B parámetros demostró una capacidad superior en argumentación, a pesar de ser mucho más pequeño que otros modelos competitivos que superan los 100B parámetros.
- La fuerza del modelo para generar procesos de argumentación explícitos en realidad redujo el rendimiento en un 3.4%.
Aunque la precisión del 64.5% es alta, sigue siendo inferior al 82.23% de referencia de expertos humanos. Esto indica que hay un amplio margen para mejoras.
Compromiso con el código abierto
La organización abraza la filosofía de innovación de Xiaomi. Los parámetros del modelo serán accesibles. Con este enfoque altruista, la compañía permite que desarrolladores e investigadores de todo el mundo expandan su innovación.
"Al abrir nuestros esfuerzos a la comunidad global de IA, buscamos acelerar el proceso hacia una verdadera comprensión inteligente del audio", expresó Lei Jun, fundador y CEO de Xiaomi. "Este es otro paso en nuestra misión de hacer que las tecnologías innovadoras sean accesibles para todos".
Para quienes estén interesados en experimentar con esta tecnología:
- Código de entrenamiento: Repositorio de Github
- Parámetro del modelo: Hugging Face
- Informe técnico: Arxiv
- Demostración interactiva: Pruébalo tú mismo
Este avance, cuando las funciones de Xiaomi KI se integren en su línea de productos, abarcará desde teléfonos inteligentes hasta productos de IoT para el hogar inteligente. Esto convierte a la empresa en un competidor serio en el ámbito global de la investigación en IA.
Gracias por confiar en nosotros y recuerda que puedes seguirnos en nuestras redes sociales tanto en nuestro grupo de ayuda en Telegram, Instagram ,Facebook y Twitter para estar al tanto de las últimas noticias y novedades de Xiaomi. Si tienes alguna consulta estaremos encantados de poder ayudarte.
Últimos lanzamientos de la semana en Xiaomi:

Xiaomi se posiciona en el tercer lugar del creciente mercado de tabletas en China

La solución al problema de Calock en Xiaomi HyperOS ya está aquí

Deja una respuesta