Microsoft ha dado un paso clave en el desarrollo de inteligencia artificial al presentar sus dos primeros modelos propios: MAI-Voice-1 y MAI-1-preview
Con esto, Microsoft busca crear una gama de soluciones especializadas capaces de adaptarse a distintos usos y generar un “valor inmenso” para los usuarios.
El primero, MAI-Voice-1, es un modelo de voz diseñado para producir audio expresivo de alta fidelidad en menos de un segundo, con una duración de hasta un minuto y en escenarios de uno o varios hablantes.
Según la compañía, esta tecnología puede ejecutarse utilizando una sola GPU, lo que lo convierte en uno de los sistemas más eficientes de su categoría. Actualmente ya está disponible en Copilot Daily, Podcasts y Copilot Labs, donde se pueden probar funciones de narración y habla expresiva.
Por su parte, MAI-1-preview es un modelo interno de expertos entrenado con unas 15.000 GPU Nvidia H100, lo que le otorga potentes capacidades para seguir instrucciones y responder consultas cotidianas de forma más precisa.
Microsoft inició las pruebas públicas a través de la plataforma LMArena y planea liberar su versión preliminar en Copilot durante las próximas semanas, incorporando mejoras a partir de la retroalimentación de los usuarios y de un grupo de probadores de confianza.
Con estos lanzamientos, la empresa liderada por Satya Nadella refuerza su apuesta por una IA aplicada como plataforma, enfocada en productos confiables y capaces de comprender las necesidades únicas de cada persona.
Microsoft subraya que su objetivo es “orquestar una familia de modelos especializados” que respondan a diferentes casos de uso, consolidando la inteligencia artificial como “la puerta de entrada a un universo de conocimiento”.