Microsoft va realizar "inversiones significativas" para mejorar su capacidad informática con el objetivo de entrenar sus propios modelos de inteligencia artificial, aunque no descarta recurrir a modelos de otras empresas "cuando sea necesario".
La compañía tecnológica presentó a finales de agosto sus dos primeros modelos de IA: MAI-Voice-1, para la generación de audio de alta fidelidad con uno o varios oradores, y MAI-1-preview, un modelo interno de expertos diseñado para "seguir instrucciones y proporcionar respuestas útiles a consultas cotidianas".
Entonces, Microsoft aseguró que pretendía "orquestar" una gama de modelos especializados que satisfagan diferentes casos de uso de los usuarios para generar un valor "inmenso". En esta línea, el director ejecutivo de Microsoft AI, Mustafa Suleyman, ha señalado que están invirtiendo en la capacidad informática necesaria para desarrollar modelos fronterizos propios.
En una asamblea de trabajadores celebrada este jueves, Suleyman indicó que Microsoft debería "tener la capacidad de desarrollar internamente modelos fronterizos de clase mundial de todos los tamaños", pero también matizó que debían ser pragmáticos y " usar otros modelos cuando sea necesario", según recogen en The Verge.
En esta línea, Microsoft realizará "inversiones significativas" en su clúster, para ampliar la capacidad informática. MAI-1-preview ha sido preentrenado y postentrenado con aproximadamente unas 15.000 GPU Nvidia H100, "un clúster diminuto en el panorama general", según el directivo, en tanto que empresas como Meta, Google y xAI emplean clústeres entre seis y diez veces más grandes.
Recientemente, se ha sabido que Microsoft está planeando usar modelos de Anthropic para mejorar algunas las funciones de Copilot que ofrece en sus herramientas de Office 365, que actualmente están impulsadas por modelos de OpenAI.
A esta situación se une la renegociación del acuerdo que Microsoft mantiene con OpenAI desde 2019, cuando se pusieron en marcha nuevas capacidades de computación en Azure para entrenar modelos de gran tamaño (LLM) y para acelerar el avance de la IA, que permitieron la aparición de ChatGPT.