Alibaba presenta los modelos Qwen3, con capacidades de agente y modo de pensamiento

|

Recurso de los modelos Qwen3


Alibaba ha presentado la tercera generación de sus modelos de inteligencia artificial Qwen, que introducen un nuevo modo de pensamiento, para las cuestiones que requieren un razonamiento más profundo, y están optimizados con capacidades de agente.



La nueva familia Qwen 3 está liderada por el modelo insignia Qwen3-235B-A22B, que ofrece un rendimiento en línea con DeepSeek-R1, OpenAI o1 y o3-mini, Grok-3 y Gemini-2.5-Pro, también en tareas más concretas en programación y matemáticas.



Este modelo cuenta con 235.000 millones de parámetros, de ellos 22.000 millones de parámetros activados, como ha detallado la compañía tecnológica en GitHub. También tiene otro modelo más pequeño, Qwen3-30B-A3B, con 30.000 millones de parámetros y 3.000 millones de parámetros activados.



Los dos modelos se han desarrollado con arquitectura Mixture of Experts (MoE), que tiene la capacidad de dividir un modelo de IA en pequeñas redes neuronales para que actúen de forma separada como si fueran distintos expertos. Hace que las tareas se realicen de manera más eficaz, al activar las redes de manera selectiva dependiendo del tipo de información introducida.



Alibaba ha apuntado que los modelos Qwen 3 introducen un modo de pensamiento híbrido para la resolución de problemas. Con él, razonan paso a paso su respuesta, para lo que tardan más tiempo en ofrecerla. También cuentan con un modo sin pensamiento, más rápido, para preguntas simples.



La compañía los ha preentrenado con 36 billones de tokens que abarcan 119 idiomas y dialectos, a partir de datos de la web y de documentos en pdf, de los que se extrajo información con el apoyo de los modelos Qwen 2.5, que también ayudaron a aumentar la cantidad de datos en matemáticos y programación. También han sido optimizados para la programación y las capacidades de agente.





europapress