xAI lanza Grok 4.1 con menos alucinaciones y mejoras en la comprensión emocional y empatía

|

El nuevo modelo Grok 4.1 de xAI.

xAI ha lanzado la nueva versión de su modelo de inteligencia artificial (IA) Grok 4.1, que incluye mejoras en sus capacidades de inteligencia conversacional y comprensión emocional, así como asegura una mayor velocidad de respuesta y reduce las probabilidades de sufrir alucinaciones.



Tras el lanzamiento de Grok 4 en julio de este año, la compañía dirigida por Elon Musk ha actualizado el modelo que impulsa su 'chatbot' Grok a la versión 4.1, al que ha definido como un modelo de vanguardia que "establece un nuevo estándar" en comparación con el resto de sus modelos antecesores.



En este sentido, xAI ha subrayado que Grok 4.1 está disponible con "mejoras significativas" para su usabilidad en el mundo real, dado que ofrece resultados de alta calidad en interacciones creativas, emocionales y colaborativas, mostrando así una mayor inteligencia conversacional.



Concretamente, la compañía ha detallado que sobresale al disponer de una mayor inteligencia emocional, empatía y habilidades interpersonales, que se reflejan en una puntuación de 1.586 en las pruebas EQ-Bench.



Como ha explicado en un comunicado en su web, esto se traduce en que las respuestas impulsadas por este modelo muestras "intenciones matizadas" y son más convincentes y coherentes en personalidad. Al mismo tiempo, xAI asegura que conserva "la inteligencia y confiabilidad" de sus predecesores.



Para mejorar estos aspectos del modelo, la compañía ha utilizado la misma infraestructura de aprendizaje por refuerzo que ya emplearon para el entrenamiento de Grok 4, sin embargo, han optimizado el estilo, la personalidad, la utilidad y la alineación del modelo, mediante otros modelos de razonamiento agentivo como modelos de recompensa para evaluar de forma autónoma las respuestas a escala.



Además de todo ello, xAI también ha subrayado que Grok 4.1 alcanza mayor velocidad y ofrece mejores resultados en escritura. Sobre todo, en escritura creativa, con una mejora notable de 600 puntos con respecto al modelo antecesor en las pruebas Elo.



Igualmente, es el modelo "con menor margen de error hasta la fecha", ya que se ha reducido en tres veces las probabilidades de provocar alucinaciones, comparado con modelos anteriores. Esto se debe a que, tras el entrenamiento de Grok 4.1, la compañía ha reducido las alucinaciones fácticas para las solicitudes de búsqueda de información.



Como resultado, "hemos observado reducciones significativas en la tasa de alucinaciones para las solicitudes de búsqueda de información de producción muestreadas", han detallado desde xAI.



Con todo, en las pruebas previas al lanzamiento, donde Grok 4.1 se puso a disposición de un grupo reducido de usuario, xAI asegura que el 65 por ciento de los usuarios prefirió las respuestas del modelo actualizado, en comparación con las versiones anteriores.



Ahora, Grok 4.1 ya está disponible para todos los usuarios en la web, a través de la red social X y en las aplicaciones para iOS y Android. Así, aunque se está implementando en modo automático, se puede seleccionar como Grok 4.1 en el selector de modelos.




europapress