DeepSeek lanza DSpark, un nuevo marco de trabajo que acelera la velocidad de respuesta de la IA entre el 57 y el 85%

|

El laboratorio de Inteligencia Artificial (IA) detrás de DeepSeek ha lanzado en código abierto DSpark, un nuevo marco de trabajo 'framework' diseñado para acelerar la velocidad de inferencia, es decir, el tiempo de respuesta, de los modelos de lenguaje grande (LLMs) entre un 57 y un 85 por ciento.



Lanzado durante este fin de semana, DSpark es un sistema con licencia MIT diseñado para que los LLMs respondan más rápido y sin alterar el contenido o la calidad de las respuestas del modelo.



Este sistema responde a un sector en el que los LLMs más conocidos como ChatGPT, Claude o Gemini basan su funcionamiento en la generación de texto palabra por palabra, lo que se conoce como 'token' por 'token'. Si bien, esto logra que el resultado sea más preciso, también hace que todo el proceso sea más lento.



En cambio, DSpark de DeepSeek utiliza una técnica conocida como decodificación especulativa. Su funcionamiento se asemeja al de una especie de "explorador" que se adelanta para adivinar las palabras siguientes y, con ello, aumentar la velocidad de respuesta.



Esto consigue que el LLM revise y valide bloques enteros de texto a la vez, en vez de esperar a que el sistema apruebe cada palabra o 'token' antes de pasar al siguiente bloque, como sucede con los LLMs tradicionales, que suelen generar cuellos de botella y ralentizar la respuesta.



En las pruebas reales llevadas a cabo con DeepSeek, DSpark ha logrado un aumento de velocidad por usuario de entre el 60 y el 85 por ciento al integrarlo en DeepSeek-V4-Flash. Por su parte, en DeepSeek-V4-Pro, el modelo frontera de la firma china, llegó a alcanzar una aceleración de entre el 57 y el 78 por ciento.



De hecho, en situaciones de alta saturación del servidor (por una gran demanda de procesado), la capacidad de procesamiento total llegó a multiplicarse entre 4 y 6 veces en comparación con su sistema anterior.



DeepSeek ha publicado estos resultados en un documento técnico, y a través de DeepSpec, un código fuente que se encarga de entrenar y evaluar sistemas de decodificación especulativa. DSpark está disponible en el GitHub de DeepSeek y en las páginas de Hugging Face, con lo que ya se puede usar por parte de desarrolladores, investigadores o empresas.



Mientras los laboratorios de IA occidentales buscan ampliar las capacidades de sus LLMs con el despliegue de macrocentros de datos, como está haciendo Meta con centros de datos como Hyperion, la estrategia de la china DeepSeek se centra en la optimización del 'software' para resolver el desafío económico de la velocidad, al hacer que la IA responda más rápido sin que los costes de los servidores hagan inviable el negocio.



Cabe destacar que el nuevo marco de trabajo de DeepSeek no limita su uso a los modelos de la propia firma sino que, gracias a la publicación de los puntos de control, cubre otras familias de modelos abiertos como Qwen (de Alibaba) o Gemma, de Google.



Los que se quedan fuera de juego, de momento, son los modelos comerciales como los de Anthropic o de OpenAI que se conectan a través de una API. Para que funcione DSpark necesita acceso absoluto al sistema de inferencia de los mismos.




europapress