​La guerra entre USA y China por la IA está declarada

|

Alfredo barriga 2

Nada menos que cinco artículos en The Economist de esta semana están relacionados con revuelo causado por Deep Seek, una Startup China de inteligencia artificial generativa (competencia directa de Open IA) que es capaz de hacer lo mismo que las grandes USA a una fracción del costo.


La asunción del presidente Trump vino acompañado, el 22 de enero, de un rimbombante anuncio de un proyecto de Inteligencia Artificial llamado “Stargate”, auspiciado por Open IA, Oracle y un gran inversionista de las tecnologías japonés. Se trata de una inversión de hasta 500.000 millones de dólares (“la más grande inversión en IA de la historia”) en infraestructura para inteligencia artificial generativa. El anunció incluyó una ironía: “este dinero hubiese ido normalmente a China”. Detrás de esto hay una estrategia confesa por parte de Trump de ganarle a China la guerra por la IA, y la presunción de que lo crítico es la infraestructura y el dinero.


Pero solo cinco días después (27/1/2025) Deep Seek anuncia su producto, que – en resumen – es capaz de hacer lo mismo que las últimas versiones de IA de los líderes de Estados Unidos, pero a una fracción del costo.


Explico por qué.


El producto final de la inteligencia artificial generativa (co o Chat GPT) con el que trabajamos a nivel de usuario, necesita en su base un modelo de lenguaje largo (LLM o Large Language Modelling, por sus siglas en inglés). Esos modelos hay que entrenarlos. Para entrenarlos se requiere de muchos datos y de mucha capacidad de cómputo. La capacidad de cómputo consume mucha energía eléctrica. Y aquí está la parte más importante del costo: infraestructura de cómputo y energía eléctrica. En la medida en que el entrenamiento se pueda hacer con menos infraestructura de cómputo, el costo de energía es menor y el costo del entrenamiento – necesario para que salga, por ejemplo, ChatGPT como producto final – es más bajo.


Hasta ahora, a medida que los modelos de IA generativa se hacían más sofisticados, la respuesta a la mayor necesidad de cómputo era “más y mejores chips”. El principal ganador de este enfoque ha sido NVIDIA, cuyo valor en bolsa llegó a sobrepasar el billón de dólares, multiplicándose por diez en dos años. China estaba fuera de la cadena de suministros que provee NVIDIA, por una decisión política de Estados Unidos, que no quería que la tecnología de punta para IA pasara a su principal adversario geopolítico.


¿Qué hicieron los chinos? Reinventar la forma de usar los chips más antiguos – que no tenían el veto del Gobierno de Estados Unidos. Y fueron capaces hacer más con menos. Gracias a innovaciones marginales en vez de una gran innovación, el modelo de DeepSeek pudo crear los miles de millones de parámetros de la IA con menos de 3 millones de horas de chip, a un costo estimado de menos de 6 millones de dólares, aproximadamente una décima parte de la potencia informática y el gasto que se invirtieron en el sistema de Meta (llamado Llama 3.1.) El entrenamiento requirió solo 2.000 chips, mientras que Llama 3.1 usó 16.000. Y debido a las sanciones de Estados Unidos, los chips utilizados ni siquiera eran los más potentes.


En un instante, la euforia por la inteligencia artificial (IA) se convirtió en pánico. Desde que comenzaron las primeras operaciones el 27 de enero, el valor de mercado de Nvidia se desplomó un 17% en el día. Los precios de las acciones de Alphabet, Amazon y Microsoft (fuertemente involucrado en la IA generativa, y compradores principales de los productos de NVIDIDA) cayeron un 3%, un 1% y un 3%, respectivamente. En total, las empresas tecnológicas estadounidenses perdieron alrededor de 1 billón de dólares en valor. Los inversionistas están nerviosos respecto de sus inversiones: “pusimos todo ese dinero y ahora nos dicen que se puede hacer lo mismo por la décima parte del costo”…


Llama la atención que no se hagan la pregunta más obvia: “si los chinos pudieron hacerlo con chips más antiguos y baratos ¿Por qué no podrían hacer lo mismo empresas no chinas? Se podría esperar que la primera empresa no china en levantar la mano diciendo “yo lo tengo” se estaría llevando el dinero que huyó de NVIDIA.


La noticia – totalmente en desarrollo – ofrece más preguntas que respuestas. Hay razones de fondo para que los Estados Unidos no quieran compartir su tecnología de IA con países adversarios. La IA es hoy comparable con lo que fue la bomba atómica, y ningún país le pasaría los detalles técnicos de su bomba atómica a un país adversario. Hay acusaciones de hackeo de propiedad intelectual por parte de los chinos. Pero también hay que decirlo con todas sus letras: el supuesto rezago de China respecto de Estados Unidos en materia de Inteligencia Artificial no es ni de lejos el que se suponía. Algunos autores lo fijan en semanas.


Las repercusiones económicas y políticas también son muy potentes. Trump puede usar como arma comercial el obligar a usar tecnología norteamericana para IA. Y el tiro puede salirle por la culata y terminar con más países colgados a la IA China, más barata. O puede salir la versión USA de DeepSeek, en cuyo caso se refuerza la estrategia de Trump.


En cualquier caso, la guerra está declarada, y no es con ejércitos ni cañones.


Alfredo Barriga

Profesor UDP

europapress