La familia de modelos de inteligencia artificial abierto Gemma se ha ampliado con Gemma 3n, diseñado para funcionar de manera fluida en tabletas, 'smartphones' y ordenadores portátiles y ofrecer experiencias de inteligencia artificial (IA) de manera rápida y con un bajo consumo.
Gemma 3 se presentó en marzo como un modelo de IA abierto "más capaz", que puede ejecutarse en una sola GPU, lo que ha permitido desarrollar una nueva versión del modelo para los dispositivos del día a día.
Gemma 3n incluye la ene en su nombre por su vinculación directa con Gemini Nano. En concreto, utiliza la misma arquitectura avanzada presente en ese otro modelo de Google, que está optimizada para la IA multimodal eficiente en el dispositivo, como explica la compañía en su blog oficial.
Pero realiza un menor uso de la RAM con una innovación tomada directamente de Google DeepMind, llamada Incrustaciones por Capa (PLE). Gracias a ello puede ejecutarse en dispositivos con 2GB de RAM.
El nuevo modelo comprende y procesa audio, texto, vídeo e imágenes, y próximamente admitirá entradas multimodales complejas. Se ejecuta en local ,lo que ayuda a mantener la privacidad del usuario y el permite trabajar incluso sin conexión, y mejora las capacidades multilingües en los idiomas español, francés, japonés, alemán y coreano.
Con sus capacidades, los desarrolladores podrán diseñar nuevas experiencias para tabletas, 'smartphones' y ordenadores de Android y ChromeOS que aprovechen las señales visuales y auditivas del entorno del usuario para introducir nuevas interacciones con las aplicaciones. Por ejemplo, apuntar con la cámara a un elemento y preguntar por lo que se ve, traducir el cartel de un evento o crear una notificación a partir de un texto escrito en un folio.
En comparación con Gemma 3 de 4.000 millones de parámetros, Gemma 3n responde un 1,5 veces más rápido en dispositivos móviles, ya que se ha optimizado con el apoyo de los fabricantes de chips.
Gemma 3n tiene 4.000 millones de parámetros, pero incluye un submodelo más pequeño, de 2.000 millones, que permite elegir de manera dinámica el pico de calidad, la velocidad y el rendimiento, con la misma huella de memoria y con un solo modelo.