Apple ha compartido una base de datos con 400.000 imágenes seleccionadas para facilitar la investigación y entrenar modelos de generación de imágenes a gran escala y con contenidos de alta calidad.
Pico-Banana-400K es el nombre que recibe el conjunto de datos que ha compartido Apple, que está disponible sin licencia comercial en GitHub para la investigación y que se ha creado atendiendo a la calidad y la diversidad de las imágenes.
En concreto, Pico-Banana-400K contiene 400.000 imágenes seleccionadas, en las que Apple ha usado Nano Banana (Gemini 2.5 Flash Image) para generar diversos pares de edición a partir de fotografías reales procedentes de OpenImages.
Estas imágenes abarcan 35 tipos de edición en ocho categorías semánticas con el objetivo de cubrir "varias transformaciones, desde ajustes de color de bajo nivel hasta objetos de alto nivel, escenas y ediciones estilísticas", como se explica en el repositorio de GitHub.
La finalidad de esta base de datos es entrenar modelos de generación de imágenes guiados por texto, avanzando en las limitaciones actuales, como "la ausencia de conjuntos de datos a gran escala, de alta calidad y de acceso abierto creados a partir de imágenes reales", como se indica en el texto de la investigación que lo acompaña, publicado en ArXiv.