IA, piratería y minería de datos: el debate que Chile está confundiendo

|

Francisco Pinochet C.

La demanda presentada en Estados Unidos contra Meta y Mark Zuckerberg por el supuesto uso de millones de libros pirateados para entrenar modelos de inteligencia artificial ha generado alarma en Chile. No solo por la magnitud del caso, sino porque coincidió con la discusión del proyecto de ley impulsado por el Gobierno que busca incorporar excepciones de minería de datos y textos a la Ley de Propiedad Intelectual. Sin embargo, ambas cuestiones -aunque relacionadas- no son jurídicamente equivalentes. Y confundirlas puede llevar a un debate profundamente equivocado.


Según las informaciones aparecidas en la prensa, se ha tendido a conectar el litigio estadounidense con el proyecto chileno sobre minería de datos. Pero ambos fenómenos responden a problemas normativos distintos: por una parte, la utilización ilícita de obras obtenidas mediante piratería; y por otra, la posibilidad de permitir legalmente ciertos usos automatizados de obras lícitamente accesibles para fines de análisis computacional o entrenamiento algorítmico.


La demanda contra Meta no se funda únicamente en que una IA haya “aprendido” de libros protegidos por derechos de autor. Lo verdaderamente explosivo del caso es la acusación de que esos libros habrían sido obtenidos desde repositorios piratas, sin licencia, sin autorización y fuera de cualquier marco legal de acceso. Es decir, el problema central no es la minería de datos, sino la apropiación ilícita del corpus utilizado para entrenar el modelo.


Eso importa mucho aclararlo, porque la minería de textos y datos (text and data mining) es una institución jurídica que ya existe en varias legislaciones comparadas. La Unión Europea la incorporó expresamente en su Directiva sobre Derechos de Autor en el Mercado Único Digital. Japón posee excepciones particularmente amplias para entrenamiento de IA. Incluso en Estados Unidos, donde domina la doctrina del fair use, la discusión no gira tanto en torno a la posibilidad abstracta de analizar obras mediante algoritmos, sino sobre las condiciones de acceso, la trazabilidad y el eventual impacto económico en los titulares de derechos.


En otras palabras: no es lo mismo entrenar un modelo utilizando bases de datos adquiridas legalmente, bibliotecas autorizadas o contenidos accesibles bajo determinadas excepciones, que descargar millones de libros pirateados desde sitios clandestinos y utilizarlos masivamente para fines comerciales.


El problema chileno, entonces, exige más sofisticación que consignas binarias del tipo “IA versus propiedad intelectual”. El verdadero desafío consiste en distinguir entre acceso ilícito y uso analítico legítimo.


Esa distinción parece haberse desdibujado también en el debate legislativo chileno. De hecho, la Comisión de Hacienda de la Cámara de Diputados rechazó la norma del proyecto de reconstrucción que permitía minería de datos y entrenamiento de IA sobre obras protegidas sin autorización de sus autores. Sin embargo, parte importante de la discusión pública pareció construirse sobre una premisa equívoca: equiparar minería de datos con piratería digital. No es lo mismo descargar clandestinamente millones de libros desde repositorios ilegales que permitir el análisis automatizado de contenidos lícitamente accesibles en Internet. La disponibilidad pública de una obra no elimina su protección autoral, pero sí modifica radicalmente el problema jurídico en discusión: ya no se trata necesariamente de acceso ilícito, sino de determinar bajo qué condiciones puede realizarse un uso computacional legítimo de dicha información.


 La minería de datos no implica necesariamente una reproducción sustitutiva de la obra. Muchas veces el sistema no “lee” un libro como lo hace una persona, sino que extrae patrones estadísticos, relaciones semánticas o correlaciones lingüísticas. El debate jurídico moderno ya no se centra únicamente en si existe una copia técnica transitoria, sino en si ese proceso afecta realmente el mercado de explotación de la obra o vulnera injustificadamente los intereses del autor.


Por eso el proyecto chileno no debería discutirse bajo el pánico moral generado por el caso Meta. La pregunta correcta no es si la inteligencia artificial debe poder analizar obras protegidas, porque de hecho ya lo hace en todo el mundo. La pregunta relevante es otra: bajo qué condiciones, con qué transparencia, con qué mecanismos de exclusión (opt-out), con qué obligaciones de trazabilidad y con qué sistemas de compensación.


Aquí aparece un punto especialmente novedoso. Durante décadas, el derecho de autor fue pensado para controlar actos humanos de reproducción y distribución. Pero la IA introduce un fenómeno distinto: el consumo industrializado de información cultural por sistemas autónomos capaces de reutilizar patrones a una escala imposible para cualquier persona.

Eso obliga a abandonar ciertas categorías clásicas. No toda utilización algorítmica equivale a piratería. Pero tampoco puede aceptarse una extracción masiva opaca de contenidos sin reglas claras.


El riesgo de sobrerreacción regulatoria es real. Si Chile prohíbe o restringe excesivamente la minería de datos, podría terminar aislando su ecosistema tecnológico y académico respecto de estándares internacionales. Pero el riesgo inverso también existe: crear excepciones tan amplias y ambiguas que terminen vaciando de contenido práctico la protección patrimonial de autores y editoriales.


Por eso la discusión seria no pasa por demonizar la inteligencia artificial ni por caricaturizar a las editoriales como enemigas de la innovación. Lo que corresponde es construir un sistema equilibrado, donde la innovación tecnológica pueda desarrollarse sin convertir el patrimonio cultural en una zona de extracción gratuita y sin control.


La paradoja es evidente: probablemente ninguna gran IA contemporánea habría podido desarrollarse sin alimentarse masivamente de obras humanas preexistentes. Pero precisamente por eso, mientras más valiosa se vuelve la inteligencia artificial, más importante será definir cómo se protege -y cómo se remunera- el trabajo intelectual que la hizo posible.


Francisco José Pinochet Cantwell

Doctor en Derecho

Universidad Nacional de Rosario, Argentina 

LL.M California Western School of Law, USA

europapress