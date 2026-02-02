



Querido Arthur Mensch, querido Guillaume Lample,

Usted cofundó Mistral AI y es genial. Francia y Europa realmente necesitaban sacar un campeón de la IA contra los pesos pesados ​​de Silicon Valley. Sólo podemos alegrarnos por esto.





Pero en su prisa por triunfar, descuidó un detalle: pagar a los autores y editores de los libros que utiliza. Una investigación de Mediapart publicada el 22 de diciembre revela que Guillaume Lample, director científico de Mistral AI, que anteriormente trabajó en Meta, suplicó y actuó antes de partir hacia Meta para entrenar su modelo de IA generativa, LLaMA, basado en millones de libros recopilados por Library Genesis (LibGen), un sitio web pirata.





“Documentos públicos demuestran que el investigador y empresario inició el hackeo de varias decenas de terabytes (TB, o mil gigabytes) de datos”concluyen los periodistas Clément Pouré y Soizic Pénicaud. “Todo el mundo usa LibGen”escribió Lampe en un mensaje interno de la empresa. “Eso es lo queIA abierta hecho con GPT3lo que hace Google con (el LLM) Palm, lo que hace DeepMind con Chinchilla. Entonces vamos a hacer eso también. »





Las IA usan nuestros libros gratis





Como autor y editor de libros pirateados por LibGen, estoy en buena posición para saber que un solo libro representa cientos, a veces miles, de horas de trabajo intelectual y editorial, y de riesgo financiero. La publicación de libros de conocimiento es económicamente frágil: está siendo erosionada por la disminución del número de lectores importantes, el tiempo que consumen las redes sociales y otros fenómenos, incluido el aumento del poder de la IA. IA que, por tanto, explotan nuestros libros de forma gratuita.





Según la investigación de Mediapart, es más que probable que el Sr. Lample haya hecho que Mistral AI se beneficiara de LibGen. Esta es también la convicción de los equipos Meta y otros jugadores de IA. Desde el verano de 2024, la normativa europea exige que las empresas de IA generativa publiquen los datos de entrenamiento utilizados en sus modelos. Mistral no cumple con esto.





Si no hubiera usado LibGen, sería fácil decir…









Estamos en Francia, sujetos a la ley francesa. Mistral es francés y está financiado en parte por los poderes públicos. No puede comportarse como piratas americanos.





Usted se presenta como un socio europeo, soberano y de confianza. Haces todo lo posible para parecer el “lindo” de la historia. No puedes permitirte esto.





Entonces haz lo correcto. No den la espalda, no esperen a que los autores se movilicen y se manifiesten frente a sus oficinas: compensen amistosamente a los titulares de derechos franceses. No en cinco o diez años, cuando los tribunales te obligan a hacerlo, sino rápidamente.