Recreando la Protohistoria con IA. Yo no he podido

Compartir


Estamos normalizando utilizar imágenes creadas por modelos IA y tengo que decir que, a priori, no me parecía una mala idea. Lo que ya no me gusta tanto es que tendemos a pensar, falsamente, que un modelo de inteligencia artificial es capaz de hacer absolutamente TODO lo que le pidamos y además, solemos aceptar que lo que nos devuelve es algo correcto.

Creo que ahí está el origen de esta cuestión. Cuando dejamos que la IA invente y le soltamos las riendas para que cree, es capaz de abrirnos mundos fantásticos de un realismo increible. Incluso si le pides que recree una escena cualquiera en tu ciudad, seguramente sea capaz de hacerlo de forma correcta. Es lógico, llevan años nutriéndose de imágenes reales de eso que recrean. No de descripciones introducidas en una interface de texto, no de nuestras palabras, sino de imágenes reales que son capaces de replicar, o mejor aún diseccionar en partes con las que luego componer lo que les pidamos.

Pero cuando le pedimos que nos devuelva una realidad que no sea la actual ¿Es igual de buena? Mi opinión es que no.

Las causas pueden ser diversas. La más importante es que no hay imágenes de la Edad del Hierro, por ejemplo, con la que podamos alimentar al algoritmo. Es más, aun si las tuviéramos, la IA mantiene un sesgo que la empuja a ofrecernos un realismo alterado por su necesidad de crear algo cotidiano para nosotros, es decir, algo contemporáneo, y no entiende que es algo más complejo. Los humanos tenemos un concepto de cotidianeidad que va cambiando con el tiempo. Le faltan «recuerdos», o experiencia si queréis.

La respuesta a esta cuestión es compleja porque la realidad lo es en sí misma. Y además, cuando tratamos de recrear una realidad pasada, de la que sólo tenemos fragmentos de información, la cosa se complica aún más. En la dialéctica entre nuestra mente, con el conocimiento adquirido a través de la arqueología, fuentes, etc… y el modelo matemático que quiere complacernos a cualquier precio, el desacuerdo es casi una consecuencia previsible.

La escena de la madre y la niña tejiendo.

Los que me leéis ya habéis visto la imagen que os añado abajo. Es el resultado de un experimento; recrear una escena cotidiana de la Edad del Hierro. Una mujer y una niña haciendo tareas textiles para hacer la portada del episodio 29 de mi podcast.

A priori no es algo complicado. Sabemos cosas como el tipo de vivienda que podían tener (paredes curvas con manteado de barro), vestimenta de la Edad del Hierro, telares, lana de ovejas autóctonas….) A eso podemos darle un aspecto hiper realista, o fotográfico, controlando el tipo de luz de un día concreto, mañana, tarde, tipo de lente de la cámara que supuestamente capte la imagen, etc…

Recreación a través de IA de escena de madre e hija realizando tareas textiles en un castro astur de la Edad del Hierro. Tiene muchos errores históricos.
Recreación a través de IA de escena de madre e hija realizando tareas textiles en un castro astur de la Edad del Hierro.

Aunque parece gran cosa, realmente eso es sólo una pequeña parte de la información. Una escena de la vida cotidiana tanto de un momento del pasado como de uno actual requeriría una descripción escrita con tantos detalles que harían que tuviera una extensión insólitamente grande ¿Os acordáis de lo de que una imágen vale más que mil palabras? En el caso de la IA es totalmente cierto.

Si no proprocionas todos esos factores en la descripción, la IA lo rellena con algo que podríamos definir como «lo que creo que le va a gustar al humano»… y eso es un desastre porque no tienen información contextual.

Para esta escena utilicé varios modelos gratuitos y de pago; Dall-E, Grok, inlcuso Claude para que me ayudara a elaborar prompts para otras IA, Gémini… por cierto, descarté esta última porque era fantasía pura. Esa imagen en la última de una serie de unas 20 en la que le apliqué correcciones a la casa, la vestimenta, la textura de la madera, las fíbulas, etc…

¿Os fijáis que la fíbula no sujeta nada? Es algo absurdo, pero no creí que fuera necesario decirle que la fíbula tenía que sujetar dos partes de un vestido, porque doy por hecho que el modelo sabe averiguar qué es y para qué vale una fíbula… Por no hablar de las tipologías (sólo dije anular hispánica, y más o menos pudo resolverlo)…

Sabiendo que tenía fallos la subí a redes sociales. Quería hacer un experimento. Si yo subo una imagen creada con IA (siempre hay que avisar que se emplea) podéis pensar que soy un interlocutor válido y que esa imagen es correcta…. y no lo es. De hecho, me comentaron precisamente eso, que si yo no aviso de que está mal, mucha gente va a pensar que es correcta y estoy tergiversando el discurso histórico… error mío, pido disculpas.

Y es que ahí está el problema.

Nos creemos las imágenes hechas por IA y eso es un peligro

Versión intermedia de la escena. Se acumulaban los fallos en cuanto a las texturas, modelos de pesos del telar, etc... Cada cambio generaba diez errores más
Versión intermedia de la escena. Se acumulaban los fallos en cuanto a las texturas, modelos de pesos del telar, etc… Cada cambio generaba diez errores más

La IA está revolucionando la arqueología, la epigrafía y otra serie de disciplinas que nos sirven para conocer la historia, pero en divulgación todavía nos juega malas pasadas. La generación con IA de imágenes para divulgación histórica es una herramienta prometedora y también es un problema. Está quedando demostrado que no es necesariamente por falta de conocimiento de la persona que las elabora como sucede en el Museo de Valladolid en esta exposición temporal que está dando que hablar en la prensa.

En la escena de la mujer y la niña me di cuenta de que en la descripción que yo hacía de la escena había detalles tan sutiles que, aparentemente, podían entrar en contradicción con otras partes de la instrucción. De hecho, no cuestiono la capacidad de la máquina para generar la imagen sino mi propia capacidad de hacer una descripción tan completa que siguiendo las instrucciones ella sea capaz de hacerlo.

También que incluso dando por hecho que una imagen está bien, no tengo todo el conocimiento necesario como para hacerla 100% correcta como pusieron de manifiesto las correcciones que me hicieron quienes sí saben.

Uno de los problemas que detecté era tratar de generar la imagen en conjunto así que opté por hacerlo de forma separada. Fondo, personas, telar, etc... este es uno de los pasos intermedios del fondo de la escena, que luego desheché.
Uno de los problemas que detecté era tratar de generar la imagen en conjunto así que opté por hacerlo de forma separada. Fondo, personas, telar, etc… este es uno de los pasos intermedios del fondo de la escena, que luego desheché.

Aún así soy indulgente conmigo mismo. La realidad subyacente a algo tan sencillo como una escena de una madre y una hija realizando tareas textiles en un momento del pasado, es tan compleja, que es difícil de expresar en su totalidad y la IA es un cerebro digital de un niño que dibuja bien pero que no tiene una formación académica en historia o arqueología y que además hace gala de una cierta «cabezonería» en cuanto a lo que cree que nos va a gustar.

La segunda parte de mi experimento era saber vuestras opiniones y publicar a posteriori una imagen bien hecha. Para ello consulté con arqueólogos e ilustradores (ellos y ellas) que me dieron correcciones sobre la primera imagen. Empleé varias IAs de nuevo para hacerla y mi sorpresa fue que, incluso afinando en algunos detalles el resultado es igual de erróneo que el primero. Creo que uno de los grandes problemas de la IA es que con cada instrucción algo se nos escapa… y lo cambia.

Curiosamente, en algún momento la respuesta de la IA incluso fue que quizá era mejor que usara un programa de ilustración y diseño… se ve que desesperé un poco al algoritmo 😀

Existe una responsabilidad

Volvamos al porcentaje de veracidad de la imagen. Si no soy capaz de darle a la máquina el 100% de las instrucciones para que lo que quiero hacer sea verídico y el modelo tiene serias dificultades en evitar los errores que menciono arriba ¿Es correcto utilizarlas en instituciones como los museos? Pues es evidente que no.

Entonces, si no contratamos a un mal ilustrador para un trabajo académico, ¿Por qué usamos un algoritmo que no está hecho para ello? Efectivamente, tú lo has dicho, por dinero.

El trabajo de un ilustrador, o la asesoría histórica de un especialista, es (o debería ser) remunerado, porque es eso, un trabajo. Es la tarea de alguien que es capaz de convertir en una imagen lo que de otra manera otros sólo podemos imaginar o describir torpemente escribiendo o en un pódcast. Lo que proporciona esa habilidad a una institución como un museo, revierte en un beneficio para toda la sociedad, a través de la difusión del conocimiento. Pero esa institución tiene que ofrecer una información verídica, al menos al nivel de conocimiento histórico que tenemos actualmente.

Una imagen generada por IA es gratis, o como mucho cuesta una suscripción mensual a uno de los modelos y unas cuantas horas delante de la pantalla. Es un caso evidente de sustitución de un trabajador por un algoritmo y además se hace con dinero público. Demencial ¿no?

Versión final. Tras un montón de horas (demasiadas) desistí en este punto. Detecté varias anomalías a la hora de ir avanzando como la excesiva texturización de las superficies con cada cambio y que las facciones de la madre iban cambiando sin sentido... la IA iba por libre con cada modificación.
Versión final. Tras un montón de horas (demasiadas) desistí en este punto. Detecté varias anomalías a la hora de ir avanzando como la excesiva texturización de las superficies con cada cambio y que las facciones de la madre iban cambiando sin sentido… la IA iba por libre con cada modificación.

No estoy en contra de la IA para nada. Creo que podemos usarla de mil maneras creativas, sobre todo como ayuda a la hora de realizar tareas más complejas, algo que ya se está haciendo y está llevando los trabajos a otro nivel; iluminación, efectos de hiper realismo fotográfico, o quizá otra serie de procesos que aligeren la carga técnica y dejen más espacio a la creativa. Incluso como creación del marco sobre el que luego trabajar, composición de escenas, etc…

Pero no podemos conformarnos con aproximarnos a la veracidad histórica por las limitaciones que nos imponga un algoritmo o un presupuesto. Evidentemente no en los museos, ni tampoco en la divulgación histórica bien hecha. Disculpad mi escepticismo, pero si no mantenemos el nivel de exigencia acabaremos cayendo en la trampa de que todo vale, algo que, en muchos sentidos, es mucho más peligroso de lo que imaginamos.

Astures
Astureshttps://astures.es/proyecto/
Me apasiona la historia de Asturias y los astures en todas sus facetas. Pateando museos y yacimientos. Excavando cuando puedo y divulgando como mejor sé.

Hablamos de

Ver todos los posts