El año de la pandemia sin pandemia, 2022, pasará a la historia por la guerra entre Rusia y Ucrania, la absurda compra de Twitter por Elon Musk y el boom, además del auge y la popularización masiva de los programas de inteligencia artificial —IA— para generar arte plástico, escritos literarios, poéticos y periodísticos, diseños arquitectónicos y de interiores, así como composiciones musicales, soluciones matemáticas, códigos computacionales y muchas otras cosas, a partir de inmensas bases de datos. Con una velocidad asombrosa, quizá sin precedente para una tecnología, la IA generativa de contenidos artísticos o creativos se ha perfeccionado y abierto a millones de usuarios en unos cuantos meses, poniendo en evidencia dilemas en torno a la situación del artista y la creación en una sociedad altamente digitalizada.
La masificación de estos algoritmos comenzó en 2021 con la empresa OpenAI, de San Francisco (establecida en 2015 con Elon Musk entre sus fundadores, aunque en 2018 renunció a la junta), y su lanzamiento del modelo de aprendizaje profundo DALL-E, que permite crear imágenes a partir de descripciones literales, de un prompt (una instrucción), con base en más de doce mil millones de referencias. Es decir que basta teclear una idea de lo que se desea ver —por ejemplo: “Un pato cargando una espada en un estanque al estilo de Monet”— y en segundos aparece una sorprendente y a veces acertada interpretación visual de la misma. El al-goritmo crea un pato a partir de millones de imágenes de patos para relacionarlo con la de una espada, un estanque y la pintura de Monet, y el resultado siempre será diferente. Al principio el acceso a esta plataforma estaba limitado exclusivamente a alrededor de doscientos artistas, investigadores y algunos usuarios de confianza; pronto se abrió a cualquier cibernauta con cuentas gratuitas y de paga.
Este proceso de generación de imágenes se deriva de los recientes avances de IA en la generación de textos, una tecnología que data por lo menos de la aparición del bot conversador o chatbot ELIZA en 1966. Los algoritmos actualmente son entrenados con cantidades enormes de textos, sacados de todo tipo de obras (literatura, documentos, manuales, instructivos, recetas y cualquier otra cosa) para que identifiquen patrones estadísticos y luego generen textos convincentes por imitación y derivación a partir de una frase inicial.
A OpenAI se le debe también ChatGPT (Generative Pre-Trained Transformer), una red neuronal profunda generadora de texto, lanzada al mundo en el mes de noviembre de 2022, que es un convincente chatbot y el impresionante sistema de lenguaje natural GPT3, capaz de escribir, debatir y crear código computacional entre otras cosas, que ha sido entrenado con cerca de mil millones de palabras sacadas de internet y de millones de libros digitalizados.
El enorme éxito de DALL-E y las expectativas que creó llevaron a la empresa a lanzar DALL-E2 en septiembre del año pasado. Hoy más de un millón y medio de usuarios generan alrededor de dos millones de imágenes al día. Esto popularizó el uso de otros generadores que ya existían (como Artbreeder, Dream y NightCa-fe) y dio lugar al lanzamiento de otros más, incluso por empresas gigantes como Google (Imagen y Parti) y Meta (Make-a-Scene). El avance ha sido tan vertiginoso que aún no hemos terminado de digerir los progresos en el campo de generación de imágenes fijas bidimensionales 2D y ya se anuncian tres generadores de texto a video 3D: GET3D de Nvidia, DreamFusion (Google) y Make-A-Video (Meta).
Las creaciones de texto a imagen generadas por esta variante de IA son en esencia espejos estadísticos. Es arte hecho de la acumulación excesiva, inagotable, inasible e insondable que permiten los archivos digitales. Independientemente de su valor estético y su novedad, gran parte de las imágenes elaboradas con estos recursos son reciclamientos de iconos pop en circunstancias extrañas, rostros distorsionados, extremidades en posturas imposibles y una cacofonía de estilos artísticos. Quizá puedan ser consideradas en conjunto como un tipo de arte conceptual en sí mismo, como una forma estética que creará una corriente, un ismo del siglo XXI, en el que la idea generadora es en sí tan valiosa como la imagen. Pronto una parte del trabajo creativo consistirá en la escritura de las indicaciones (prompts) necesarias para obtener las imágenes deseadas.
REVOLUCIÓN O PLAGIO
Junto con DALL-E, los programas más usados y destacados que usan texto para generar imágenes son Stable Diffusion y Midjourney. Stable usa una base de datos llamada LAION-Aesthetics (Large-scale Artificial Intelligence Open Network), que ya almacena 5.6 mil millones de imágenes recopiladas de internet. Una versión anterior, LAION-400M resultó contener una abundancia de imágenes problemáticas: sexo violento, pornografía, estereotipos racistas y sexistas.
En un estudio de 12 millones de los más de 600 millones de imágenes de LAION se encontró que una gran parte de ellas proviene de sitios como Pinterest, Tumblr y páginas de vendedores de arte como Fine Art America y de ArtStation, a las que numerosos artistas suben sus portafolios. Esto da lugar a las dos acusaciones principales en contra de estos sistemas: que “roban el trabajo de los artistas” al no pagar ni pedir autorización para entrenar sus algoritmos; y que contribu-yen a una economía de depredación de datos, al usar información y creaciones ajenas de manera irresponsable. Una vez que estos algoritmos están en funcionamiento es muy difícil expurgar las obras de quienes se niegan a permitir que su trabajo sea usado para esos fines.
Desde luego, podemos aceptar que el uso ilícito de miles de millones de imágenes de internet es una violación a los derechos de los autores y artistas que exigen que sus obras sean retiradas de las bases de datos que alimentan estos sitios de IA, o bien que se les den regalías por el uso de su trabajo. Estas exigencias son lógicas y comprensibles, pero lamentablemente no son prácticas. Como señala Kevin Kelly,1 en el caso de artistas poco reconocidos o con una influencia no muy perceptible en la cultura visual contemporánea, nada cambiará si se retiran sus imágenes de una base de datos que contiene miles de millones de obras. Pero en el caso de artistas famosos, consumados y con gran influencia, si sus imágenes se retiran, tampoco cambiará casi nada debido a que su legado está presente de cualquier manera en la cultura y por tanto en la obra de sus seguidores e imitadores.
Ahora bien, dado que las IA usan miles de millones de obras para ser entrenadas, el simple concepto de dar regalías individuales se vuelve abstracto ya que serían sumas infinitesimales para cada autor. Esto es tan absurdo como querer imponer una tarifa a cualquier artista que se vea influenciado por la obra de alguien más. En cambio, en muchas ocasiones en la descripción textual de la obra, en el prompt mismo, el usuario determina explícitamente el estilo de algún artista que su imagen debe replicar: Rembrandt, Van Gogh, Picasso o, bien, el artista digital polaco Greg Rutkowski (que es, probablemente, una de las influencias más solicitadas a estos algoritmos).
En casos de solicitudes de una influencia determinada (y no sólo probabilística, como sucede normalmente) quizá podría aplicarse algún tipo de cuota. De cualquier forma si-gue pareciendo un tanto arbitrario imponer una tarifa por el uso de elementos característicos del arte de alguien más a una creación digital. Es muy importante que en esta fase del desarrollo de la tecnología de IA se establezcan sistemas de transparencia y responsabilidad tanto para los creadores como para los usuarios.
¿EN QUÉ CONSISTE EL ARTE?
La reflexión en torno al arte generado por mentes no humanas nos obliga a definir de qué estamos hablando. El arte no puede reducirse a simples objetos, sino que es el resultado de procesos creativos a través de los cuales se plasman ideas, emociones y percepciones acerca del mundo (físico, imaginario o espiritual) mediante una diversidad de materiales y recursos. Más allá de una idea estética, el arte es un esfuerzo por plasmar el momento histórico, el estado del mundo desde la visión, sensibilidad, ánimo y ansiedad del creador.
Las IA generativas emplean reglas estéticas y principios artísticos para organizar pixeles (conjuntos de números) en trazos, formas, colores o palabras de acuerdo con patrones que les han sido alimentados. A un prompt responden con referencias que entretejen azarosamente, es decir, ofrecen una creación en la que el proceso es una forma de creatividad combinatoria que imita, fusiona, sustituye y desmantela millones de ejemplos; replica estilos, detecta elementos significativos en conjuntos (a veces invisibles al ojo) y crea derivaciones.
Una IA generativa no tiene conciencia ni voluntad ni intención creativa; no sabe qué pinta ni qué escribe, no entiende de criterios ni ambiciones ni contextos ni relaciones causales entre los elementos que incluye en sus fabricaciones. Tampoco es capaz de reconocer los deseos, necesidades y emociones de un ser humano. De tal forma que se trata de arte decorativo despojado de ideas u originalidad, lo cual se debe a la falta de memorias, visiones estéticas y vivencias.
En algún momento quizá sea posible proveer a las máquinas de experiencias vivenciales, la oportunidad de explorar y experimentar el mundo, de confrontar situaciones de aprendizaje, no sólo de datos que alimentan su memoria. De esa forma tal vez podrían descubrir la curiosidad o algún equivalente. La idea de que basta con hacer bases de datos cada vez más grandes para que las IA actúen de manera más humana o desarrollen el sentido común es torpe y miope. El problema de crear una IA generativa no depende de la escala, sino de que requiere cultivar en su mente zonas diferenciadas, capaces de elaborar procesos de pensamiento complejos.
La creatividad es la capacidad de inventar cosas nuevas y originales, de sorprender con soluciones inesperadas. Podemos aventurar que existen dos maneras de entenderla: como una fuerza casi sobrenatural que se debe a la inspiración (a las musas), o bien como una característica que puede ser reproducida artificialmente, sintetizada, modificada y extendida. El algoritmo no es un motor creativo sino una herramienta, o en el mejor de los casos un colaborador cargado de buenas referencias y citas.
Quizá sea posible proveer a las máquinas de experiencias vivenciales y la oportunidad de explorar el mundo, no sólo datos que alimentan su memoria
Lo cierto es que la IA nos obliga a cuestionar la creatividad humana, entenderla como algo que puede ser investigado, desmantelado, disecado e imitado. De manera similar, ChatGPT puede escribir programas de cómputo con eficiencia, pero los expertos dicen que rara vez muestra originalidad y tan sólo recicla códigos, a veces impecablemente, de otros creadores; no es raro que incluya viejos errores o formatos obsoletos. El programa de asistencia a la programación GitHub Copilot ha sido objeto de demandas por reciclar material protegido por los derechos de autor sin dar crédito a sus creadores o propietarios.
TRUCOS TÉCNICOS Y FE EN EL ARTE
Para muchos la idea de crear obras de arte con sólo teclear una descripción es una trampa, un atajo absurdo. Pero si lo consideramos como una herramienta auxiliar en la creación podríamos comparar esta tecnología con el probable uso de cámaras obscuras por artistas como Johannes Vermeer y otros maestros, por lo menos desde el siglo XVII, quienes capturaron la perspectiva y la luz mediante un truco tecnológico.
La fotografía fue imaginada como el fin de la pintura y en particular de un género: el retrato. El poeta Charles Baudelaire la llamó el enemigo mortal del arte. Durante décadas la fotografía sólo fue considerada como un artefacto curioso y un mecanismo sin espíritu. Y si la cámara provocaba ansiedad, al imaginar que el arte sería reemplazado por emulsiones que captaban la luz para crear imágenes fijas, el cine vino a dar otro golpe brutal a la forma en que las artes plásticas representaban y capturaban el movimiento.
DALL-E puede ser el equivalente a la proliferación de cámaras en los smartphones, que ha hecho más simple, democrática y accesible la creatividad visual; y si bien es cierto que todo mundo toma fotos, eso no ha eliminado a los fotógrafos (en Estados Unidos había 160 mil profesionales antes de la invención del smartphone en 2002, y 230 mil en 2021). Asimismo, estamos ante un momento en que una nueva forma artística se ha convertido en un medio de comunicación, como sucedió con la fotografía desde que aparecieron los teléfonos inteligentes y las redes sociales.
Ésta no es, ni remotamente, la primera vez que la gente imagina que los cambios tecnológicos y estéticos serán el fin del arte. Hace más de cien años un urinal se convirtió en pieza de museo. Marcel Duchamp, firmando como R. Mutt, contribuyó con este ready made a la idea de que el arte moderno hacía posible que cualquier persona pudiera ser artista. La realidad es que no hubo marabuntas de improvisados dadaístas. El arte siguió y sigue siendo patrimonio de los artistas, a pesar de la aparente simplicidad de algunas obras contemporáneas que aún ahora provocan a los ingenuos a decir: “Mi hijo de cinco años podría hacer eso”.
La IA puede permitir que cualquiera haga arte y sin embargo eso no generará nuevos artistas. Esta tecnología puede verse como una extensión del sueño de la mecanización del arte que imaginaban los futuristas, pero de ninguna manera la eficiencia de su producción podrá sustituir la creatividad o el atrevimiento de declarar que esto o bien aquello es o no arte. De manera similar, algunos consideran que el trabajo de figuras como Demian Hirst, Takashi Murakami y Jeff Koons, entre otros que han montado verdaderas industrias en torno a sus obras para producir de manera masiva y maquinal, no debería considerarse arte. La habilidad técnica no quiere decir mucho si cualquiera la puede tener. Lo que realmente importa para que un artista destaque es su propuesta, su visión narrativa, su universo creativo y no algunas imágenes con mayor o menor fortuna. El estilo personal, más que una forma característica de dibujar, escribir o hacer música, entraña una cosmovisión.
MÚSICA Y COMPUTADORAS
En el ámbito de la música, desde la década de 1950 algunos científicos exploraron las posibilidades heurísticas de la composición musical a partir de computadoras. En 1958, Lejaren Hiller y Leonard Issacson aplicaron en la computadora ILLIAC un método para generar y probar con cadenas de Markov series de notas cuasialeatorias que debían cumplir ciertas reglas. Las notas exitosas se conservaban como parte de la composición Suite Illiac para cuarteto de cuerdas, las demás eran descartadas. La pieza no buscaba ser expresiva ni emocional sino tan sólo respetar ciertas bases de la composición clásica y el contrapunto.
En 1972, James A. Moorer experimentó con la generación de melodías tonales, mediante patrones de repetición de notas. Un par de años más tarde G. M. Rader diseñó un sistema de programación de IA para crear rondas musicales o cánones circulares. En los años ochenta, usando un modelo generativo, se entrenó a una IA con toda la música de Schubert, a fin de componer los dos movimientos finales de su sinfonía número 8, inconclusa. El algoritmo detectó los patrones de composición característicos del músico para imitarlos. En los noventa, David Levitt intentó crear música al programar descripciones de estilos con base en restricciones características como progresiones de acordes y líneas melódicas. Hoy tenemos varias herramientas poderosas de composición como Google Magenta, IBM Watson Beats, Amper Music y AIVA.
SUEÑOS PROFUNDOS DE LA MÁQUINA
Las imágenes elaboradas con IA empiezan formalmente con el trabajo de Alexander Mordvintsev, quien fue el creador del algoritmo DeepDream en 2015, quien tuvo la idea de dar a las computadoras “libertad para soñar”. En esencia lo que hizo fue que, al alimentar una imagen para ser analizada por una red neuronal, detuvo el proceso enmedio de diferentes niveles para de esa manera enfatizar interpretaciones incompletas. Como la red usada había sido entrenada principalmente con imágenes de perros y gatos, casi todo lo interpretaba como partes de perros y gatos, en un ejemplo extremo de la pareidolia (ilusión sensorial que otorga significados preexistentes a determinados estímulos) que los humanos aplicamos al reconocer rostros en objetos. Las visiones creadas con los experimentos de Mordvintsev tienen una calidad psicodélica, caleidoscópica y fractal que sirvió para ilustrar por primera vez lo que una máquina veía, no lo que había sido programada para ver. Este trabajo ha sido decisivo para la creación actual de imágenes de IA.
Las obras creadas por IA generativa no solamente sorprenden y divierten al público amateur sino que han sido objeto de validación artística. Un ejemplo muy singular es el de la feria anual de arte del estado de Colorado, que otorgó en 2022 el primer premio de arte digital a la obra Théâtre D’opéra Spatial de Jason M. Allen, quien nunca ocultó haberla realizado con el programa Midjourney. Al ser cuestionado por presentar un trabajo que elaboró de esa manera dijo: “El arte está muerto. Se acabó. La IA ganó. Los seres humanos perdimos”. Asimismo, el 25 de octubre de 2022, en una subasta de la casa Christie’s, la obra Portrait of Edmond Belamy, creada mediante el método GAN (red generativa adversarial) por el colectivo parisino Obvious (Hugo Caselles-Dupré, Pierre Fautrel y Gauthier Vernier) alcanzó un precio de 432,500 dólares.
HERRAMIENTAS O COMPETIDORES
La popularización de estos recursos inmediatamente dio lugar a debates en torno al futuro y la obsolescencia de los artistas humanos, quienes no podrían competir con la velocidad, versatilidad y capacidad técnica que ofrecida por los algoritmos. Lo primero que debemos señalar es la idea ridícula de que el humano compita contra estas plataformas. No se rivaliza contra nuestras herramientas sino que se utilizan para presentar mejor las ideas. Las buenas imágenes de IA son el resultado de largas conversaciones entre el hombre y la máquina, son cocreaciones y no simples productos de un prompt afortunado.
La mente humana deberá dirigir, administrar, curar y aplicar un pensamiento crítico a lo que manufactura. Al emplear estos recursos el artista en cierta forma está en proceso de convertirse en director de arte y el autor, en editor. El problema obvio es que esto se convierta en una muletilla inevitable, una obsesión simplificado-ra. Pero es claro que dichos algoritmos usados como herramientas para hacer bosquejos y borradores parecen insuperables ya que no sólo resuelven técnicamente y en segundos problemas de representación, sino que ofrecen opciones creativas de gran utilidad.
LA SUPERVIVENCIA DEL ARTISTA
Las visiones apocalípticas de un mundo en el que los humanos cederemos el terreno de la creación artística a las máquinas son por el momento un reflejo de la tendencia aberrante que desprecia la labor del artista y el escritor al imaginarlos simplemente como técnicos cuya destreza puede ser copiada, mejorada y reemplazada por las máquinas.
Es imposible saber ahora si estamos en el arranque de una era de delirante e insospechada creatividad asistida por máquinas o más bien en una de desgaste, amontonamiento y saturación cultural debido a la fascinación, el abaratamiento y la prisa por generar contenidos con imágenes de IA mediocres. Si bien es poco probable que estas herramientas reemplacen a los artistas, resulta prácticamente imposible que no se vuelvan el recurso más empleado por las agencias de publicidad. Por eso su impacto será distinto en el arte culto y en el arte comercial, utilitario, así como en la ilustración.
El impacto del tsunami cultural que provocarán las imágenes creadas por IA afectará por lo menos en lo laboral y lo cultural. Los ilustradores que se ganan la vida con trabajos freelance ocasionales y que deben cazar oportunidades en publicaciones enfrentarán una seria competencia desleal contra IA súper baratas que se usarán más y más para sustituirlos. Lo mismo sucederá a los reporteros, articulistas y músicos cuyo trabajo podrá ser reemplazado con obras producidas mediante software. Esta tecnología creará nuevas escalas de retribución y éstas siempre favorecerán a los ejecutivos y administradores, nunca a los trabajadores; en su estado actual estos recursos no contribuirán a la justicia en el medio laboral.
Por otro lado, la inmensa avalancha de obras realizadas mediante IA va a erosionar nuestro sentido del gusto y capacidad de sorpresa. Al menos por un tiempo crearán una sensación de agotamiento y desensibilización. Estamos ante un caso más en el que una tecnología muestra un enorme potencial para simplificarnos la vida, para generar productos interesantes y estéticamente agradables, como también para falsificar, engañar, desinformar o hacer daño de diversas maneras. En Blade Runner (Scott, 1982 y Villeneuve, 2017) los cazadores de replicantes utilizan herramientas para determinar si una persona es o no real pues resulta imposible diferenciarlos con la mirada.
No hay marcha atrás, porque los generadores de contenido se convertirán en parte de la cultura, se normalizará su uso y las instituciones tendrán que reescribir sus reglas en torno a ellos
En el terreno del arte elaborado con IA serán necesarios mecanismos para detectar si una obra o producto cultural es real o fue realizado mediante software. Esto puede hacerse al incorporar el equivalente de marcas de agua o etiquetas de identificación en el material, así como con IA diseñadas para determinar la autoría de una obra al reconocer patrones invisibles. Pero no es totalmente seguro, ya que en la carrera tecnológica entre las corporaciones y los hackers, las tecnologías siempre deben superarse para asegurar su protección.
En estos momentos de las IA, sus sistemas incluyen protecciones y filtros contra el abuso, por lo que no permiten usar rostros de personas reales, especialmente celebridades y niños. Hay también filtros para impedir que se representen escenas sexuales. De cualquier forma, poco después del lanzamiento de Stable Diffusion, cientos de usuarios comenzaron a modificar el programa para evadir restricciones y crear imágenes sexuales explícitas y extremadamente perversas.
Las IA Generativas plantean hoy un problema elemental. No ocurre en el sentido de la ciencia ficción, donde la máquina quiere dominar el mundo, o cuanto menos el mundo del arte, sino al obligarnos a una pregunta: ¿quién es el verdadero autor de la obra? ¿El algoritmo, el autor del prompt, los programadores o los que alimentaron la base de datos? Asimismo, sus obras reflejan prejuicios enquistados en el material que se utiliza para entrenar al algoritmo.
No hay marcha atrás, porque los programas generadores de contenido se convertirán en parte de la cultura, se normalizará su uso y tanto las instituciones educativas como culturales tendrán que reescribir sus reglas en torno a ellos. Si bien facilitarán el trabajo de algunos profesionales también destruirán carreras, eliminarán campos de trabajo, y a la vez darán lugar a una infinidad de obras que pasarán a ser parte de la cultura humana.
La IA comprensiva aún está lejos de existir ya que nada parece más complicado que emular al sentido común: es decir, crear sistemas, programas que puedan entender cosas elementales de cómo funciona el mundo. Quizá cuando esto cambie la creati-vidad sintética se volverá imposible de diferenciar de la humana.