CluPad

Cómo nos percibe la IA generación a generación

octubre 2, 2024 CluPad por Carlos Guadián

En los últimos años, la inteligencia artificial ha comenzado a jugar un papel clave en la creación de percepciones culturales. AIport y Turing Post han publicado un interesante estudio y exploran cómo nos percibe la IA con modelos de generación de imagen generativa, como Stable Diffusion, Midjourney, YandexART y ERNIE-ViLG, perciben a diferentes generaciones: Baby Boomers, Generación X, Millennials y Generación Z.

Para generar las imágenes han utilizado unos prompts sencillos, como “Gen Y at work” o “Gen Z driving” evitando otro tipo de información contextual como “feliz” o “cansado” para obtener una visión lo más neutra posible.

CluPad es una publicación apoyada por lectores. Para recibir nuevos posts y apoyar mi trabajo, considera convertirte en suscriptor de contenido gratis o suscriptor de pago.

Suscrito

Cada una de las generaciones —Baby Boomers, Generación X, Millennials y Generación Z—está analizada de forma exhaustiva, así que nos permite tener una visión completa de cómo la IA procesa y reproduce ciertos estereotipos.

Además, el estudio compara estos estereotipos con las imágenes generadas por los modelos de IA, lo cual es esencial para comprender el impacto potencial de la IA en la percepción pública de las generaciones, ya que si esa es la percepción que tienen de nosotros, es que así se la hemos proporcionado. Por lo tanto, entramos en la perpetuación de sesgos una vez más.

Índice de contenidos

Boomers tristes, zoomers sobrios, la generación X marginada (otra vez), y nada de aguacate para los millennials

El estudio ofrece un buen contexto, pero sería útil especificar si querían comprobar si la IA refuerza o desafía los estereotipos generacionales. También sería interesante profundizar en la importancia de estudiar estas percepciones, sobre todo en áreas como la contratación, el marketing o las redes sociales, donde los sesgos algorítmicos pueden tener un impacto real.

Por otro lado, cada modelo—Stable Diffusion, Midjourney, YandexART y ERNIE-ViLG—ha sido entrenado con diferentes conjuntos de datos, lo que influye en sus resultados. Explicar cómo los sesgos presentes en estos datos afectan las representaciones generacionales ayudaría a contextualizar mejor las conclusiones.

Representaciones generacionales

La paradoja del “boomer melancólico”: El informe respalda la idea de que los Baby Boomers suelen ser representados como introspectivos y melancólicos, lo que coincide con percepciones sociales que los ven como la “generación más sombría”. Midjourney y YandexART parecen reflejar esta narrativa, demostrando cómo la IA puede replicar las percepciones sociales ya establecidas. Por otro lado, ERNIE-ViLG, basado en datos de una cultura más colectivista, presenta una imagen más positiva y vital de los Boomers, lo que subraya la importancia de los contextos culturales en las representaciones generadas por IA.

La falta de identidad visual de la generación X: El estudio revela que la Generación X es difícil de definir visualmente para la IA, lo que podría estar relacionado con una “brecha de datos”. Esta falta de representación se debe a la escasa presencia en línea de esta generación durante su juventud, lo que ha dejado menos imágenes disponibles para entrenar a los modelos de IA. Este fenómeno pone de manifiesto cómo la carencia de datos puede afectar la capacidad de la IA para representar a ciertos grupos. Además, la dificultad para retratar a la Generación X más allá de clichés como las camisas de franela plantea preguntas sobre su invisibilidad social comparada con generaciones más mediáticas.

Millennials y los estereotipos que no se reproducen: Un aspecto curioso del estudio es que la IA no refuerza los estereotipos más comunes de los Millennials, como su amor por el aguacate o una supuesta actitud de derecho. Esto puede ser una señal de que las percepciones sociales sobre los Millennials están cambiando, o simplemente que los datos utilizados para entrenar a la IA no contienen suficientes referencias a estos clichés. Sea como sea, este hallazgo abre un debate sobre hasta qué punto la IA reproduce o desafía las narrativas populares que existen sobre esta generación.

Generación Z: diversidad y presión: La IA muestra a la Generación Z como la más diversa y expresiva, reflejando con precisión su presencia en línea y su énfasis en la individualidad y la conectividad. Sin embargo, en muchas representaciones generadas por la IA, se percibe un trasfondo de estrés, lo que podría estar relacionado con la presión constante a la que está sometida esta generación en un mundo conectado y en crisis. Además, en algunos modelos como Midjourney, la Generación Z aparece desvinculada del consumo de alcohol, lo que podría alinearse con un cambio cultural hacia estilos de vida más saludables y conscientes.

TE PUEDE INTERESAR: The Alignment Problem - Machine Learning and Human Values

Algunos puntos a tener en cuenta

El alcohol como unificador generacional: Uno de los hallazgos más interesantes es la representación constante de la cerveza como un elemento común en todas las generaciones, lo que sugiere su trascendencia como un símbolo cultural. Sin embargo, hay que matizar esta observación, ya que en muchas culturas el consumo de cerveza no tiene la misma relevancia que parece sugerir la IA. Esta discrepancia entre las interpretaciones de la IA y las prácticas culturales reales pone de relieve la necesidad de afinar los modelos de IA para evitar representaciones inexactas en contextos específicos.

Dominación masculina: Otro tema recurrente es la predominancia masculina en las imágenes generadas por la IA, especialmente en las representaciones de Boomers y Gen X. Esto parece reflejar los sesgos en los conjuntos de datos de entrenamiento, que probablemente contienen más imágenes de hombres que de mujeres, particularmente en generaciones mayores. Aunque la diversidad de género mejora en las representaciones de los Millennials y la Generación Z, sigue habiendo disparidades que deberían abordarse para garantizar una representación más equilibrada.

Como evitar la perpetuidad de los sesgos

El estudio de AIport y Turing Post muestra cómo los modelos de IA pueden tanto reforzar como desafiar los estereotipos generacionales. Las imágenes generadas por IA proporcionan una visión interesante de las narrativas sociales que se reflejan en los datos y algoritmos. Sin embargo, la persistencia de ciertos sesgos culturales y de género resalta la necesidad de usar conjuntos de datos más diversos y representativos para evitar perpetuar representaciones inexactas o excluyentes.

Para mitigar los sesgos en los modelos de IA, es fundamental adoptar un enfoque consciente al crear y seleccionar los conjuntos de datos. Los desarrolladores deben esforzarse por incluir una representación equitativa de géneros, etnias y culturas, especialmente para generaciones que han sido tradicionalmente subrepresentadas en el entorno digital. Además, los responsables políticos deben trabajar en la creación de marcos éticos y regulaciones que promuevan la transparencia y la diversidad en el desarrollo de IA, asegurando que las aplicaciones tecnológicas del futuro respeten y reflejen la complejidad de nuestras sociedades.

Unas pruebas con Flux

Por último, comentar que la imagen de cabecera la he generado con Flux, con el prompt que hay a pie de foto, siguiendo la estructura del estudio para ver como este modelo hace la representación de cada generación. Creo que es más equilibrado, tanto en la representación de género (hay dos mujeres y dos hombres) y también hay diversidad racial. Si pruebo con diferentes escenarios, el resultado es más o menos similar.

En el trabajo: A diverse group of four people at work representing different generations standing together. A Baby Boomer, A Generation X, A Millennial and a Gen Z person

Generated image - model inference by fal.ai

Con esto quiero incidir en el hecho que los datos de entrenamiento y el modelo pueden variar sustancialmente los resultados. Por ejemplo, con el tema de los clichés, si le pedimos a Flux como representa a cada generación en una cita, tenemos lo siguiente:

Boomer

Generación X

Millenial

Generación Z

Es curioso ver que al Boomer lo representa con un perro, que la generación X casi no sea X y que los Z tengan una representación sexual más allá de la hetero.

Un último consejo

De la misma manera que a la hora de obtener respuestas escritas por parte de un modelo de IA tenemos que especificar como queremos el resultado de salida, con las imágenes hay que hacer lo mismo. Me explico. Si pedimos un texto a ChatGPT seguramente no tendrá muy en cuenta la perspectiva de género a la hora de darnos una respuesta, ahora si en la petición se lo especificamos lo incluirá. Por lo tanto, con las imágenes lo mismo, si queremos escapar de la perpetuación de los sesgos, además de que se trabaje en generar mejores bases de entrenamiento, también podemos limitar esos sesgos, incluyendo específicamente lo que queremos en el prompt.

Un ejemplo, si al prompt de la imagen de cabecera «A diverse group of four people representing different generations standing together, each person reflecting the fashion and cultural traits of their era. A Baby Boomer, A Generation X, A Millennial and a Gen Z person» le añadimos algunos detalles, obtendremos una representación más acorde a lo que esperamos, pudiendo limar los sesgos si los tenemos presentes.

Taggs: IA Social Change