Por Aaron Tucker
Tucker, A. (2024). Imagens algorítmicas interoperáveis e padronizadas: a guerra doméstica contra drogas e tiros nas tecnologias de reconhecimento facial. Big Data & Society, 11 (3). https://doi.org/10.1177/20539517241274593
AI generativa (Genai), como Midjourney, Difusão estável e Dall-E, são sistemas de visualização de dados. Tais tecnologias são o resultado de seus dados de treinamento em combinação com matemática algorítmica densa: as imagens produzidas por esses sistemas superam que os dados originais de treinamento, pares de texto e imagem, para melhor e para pior.
Essa dinâmica é especialmente problemática quando os dados de imagem que são atados a vetores racializados de poder, como fotos de canecas, estão disponíveis gratuitamente para aqueles que construem modelos genai. Desde a sua criação no final do século XIX, por cientistas como Francis Galton e Alphonse Bertillion, as fotos sempre pretendem ser móveis e padronizadas: a visualidade aceita da foto, como uma pose dianteira frontal e um perfil lateral obtido na lâmpada para maximizar uma visibilidade, que a fotografia pudesse ser “em comparação” e em comparação com qualquer uma de qualquer uma delas em comparação com qualquer uma delas em comparação com qualquer uma delas, em comparação com qualquer uma delas, em comparação com a faixa, em comparação com a lâmina, em comparação com a faixa, em comparação com uma variedade de uma variedade de uma variedade, em comparação com uma variedade de que a fotografia poderia ser “em comparação com a denúncia.
Tais lógicas foram adotadas por cientistas da computação que resolverem o problema do reconhecimento de rosto computacional e das fotos. Relatórios como a “recomendação de melhores práticas de 1997 para a captura de fotos” enfatizaram que as fotos precisavam ser “interoperáveis” para que pudessem mudar entre vários FRTs e aplicações.
As fotos são intercaladas com sistemas sociotécnicos, como práticas de policiamento, apoio à saúde mental e apoio ao dependência; As fotos não são imagens neutras, mas um composto de afeto, narrativa vivida, estruturas de poder social e, muitas vezes, violência em muitas formas. Portanto, como Katherine Biber alertou em seu artigo de 2013, “No Arquivo do Crime”, há perigos reais quando o arquivo criminal entra de forma acriticamente na esfera cultural. É crucial que prestemos atenção a Genai e as maneiras que ele diz a si e os dados que está visualizando por meio de suas criações. Como meu artigo descreve, a capacidade de gerar imagens com o prompt de “uma foto” definido pelos mesmos vieses que os bancos de dados de cajunto é alarmante.
A solução não é proibir tais prompts ou reprimir a pronta para a engenharia que surge esses resultados, mas para resolver o problema raiz: o uso acrítico e a reutilização de dados problemáticos no treinamento de máquinas, não apenas nos sistemas de visão computacional, mas em todos os sistemas de IA.
Leave a Reply