Génération d'images : l'I.ntelligence hA.llucinée

Les mystères apparents de la machine neuronale

En matière de production d'images, les prouesses de l'IA sont remarquables. Un observateur peu averti peut facilement se laisser berner par le niveau de réalisme apparent développé par ces combinaisons d'algorithmes complexes dont la mise en application fonctionnelle échappe en lisibilité à ses propres créateurs (le fameux effet boite noire). Les algorithmes effectivement utilisés dans les systèmes d’IA apprennent directement à partir d'une masse de données colossale et "décident" selon des règles non préalablement fixées par l’humain et qui nous paraissent souvent incompréhensibles. Certains systèmes d’IA réussissent ainsi à développer des compétences inattendues, pour lesquelles ils n’étaient pas formés. Néanmoins…

IA artefacts/midjourney

« Ce qui nous distingue de nos prédécesseurs, c'est notre sans-gêne à l'égard du mystère. Nous l'avons même débaptisé ; ainsi est né l'absurde. »
—Emil Michel Cioran

De l'autre coté du miroir

…si l'on s'attarde sur les détails de l'image qui précède, on remarque que le dessin de la carte est particulièrement incohérent. Fleuves, mers et continents se juxtaposent en dehors de toute logique, les inscriptions relèvent d'alphabets inconnus sur notre planète, quant à ce qui paraît être une boussole, son dessin interne est extraordinairement fantaisiste. L'intelligence artificielle est capable de simuler l'apparence d'une carte géographique, mais elle ne fait pas le lien entre cette carte et l'environnement réel ainsi représenté. Elle est capable de produire l'image d'un instrument de navigation sous une apparence matérielle crédible, mais l'objet qu'elle a conçu s'avère inutilisable. N'ayant jamais manipulé ces outils, elle ne parvient pas à les rendre porteurs de l'information qui les définis habituellement. La carte ne décrit pas un territoire, la boussole n'indique aucune direction. Il ne fait aucun doute que ce type d'erreur finisse par être corrigé. Cependant, si ces écueils de compréhension sont un jour gommés de la restitution picturale de notre environnement, cela ne signifiera pas pour autant que l'intelligence artificielle aura intégré dans son raisonnement les nombreux facteurs humains qui ont présidé à son invention ou à sa mise en pratique.

IA artefacts/midjourney

« La logique est une manière méthodique de se tromper en toute confiance. »
—Robert A. Heinlein

Le mouton électrique dans la machine

En réfléchissant à la manière dont l'IA apprend à se conformer à nos demandes, on perçoit bien que cette méthode d'apprentissage repose entièrement sur une simulation formellement distincte de notre réalité vécue. Cette mise en abyme récurrente de l'IA sur elle-même génère une représentation du monde qui n'a absolument rien de commun avec la nôtre, puisque la seule injonction présidant à cette construction repose sur l'adéquation apparente des réponses rendues sans contrôle possible sur le raisonnement induit. Plus la logique interne sera dissimulée et inaccessible, moins nous aurons conscience de ce décalage fondamental, et plus il deviendra probable que se développent de façon sournoise des aberrations logiques particulièrement monstrueuses.

La problématique de ces mécanismes hallucinatoires réside dans le fait que ces éléments erronés, lorsqu'ils surgissent, sont présentés de manière convaincante, argumentée et justifiée comme s'il s'agissait d'éléments véridiques. Et les processus de rétroaction, juges et parties, censés corriger ces excès, sont loin d’être infaillibles. Les outils développés, par exemple, afin de détecter si un texte a été rédigé par ChatGPT ou un autre chatbot peuvent se tromper. Ils leur arrivent de déterminer qu’un deepfake n’est pas un contenu factice, mais une image réelle. Yann Le Cun, l'un des inventeurs du deep learning estime d'ailleurs que les SIA Génératives ne pourront jamais être exempts d’hallucinations, car les réponses générées sont structurellement incontrôlables. Devant ce constat insoluble, de plus en plus d’experts avancent que les hallucinations ne sont pas un bug, mais une "fonctionnalité" propre à la technologie élaborée derrière les SIA Génératives.

IA artefacts/midjourney

« Peindre, c'est faire apparaître une image qui n'est pas celle de l'apparence naturelle des choses, mais qui a la force de la réalité. »
—Raoul Dufy

Des réseaux de neurones sans histoire

Dans ce contexte, il est particulièrement intéressant d'observer ce qui se joue derrière la génération d'images pilotées par IA. Prenons par exemple deux images illustrant à priori une thématique similaire. La première est une création de Midjourney, la seconde est une photographie prise en 1929 par le photographe japonais Kusutora Matsuki. Toutes deux représentent une silhouette humaine, isolée dans un décor urbain relativement banal, discrètement éclairé par les premières lueurs matinales. Cette similitude apparente est très vite contredite par une analyse sensible des deux scènes. Dans la seconde image, le moment où le photographe a appuyé sur le déclencheur est perceptible. La position de la silhouette au point de rencontre des différentes lignes de la composition, la répartition rigoureuse des lumières, la capture volontaire d'un instantané furtif et volatil, révèlent la présence de l'observateur attentif. Cette photographie de rue, prise une seconde avant ou une seconde après, cadrée un peu différemment, aurait raconté une histoire totalement autre. C'est cet ancrage dans une dimension temporelle et géographique précise qui manque à la scène générée par l'IA. Ce regard particulier, conjointement scrutateur et créateur est absent de la première image. Aucun regard n'a présidé à sa fabrication.

Midjourney/Kusutora Matsuki

Le tableau inventé par l'intelligence algorithmique propose un assemblage aléatoire de formes identifiées, réagencé suivant des règles de perspective cohérentes, mais dépourvues d'intentions. Alors que le cliché réalisé par Matsuki est habité par un récit et frappe l'imagination parce qu'il permet de saisir un fragment particulier d'une histoire en train de se faire, la vision fabriquée par l'IA en est exempte. Nous pourrions évidemment pallier ce manque en imaginant ce qui a précédé et ce qui suivra cette mise en scène arbitraire, mais la construction de la trame temporelle nous incombe. Elle est absente du décor. Le "devenir" des personnages campés à cette occasion brille par son inconsistance. Il en résulte une impression de mouvement suspendu, un tableau statique dont la quatrième dimension serait définitivement figé. L'IA est capable de mesurer une durée, mais la notion de temps relatif telle qu'elle est perçue par l'être humain lui est inconnue. Or, c'est justement le passage du temps qui nous permet d'accéder à la sensation de l'existence. L'intelligence artificielle n'est pas vivante, et ne peut donc concevoir des représentations habitées par la vie. Cette incapacité de l’IA à co-énoncer, c'est-à-dire à prendre part à l'expérience existentielle avec une réciprocité empathique, lui interdit tout accès aux sensations subjectives qui constituent le liant de toutes les interactions humaines ou animales. L'IA n'en peut que simuler, avec un certain brio, la part la plus convenue et la plus codifiée. Mais pour elle, ce territoire mental n'existe pas.

Mise en abîme de l'antimonde

« La logique est le dernier refuge des gens sans imagination. »
—Oscar Wilde

IA artefacts/midjourney

Le larcin invisible du photographe, en capturant d'un clic le hic et nunc de la réalité, révèle le tempérament unique, inexprimable, mais néanmoins reconnaissable par chacun d'entre nous, de notre présence au monde. À contrario, la construction picturale laborieuse de l'IA (gestion algorithmique imbriquée de plusieurs milliards de paramètres par image) entérine, via l'accumulation continue de ces faire-part de deuil hyper-réalistes (2,5 millions d'images par jour) distribués continûment avec la morgue consciencieuse qui la caractérise, le constat implacable que le monde qu'elle décrit n'a proprement jamais eu lieu. Malheureusement, elle illustre aussi avec éclat la dérive mécaniste qui emporte le monde vivant hors de ses assises ontologiques… la logique, instrument théorique initialement cantonné au langage, devenu grâce aux mathématiques un ingrédient clé du hardware et des logiciels montre un impact direct et croissant sur notre vie quotidienne. Pour les géants du numérique, tenants du matérialisme post-nietzschéen, l'intelligence artificielle est désormais en capacité de réduire la totalité du monde phénoménal en langage binaire.

On peut affirmer sans se tromper que l'IA est une experte en nature-morte. Un genre pictural ainsi définit : contrairement à la représentation de sujets vivants et dynamiques, la nature morte capture des objets immobiles et immuables, veillant à mettre en valeurs leurs qualités picturale (texture, couleur, transparence). Un positionnement soigné des éléments, un éclairage précis et un œil aiguisé pour les détails sont les clés de sa réalisation. On objectera avec raison qu'un peintre comme Cezanne a su tirer de l'exercice des résultats totalement opposés. Dans un de ses tableaux, la table chargée de pommes semble se dédoubler, les fruits n'ont pas de contours véritablement définis, ou semblent sur le point de dégringoler. C'est une peinture en mouvement, dynamique, fidèle à la subjectivité de notre vision et de ses imprécisions. Tout à rebours, la mécanique algorithmique dissèque le vivant pour le reconstituer fragment par fragment, échouant immanquablement à traduire l'aspect mouvant, fugitif, insaisissable, de ses manifestations.

Pommes et oranges/Paul Cézanne

« Les événements n'ont pas d'intérêt en eux-mêmes, mais ils sont comme réverbérés par l'imaginaire et la rêverie. »
— Patrick Modiano

Cette manière de privilégier l'hyper-réalisme, cette hantise de la perfection plastique, ce gout prononcé pour la netteté exacerbée ont précédé l'avènement des IA générative. Ces préoccupations se sont décuplées avec l'arrivée de la photographie numérique. L'intelligence artificielle est bien plus qu'un miroir, c'est un révélateur. Elle affiche ce que nous sommes devenus. Si les interactions profondes qui animent le vivant intéressaient notre époque, elles seraient nettement plus présentes au cœur des visions fabriquées par l'IA. À l'image des impulsions épidermiques qui gouverne nos relations sociales, l'intelligence artificielle ne restitue que la surface apparente de nos existences. À ces simulacres, la vogue des "mêmes", l'obsession de l'apparence, l'homogénéisation des désirs, la violence du matérialisme qui irriguent nos sociétés en sont autant le fruit que la semence propice. De ces mises en scènes sophistiquées, jouant de l’évidence de représentations pensées comme "naturelles", hormis l'emphase visuelle des mises en scène, rien ne nous touche fondamentalement. En se superposant au réel connu, en abusant des usages rhétoriques de la synthèse démultipliée, ces visions médiagéniques dressent le portrait d'un monde inexplicable, marqué par une perte de sens qui est au cœur de la sidération qu'elles provoquent.

IA artefacts/midjourney

« Epargnez-nous l'emphase. Elle est le propre des esprits creux. Et si vous n'avez rien à proposer, vous avez toujours la solution de vous taire. »
—Lydie Salvayre

publié le 30/01/2025, à 11h26 par Frédéric Schäfer

Génération d'images : l'I.ntelligence hA.llucinée

Les mystères apparents de la machine neuronale

« Ce qui nous distingue de nos prédécesseurs, c'est notre sans-gêne à l'égard du mystère. Nous l'avons même débaptisé ; ainsi est né l'absurde. »—Emil Michel Cioran

De l'autre coté du miroir

« La logique est une manière méthodique de se tromper en toute confiance. »—Robert A. Heinlein

Le mouton électrique dans la machine

« Peindre, c'est faire apparaître une image qui n'est pas celle de l'apparence naturelle des choses, mais qui a la force de la réalité. »—Raoul Dufy

Des réseaux de neurones sans histoire

Mise en abîme de l'antimonde

« La logique est le dernier refuge des gens sans imagination. »—Oscar Wilde

« Les événements n'ont pas d'intérêt en eux-mêmes, mais ils sont comme réverbérés par l'imaginaire et la rêverie. »— Patrick Modiano

« Epargnez-nous l'emphase. Elle est le propre des esprits creux. Et si vous n'avez rien à proposer, vous avez toujours la solution de vous taire. »—Lydie Salvayre

« Ce qui nous distingue de nos prédécesseurs, c'est notre sans-gêne à l'égard du mystère. Nous l'avons même débaptisé ; ainsi est né l'absurde. »
—Emil Michel Cioran

« La logique est une manière méthodique de se tromper en toute confiance. »
—Robert A. Heinlein

« Peindre, c'est faire apparaître une image qui n'est pas celle de l'apparence naturelle des choses, mais qui a la force de la réalité. »
—Raoul Dufy

« La logique est le dernier refuge des gens sans imagination. »
—Oscar Wilde

« Les événements n'ont pas d'intérêt en eux-mêmes, mais ils sont comme réverbérés par l'imaginaire et la rêverie. »
— Patrick Modiano

« Epargnez-nous l'emphase. Elle est le propre des esprits creux. Et si vous n'avez rien à proposer, vous avez toujours la solution de vous taire. »
—Lydie Salvayre