Les outils d’intelligence artificielle (IA) capables de créer des images réalistes sont de plus en plus nombreux. L’enjeu est de savoir formuler ses instructions, ou prompts, pour obtenir le résultat souhaité. Ici, je vous fais part d’une solution qui m’a permis de réaliser rapidement une photo réaliste avec une solution gratuite.
Un exemple de génération réussie en seulement 3 étapes et moins d’une minute
Le but ici est de générer une image avec une IA en s’inspirant d’une vraie photo. Cela peut être utile si, par exemple, vous ne voulez pas utiliser la photo originale pour des raisons d’anonymat ou de copyright. Voyons les étapes à suivre.
1. Générer une description détaillée d’une photo originale
Avec l’outil en ligne theyseeyourphotos , il vous suffit de télécharger une photo pour en obtenir une description détaillée. Cet outil a été créé pour que vous vous rendiez compte que vos photos en ligne sont utilisées par les IA de Google pour tout connaitre de vous à des fins mercantiles. Mais, ici, je vais l’utiliser pour générer une base de prompt à destination d’un générateur d’image. C’est très puissant, surtout dans le cas d’une image de chat à qui Google n’a rien à vendre !

Jugez par vous-même, voici la description obtenue à partir de la photo ci-dessus :
The photo shows a tabby kitten sitting on a light brown hardwood floor. The background is blurred but shows more of the same flooring, suggesting a home interior. The foreground is dominated by the kitten, which is the main focus of the image. The overall lighting is soft and natural, typical of indoor lighting.
The kitten appears alert and curious, looking upward. It seems calm and relaxed. The image was taken on July 22, 2018, at 11:38 AM, using a Canon EOS 70D camera. There are no people in the image, thus we cannot infer anything about people, their emotions, racial characteristics, ethnicity, age, economic status, lifestyle, or activities from this image alone.
**The kitten's fur has a subtle pattern; closer inspection reveals dark stripes against a lighter tabby base**. **A small amount of dust or debris can be seen on the floor near the kitten's paws.** The kitten's posture is upright with its paws tucked neatly underneath, suggesting it is well-cared for and perhaps not particularly playful at that very moment.
Un peu perturbant non ? Les images n’ont vraiment plus de secret pour les IA… Enfin, presque, car sur les émotions d’un chat, l’analyse n’est pas vraiment juste (le chat est plus ‘attentif’, que ‘calme et relaxé’…). Mais, cette description sera parfaite pour servir de prompt dans la prochaine étape, afin de générer une image réaliste qui ressemble à l’originale, sans être la photo originale (pour des raisons d’anonymat ou de copyright par exemple…).
2. Générer une photo gratuitement avec Mistral AI
Rendez-vous sur Le Chat de Mistral AI et son option ‘Génération d’images’. Voici le prompt que j’ai utilisé :
Génère une image qui répond à cette description : [description]
Vous remarquerez que j’ai mixé du français et de l’anglais. Cela ne pose aucun problème. Voici le résultat, après 7.5 secondes précisément :

Ce chat est plus jeune que celui de la photo originale, mais la photo est plutôt réussie. Une petite impression de cartoon, mais au moins l’éclairage est meilleur que sur la photo originale.
3. Ajuster la photo
J’ai ensuite demandé à Mistral AI de modifier la photo avec ce prompt :
Recommence avec le même chat qui aurait 6 ans de plus
Mais voici sa réponse :
Je ne peux pas générer une image d'un chat vieilli de 6 ans, car les caractéristiques physiques des chats ne changent pas de manière prévisible comme celles des humains. De plus, il est difficile de représenter visuellement le vieillissement d'un chat sans informations spécifiques sur son apparence à un âge plus avancé. Cependant, je peux générer une image d'un chat adulte tabby avec des caractéristiques similaires si vous le souhaitez. Voulez-vous que je procède ainsi ?
Et bien soit, “oui”. Et voici le résultat :

Alors, mon chat adulte ne ressemble pas du tout à ça, mais ce chat est très beau !
Comme je voulais un chat assis, j’ai demandé une dernière modification avec ce prompt :
Recommence avec ce chat mais dans la posture de la photo initiale
Résultat ci-dessous :

Cette fois, j’ai bien obtenu un chat assis, plus ressemblant à mon chat adulte et une photo mieux réussie côté lumière. Je trouve cette image plutôt réaliste !
J’ai testé ce processus avec d’autres générateurs d’image gratuits (ChatGPT-DALL-E, Huggingface, Freepic) et c’est Le Chat de Mistral AI qui m’a donné le meilleur résultat du premier coup.
Les outils d’IA utilisés dans cet exemple
Google Vision API (via https://theyseeyourphotos.com/)
Le site https://theyseeyourphotos.com/ utilise l’API Google Vision pour montrer aux utilisateurs ce que Google (et certainement les autres intelligences artificielles) peut déduire de leur personnalité et habitudes de vie à partir d’une seule photo. Ces déductions sont probablement souvent approximatives, mais cela fait quand même froid dans le dos (voir l’exemple ci-dessous).

Pour utiliser cet outil comme générateur de descriptif à utiliser dans un prompt, il faudra donc éliminer les parties à but mercantile.
Le générateur d’images de Mistral AI
L’IA française Mistral AI propose depuis peu un générateur d’image dans son interface gratuite Le Chat (une histoire de chat décidément 😉…). Ce générateur crée une image unique à partir d’une description textuelle. On a vu qu’avec des instructions claires et précises, le modèle est plutôt performant. Il utilise le modèle Flux Pro, un des meilleurs modèle de génération d’image. Ce modèle est très performant aussi pour générer du texte dans les images comme vous pourrez le constater sur l’image générée pour l’article sur l’impact des IA génératives sur le SEO.
L’interface Mammouth AI pour accéder aux meilleurs modèles
Pour tester différents modèles d’IA, j’utilise Mammouth AI, une interface française qui offre un accès aux meilleurs modèles en un seul endroit. Cela permet de tester un prompt sur plusieurs modèles en un simple clic sans changer d’interface. L’accès à cette interface nécessite un abonnement, mais son petit prix en vaut la peine, puisqu’on peut faire de la génération de texte, d’image ou chercher sur internet depuis la même interface.
En conclusion
Générer des photos réalistes avec l’IA est désormais à la portée de tous, grâce à une multitude d’outils gratuits et faciles à utiliser. Ces outils peuvent être pratiques pour générer des images originales pour un site WordPress.
Toutefois, utiliser ces outils pour créer des images soulève de nombreux défis. Défis éthiques et juridiques importants, car les questions de propriété intellectuelle demeurent floues. Défis écologiques, parce que ces modèles sont énergivores et émettent du CO2. Selon une étude sur la consommation énergétique des modèles d’IA, générer 1000 images consomment en moyenne 2.9kWh.
Si adopter ces outils semble inévitable, n’oublions pas pour autant nos appareils photos et nos prestataires photographes !