La course à l’innovation alimentée par la technologie de l’intelligence artificielle est loin d’être terminée. Suite à aux nombreuses sorties d’outils conversationnels alimentés par l’IA ces derniers mois, la start-up américaine et précurseure du marché de l’IA OpenAI a annoncé la sortie prochaine d’une nouvelle version de DALL-E, son outil de génération d’image. Baptisé sobrement DALL-E 3, cet outil va révolutionner, une fois encore, le marché encore balbutiant de la technologie IA. Gros plan sur cette nouvelle version de DALL-E que lancera bientôt OpenAI.
Quand ChatGPT et DALL-E fusionnent
Dès ce mois d’octobre, les internautes férus d’innovations technologiques auront le plaisir de tester le nouvel outil de génération d’image par la technologie IA lancée par OpenAI : DALL-E 3. Ce nouveau modèle d’outil de création de contenu image promet de nombreuses améliorations par rapport à ces précédentes versions, en prenant en considération plusieurs paramètres pour générer chaque image, de manière à ce que le résultat soit le plus réaliste possible. Mais la principale force de DALL-E 3, c’est son intégration à l’autre outil phare d’OpenAI, ChatGPT.
Ainsi, les internautes pourront profiter d’une puissance de calcul nettement supérieure à ce qui se fait sur le marché actuel, afin de créer des images d’un réalisme à couper le souffle. Outre l’ajout de puissance, cette intégration a pour but de coupler les deux intelligences artificielles que compte OpenAI, assurant une cohérence entre les textes (consignes) et l’image générée par DALL-E. Voici ce que la start-up dirigée par Sam Altman explique quant aux performances de son nouvel outil alimenté par l’IA : « Les systèmes modernes de conversion de texte en image ont tendance à ignorer les mots ou les descriptions, ce qui oblige les utilisateurs à apprendre le prompt engineering. DALL-E 3 représente un bond en avant dans notre capacité à générer des images qui correspondent exactement au texte que vous fournissez. » Ce message s’accompagne notamment de quelques images générées par DALL-E 3, images répondant à la demande suivante : « Une peinture à l’huile expressive représentant un joueur de basket-ball en train de faire un dunk, illustré comme une explosion de nébuleuse ».
Un outil plus respectueux des artistes
La génération d’image par l’intelligence artificielle est toujours au cœur de plusieurs polémiques, surtout au sein des communautés d’artistes qui font appel à la protection intellectuelle de leurs œuvres. OpenAI rassure les principaux concernés, et présente son outil DALL-E 3 comme étant une version plus respectueuse des artistes. Plusieurs dispositions ont été prises par la start-up en ce sens :
- Refus automatique de créer des images selon le style d’un artiste encore vivant.
- Possibilité pour les artistes de refuser que DALL-E 3 utilise leurs œuvres pour générer des images ; un formulaire permettant de supprimer les modèles de générations d’images (modèles dont les artistes détiennent les droits) est mis à leur disposition sur le site d’OpenAI.
- Mise à disposition d’un outil de classification et d’identification d’images générées ou non par DALL-E (en phase de test actuellement).
En complément de ces dispositions, OpenAI a également renforcé la sécurité de son outil DALL-E 3, en bloquant la création d’images violentes, à caractères haineux ou obscènes. Il sera également impossible de créer des images de personnalités publiques si le prompt mentionne un nom spécifique.
Cet outil révolutionnaire sera disponible dès le mois d’octobre 2023, et accessible uniquement pour les abonnés payants aux offres ChatGPT PLUS et ChatGPT Enterprise. Aucune date pour une sortie à destination du grand public n’a encore été dévoilée par OpenAI.