Accueil A la une ! DALL-E 2 d’OpenAI produit des images fantastiques de presque tout ce que...

DALL-E 2 d’OpenAI produit des images fantastiques de presque tout ce que vous pouvez imaginer : comment ça marche ?

109

En janvier 2021, la société OpenAI fondée par Elon Musk et soutenue financièrement par Microsoft a dévoilé son projet le plus ambitieux à ce jour, le système d’apprentissage automatique. DALL-E.

Cette ingénieuse intelligence artificielle multimodale était capable de générer des images (bien que plutôt caricaturales) sur la base des attributs décrits par un utilisateur. Pensez à « un chat en sushi » ou à « une radiographie d’un capybara assis dans une forêt ». Récemment, l’entreprise a dévoilé la prochaine itération de la DALL-Equi a une résolution plus élevée et une latence plus faible que l’original.

Le premier DALL-E pouvait générer des images et combiner plusieurs images en un collage, offrant ainsi différents angles de vue. Il pourrait même déduire des éléments d’une image – comme les effets d’ombre – à partir de la description.

« Contrairement à un moteur de rendu 3D, dont les entrées doivent être spécifiées sans ambiguïté et dans tous les détails, DALL-E est souvent capable de « remplir les blancs » lorsque la légende implique que l’image doit contenir certains détails qui ne sont pas explicitement indiqués. » a déclaré L’équipe d’OpenAI en 2021.

Le DALL-E d’OpenAI ne peut pas être utilisé par tout le monde

DALL-E n’a jamais été conçu pour être un produit commercial, et ses capacités étaient donc quelque peu limitées, étant donné que l’équipe d’OpenAI le considérait comme un outil de recherche. Elle a également été intentionnellement limitée afin que le système ne soit pas utilisé pour générer de la désinformation.

Lire aussi :  La mauvaise nouvelle pour les fans de Spotify : pourquoi ça ne sonne pas bien

DALL-E 2, qui utilise le système de reconnaissance d’images CLIP d’OpenAI, s’appuie sur ces capacités de génération d’images. Les utilisateurs peuvent désormais sélectionner et modifier des zones spécifiques d’images existantes, ajouter ou supprimer des éléments, combiner deux images en un seul collage et générer des variations d’une image existante. Le CLIP d’OpenAI est conçu pour examiner une image donnée et en résumer le contenu d’une manière compréhensible par tous. La société a inversé ce processus, en construisant une image à partir de son résumé dans le processus avec le nouveau système.

« DALL-E 1 a simplement pris notre approche GPT-3 du langage et l’a appliquée à la production d’une image : nous avons comprimé les images en une série de mots et avons simplement appris à prédire ce qui va suivre », a déclaré Prafulla Dhariwal, chercheur chez OpenAI, au Verge.

Contrairement à la première, avec laquelle tout le monde peut jouer sur le site web d’OpenAI, cette nouvelle version n’est actuellement disponible que pour les tests des partenaires vérifiés, qui sont eux-mêmes limités dans ce qu’ils peuvent télécharger ou générer avec le programme.

Lire aussi :  Appareil 2 en 1, disponible bientôt chez Lidl. Il vous aide à vous détendre et à dormir.
Article précédentLa Russie appelle les membres de l’ONU à rejeter la résolution suspendant le pays du Conseil des droits de l’homme
Article suivantLe Kremlin affirme que l’Ukraine a présenté un projet d’accord de paix « inacceptable ».
Un passionné de voyage. Journaliste et buveur de café. Évangéliste du Web et fanatique de bière depuis toujours mais aussi passionné de culture Pop !