4 min läsning

DALL·E 2 en AI som ritar bilder

Generativ AI som skapar bilder har fullkomligt exploderat. Här är en samling med olika verktyg och tankar kring dem.

Skrivet av

Kristoffer Yi FredrikssonDigital strateg16 maj, 2022

En teckning fylld med färgglada karaktärer och ord som ‘BANG!’ och ‘WHAM!’, omgiven av färgpennor, markers och en retro-spelenhet på ett träbord.

Organisationen OpenAI har släppt en begränsad förhandsvisning av en minst sagt imponerande samling kod som kan teckna. (Sedan denna bloggposten publicerades har Midjourney sprungit om Dall·E 2 med hästlängder, vill du snabbt komma igång och skapa lite egna bilder så är OpenArt en bra plats att börja)

Psst! Om du gillar att skapa saker med hjälp av AI så kan borde du testa att göra din egen app med hjälp av AI. Följ stegen i vår tutorial så kan du grunderna på runt 20 minuter.

Kanske har du redan sett massa roliga bilder skapade av algoritmen Dall·E 2. En människa skriver en mening, och sen skapar Dall·E 2 en bild baserat på den meningen.

AI-konst, en illustration i traditionell japansk stil som visar två björnar i kimono som säljer varor på en marknad.

Här var prompten “Nallebjörnar som handlar mat i ukiyo-e stil”. Resultaten är fantastiska och det gäller för alla bilderna på deras Instagramkonto också.

En väldigt mycket sämre version av detta finns att testa på WOMBO Dream, jag bad den skapa samma bild, shoppande nallebjörnar, och i samma stil, men resultatet är inte riiiiktgit där. Eller?

Digital illustration skapad av AI som visar en grupp björnar som handlar eller interagerar i en butiksmiljö, med hyllor fyllda av varor i bakgrunden.

Men! Skarpögda läsare har säkert märkt att jag de senaste månaderna börjat använda mig av Wombo Dream för att illustrera mina bloggposter. Även om bilderna blir mer som en grov skiss, något som snarare föreslår hur resultat skulle kunna bli snarare än levererar en färdig illustration, så tycker jag de kan vara användbara.

Tre digitala konstverk: till vänster en mäktig trollkarl i en stor magisk sal, i mitten en munk som postar ett brev i en brevlåda, och till höger en tjur som står i en muromgärdad trädgård.

Inte så konstigt att jag såg folk oroa sig för vad konstnärer och illustratörer ska försörja sig på i framtiden. Den frågan blir extra intressant eftersom det länge sades att just kreativa yrken skulle vara lite extra säkra i den kommande apokalypsen.

Jag vet inte riktigt vad jag ska tänka om det där. Å ena sidan är inget av det jag ser på Dall·E 2 insta det minsta konstnärligt, å andra sidan är allt mer än tillräckligt bra för att vara redaktionella illustrationer, skojiga planscher att hänga på studentkorridoren, eller kanske ha som tryck på en t-shirt. Vem vet, kanske någon skapar en hel tecknad serie med hjälp av en tecknande dator eller karaktärer till ett spel gjort i Scratch?

Precis som CC0 har skapat möjligheten att ha snygga, men generiska, bilder på bloggar, så ken Dall·E 2 fylla en viktig funktion i vårt allt mer visuella kommunikationsflöde. Jag hoppas att tecknande AI’s kan skapa fler nya jobb än vad de krossar befintliga, men det är en klen tröst för den som lagt ner tiotusentals timmar på att lära sig teckna.

Avslutningsvis vill jag bara lyfta fram att OpenAI har följande som mål: Our mission is to ensure that artificial general intelligence benefits all of humanity.* och det låter betryggande. Fast är det ens möjligt att något är bra för hela mänskligheten? Definitvit en fråga en algoritm inte är kapabel att besvara i dagsläget.

*Dall·E 2 är inte artificial general intelligence, inte ens i närheten.

Uppdaterat 30 maj

Videoreportage

Mega Youtubern MKBHD har gjort ett bra reportage om Dall·E 2, väl värt att se, särskilt delen där han visar de småkomiska begränsningarna som Dall·E 2 har.

A new challenger approaches

Google klarade inte av att lämna scenen öppen för OpenAI utan skyndade sig att visa upp sin egen version av "algoritm som kan skapa bilder utifrån en rad text"

Uppdaterad 10 juni

Ännu en öppen webbdemo

Det visade sig att det finns en demoversion av en nedbantad version av Dall·E att testa. Resultaten är i och för sig på nivå med Wombo Dream, om inte sämre, och interfacet är råddigare. Men men. Här kan du testa.

Robin Sloan, författare av den utmärkta boken Sourdough (verkligen utmärkt, köp den), påpekade nyligen i en syrlig bloggpost att tjusningen med illustrerande AIs än så länge sträcker sig till "I see what you did there" och att det finns en anledning till att bilderna alltid postas tillsammans med meningen de genererades utifrån.

Uppdaterad 23 juni

Cosmopolitan kör ett omslag skapat av Dalle

Intressant läsning om att använda ML skarpt, plus en preview av en ny funktion där man kan säga åt algoritmen att måla lite mer åt sidorna.

Uppdaterad 29 juni

En oväntad infallsvinkel

En sevärd fundering kring hur tecknande algoritmer kan hota fotograferandet. Jag hade inte ens tänkt på att det så klart inte bara är illustratörer som eventuellt hotas av detta.