Kunstmatige intelligentie verandert de kunstwereld op opmerkelijke manieren. Een van de fascinerende toepassingen van AI in het kunstsegment is het gebruik van beschrijvende kunstgeneratoren. Deze generatoren hebben de mogelijkheid om afbeeldingen te onderzoeken en te interpreteren en op basis van hun analyse volledig nieuwe kunstwerken te genereren.
In dit artikel bespreken we drie van dergelijke AI-kunstgeneratoren: MidJourney, Stable Diffusion en Microsoft Bing Image Creator, en welke van de drie als beste uit de bus komt bij het genereren van de beste resultaten op basis van prompts.
Halverwege de reis
MidJourney, opgericht door David Holz, is een AI-kunstgenerator die machine learning gebruikt om patronen en kenmerken in bestaande kunstwerken te identificeren, die vervolgens kunnen worden gebruikt om nieuwe stukken te maken.
MidJourney ging op 12 juli 2022 de open bèta in. Voordat MidJourney werd gelanceerd, was Holz medeoprichter van Leap Motion, een startup die gebruikersinterfaces transformeerde door gebruik te maken van video-opname en handgebaren. In 2019 verkocht hij Leap Motion aan Ultrahaptics.
Nu MidJourney aan populariteit wint, heeft Holz zijn inzichten over technologie en de invloed ervan op kunst en de samenleving gedeeld. Holz beschouwt artiesten als klanten van MidJourney, niet als concurrenten, en is van mening dat het platform meer creativiteit en experimenten in de ideevormingsfase kan faciliteren.
Er zijn echter zorgen over mogelijke inbreuk op het auteursrecht van de trainingsset van MidJourney, die mogelijk auteursrechtelijk beschermde werken van andere artiesten bevat.
Holz benadrukt dat MidJourney is ontworpen om menselijke capaciteiten te verbeteren in plaats van ze te vervangen. Hij vergelijkt het met auto’s en legt uit dat alleen omdat auto’s sneller zijn dan mensen, dit niet betekent dat we onze benen moeten afhakken.
Door gebruik te maken van de AI-beeldgeneratie van MidJourney kunnen kunstenaars nieuwe mogelijkheden verkennen en tal van ideeën bedenken voordat ze hun eigen werk maken.
Stabiele verspreiding
Stable Diffusion is een open-source machine learning-model dat afbeeldingen kan genereren uit tekst, afbeeldingen kan wijzigen op basis van tekst of details kan invullen op afbeeldingen met een lage resolutie of weinig details. Het is getraind op miljarden afbeeldingen en kan resultaten opleveren die vergelijkbaar zijn met die van DALL-E 2 en MidJourney.
Emad Mostaque, oprichter en CEO van Stability AI, is het bedrijf dat verantwoordelijk is voor Stable Diffusion. Stable Diffusion is een latent diffusiemodel ontwikkeld door de CompVis-groep van LMU München en ontworpen door Patrick Esser en Robin Rombach, die eerder de latente diffusiemodelarchitectuur creëerden die wordt gebruikt door Stable Diffusion.
Een samenwerking tussen Stability AI, CompVis LMU, Runway, EleutherAI en LAION heeft Stable Diffusion beschikbaar gemaakt voor het publiek.
Stabiele diffusie kan worden ingezet op verschillende platforms, waaronder Windows- en Apple-apparaten. Door implementatie op het apparaat in een app te gebruiken, kan de privacy van gebruikers worden beschermd, wat de voorkeur heeft boven een servergebaseerde benadering.
Microsoft Bing Image Creator
Microsoft heeft een nieuwe tool onthuld genaamd Bing Image Creator, waarmee gebruikers hun eigen afbeeldingen rechtstreeks in Microsoft Edge kunnen maken. Het bedrijf heeft een reeks tools voor makers uitgebracht die zijn ontworpen om creativiteit en zelfexpressie aan te wakkeren. Met de tool kunnen gebruikers gepersonaliseerde afbeeldingen maken om hun levensupdates te delen of voor elk ander doel dat ze nodig hebben.
Gebruikers hebben eenvoudig toegang tot de Image Creator vanuit de zijbalk van Microsoft Edge. Microsoft heeft proactieve maatregelen genomen om ervoor te zorgen dat de tool op verantwoorde wijze wordt gebruikt en de verspreiding van aanstootgevende inhoud niet bevordert.
Het bedrijf heeft een inhoudsbeleid opgesteld dat het gebruik van Image Creator in bepaalde gevallen verbiedt, en gebruikers kunnen schendingen van dit beleid melden. Bovendien heeft Microsoft technologie geïmplementeerd om mogelijke vooroordelen aan te pakken die zouden kunnen ontstaan in generatieve beeldtechnologie.
In dit artikel gaan we op reis om de resultaten van elke beschrijvende AI-beeldgenerator te evalueren wanneer daarom wordt gevraagd met identieke tekstprompts.
Prompt 1: Moderne kerstman op een slee die wordt voortgetrokken door rendieren op een warme, zonnige dag op een snelweg
Prompt 2: een close-up van een dier met grote ogen, die zijn onschuld en schattigheid vastlegt
Prompt 3: Een menselijke astronaut die speelt om een nieuwe planeet te landen, wordt welkom geheten door vijandige buitenaardse wezens die hun wapens trekken
Prompt 4: moderne abstracte kunst van een boekomslag van een roman uit New York City in gedurfde heldere kleuren
Prompt 5: Een man kiest tussen twee borden: een met pizza en een met een cheeseburger erop
Prompt 6: Een gewonde krijger die op zijn paard op een besneeuwde berg rijdt met een zwaard in zijn hand
Prompt 7: Een abstracte afbeelding met verschillende tinten die de beweging en stroming van water laat zien
Prompt 8: Zalm in een rivier met weelderig groene bomen op de achtergrond
Prompt 9: Een glas water op een tafel met een citroen erin geperst door een hand
Prompt 10: Zicht op de horizon in een woestijn vanuit het standpunt van mensen die er op een olifant in rijden
Prompt 11: Een bos waar papiergeld aan bomen groeit en vogels van munten zijn gemaakt
Prompt 12: Kom met ramen, celschaduw, avondverlichting, fotorealistisch
Prompt 13: Elon Musk is arm en werkloos
Uitspraak
Bij het evalueren van de resultaten van MidJourney, Stable Diffusion en Bing Image Creator is het duidelijk dat er geen definitieve winnaar is.
Elke generator interpreteert prompts op een onderscheidende manier, met overeenkomsten die te vinden zijn in de uitvoer van Bing Image Creator en MidJourney. Stabiele verspreiding is efficiënt wanneer prompts duidelijke beschrijvingen hebben, maar woorden vaak te letterlijk nemen. Hoewel MidJourney en Bing Image Creator over het algemeen succesvol zijn, leveren ze af en toe resultaten op die niet overeenkomen met de aanwijzingen.
Bing Image Creator is met name voorzichtig bij het genereren van beledigende of opruiende output, en geeft een waarschuwingsbericht wanneer daarom wordt gevraagd om een beeld te creëren van een arme en werkloze Elon Musk. Microsoft’s goedkeuring van dergelijke beschermende maatregelen is lovenswaardig.
Ondertussen genereerde de neurale netwerkexpertise van MidJourney een beeld van een behoeftige en verlaten Elon Musk. Daarom kan worden geconcludeerd dat elke generator geschikt is voor zijn respectieve gebruikersbestand.