Følgende artikel hjælper dig med: DeepFloyd and Beyond: Udforsk det seneste inden for AI-kunst med NightCafe Studios CEO

NightCafe Studio er en AI Art Generator, der giver brugerne mulighed for at skabe fantastisk og futuristisk kunst på få sekunder ved hjælp af kunstig intelligens. Grundlagt af Angus Russell For fire år siden blev NightCafe Studio født ud af Angus’ egen frustration over ikke at kunne finde kunstværker, der gav genklang hos ham. Drevet af viden om, at stiloverførselsalgoritmer eksisterede, søgte han efter et websted, der ville gøre ham i stand til at skabe personlig kunst gennem stiloverførsel og udskrive den.
Til sin skuffelse kunne han ikke finde sådan en platform. Men dette tilbageslag udløste en innovativ idé hos ham. Han besluttede at skabe en neural stiloverførselsapp til at skabe AI-genereret kunst, og han satte den op på Reddit.
NightCafe Studio opstod som en tekst-til-billede-genereringsplatform, hvilket gør den til den første af sin slags. Denne unikke funktion medførte en betydelig stigning i både omsætning og brugerbase. Siden da er platformen forblevet på forkant med generativ kunstig intelligens og har tiltrukket et stort fællesskab af entusiaster, der glæder sig over at bruge generatoren til at skabe fantastiske kunstværker. I dag betragtes NightCafe Studio bredt som en af de mest populære og innovative AI-billedgeneratorer, der findes.
Under et interview med Angus Russell undersøgte vi fordelene og begrænsningerne ved AI-genereret kunst, den stigende brug af kunstig intelligens i kunstverdenen og den seneste AI-billedgenereringsalgoritme, DeepFloyd.

Fremkomsten af AI-genereret kunst
I det sidste årti har kunstindustrien været vidne til en gradvis infiltration af kunstig intelligens og maskinlæring (ML). Disse banebrydende teknologier har introduceret nogle fascinerende nye koncepter, såsom Deepfakes og DALL-E, som har vundet betydelig opmærksomhed over hele kloden. I dag har kunstindustrien ikke råd til at ignorere den enorme virkning af AI, som nu udløser en længe ventet revolution i sektoren.
Angus diskuterede, hvordan NightCafe Studio oplevede stigninger i væksten under udgivelsen af Stable Diffusion, en tekst-til-billede-model, som hans virksomhed gik live med på lanceringsdagen. Siden da er adgangsbarrieren for at skabe lignende værktøjer blevet sænket på grund af open-sourcing af algoritmer og eksempelkoder.
NightCafe Studios grundlægger mener, at skabelse af kunstig intelligens ikke kun handler om slutproduktet, men også om processen med at skabe det. Han ser det som en form for terapi og afslapning, der giver folk mulighed for at udtrykke sig på unikke og kreative måder. Mange mennesker, der aldrig havde betragtet sig selv som kreative, har opdaget deres kunstneriske evner gennem AI-genererede billeder. Denne filosofi afspejles i platformens brugergrænseflade, som er designet til at være brugervenlig og tilgængelig for kunstnere på alle færdighedsniveauer.
Alene på NightCafe Studio er der allerede mellem to og tre millioner brugere om måneden, hvilket genererer omkring en million billeder om dagen. Stability AI, en open source-generativ AI-virksomhed, anført at de havde over 10 millioner brugere, der var aktive dagligt kort efter lanceringen af Stable Diffusion.
DeepFloyd IF: The New Game-Changing AI Image Generation Algorithm
NightCafe Studio implementerer en ny algoritme af Stability AI kaldet DeepFloydsom lover at revolutionere, hvordan vi genererer billeder med kunstig intelligens.
DeepFloyd, som i øjeblikket er i beta, er en ny tekst-til-billede-model, der kan generere imponerende billeder fra naturlige sprogbeskrivelser. Den er baseret på en ny arkitektur, der kombinerer en stor sprogmodel med tre spredningsmodeller. Den er inspireret af Imagen, en lignende model udviklet af Google Research, men aldrig udgivet til offentligheden.
Modellen kan generere klare og sammenhængende billeder med tekst og objekter i forskellige rumlige relationer, hvilket er en udfordrende opgave for de fleste andre tekst-til-billede-modeller. Dette opnås ved at bruge den store sprogmodel T5-XXL-1.1 som tekstkoder og en betydelig mængde tekst-billede krydsopmærksomhedslag, der giver bedre prompt og billedalliance.
DeepFloyd kan også skabe billeder med et ikke-standard formatforhold og har en høj grad af fotorealisme. Derudover giver det mulighed for nul-shot billede-til-billede oversættelser, hvilket betyder, at stilen, mønstrene og detaljerne i et outputbillede kan ændres, mens den grundlæggende form af kildebilledet bevares uden behov for finjustering.
Den nye algoritme fungerer på en anden måde end stabil diffusion. DeepFloyd bruger pixelplads og en Large Language Model (LLM), hvorimod Stable Diffusion bruger latent plads og en fast CLIP-model. DeepFloyd bruger også flere diffusionsprocesser til at skabe billeder, mens Stable Diffusion kun bruger en enkelt.
DeepFloyd er navnet på den forskergruppe, der har bygget algoritmen, og selve algoritmen hedder IF. Forskergruppen omfatter mange af de samme mennesker, som skabte GPT-3’s forgænger, GPT-2, og en tidligere state-of-the-art sprogmodel kaldet RuGPT.
Nogle spekulationer tyder på, at navnet IF kan være inspireret af en Pink Floyd-sang af samme navn, som antydet af algoritmeforskningsgruppens bios på sociale medier.
Læs mere om algoritmen her.

Sammenligning af AI-kunstbegrænsninger og digital kunst
En af de største AI-begrænsninger er tekst, selvom DeepFloyd tackler dette problem. En anden begrænsning er vanskeligheden ved at få et billede nøjagtigt som forventet, især uden ekspertopfordring. AI mangler også evnen til at forstå og fortolke de kulturelle og sociale sammenhænge, der former menneskelig kunst. Derfor kan AI-genereret kunst nogle gange producere værker, der virker malplacerede eller kulturelt ufølsomme.
AI-genererede billeder kan dog stadig være smukke og til tider endda bedre end den oprindelige idé, så længe brugeren er åben for at blive overrasket, sagde Angus. Desuden er der måder at ændre de genererede billeder ved hjælp af AI-algoritmer eller Photoshop. Selvom det i øjeblikket er et område for aktiv forskning at få et nøjagtigt billede, sker der betydelige fremskridt. Det kan snart være muligt at have fuld kontrol over alle aspekter af et billede.
AI er afhængig af de billeder og kunst, der findes på nettet, som inspiration, men kun dem, den er trænet på. Forskellige algoritmer, såsom Midjourney, DALL-E og Stable Diffusion, trænes på forskellige datasæt, hvilket betyder, at de kan præstere bedre på bestemte typer billeder.
For nylig har forskere undersøgt virkningen af at fjerne billeder af lav kvalitet fra træningsdatasæt for at forbedre AI-resultater. Ved at bortfiltrere disse lavkvalitetsbilleder kan det resulterende datasæt blive mindre, men højere kvalitet, hvilket fører til bedre resultater uden at øge størrelsen på AI-modeller eller kræve dyrere hardware. Angus delte, at denne tilgang repræsenterer en lovende måde at forbedre kvaliteten af AI-genererede billeder uden at stole på større og mere ressourcekrævende modeller.
Et problem med AI i kunst er, at det kan devaluere menneskelige kunstneres arbejde, som bruger meget tid på at skabe kunst, mens AI er i stand til at generere kunst i løbet af få sekunder. Der er dog en vis immateriel kvalitet ved menneskelig kunst, som kan være vanskelig for AI at replikere, såsom den følelsesmæssige dybde og kompleksitet, der ofte er til stede i menneskeskabte værker. NightCafe Studio mener, at AI handler mindre om at skabe kunst til kommercielle formål og mere om nydelsen af selve den kreative proces.
“Der vil altid være værdi i menneskeskabt kunst, fordi den repræsenterer kunstnerens indsats og dygtighed, hvorimod AI-genereret kunst ikke har den samme iboende værdi.”
sagde Angus.
Et etisk problem omkring AI i kunst er brugen af offentlige billeder til at træne AI-algoritmer, som muligvis ikke tilhører den virksomhed, der træner AI’en. Selvom der i øjeblikket ikke er nogen love, der er brudt, rejser det spørgsmål om samtykke og privatliv. Open source-virksomheder som OpenAI og DALL-E arbejder på at gøre processen mere etisk, men det er stadig et åbent spørgsmål. Der kan komme fremtidige regler vedrørende brugen af billeder til at træne AI i kunst.
På trods af disse bekymringer mener Angus, at AI-processen i kunst ikke er fundamentalt forskellig fra menneskelige kunstnere, der henter inspiration fra andre kunstneres arbejde. AI ved, hvordan tingene ser ud og husker stykker om billeder, ligesom mennesker gør. Det er simpelthen bedre til at genskabe dem fra bunden.
Læs mere: