Redaktørvurderinger: Brukervurderinger:[Totalt: 0 Gjennomsnitt: 0].ilfs_responsive_below_title_1 { width: 300px; } @media(min-bredde: 500px) {.ilfs_responsive_below_title_1 { width: 300px; } } @media(min-bredde: 800px) {.ilfs_responsive_below_title_1 { width: 336px; } }
Tekst-til-bilde generering er en teknikk for å generere bilder basert på tekstbeskrivelser ved bruk av kunstig intelligens . Den bruker forskjellige tekst-til-bilde-modeller som begynte å bli utviklet i 2010 på grunn av mye fremgang innen nevrale nettverk. Disse maskinlæringsmodellene godtar en naturlig språkbeskrivelse som input og produserer et bilde som samsvarer med beskrivelsen så langt som mulig.
En rekke tekst-til-bilde-modeller er tilgjengelige for forskere og utviklere, mest populære blant dem er DALL-E, Imagen (Google), MidJourney og Stable Diffusion. Både DALL-E og MidJourney er ikke åpen kildekode i motsetning til Stable Diffusion som ble utgitt i 2022.
Stable Diffusion er et samarbeid mellom Stability AI, LMU (Ludwig Maximilian University of Munich) og noen andre virksomheter og brukes hovedsakelig for å lage bilder basert på tekstbeskrivelser. Stabil diffusjon har blitt trent på milliarder av bilder og har kapasitet til å produsere resultater som matcher kvaliteten på ekte fotografier og kunst tegnet av mennesker. Klikk her for å lese mer om Stable Diffusion.
I denne artikkelen har vi vil utforske 5 AI-bildegeneratorer basert på stabil diffusjon tekst-til-bilde-modell.
1. Stable Diffusion Web
Som navnet antyder, bruker denne nettsiden Stable Diffusion-modellen for å produsere nesten fotorealistiske bilder fra rent tekstinndata. Bare skriv inn noen få ord om bildet du ønsker å generere ved bruk av naturlig språk, og klikk deretter på’Generer bilde’.
Vent tålmodig, da det vil ta en stund før stabil diffusjon behandler teksten og genererer en par bilder ved hjelp av AI-modellen. Størrelsen på hvert bilde er 512 x 512 piksler, og du kan bruke miniatyrbildene nedenfor for å se bildet i full størrelse. For å laste ned et bilde, høyreklikk på det og velg”Lagre bilde som”.
Klikk her for å navigere til Stable Diffusion Web.
2. Night Café
Dette er nok en tekst-til-bilde-generator basert på stabil diffusjon som kan hjelpe deg med å lage utrolig estetiske bilder fra en tekstmelding. Denne generatoren lar deg også velge stilen til bildet som NightCafe, Artistic og Bon Voyage.
Bare skriv inn noen få ord/setninger på ditt naturlige engelske språk, velg stilen på bildet og klikk på’Skape’. Det kan ta et par sekunder før tekst-til-bilde-modellen behandler forespørselen og genererer bildet for deg.
Du kan klikke på”Flere alternativer”for å bruke flere stiler som Foto, B & W-portrett, moderne tegneserie osv. Du kan også aktivere’Avanserte alternativer’ved å bruke vippebryteren øverst for å velge sideforhold, forespørselsvekt (hvor mye det endelige bildet samsvarer med tekstmeldingen), antall bilder som skal genereres og mer.
Når bildene er generert, kan du klikke på”Se oppretting”og velge å laste dem ned i JPG-format eller dele dem med andre. Du kan også klikke på”Utvikle”for å bruke det tidligere genererte bildet som basisbilde og justere innstillingene for å lage det du vil.
Hver bildegenerering tar 0,5 kreditter og Night Café tilbyr deg 5 gratis kreditter som betyr at du kan generere maksimalt 10 bilder, hvoretter du kan kjøpe flere kreditter ved å klikke på’Kjøp kreditt’-knappen.
Gå rett i gang og bruk Night Café ved å klikke på denne lenken.
3. Hugging Face
Dette er en annen populær Stable Diffusion Text-to-Image Generator som fungerer mer eller mindre på samme måte som Stable Diffusion Web som vi har diskutert tidligere. Bare skriv inn den naturlige språkteksten for å beskrive bildet og klikk på”Generer bilde”. Et klemt ansikt vil produsere 4 bilder på 512 x 512 piksler hver. Du kan klikke på et hvilket som helst miniatyrbilde for å se bildet i full størrelse. Høyreklikk på bildet og velg”Lagre bilde som”for å laste det ned til systemet ditt i JPG-format.
For å bruke Hugging Face for bildegenerering, klikk her
4. Repliker
La oss gå videre til Replicate, som er den neste tekst-til-bilde-generatoren basert på den stabile diffusjonsmodellen. Dette generatornettstedet lar deg konfigurere noen viktige innstillinger som størrelse på utdatabildet (bredde og høyde), forespørselsstyrke, antall bilder som skal genereres og mer.
Prosessen med bildegenerering forblir den samme. Bare skriv inn bildet Beskrivelse med noen få ord med naturlig språk, spesifiser innstillingene om nødvendig og klikk på’Send’-knappen på slutten av nettsiden.
Det tar et par sekunder å generere bilde(r) som du kan klikke for å se dem i full størrelse (512 x 512 piksler) eller høyreklikk og velg”Lagre bilde som”for å laste dem ned til systemet ditt i PNG-format. Alternativt kan du også velge å dele bildet til GitHub eller Discord.
Du kan også bruke Replicate API for tekst-til-bilde generering eller kjøre modellen på din egen datamaskin om nødvendig. Klikk på de relevante fanene på nettsiden for å lære mer om dette.
For å besøke Replicate, klikk her.
5. Deep AI
Dette er den siste på listen over tekst-til-bilde-generatorer som bruker stabil diffusjon. Arbeidet er ikke forskjellig fra de andre vi har listet opp ovenfor.
Bare skriv inn ordene eller setningen for å beskrive bildet på naturlig språk og klikk på”Generer”. Om noen sekunder vil Deep AI vise et enkelt bilde som du kan laste ned som en JPG-fil med en størrelse på 512 x 512 piksler. Det er ingen andre relaterte innstillinger for å konfigurere bildegenereringen, slik vi har sett på noen av de andre nettstedene ovenfor.
Klikk her for å besøke Deep AI
Du kan prøve ut hver av de ovennevnte Stable Diffusion AI-bildegeneratorene og sammenligne fleksibiliteten og resultatene for å komme til en konklusjon hva som passer best for dine behov. Min stemme vil bli avgitt til fordel for Night Café, da det gir mye fleksibilitet og kontroll i prosessen med bildegenerering på grunn av innstillingene og alternativene den gir. Fortell oss hva du føler.