Redaktörsbetyg: Användarbetyg:[Totalt: 0 Genomsnitt: 0].ilfs_responsive_below_title_1 { width: 300px; } @media(min-bredd: 500px) {.ilfs_responsive_below_title_1 { bredd: 300px; } } @media(min-bredd: 800px) {.ilfs_responsive_below_title_1 { bredd: 336px; } }
Text-till-bild-generering är en teknik för att generera bilder baserade på textbeskrivningar med hjälp av artificiell intelligens . Den använder olika Text-to-Image-modeller som började utvecklas 2010 på grund av många framsteg inom området neurala nätverk. Dessa maskininlärningsmodeller accepterar en beskrivning av naturligt språk som indata och producerar en bild som matchar beskrivningen så långt som möjligt.
Ett antal text-till-bild-modeller finns tillgängliga. för forskare och utvecklare, mest populära bland dem är DALL-E, Imagen (Google), MidJourney och Stable Diffusion. Både DALL-E och MidJourney är inte öppen källkod till skillnad från Stable Diffusion som släpptes 2022.
Stable Diffusion är ett samarbete mellan Stability AI, LMU (Ludwig Maximilian University of Munich) och några andra satsningar och används främst för att skapa bilder baserade på textbeskrivningar. Stable Diffusion har tränats på miljarder bilder och har kapacitet att producera resultat som matchar kvaliteten på riktiga fotografier och konst som ritats av människor. Klicka här för att läsa mer om Stable Diffusion.
I den här artikeln kommer att utforska 5 AI-bildgeneratorer baserade på stabil spridning text-till-bild-modell.
1. Stable Diffusion Web
Som namnet antyder använder den här webbplatsen Stable Diffusion-modellen för att producera nästan fotorealistiska bilder från enbart en textinmatning. Skriv bara några ord om bilden som du vill skapa med naturligt språk och klicka sedan på”Generera bild”.
Vänta tålmodigt eftersom det kommer att ta ett tag för Stable Diffusion att bearbeta texten och generera en ett par bilder med dess AI-modell. Storleken på varje bild är 512 x 512 pixlar, och du kan använda miniatyrerna nedan för att se bilden i full storlek. För att ladda ner en bild, högerklicka på den och välj”Spara bild som”.
Klicka här för att navigera till Stable Diffusion Web.
2. Night Café
Detta är ännu en text-till-bild-generator baserad på stabil spridning som kan hjälpa dig att skapa otroligt estetiska bilder från en textuppmaning. Denna generator låter dig också välja stil på bilden som NightCafe, Artistic och Bon Voyage.
Skriv bara in några ord/fraser på ditt naturliga engelska språk, välj stilen på bilden och klicka på’Skapa’. Det kan ta ett par sekunder för text-till-bild-modellen att bearbeta uppmaningen och skapa bilden åt dig.
Du kan klicka på”Fler alternativ”för att använda ytterligare stilar som Foto, B & W-porträtt, Modern comic etc. Du kan också aktivera”Avancerade alternativ”med hjälp av vippknappen längst upp för att välja bildförhållande, promptvikt (hur mycket den slutliga bilden matchar textprompten), antal bilder som ska genereras och mer.
När bilderna har skapats kan du klicka på”Visa skapande”och välja att ladda ner dem i JPG-format eller dela dem med andra. Du kan också klicka på”Utveckla”för att använda den tidigare genererade bilden som basbild och justera dess inställningar för att skapa vad du vill.
Varje bildgenerering tar 0,5 krediter och Night Café erbjuder dig 5 gratis krediter som innebär att du kan skapa maximalt 10 bilder, varefter du kan köpa ytterligare krediter genom att klicka på knappen”Köp krediter”.
Gå direkt och använd Night Café genom att klicka på denna länk.
3. Krama ansikte
Detta är en annan populär stabil spridningstext-till-bild-generator som fungerar ungefär på samma sätt som stabil spridningswebb som vi har diskuterat tidigare. Skriv bara texten på naturligt språk för att beskriva bilden och klicka på”Generera bild”. Ett kramande ansikte ger 4 bilder på vardera 512 x 512 pixlar. Du kan klicka på valfri miniatyrbild för att se bilden i full storlek. Högerklicka på bilden och välj”Spara bild som”för att ladda ner den till ditt system i JPG-format.
För att använda Hugging Face för bildgenerering, klicka här
4. Replikera
Låt oss gå vidare till Replicate som är nästa text-till-bild-generator baserad på stabil diffusionsmodell. Denna generatorwebbplats låter dig konfigurera några viktiga inställningar såsom storleken på den utgående bilden (bredd och höjd), styrka för meddelanden, antal bilder som ska genereras och mer.
Processen för bildgenerering förblir densamma.. Skriv bara bilden Beskrivning med några få ord med naturligt språk, ange inställningarna om det behövs och klicka på knappen”Skicka”i slutet av webbsidan.
Det tar ett par sekunder att skapa bilder som du kan klicka på för att se dem i full storlek (512 x 512 pixlar) eller högerklicka och välj”Spara bild som”för att ladda ner dem till ditt system i PNG-format. Alternativt kan du också välja att dela bilden till GitHub eller Discord.
Du kan också använda Replicate API för text-till-bild-generering eller köra modellen på din egen dator om det behövs. Klicka på relevanta flikar på webbsidan för att lära dig mer om detta.
Om du vill besöka Replicate, klicka här.
5. Deep AI
Detta är den sista på listan över text-till-bild-generatorer som använder stabil diffusion. Arbetet skiljer sig inte från de andra som vi har listat ovan.
Skriv bara in orden eller frasen för att beskriva bilden på naturligt språk och klicka på”Generera”. Inom några sekunder kommer Deep AI att visa en enda bild som du kan ladda ner som en JPG-fil med en storlek på 512 x 512 pixlar. Det finns inga andra relaterade inställningar för att konfigurera bildgenereringen som vi har sett på några av de andra webbplatserna ovan.
Klicka här för att besöka Deep AI
Du kan prova var och en av ovanstående Stable Diffusion AI-bildgeneratorer och jämföra flexibiliteten och resultaten för att komma till en slutsats vilken som passar bäst för dina behov. Min röst kommer att läggas till förmån för Night Café eftersom det ger mycket flexibilitet och kontroll i processen för bildgenerering på grund av de inställningar och alternativ som det ger. Låt oss veta vad du känner.