Snili jste někdy o snadném přenosu obrázků z vaší fantazie na papír? To je nyní možné díky generátorům obrázků, jako je Midjourney.
Ať už jste talentovaný umělec nebo nemáte vůbec žádné zkušenosti se štětcem, nyní můžete vytvářet mistrovská díla. To znamená, že díky umělé inteligenci můžete během pár minut vytvořit snímky, které dříve zůstávaly jen ve vaší hlavě. Stačí je popsat slovy a za chvíli bude obrázek hotový. To vše díky zajímavé službě Střední cesta, která vytváří obrázky generované umělou inteligencí. Zaujalo? Pak vám navrhuji zjistit podrobněji, co je Midjourney, jak funguje a všechny nejdůležitější informace o tomto nástroji umělé inteligence.
Přečtěte si také: Testoval jsem a vyzpovídal Bingova chatbota
Midjourney: Co je to?
Od papeže Františka ve světlé bundě po filmové plakáty inspirované Wesem Andersonem, obrázky generované umělou inteligencí jsou na internetu stále běžnější. Je snadné pochopit proč – moderní nástroje umělé inteligence se staly tak přesvědčivými, že fotografie, které vytvářejí, dokonce získaly prestižní fotografická ocenění.
Midjourney je příkladem generativní umělé inteligence, která dokáže vytvářet grafiku na základě textových pokynů. Toto je jen jeden z mnoha generátorů obrázků založených na strojovém učení, které se nedávno objevily. Navzdory tomu se Midjourney stal spolu s DALL-E a Stable Diffusion jedním z největších a nejoblíbenějších nástrojů AI svého druhu.
K používání Midjourney nepotřebujete žádný speciální hardware ani software, protože funguje prostřednictvím chatovací aplikace Discord. Jediná nevýhoda? Tedy je. Právě nutnost zaplatit určitou částku za zahájení generování obrázků odlišuje Midjourney od většiny konkurenčních řešení, která často nabízejí alespoň nějaké generování obrázků zdarma.
Použití Midjourney je však extrémně snadné a dostupné pro každého, protože náklady nejsou příliš vysoké a získané výsledky mohou být skutečně úžasné.
Zajímavé také: Moderní dělostřelectvo je super zbraň Ukrajiny. A proč je tady Elon Musk?
Příběh původu Midjourney
Na rozdíl od DALL-E, za kterým stojí vývojář Chat GPT, se Midjourney popisuje jako samostatně financovaný a nezávislý projekt. Službu založil David Holtz, který je také spoluzakladatelem Leap Motion, známého startupu pro virtuální a rozšířenou realitu, který v roce 2019 koupil UltraHaptics.
Tým Midjourney zahrnuje prominentní osobnosti, jako je Jim Keller (procesorový inženýr Apple, AMD, Tesla, Intel a spoluautor x86-64), Nat Friedman (CEO společnosti Github a předseda nadace GNOME) a Philip Rosedale (zakladatel Second Life).
Vývoj AI textu a obrázků Midjourney začal v uzavřené beta verzi, která byla poté v červenci 2022 přesunuta do otevřené beta verze. To umožnilo veřejnosti přístup a používání nástroje. Právě tento krok pomohl službě Midjourney získat popularitu. Na rozdíl od jiných nástrojů AI byl Midjourney ziskový již v srpnu 2022, což potvrdilo svůj úspěch na trhu.
Zajímavé také: ChatGPT: Jednoduchý návod k použití
Jak používat Midjourney?
Používání Midjourney se může zpočátku zdát trochu zdrcující. Zvlášť když se tvůrci rozhodli pro neobvyklé rozhodnutí. Totiž místo dedikované aplikace pro generování obrázků získáme odkaz na Discord bota s názvem Midjourney Bot. Pojďme si tedy projít všechny kroky, které musíte provést, abyste vytvořili grafiku pomocí nástroje Midjourney.
Zaregistrujte se do Discordu
Abyste mohli začít s Midjourney, musíte mít Discord účet. Discord je chatovací aplikace trochu podobná Slacku. Přestože byl původně vyvinut pro hráče, kteří potřebují koordinovat taktiku při hraní online her pro více hráčů, jako je League of Legends a World of Warcraft, je nyní mimořádně populární i mezi ostatními komunitami.
Jak tedy vidíte, než budete moci používat Midjourney, musíte si vytvořit účet Discord. Je to zdarma. Navštivte stránku Discord a zaregistrujte se. Tam projděte všechny kroky podle pokynů, které se objeví. Pokud již máte nebo jste si právě vytvořili účet Discord, můžete přeskočit k dalšímu kroku.
Přihlaste se do Midjourney
Po nastavení svého Discord účtu přejděte na Midjourney a klikněte na „Připojit se k beta verzi“. Otevře se pozvánka ke kanálu Midjourney Discord. Klikněte na „Přijmout pozvání“.
Jako bezplatný člen nebudete moci vytvářet obrázky, ale můžete si prohlížet rozhraní. Můžete také vidět výtvory ostatních uživatelů, když navštívíte různé místnosti (pojmenované #newbies-14 a #newbies-21), abyste pochopili, jak Midjourney funguje.
Přihlaste se k odběru Midjourney
Chcete-li začít generovat obrázky pomocí Midjourney, musíte si zakoupit předplatné. Chcete-li to provést, navštivte Midjourney.com/account, přihlaste se pomocí svého ověřeného účtu Discord a vyberte si plán předplatného, který vyhovuje vašim potřebám. O cenách jednotlivých plánů napíšeme dále v textu.
Připojte se k serveru Midjourney Discord
Jakmile se připojíte k serveru Midjourney Discord a přihlásíte se k odběru plánu, můžete začít generovat obrázky. Následuj tyto kroky:
- Otevřete Discord a ujistěte se, že jste v nabídce nalevo vybrali server Midjourney.
- Na levé straně obrazovky byste měli vidět dlouhý seznam kanálů.
- Vyberte jeden z kanálů, který začíná na „nováčky“. Možná budete muset posunout seznam dolů, abyste jej našli.
- Můžete procházet kanálem, abyste viděli, jaké tipy použili ostatní uživatelé k vytváření obrázků.
Jak generovat příkazy
V kanálu pro začátečníky nebo ve svém vlastním kanálu zadejte „/imagine“ a za ním text pokynů. Chcete-li zahájit soukromý chat s robotem, vyhledejte ikonu Midjourney Bot v seznamu uživatelů na pravé straně obrazovky. Klikněte na něj pravým tlačítkem a vyberte „Odeslat zprávu“ nebo „Zpráva“.
Buďte ve svém popisu co nejkonkrétnější, abyste AI poskytli dostatek informací k vytvoření požadovaného obrázku. Můžete například zahrnout detaily, jako je styl, žánr, nálada a další prvky, které pomohou AI vytvořit vzhled, jaký si představujete. O tom se dočtete dále v textu.
Zajímavé také: Co jsou neuronové sítě a jak fungují?
Jak vytvořit efektivní výzvy v Midjourney
Každý, kdo použil Midjourney, ví, že čím lépe popíšete snímek, který chcete získat, tím jasnější a jedinečnější bude výsledek. Uživatelé obvykle používají krátké a přímé výzvy. Například po zadání jednoduché instrukce jako „robot používá AI k vytvoření grafiky“, Midjourney vytvoří mimo jiné něco takového:
Jak vidíte, tak jednoduché pokyny nestačí (nebo alespoň ne vždy) k dosažení požadovaných výsledků, takže klíčem k úspěchu je napsání dokonalého vysvětlujícího tooltipu.
Líbí se vám styl toho či onoho umělce? Chcete, aby vaše grafika byla vyrobena ve stylu jiné doby? Nebo existuje konkrétní technika, kterou chcete, aby generátor obrázků používal? Toho všeho lze dosáhnout. Umělá inteligence je trénovaný systém, který bere nespočet vstupních obrázků, aby z nich vytvořil dokonalou grafiku. Jediná věc, o kterou se musíte postarat, je poskytnout AI nejlepší možný popis toho, co od ní očekáváte. Ale jak to udělat? Naštěstí odpověď známe.
Interpunkce
Většinu interpunkce, kterou používáte v nápovědách, bude Midjourney ignorovat. Jediná interpunkce, které Midjourney rozumí, je:
- Možnosti jsou odděleny dvojitými pomlčkami, například „–ar 16:9“ nebo „–v 5“.
- Dvojtečka odděluje celá čísla, kladná i záporná. Například „::-0.5“.
- Mezery slouží jako hlavní symbol, který odděluje lexikální prvky.
Strukturování výzev Midjourney
Nejprve si pamatujte, že v Midjourney musí být výzvy napsány v angličtině, pak jim program nejlépe porozumí. Každá pozvánka začíná příkazem /imagine a musí obsahovat popis toho, co chcete obdržet. Je dobré dát výzvám nějakou strukturu. Není to nutné, ale rozhodně je velmi užitečné získat požadovanou grafiku co nejrychleji a v případě potřeby ji snadno změnit.
V první části popisu uveďte všechny prvky, které nejlépe popisují váš obrázek. Můžete například požádat Midjourney, aby se řídila určitým uměleckým stylem a nabídnout jej jako základ. Zde je příklad: „Obrázek slona ve stylu Van Gogha“:
Co je však na Midjourney opravdu zajímavé, je jeho schopnost reprodukovat snímky, které vypadají jako fotografie. Je třeba zvážit několik věcí. Můžete si například vybrat typ fotoaparátu, který má umělá inteligence emulovat: SLR pro filmové fotoaparáty a DSLR pro fotoaparáty DSLR. Můžete také navrhnout typ objektivu (18, 35, 50 nebo dokonce 250 mm) a konkrétní model fotoaparátu.
Poté můžete zadat další příkazy. Musí jim předcházet znak „-“ a umožnit vám nasměrovat AI na konkrétní aspekty, jako je verze Midjourney (v 4, v 5), poměr stran (3:2, 16:9 atd.) nebo možnosti stylu (s 100 pro střední, p 250 pro vysoké nebo p 750 pro velmi vysoké). Nízké hodnoty pro možnost stylu vytvářejí obrázky, které přesně odpovídají popisku, ale jsou méně umělecké. Vysoké hodnoty vytvářejí mnohem více umělecké grafiky, ale méně související s popisem.
Úplný seznam možností a příkazů je k dispozici na webu Midjourney.
Zde je příklad výzvy a výsledné grafiky:
obrázek sladké malé myši ležící na pláži. Fotografie pomocí Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750
(obrázek roztomilé myšky ležící na pláži. Foto s Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750)
Osvětlení, okolí, perspektiva – promyslete každý detail
Chcete-li dát svým fotografiím kontext, umístěte objekty, které jste vymysleli, do konkrétního prostředí. Midjourney vám umožní udělat neuvěřitelné scény ultrarealistické. Možná budete chtít umístit svou postavu do domu vyzdobeného v určitém stylu, na pláž nebo do ulic určitého města.
Dalším aspektem, který stojí za pozornost, neboť přináší skvělé efekty, je světlo. O tom, jak je to při focení důležité, není třeba nikoho přesvědčovat. Totéž platí pro AI grafiku, která často velmi připomíná skutečné fotografie.
V závislosti na denní době je osvětlení různé. Proto jsou barvy a kontrasty na fotografiích různé. Midjourney je schopen tyto kontrasty reprodukovat. Například už nemusíte čekat na západ slunce, stačí požádat o vytvoření konkrétní fotografie přidáním slova „zlatá hodina“.
Dalším faktorem, se kterým si můžete pohrát, je pozorovací úhel obrazu. V některých případech je k tomu potřeba upravit optiku, což může výrazně změnit vaši grafiku.
Zde je několik příkladů úhlů, které lze zahrnout do výzev Midjourney: Pro vzdálené záběry, širokoúhlý záběr, ultraširokoúhlý záběr, dlouhý záběr, letecký nebo satelitní pohled, záběr z úrovně očí; zblízka – Up, Glamour Portrait, Macro-Shot nebo Macrofotografie.
Zde je příklad dotazu a jeho výsledek:
pohledný muž procházející ulicemi Los Angeles, zlatá hodina Foto s Canon R5, 50 mm, DSLR, –v 5 –ar 3:2 –s 750
(hezký muž procházející se ulicemi Los Angeles, zlatá hodina Foto na Canon R5, 50mm, DSLR, –v 5 –ar 3:2 –s 750)
Upravujte obrázky pomocí změny měřítka a rozptylu
Pod každou sadou vygenerovaných obrázků uvidíte osm tlačítek: U1, U2, U3, U4, V1, V2, V3 a V4. Všechna tato tlačítka umožňují doladit a lépe ovládat typ snímků z Midjourney.
Pokud používáte verzi starší než V5, tlačítka U se použijí k přiblížení, tj. změně velikosti původního obrázku, čímž se vytvoří nová, větší verze s více detaily. Jsou číslovány U1–U4, které se používají k identifikaci snímků v sekvenci. Pokud chcete například přiblížit druhý snímek, stiskněte tlačítko U2 v horní řadě. Nejnovější modely mají ve výchozím nastavení obrázky 1024×1024 pixelů, takže je tlačítka U jednoduše zvýrazní pro pozdější úpravy a snazší ukládání.
Vpravo v prvním řádku je tlačítko Re-roll. Je to skvělý nástroj, pokud nejste spokojeni s první sadou obrázků, které pro vás Midjourney vytvořilo. Kliknutím na toto tlačítko pro opětovné vytvoření požádáte Midjourney, aby vyzkoušelo jiný koncept na základě původního požadavku, a získáte čtyři nové obrázky.
Tlačítka V vytvoří čtyři nové varianty vybraného snímku, které jim odpovídají stylem a kompozicí. Výběrem mezi V1 – V4 můžete vybrat tlačítko, které odpovídá obrázku, pro který chcete vytvořit variace.
A v neposlední řadě: funkce /describe
Nakonec jsem tu nechal skvělý tým, který vám usnadní vytvoření dokonalého tipu. Toto je funkce /popsat, který umožňuje nahrát vlastní obrázek a na základě tohoto obrázku vygenerovat čtyři možné dotazy. Jak to funguje? Po úvodu /popsat zobrazí se okno pro výběr fotografie z disku počítače. Vyberte příslušný grafický soubor, nahrajte jej na server a Midjourney vám nabídne 4 textové návrhy, které jej popisují. Níže je uveden popis fotografie, kterou jsem poslal:
Jak můžete vidět na obrázku výše, pro každý ze čtyř uvedených popisů budou tlačítka, která vám umožní použít nápovědu generovanou Midjourney. Po výběru obrázku se zobrazí textové okno s vybraným popisem. V tuto chvíli se můžete rozhodnout, zda chcete text upravit nebo jej nechat tak, jak byl vytvořen.
Chcete-li dosáhnout nejlepších výsledků, navrhuji, abyste popis co nejvíce rozšířili a jako základ použili pouze text vygenerovaný programem. Po kliknutí na Odeslat jednoduše přijměte pozvánku a odešlete ji Midjourney. Po chvíli obdržíte odpověď s ukázkovými obrázky:
Pro srovnání níže je fotografie, kterou jsem nahrál jako příklad, a fotografie, kterou jsem vybral z předložených návrhů:
Přečtěte si také: O kvantových počítačích jednoduchými slovy
Kolik stojí Midjourney? Dá se používat zdarma?
Zatímco jsme zvyklí na chatboty jako ChatGPT a Bing Chat nabízející téměř neomezené bezplatné použití, u generátorů obrázků to neplatí. Téměř všechny mají určitá omezení a Midjourney již není zdarma kromě několika krátkých propagačních období.
Když byla služba poprvé spuštěna v červenci 2022, kdokoli ji mohl použít k vytvoření 25 obrázků zdarma. Jediné, co jste museli udělat, bylo vytvořit si bezplatný Discord účet a připojit se k serveru Midjourney. Bezplatná zkušební verze byla aktivována ihned po odeslání první žádosti. Když jste však dosáhli limitu 25 obrázků, museli jste přejít na placený tarif.
To vše se změnilo v dubnu 2023, kdy generální ředitel společnosti Midjourney oznámil pozastavení bezplatného zkušebního programu. Za poslední rok se Midjourney stala velmi populární a uživatelé touží sdílet grafiku, kterou vytvořili, na sociálních sítích. Proč se tvůrci k takovému kroku rozhodli?
Rozhodnutí opustit bezplatnou verzi je snadné pochopit. Každá zobrazovací úloha vyžaduje velký výpočetní výkon, zejména grafické procesorové jednotky (GPU). Každý GPU má navíc omezenou videopaměť, která se používá ve velkých objemech pro proces odšumování.
Přesněji řečeno, generátory obrázků používají energeticky náročná GPU, která nejenže stojí spoustu peněz, ale jsou také k dispozici pouze v omezeném množství. Společnost proto v zájmu zachování kvality služeb zastavila bezplatné zkušební období až do odvolání, což by nemělo nikoho překvapit.
Bezplatná zkušební verze se ale může jednou vrátit. Například se spuštěním verze 5.1 Midjourney vrátila týdenní bezplatnou zkušební verzi.
Chcete-li však Midjourney kdykoli používat, musíte si zakoupit jeden ze čtyř plánů předplatného. Nejnižší cena je 10 $ měsíčně. Co dostanete na oplátku? V průměru Midjourney vytvoří nový obrázek za jednu minutu. Pokud však chcete obrázek se změněnou velikostí nebo obrázek s nečtvercovým poměrem stran, možná budete muset strávit trochu více času. Můžeme tedy předpokládat, že základní, nejlevnější plán Basic poskytuje 3,3 hodiny GPU času, což stačí na vygenerování asi 200 generací obrazu.
S každým vyšším předplatným získáte vyšší limit, který vám umožní vytvořit více obrázků za měsíc. Další plán, Standard, tedy poskytuje 15 hodin rychlého generování obrazu a neomezené pomalejší generování (režim Relax) za 30 $ měsíčně. Dále přichází plán Pro, který stojí 60 dolarů měsíčně a nabízí 30 hodin rychlého zobrazování, neomezené pomalejší zobrazování a stealth režim.
V červenci 2023 přibyl Mega plán, který stojí 120 dolarů a dává vám 60 hodin rychlého generování obrazu a samozřejmě neomezené hodiny režimu Relax.
Jak můžete vidět, všechny plány Midjourney vyšší úrovně nabízejí neomezený počet fotografií v režimu Relax, ale na získání obrázků musíte počkat až 10 minut.
Nejnižší úroveň tuto funkci nemá, ale za 10 $ měsíčně stojí za to začít svou cestu Midjourney. Tento plán vám umožňuje prozkoumat platformu, vytvářet obrázky a seznámit se s rozhraním a tím, jak fungují návrhy textu. Pokud se vám líbí, co vidíte, můžete to vždy posunout na další úroveň jednoduchým zadáním výzvy /subscribe, abyste přešli do svého účtu, kde můžete svůj nástroj Midjourney snadno aktualizovat.
Také stojí za to připomenout, že Midjourney někdy pořádá propagační akce a nabízí roční plány s 20% slevou:
- Základní plán s ročním předplatným – 8 $ měsíčně
- Standardní plán s ročním předplatným je 24 $ měsíčně
- Pro tarif s ročním předplatným – 48 $ měsíčně
- Mega plán s ročním předplatným – 96 $ měsíčně.
Střední cesta a vlastnická práva
Generátory obrázků AI se učí z miliard obrázků od fotografů a umělců. Midjourney není výjimkou. Mnoho umělců se domnívá, že generátory obrázků AI porušují autorská práva tím, že jejich díla používají pro vzdělávací účely. Někteří umělci dokonce ve Spojených státech podali stížnosti na generátory AI, jako jsou Midjourney, Stability AI a DeviantArt. Druhá strana však tvrdí, že proces učení spadá do kategorie fair use. Kdo je tedy skutečným vlastníkem obrázku generovaného umělou inteligencí?
Zakladatel Midjourney David Holtz v rozhovoru pro Forbes přiznal, že obrázky používá bez souhlasu majitelů, protože s tak obrovským souborem dat je to prakticky nemožné.
Takže víme, že na tyto obrázky se nevztahují autorská práva, ale mohla by grafika, kterou jste vytvořili, podléhat autorským právům? Odpověď není snadná, ale obecně lze říci, že umělci s umělou inteligencí mohou používat, a to i komerčně, obrázky vytvořené Midjourney, ale nemohou zabránit ostatním v jejich používání.
Přečtěte si také: 7 nejlepších využití ChatGPT
Midjourney Alternativy
DALL-E
DALL-E je první generativní umělá inteligence, která se stala velmi populární na sociálních sítích. Zpočátku, když byl uveden na trh v roce 2021, produkovaná grafika zůstala hodně žádoucí. Nejnovější verze, DALL-E 2, je však díky lepšímu porozumění jazyku a vyšší kvalitě obrazu úplně jiná úroveň. DALL-E může také upravovat stávající obrázky, což vám umožní nahradit nebo přidat zcela nové objekty.
Bing Image Creator
Pokud chcete bezplatnou alternativu k Midjourney, můžete si vybrat Bing Image Creator. Bing Image Creator je zabudován do postranního panelu Microsoft Edge, takže k němu máte přístup při používání prohlížeče. Díky partnerství Microsoft s OpenAI můžete bezplatně používat generátor obrázků DALL-E 2 přes Bing.
studio snů
Midjourney zatím funguje pouze přes Discord, jehož použití nemusí být příliš intuitivní. DreamStudio na druhou stranu nabízí bohaté webové stránky se spoustou tlačítek a knoflíků k přizpůsobení, ale může se to zdát docela složité. DreamStudio používá otevřený model Stable Diffusion.
Sam Stable Diffusion je bezplatný software s otevřeným zdrojovým kódem, který si můžete nainstalovat a spustit na svém počítači. To však vyžaduje určité znalosti programování a značný výpočetní výkon. Z tohoto důvodu Stability AI, společnost odpovědná za tento model, vytvořila platformu s názvem DreamStudio. Podobně jako u modelu Midjourney vytváří Stable Diffusion čtyři různé obrazy na základě jediného příkazu (cue). Uživatel je pak může upravit nebo použít jako základ pro tvorbu nové grafiky. Model lze také doladit tak, aby obrázky, které generuje, více odpovídaly požadavku uživatele, nebo lze použít více výpočetních kroků, což může vést k přesnějšímu výsledku.
Stojí Midjourney za vaši pozornost?
Midjourney je známá produkcí dobře strukturovaných, definovaných a realistických obrázků, díky čemuž je silným konkurentem jiných nástrojů AI, jako jsou DALL-E a Stable Diffusion.
Tento nástroj dokáže vytvářet obrázky s rozlišením až 1792×1024 pixelů, což poskytuje detailnější obrázky.
Midjourney pohání Discord, široce používaná komunikační platforma. Uživatelé mohou s robotem AI komunikovat pomocí jednoduchých příkazů, díky čemuž je přístupný i lidem bez zkušeností s programováním. I když je to zároveň jedna z jeho nevýhod, protože je vázán pouze na platformu Discord. Ne každému se to bude líbit. Osobně mi přišlo jednodušší nainstalovat aplikaci Midjourney samostatně.
Přestože vývojáři ujišťují, že je to server Midjourney Discord, který poskytuje aktivní komunitu, kde mohou uživatelé sdílet své výtvory, klást otázky a získávat pomoc od ostatních uživatelů i týmu Midjourney.
Nelíbilo se mi, že vygenerované obrázky byly veřejné. To znamená, že obrázky, které vytvoříte pomocí Midjourney, vám nepatří. Můžete je (s omezením) používat i komerčně, ale zcela legálně je mohou používat i ostatní uživatelé. Midjourney dokonce zobrazuje ty nejpovedenější výtvory, včetně textových výzev, na svém vlastním webu.
Tým Midjourney neustále pracuje na vylepšování a rozšiřování schopností umělé inteligence, aby zajistil, že nástroj zůstane relevantní ve stále se vyvíjejícím prostředí umělé inteligence. To je důvod, proč nástroj nemá bezplatnou verzi. To nemusí oslovit mnoho potenciálních uživatelů, ale 10 dolarů za to stojí za to, abyste vytvořili své vlastní „skutečné“ mistrovská díla s Midjourney.
Zajímavé také:
Chci do Foydalanu
Skvělý článek! :) Užsisakiau standardní MJ planą. Ar aš gerai suprantu, kad podvosiu per mini utilizati tik 10 savo photos ir internet rastų photos kuriant vizualus?