Google Nano Banana nabízí dosud největší potenciál pro marketing mezi genAI modely pro tvorbu obrázků
AI verze autora tohoto textu a Nano Banana. Zdroj: Google studio, repro Marketing Journal.
Google zásadně rozšiřuje možnosti editace obrázků. V jeho AI nástroji Gemini je nově k dispozici jeden z dosud nejmocnějších modelů pro generování obrázků a jejich úpravu; právě v ní přitom model Gemini 2.5 Flash Image s přezdívkou Nano Banana předstihuje konkurenci. Díky promptování úprav stávajících fotografií a možností pracovat se scénami i charaktery z referenčních fotek i na jiných obrázcích přináší schopnosti skutečných králů Photoshopu do rukou všech, kteří dokáží popsat, co chtějí.
Úpravy fotografií
Změna pozadí, odmazání postavy, změna oblečení na postavě, automatické vylepšení parametrů typu kontrastu či expozice. To vše jsou věci, které umí Photoshop i další nástroje na úpravu fotografií. Některé typu Remini to umí i relativně jednoduše v mobilní aplikaci. Dosud žádný AI model to ale nezvládal tak dobře při přesném zachování toho, co chcete na snímku ponechat.
Přidání vlasů plešatým mužům nebo odstranění Donalda Trumpa z oslav, kde neměl co dělat? Žádný problém.
Removing people in pictures (from r/PhotoshopRequest)
— Deedy (@deedydas) August 23, 2025
4/11 pic.twitter.com/KWcjO3V6By
Překvapivá konzistence
Když přišel na jaře tohoto roku ChatGPT-4o s výrazně lepší schopností vytvářet fotorealistické snímky, přiblížil se i tomu, aby dokázal znovu tvořit fotografie lidí či objektů, které jste mu předložili jako referenční. Jeho výstupy dokáží být velmi podobné, ale ne stejné. Google si u svého nového modelu dal záležet na tom, aby otisk referenční obrázků měl ve výstupech velkou konzistenci.
„Zaměřili jsme se hlavně na to, aby si postavy na obrázcích zachovaly svoji podobu i při úpravách. Víme, že při úpravě fotek vás samotných nebo lidí, které dobře znáte, záleží i na jemných detailech — obrázek, který je „skoro stejný, ale ne úplně“, prostě nesedí. Proto je naše nejnovější aktualizace navržena tak, aby fotky vašich přátel, rodiny a dokonce i domácích mazlíčků vypadaly stále jako oni, ať už jim zkoušíte dát účes z 60. let, nebo navlékáte čivavu do baletní sukýnky,“ uvádí na svém blogu Google.
Kombinování scén a postav
„Nahrajte fotku člověka nebo mazlíčka a náš model zachová jejich vzhled ve všech obrázcích, i když je umístíte do nových scén. Vyzkoušejte různé outfity, profese, nebo se podívejte, jak byste vypadali v jiné dekádě — vždy ale pořád jako vy,“ upozorňuje Google.
S jeho pomocí se nyní můžete pochlubit uvěřitelnými fotografiemi z dovolené z nejžádanějších míst světa, i když jste nevylezli po celé léto ze sklepa. Gemini je zdarma přes Google Studio i v aplikaci Gemini.
A značně tím „vypaluje rybník“ některým menším službám, které nabízí za několik set korun vytvořit z vašeho selfíčka set profesionálních snímků, které uplatníte nejen na LinkedIn. Teď to zvládnete i tady, snadno si vyměníte oblečení i prostředí, v němž se budete nacházet.
Test autora tohoto textu předpoklady potvrdil. V Google Studiu šlo utrápený výraz ze selfíčka převést téměř 1:1 na profesionálně vypadající snímek. Plusové body dávám i za přesné zachycení brýlí, se kterými měly jiné genAI modely dosud potíže. Věrně vypadá dokonce i distorze obličeje v průhledu skla silou dioptrií v různých úhlech pohledu.
U stolečku v kavárně jsem jednoduše vyměnil kávu...
...za sklenici vody.
Nelze přitom jednoduše označovat konkrétní plochu na vytvořeném snímku, kterou chcete upravovat, jako to nabízí ChatGPT. Na přesné zadání ovšem Nano Banana reaguje chirurgicky přesnou reakcí.
Nebylo také obtížné si (na prompt) převléct oblečení nebo odnést nápoje a položit na stůl počítač skutečně připomínající zadané Lenovo.
Je ale nutné dodat, že téměř 100% podoba se v mnoha úhlech a výrazech tváře měnila na 70-90%. Dobrou praxí je větvit postavu ze snímku, u něhož jste s podobou spokojení, s využitím funkce „branch of", kdy specifikujete, že chcete použít daný charakter, ale zasadit ho do jiné scény.
Převést či rozšířit fotku z formátu na výšku na šířku bylo o poznání těžší než v ChatGPT. Podobně i vložení ilustrovaného banánu a nápisu na zeď (viz úvodní fotografie) bylo obtížnější operací, než bych si přál. Pozitivní nicméně je, že většinu snímků dodal Gemini 2.5 Flash Image do minuty, maximálně si na úkol vzal 121 vteřin. Po rozkliku na dodané fotografie můžete vidět maximální velikost snímků, která je v případě konkurenta od OpenAI větší.
Můžete si vyzkoušet také to, jak by vám slušely různé účesy. Dodejme, že autor tweetu níže k rozhýbání fotografií vytvořených s Nano Banana využil čínský genAI video nástroj Kling.
Want to try a new haircut? Check out this AI workflow:
— fabian (@fabianstelzer) August 29, 2025
1. upload a selfie & prompt your desired haircut
2. uses Nano Banana to generate your haircut
3. then Kling 2.1 morphs from old you to new you
4. Claude helping behind the scenes with all the prompts
link to glif below pic.twitter.com/9QO2EArOsu
Příslib komerčního využití v marketingovém prostředí v sobě nese možnost propojovat více fotek, tak aby se pak na dalším snímku potkali například dívka a retrívr, ale třeba taky modelka držící v ruce nějaký produkt.
2/ Can edit image by describing to it pic.twitter.com/MXa3UzShwZ
— Eyisha Zyer (@eyishazyer) August 29, 2025
Vícekolové úpravy
To, že mohou být úpravy vícekolově, ukazuje Google na sérii snímků zachycující různé doplňování interiéru pokoje. Jde přitom právě o to, co dosavadním genAI nástrojům moc nešlo. S větší jistotou zachování určitých prvků snímku, si můžete dovolit více řídit, co na něm bude. Travis Davis dokázal na jeden obrázek dostat hned 13 produktů. A to už nezvládne ani hodně zkušený influencer.
New record? 13 images merged into a single image using Gemini 2.5 Flash Image (Nano Banana). This collage method is absolutely BANANAS! I'm actually amazed that it can do this however I feel like I'm reaching it's limit now but even at 13 elements it's still managing to obtain… pic.twitter.com/SOUjLVCedb
— Travis Davids (@MrDavids1) August 27, 2025
Mixování stylů
Nano Banana si dobře poradí i s mixováním stylů. Vezmete vzor motýlího křídla a necháte z něj udělat šaty dívky procházející se městem. Nebo přetvoříte holínky ve stylu okvětních lístků.
Zcela výjimečné v ranku AI nástrojů je možnost kombinovat selektivně styly v rámci jednoho snímku, například realismu a zřetelné ilustrace nebo kombinování realistické scény s emoji. V následující ukázce je vše rozhýbáno do videa.
5/ Move styles from one image to another pic.twitter.com/INNwcP4e5Z
— Eyisha Zyer (@eyishazyer) August 29, 2025
Potěší ale i to, že můžete na referenčím obrázku jen náznakově nakreslit, co a kde byste chtěli umístit, a Google pak zadání lépe pochopí. Klidně vám ale zadanou postavu dá i do polohy dle zadaného 3D modelu.
19/ Make the model pose like the sketchhttps://t.co/Rtp1skWyJS
— Eyisha Zyer (@eyishazyer) August 29, 2025
Konzistence usnadňuje videotvorbu
Výjimečné schopností konzistence výstupů obrázků Gemini naleznou uplatnění i při videotvorbě, ať už s nástrojem od Googlu, Veo, nebo s těmi konkurenčními, které umožňují práci s referenčními obrázky. Ty vám pak pomohou udržet konzistentní charakter i scénu, jak to ukazuje například video níže, u něhož autor použil k rozhýbání fotografií Kling AI.
Higgsfield kicks off a new era of AI content creation
— TechHalla (@techhalla) August 28, 2025
nano banana is unlimited FOR A YEAR, and now your videos are gonna look as real as this one and all from just 1 picture!
all the info, tricks and prompts in this thread pic.twitter.com/gZO4D2YirU
Kombinace Nano Banana, Kling AI a Seedance pak pomohla k pozoruhodnému zhmotnění charakterů z nejznámějších obrazů malířských mistrů.
You've seen these paintings a million times.
— Alex Patrascu (@maxescu) August 29, 2025
But never like this.
Using nano-banana, Seedance, and Kling, I brought them into our modern world, creating an unlikely romance in Central Park, New York City.
Enjoy: pic.twitter.com/NLVIa4NELd
Mimochodem v Gemini i Google studiu si můžete zdarma vyzkoušet domácí Veo 2, tedy ve verzi, jež patřila na špici genAI video nástrojů před uvedením Veo 3. Bohužel právě u něj nejde využít referenční obrázky.
Sporné otázky
Google pořádně zamotal hlavy konkurenci, zpochybnil opodstatnění několika menších AI nástrojů a ukázal, že závody umělé inteligence nejsou zdaleka u konce a o zápletky v nich nebude nouze.
Sporné otázky souvisí zejména s tím, jak je tento model dobrý. Google řeší problematiku autorských práv a ochrany soukromí tím, že všechny obrázky obsahují viditelný vodoznak v pravém dolním rohu a zároveň i neviditelný SynthID podpis. Přesto může hojně přispět k tvorbě výstupů zneužívajícím cizí podobu nebo copyrightované materiály.
Každopádně znamená Gemini další velký krok kupředu v evoluci vizuální GenAI. Mimo přílišných limitů typu neschopnosti pracovat s dětskými postavami směřuje naše hlavní výtka jen k rozlišení či detailu tváří, když nejsou postavy na snímcích dominantním prvkem. Výstupy jsou skvělé na sociální média, ale do printu byste s nimi asi nešli. Pokud by v jednom balíku dokázal Google vyřešit i to, už bychom se mohli u referování o Nano Banana dokonce bavit o jisté formě revoluce. Takto jde o evoluci, která vystřelila Google po videu na špici genAI pelotonu také u tvoření statických snímků.