Stručná odpověď: Zvětšení rozlišení pomocí umělé inteligence funguje tak, že se model trénuje na spárovaných obrázcích s nízkým a vysokým rozlišením a poté se na jejich základě predikuje věrohodný počet dalších pixelů během zvětšení rozlišení. Pokud model během trénování viděl podobné textury nebo obličeje, může přidat přesvědčivé detaily; pokud ne, může „halucinovat“ artefakty, jako jsou svatozáře, vosková kůže nebo blikání ve videu.
Klíčové poznatky:
Predikce : Model generuje věrohodné detaily, nikoli zaručenou rekonstrukci reality.
Volba modelu : CNN bývají stabilnější; GAN mohou vypadat ostřeji, ale riskují, že si vymyslí nové funkce.
Kontroly artefaktů : Dávejte pozor na svatozáře, opakující se textury, „téměř písmena“ a plastické plochy.
Stabilita videa : Použijte časové metody, jinak uvidíte chvění a posun mezi jednotlivými snímky.
Použití s vysokými sázkami : Pokud je důležitá přesnost, uveďte zpracování a výsledky považujte za ilustrativní.

Pravděpodobně jste to už viděli: z malého, křupavého obrázku se stane něco dostatečně ostrého na to, aby se dal vytisknout, streamovat nebo vložit do prezentace, aniž byste se museli mračit. Připadá mi to jako podvádění. A – v tom nejlepším slova smyslu – tak nějak to i je 😅
Takže to, jak funguje upscaling s umělou inteligencí, se redukuje na něco konkrétnějšího než „počítač vylepšuje detaily“ (zvlnění ruky) a blíží se k „modelu, který předpovídá věrohodnou strukturu s vysokým rozlišením na základě vzorců, které se naučil z mnoha příkladů“ ( Hluboké učení pro superrozlišení obrazu: Průzkum ). Tento krok predikce je celá hra – a proto může upscaling s umělou inteligencí vypadat úžasně… nebo trochu plasticky… nebo jako by vaší kočce narostly bonusové vousy.
Články, které byste si mohli po tomto přečíst:
🔗 Jak funguje umělá inteligence
Naučte se základy modelů, dat a inference v umělé inteligenci.
🔗 Jak se umělá inteligence učí
Podívejte se, jak trénovací data a zpětná vazba v průběhu času zlepšují výkon modelu.
🔗 Jak umělá inteligence detekuje anomálie
Pochopte základní vzory a to, jak umělá inteligence rychle signalizuje neobvyklé chování.
🔗 Jak umělá inteligence předpovídá trendy
Prozkoumejte metody prognózování, které rozpoznávají signály a předvídají budoucí poptávku.
Jak funguje upscaling s umělou inteligencí: základní myšlenka, řečeno běžnými slovy 🧩
Zvětšení rozlišení znamená zvýšení rozlišení: více pixelů, větší obraz. Tradiční zvětšení rozlišení (jako bikubické) v podstatě roztahuje pixely a vyhlazuje přechody ( bikubická interpolace ). Je to v pořádku, ale nedokáže vymyslet nové detaily - pouze interpoluje.
Upscaling s využitím umělé inteligence se pokouší o něco odvážnějšího (ve světě výzkumu známém jako „superrozlišení“) ( Hluboké učení pro superrozlišení obrazu: Průzkum ):
-
Dívá se na vstup s nízkým rozlišením
-
Rozpoznává vzory (hrany, textury, rysy obličeje, tahy textu, tkaní látky…)
-
by měla vypadat verze s vyšším rozlišením
-
Generuje další pixelová data, která odpovídají těmto vzorům
Ne „dokonale obnovit realitu“, spíše „udělat vysoce věrohodný odhad“ ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ). Pokud vám to zní trochu podezřele, nemýlíte se – ale to je také důvod, proč to funguje tak dobře 😄
A ano, to znamená, že upscaling pomocí umělé inteligence je v podstatě řízená halucinace… ale produktivním způsobem respektujícím pixely.
Co dělá dobrou verzi upscalingu AI? ✅🛠️
Pokud hodnotíte vylepšení umělé inteligence (nebo přednastavené nastavení), zde je to, co je obvykle nejdůležitější:
-
Obnova detailů bez převaření.
Dobré zvýšení rozlišení dodává křupavost a strukturu, nikoli křupavý šum nebo falešné póry. -
Disciplína na hranách
Čisté linie zůstávají čisté. Špatné modely způsobují, že se hrany viklají nebo na nich vznikají svatozáře. -
Realismus textur
Vlasy by se neměly stát tahem štětce. Cihla by se neměla stát opakujícím se vzorem. -
Zpracování šumu a komprese
Mnoho běžných obrázků je převedeno do formátu JPEG k neúnosnému rozlišení. Dobrý upscaler toto poškození nezesiluje ( Real-ESRGAN ). -
Rozpoznání tváří a textu
Obličeje a text jsou místa, kde se chyby nejsnáze odhalí. Dobří modelové s nimi zacházejí jemně (nebo mají specializované režimy). -
Konzistence napříč snímky (u videa)
Pokud detaily mezi jednotlivými snímky mihotají, vaše oči budou křičet. Zvyšování rozlišení videa se odvíjí od časové stability ( BasicVSR (CVPR 2021) ). -
Ovládací prvky, které dávají smysl
Chcete posuvníky, které odpovídají skutečným výsledkům: odšumování, rozmazání, odstraňování artefaktů, zachování zrnitosti, doostření… praktické věci.
Tiché pravidlo, které platí: „nejlepší“ upscaling je často ten, kterého si sotva všimnete. Vypadá to, že jste měli od začátku lepší fotoaparát 📷✨
Srovnávací tabulka: oblíbené možnosti upscalingu AI (a k čemu jsou dobré) 📊🙂
Níže je uvedeno praktické srovnání. Ceny jsou záměrně nejasné, protože nástroje se liší podle licence, balíčků, výpočetních nákladů a všech těch zábavných věcí.
| Nástroj / Přístup | Nejlepší pro | Cenová atmosféra | Proč to funguje (zhruba) |
|---|---|---|---|
| Zvětšovací rozlišení stolních počítačů ve stylu Topaz ( Topaz Photo , Topaz Video ) | Fotografie, video, snadný pracovní postup | Placené | Silné obecné modely + spousta ladění, většinou „prostě fungují“… |
| Funkce typu Adobe „Super Resolution“ ( Adobe Enhance > Super Resolution ) | Fotografové, kteří již v tomto ekosystému působí | Předplatné | Rekonstrukce s důkladnými detaily, obvykle konzervativní (méně dramatická) |
| Real-ESRGAN / varianty ESRGAN ( Real-ESRGAN , ESRGAN ) | DIY, vývojáři, dávkové úlohy | Zdarma (ale časově náročné) | Skvělé pro detail textury, na obličeji může být pikantní, pokud si nedáte pozor |
| Režimy upscalingu založené na difúzi ( SR3 ) | Kreativní práce, stylizované výsledky | Smíšený | Dokáže vytvořit nádherné detaily - ale také dokáže vymyslet nesmysly, takže… jo |
| Herní upscalery (ve stylu DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) | Hraní a renderování v reálném čase | V balíčku | Využívá data o pohybu a naučené apriorní hodnoty - plynulý výkon 🕹️ |
| Služby pro upscaling cloudu | Pohodlí, rychlé výhry | Platba za použití | Rychlé + škálovatelné, ale obětujete kontrolu a někdy i jemnost |
| AI upscalery zaměřené na video ( BasicVSR , Topaz Video ) | Staré záběry, anime, archivy | Placené | Časové triky pro snížení blikání + specializované video modely |
| Zvětšení rozlišení pro „chytrý“ telefon/galerie | Příležitostné použití | Zahrnuto | Lehké modely vyladěné pro příjemný výkon, ne pro dokonalost (stále praktické) |
Přiznání k formátovací zvláštnosti: „Placené“ v té tabulce odvádí spoustu práce. Ale chápete, o co jde 😅
Velké tajemství: modely se učí mapování z nízkého na vysoké rozlišení 🧠➡️🖼️
Jádrem většiny upscalingů umělé inteligence je systém řízeného učení ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ):
-
Začněte s obrázky ve vysokém rozlišení („pravda“)
-
Převzorkovat je na verze s nízkým rozlišením („vstup“)
-
Trénujte model pro rekonstrukci původního vysokého rozlišení z nízkého rozlišení
Postupem času se model učí korelacím, jako například:
-
„Tento druh rozmazání kolem oka obvykle patří řasám.“
-
„Tento shluk pixelů často označuje patkový text.“
-
„Tento gradient okrajů vypadá jako linie střechy, ne jako náhodný šum.“
Nejde o memorování konkrétních obrázků (v jednoduchém slova smyslu), jde o učení statistické struktury ( Hluboké učení pro superrozlišení obrázků: Průzkum ). Představte si to jako učení se gramatiky textur a hran. Ne gramatika poezie, spíš jako… gramatika manuálu IKEA 🪑📦 (neohrabaná metafora, ale dostatečně blízká).
Základní principy: co se děje během inference (při upscale) ⚙️✨
Když vložíte obrázek do upscaleru s umělou inteligencí, obvykle existuje postup podobný tomuto:
-
Předzpracování
-
Převod barevného prostoru (někdy)
-
Normalizace hodnot pixelů
-
Pokud je obrázek velký, rozdělte ho na bloky (kontrola reality VRAM 😭) ( Real-ESRGAN repozitář (možnosti dlaždic) )
-
-
Extrakce prvků
-
Rané vrstvy detekují hrany, rohy a přechody
-
Hlubší vrstvy detekují vzory: textury, tvary, komponenty obličeje
-
-
Rekonstrukce
-
Model generuje mapu prvků s vyšším rozlišením
-
Pak to převede na skutečný pixelový výstup
-
-
Následné zpracování
-
Volitelné ostření
-
Volitelné odšumování
-
Volitelné potlačení artefaktů (zvonění, halo efekty, blokovitost)
-
Jeden nenápadný detail: mnoho nástrojů zvětšuje rozlišení dlaždic a poté spáruje spoje. Skvělé nástroje skrývají hranice dlaždic. Některé nástroje zanechávají při mhouření očí slabé stopy mřížky. A ano, budete mhouřit oči, protože lidé rádi zkoumají drobné nedokonalosti při 300% přiblížení jako malí skřítci 🧌
Hlavní modelové rodiny používané pro upscaling AI (a proč se zdají být odlišné) 🤖📚
1) Superrozlišení založené na CNN (klasický pracant)
Konvoluční neuronové sítě jsou skvělé pro lokální vzorce: hrany, textury, malé struktury ( Image Super-Resolution Using Deep Convolutional Networks (SRCNN) ).
-
Výhody: rychlý, stabilní, méně překvapení
-
Nevýhody: při větším zatěžování může vypadat trochu „opracovaně“
2) Upscaling založený na GAN (ve stylu ESRGAN) 🎭
GAN (generativně-adversarialní sítě) učí generátor k vytváření obrázků s vysokým rozlišením, které diskriminátor nedokáže rozlišit od skutečných obrázků ( generativně-adversarialní sítě ).
-
Klady: výrazné detaily, působivá textura
-
Nevýhody: mohou si vymyslet detaily, které tam nebyly - někdy špatně, někdy až neuvěřitelně ( SRGAN , ESRGAN )
GAN vám může dodat ohromující ostrost. Také může vašemu portrétovanému dodat obočí navíc. Takže… vyberte si své bitvy 😬
3) Zvětšení rozlišení založené na difúzi (kreativní zástupný znak) 🌫️➡️🖼️
Difúzní modely krok za krokem odšumují a lze je vést k vytváření detailů s vysokým rozlišením ( SR3 ).
-
Klady: dokáže být neuvěřitelně dobrý v věrohodných detailech, zejména pro kreativní práci
-
Nevýhody: může se odchýlit od původní identity/struktury, pokud je nastavení agresivní ( SR3 )
Tady se „upscale“ začíná mísit s „reimaginingem“. Někdy je to přesně to, co chcete. Někdy ne.
4) Zvětšení rozlišení videa s časovou konzistencí 🎞️
Zvyšování rozlišení videa často přidává logiku reagující na pohyb:
-
Používá sousední snímky ke stabilizaci detailů ( BasicVSR (CVPR 2021) )
-
Snaží se vyhnout blikání a plazivým artefaktům
-
Často kombinuje superrozlišení s odšumováním a prokládáním ( Topaz Video )
Pokud je zvýšení rozlišení obrazu jako restaurování jednoho obrazu, pak je zvýšení rozlišení videa jako restaurování flipbooku, aniž by se nos postavy měnil na každé stránce. Což je… těžší, než se zdá.
Proč upscaling s využitím umělé inteligence někdy vypadá falešně (a jak ho rozpoznat) 👀🚩
Upscaling s využitím umělé inteligence selhává známými způsoby. Jakmile se naučíte vzorce, uvidíte je všude, například když si koupíte nové auto a najednou si všimnete daného modelu na každé ulici 😵💫
Běžné výroky:
-
Depilace pleti voskem (příliš mnoho odšumování + vyhlazování)
-
Příliš doostřené halo efekty kolem hran (klasická oblast „přestřelování“) ( bikubická interpolace )
-
Opakované textury (cihlové zdi se stávají kopírovatelnými vzory)
-
Křupavý mikrokontrast , který přímo křičí „algoritmus“
-
Zkomolení textu , kde se písmena stávají téměř písmeny (nejhorší druh)
-
Posun detailů , kdy se malé prvky nenápadně mění, zejména v difúzních pracovních postupech ( SR3 )
Záludnost: někdy tyto artefakty na první pohled vypadají „lépe“. Váš mozek má rád ostrost. Ale po chvíli vám to přijde… divné.
Slušná taktika je oddálit a zkontrolovat, jestli to vypadá přirozeně při normální pozorovací vzdálenosti. Pokud to vypadá dobře jen při 400% přiblížení, tak to není výhra, to je koníček 😅
Jak funguje upscaling AI: tréninková stránka bez matematických starostí 📉🙂
Trénování modelů s vysokým rozlišením obvykle zahrnuje:
-
Párové datové sady (vstup s nízkým rozlišením, cíl s vysokým rozlišením) ( Obrazové superrozlišení s využitím hlubokých konvolučních sítí (SRCNN) )
-
Ztrátové funkce , které trestají chybné rekonstrukce ( SRGAN )
Typické typy ztrát:
-
Ztráta pixelů (L1/L2)
Podporuje přesnost. Může vést k mírně rozmazaným výsledkům. -
Percepční ztráta
Porovnává hlubší rysy (například „ vypadá podobně“) spíše než přesné pixely ( Percepční ztráty (Johnson et al., 2016) ). -
Prohra v důsledku adversarial loss (GAN) -
Podporuje realismus, někdy na úkor doslovné přesnosti ( SRGAN , Generative Adversarial Networks ).
Neustále probíhá přetahování:
-
Udělejte to věrné originálu
vs. -
Udělejte to vizuálně příjemné
Různé nástroje se v tomto spektru uplatňují v různých oblastech. A jeden z nich můžete upřednostnit v závislosti na tom, zda restaurujete rodinné fotografie nebo připravujete plakát, kde je „dobrý vzhled“ důležitější než forenzní přesnost.
Praktické pracovní postupy: fotky, staré skeny, anime a video 📸🧾🎥
Fotografie (portréty, krajiny, produktové snímky)
Nejlepší postup je obvykle:
-
Nejprve mírně odšuměte (pokud je to potřeba)
-
Luxusní s konzervativním prostředím
-
Pokud se vám zdá, že je to příliš hladké, přidejte zpět zrno (ano, opravdu)
Obiloviny jsou jako sůl. Příliš mnoho zkazí večeři, ale ani jedna z nich nemůže být trochu prázdná 🍟
Staré skeny a silně komprimované obrázky
Tyto jsou obtížnější, protože model by mohl kompresní bloky považovat za „texturu“.
Zkuste:
-
Odstranění nebo deblokování artefaktů
-
Pak luxusnější
-
Pak lehké doostření (ne moc… Vím, to říká každý, ale i tak)
Anime a perokresba
Výhody čárové grafiky:
-
Modely, které zachovávají čisté hrany
-
Snížené halucinace textur
. Zvětšení rozlišení anime často vypadá skvěle, protože tvary jsou jednodušší a konzistentnější. (Štěstí.)
Video
Video přidává další kroky:
-
Odšumení
-
Odstranění prokládání (pro určité zdroje)
-
Luxusní
-
Časové vyhlazení nebo stabilizace ( BasicVSR (CVPR 2021) )
-
Volitelné opětovné zavedení zrna pro soudržnost
Pokud vynecháte časovou konzistenci, získáte to třpytivé detailní mihotání. Jakmile si ho všimnete, už ho nemůžete přestat vidět. Jako vrzající židle v tiché místnosti 😖
Výběr nastavení bez zbytečného hádání (malý tahák) 🎛️😵💫
Zde je slušný výchozí bod myšlení:
-
Pokud obličeje vypadají plasticky
, snižte šum, doostřování nebo vyzkoušejte model nebo režim zachovávající obličej. -
Pokud textury vypadají příliš intenzivně,
snižte nastavení posuvníků „vylepšení detailů“ nebo „obnovení detailů“ a poté přidejte jemné zrnění. -
Pokud okraje září
, snižte ostření a zkontrolujte možnosti potlačení halo efektu. -
Pokud obrázek vypadá příliš „AI“,
zvolte konzervativnější přístup. Někdy je nejlepším krokem prostě… méně.
Taky: nezvyšujte rozlišení na 8x jen proto, že můžete. Čisté zvětšení 2x nebo 4x je často ideální volbou. Kromě toho už po modelce žádáte, aby o vašich pixelech psala fanfikci 📖😂
Etika, autenticita a trapná otázka „pravdy“ 🧭😬
Zvyšování rozlišení pomocí umělé inteligence stírá hranici:
-
Restaurování znamená znovuobjevení toho, co tam bylo
-
Vylepšení znamená přidání toho, co nebylo
U osobních fotografií je to obvykle v pořádku (a je to krásné). U žurnalistiky, právních důkazů, lékařského zobrazování nebo čehokoli, kde záleží na věrnosti… je třeba být opatrný ( OSAC/NIST: Standardní průvodce pro správu forenzních digitálních obrazů , SWGDE Pokyny pro forenzní analýzu obrazu ).
Jednoduché pravidlo:
-
Pokud je v sázce hodně, považujte upscaling umělé inteligence za ilustrativní , nikoli definitivní řešení.
Zveřejňování informací je důležité i v profesionálním kontextu. Ne proto, že by umělá inteligence byla zlo, ale proto, že si publikum zaslouží vědět, zda byly detaily rekonstruovány nebo zachyceny. To je prostě… uctivé.
Závěrečné poznámky a rychlé shrnutí 🧡✅
Takže, jak funguje AI Upscaling, je to takto: modely se učí, jak detaily s vysokým rozlišením obvykle souvisí se vzory s nízkým rozlišením, a poté během upscalingu předpovídají věrohodné další pixely ( Hluboké učení pro superrozlišení obrazu: Průzkum ). V závislosti na rodině modelů (CNN, GAN, difúze, video-temporální) může být tato predikce konzervativní a věrná… nebo odvážná a občas nekonzistentní 😅
Rychlé shrnutí
-
Tradiční upscaling roztahuje pixely ( bikubická interpolace )
-
Zvyšování rozlišení pomocí umělé inteligence předpovídá chybějící detaily pomocí naučených vzorů ( Superrozlišení obrazu s využitím hlubokých konvolučních sítí (SRCNN) )
-
Skvělé výsledky plynou ze správného modelu a omezení
-
Dávejte si pozor na svatozáře, voskové tváře, opakující se textury a blikání ve videu ( BasicVSR (CVPR 2021) )
-
Zvyšování rozlišení je často „věrohodná rekonstrukce“, nikoli dokonalá pravda ( SRGAN , ESRGAN )
Pokud chceš, řekni mi, co převádíš na vyšší rozlišení (tváře, staré fotky, video, anime, skeny textu), a já ti navrhnu strategii nastavení, která se bude snažit vyhnout běžným nástrahám „AI vzhledu“ 🎯🙂
Často kladené otázky
Upscaling umělé inteligence a jak funguje
Zvyšování rozlišení pomocí umělé inteligence (často nazývané „superrozlišení“) zvyšuje rozlišení obrazu predikcí chybějících detailů s vysokým rozlišením ze vzorů naučených během trénování. Místo pouhého roztahování pixelů, jako je bikubická interpolace, model studuje hrany, textury, plochy a textové tahy a poté generuje nová pixelová data, která odpovídají těmto naučeným vzorům. Jde méně o „obnovení reality“ a více o „vytváření věrohodného odhadu“, který působí přirozeně.
Zvětšení rozlišení pomocí umělé inteligence versus bikubická nebo tradiční změna velikosti
Tradiční metody upscalingu (jako bikubické) interpolují hlavně mezi existujícími pixely a vyhlazují přechody, aniž by vytvářely skutečně nové detaily. Upscaling s využitím umělé inteligence si klade za cíl rekonstruovat věrohodnou strukturu rozpoznáváním vizuálních podnětů a předpovídáním, jak budou verze těchto podnětů ve vysokém rozlišení obvykle vypadat. Proto se výsledky umělé inteligence mohou zdát dramaticky ostřejší a také proto mohou zavádět artefakty nebo „vymýšlet“ detaily, které ve zdroji nebyly.
Proč může obličej vypadat voskový nebo příliš hladký
Voskové tváře obvykle vznikají agresivním odšumováním a vyhlazováním v kombinaci s doostřováním, které odstraňuje přirozenou texturu pleti. Mnoho nástrojů zachází se šumem a jemnou texturou podobně, takže „čištění“ obrazu může vymazat póry a jemné detaily. Běžným přístupem je snížit šum a doostření, použít režim zachování tváře, pokud je k dispozici, a poté znovu přidat trochu zrna, aby výsledek působil méně plasticky a více fotograficky.
Běžné artefakty upscalingu umělé inteligence, na které je třeba dávat pozor
Mezi typické varovné signály patří kruhové záblesky kolem okrajů, opakující se texturové vzory (jako cihly z kopírování a vkládání), křupavý mikrokontrast a text, který se mění „téměř v písmena“. V pracovních postupech založených na difúzi můžete také pozorovat posun detailů, kdy se malé prvky nenápadně mění. U videa jsou velkými varovnými signály blikání a plazivé detaily napříč snímky. Pokud to vypadá dobře jen při extrémním přiblížení, nastavení je pravděpodobně příliš agresivní.
Jak se výsledky upscalerů GAN, CNN a difuze liší
Superrozlišení založené na CNN bývá stabilnější a předvídatelnější, ale při větším zacílení může vypadat „zpracovaně“. Možnosti založené na GAN (ve stylu ESRGAN) často produkují výraznější texturu a vnímanou ostrost, ale mohou halucinovat s nesprávnými detaily, zejména na obličejích. Upscaling založený na difuzi může generovat krásné a věrohodné detaily, ale mohou se odchýlit od původní struktury, pokud je nastavení vodítek nebo intenzity příliš silné.
Praktická strategie nastavení, jak se vyhnout vzhledu „příliš umělé inteligence“
Začněte konzervativně: zvyšte rozlišení na 2× nebo 4×, než sáhnete po extrémních faktorech. Pokud obličeje vypadají plasticky, snižte šum a doostření a vyzkoušejte režim s ohledem na obličeje. Pokud jsou textury příliš intenzivní, snižte vylepšení detailů a poté zvažte přidání jemného zrnění. Pokud hrany září, snižte doostření a zaškrtněte potlačení halo efektu nebo artefaktů. V mnoha pipeline vítězí „méně“, protože zachovává věrohodný realismus.
Zpracování starých skenů nebo silně komprimovaných obrázků JPEG před zvýšením rozlišení
Komprimované obrázky jsou složité, protože modely mohou blokové artefakty považovat za skutečnou texturu a zesilovat je. Běžným pracovním postupem je nejprve odstranění nebo deblokování artefaktů, poté zvýšení rozlišení a následně jemné doostření, pouze pokud je to nutné. U skenů může jemné čištění pomoci modelu soustředit se na skutečnou strukturu spíše než na poškození. Cílem je omezit „falešné texturní signály“, aby modelář provádějící zvýšení rozlišení nebyl nucen dělat sebevědomé odhady na základě zašuměných vstupů.
Proč je upscaling videa těžší než upscaling fotografií
Zvyšování rozlišení videa musí být konzistentní napříč všemi snímky, nejen dobré u jednoho statického obrazu. Pokud detaily mezi jednotlivými snímky mihotají, výsledek se rychle stane rušivým. Přístupy zaměřené na video využívají časové informace ze sousedních snímků ke stabilizaci rekonstrukce a zamezení třpytivých artefaktů. Mnoho pracovních postupů zahrnuje také odšumování, prokládání u určitých zdrojů a volitelné opětovné zavedení zrnění, takže celá sekvence působí soudržně, nikoli uměle ostře.
Kdy není upscaling umělé inteligence vhodný nebo je riskantní se na něj spoléhat
Zvyšování rozlišení pomocí umělé inteligence je nejlepší vnímat jako vylepšení, nikoli jako důkaz. V kontextech s vysokými sázkami, jako je žurnalistika, právní důkazy, lékařské zobrazování nebo forenzní práce, může generování „věrohodných“ pixelů uvést do omylu, protože může přidat detaily, které nebyly zachyceny. Bezpečnějším rámováním je použít je ilustrativně a ukázat, že umělá inteligence detail zrekonstruovala. Pokud je věrnost kritická, zachovejte originály a zdokumentujte každý krok zpracování a nastavení.
Reference
-
arXiv - Hluboké učení pro superrozlišení obrazu: Průzkum - arxiv.org
-
arXiv - Superrozlišení obrazu s využitím hlubokých konvolučních sítí (SRCNN) - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
Vývojář NVIDIA - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Otevřený přístup Nadace pro počítačové vidění (CVF) - BasicVSR: Hledání základních komponent ve video superrozlišení (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Generativní adverzární sítě - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Percepční ztráty (Johnson a kol., 2016) - arxiv.org
-
GitHub - Repozitář Real-ESRGAN (možnosti dlaždic) - github.com
-
Wikipedie - Bikubická interpolace - wikipedia.org
-
Topaz Labs - Topaz Photo - topazlabs.com
-
Topaz Labs - Topaz Video - topazlabs.com
-
Centrum nápovědy Adobe – Adobe Enhance > Super rozlišení – helpx.adobe.com
-
NIST / OSAC - Standardní příručka pro správu forenzních digitálních obrazů (verze 1.0) - nist.gov
-
SWGDE - Pokyny pro forenzní analýzu obrazu - swgde.org