Využitie umelej inteligencie – hovoriace fotografie historických postáv

V tomto článku si ukážeme jednoduchý spôsob oživenia historických postáv na praktickom príklade pomocou AI nástrojov – Mango AI.

Mango AI

Úvodná obrazovka Mango AI.

 

Mango AI, vyvinutý spoločnosťou Mango Animate, je pokročilý nástroj na generovanie videa s umelou inteligenciou.

Umožňuje používateľom vytvárať hovoriace fotografie, animované avatary, preklady videí a ďalšie v priebehu niekoľkých minút. Je ideálny pre marketérov, pedagógov, tvorcov obsahu a firmy. Umožňuje bez námahy vytvárať profesionálne videá. Vďaka funkciám, ako je animácia živého portrétu, animácia textu a vlastné avatary, je Mango AI vhodný pre každého, kto hľadá inovatívne a časovo úsporné riešenia pre video. My sa dnes pozrieme ako vytvoriť hovoriacu fotografiu (Talking Photo).

Mango AI je dostupná cez nasledovnú adresu: https://mangoanimate.com

Na prihlásenie nám stačí Gmail konto, alebo Facebook. Po prihlásení získavame bezplatnú možnosť vytvorenia hovoriaceho videa do 300 znakov textu, ktorý sa bude hovoriť (alebo do minúty zvukovej stopy) s vodoznakom vo videu. K dispozícii sú samozrejme aj platené režimy na odstránenie vodoznaku, zväčšenie dĺžky vkladaného textu a podobne.

 

Talking Photo

Bude nás zaujímať modul Talking Photo. Vygenerovanie hovoriacej fotky je pomerne jednoduché. Skladá sa z viacerých krokov.

1. Výber fotografie zo zariadenia a nahratie do modelu AI.

Dobrá je kvalitná, ostrá fotografia s dostatočným rozlíšením vo formáte JPG, JPEG, PNG, prípadne WebP. Mango AI poskytuje aj možnosť ukážkových preddefinovaných obrázkov, ale tie pre naše potreby nebudeme potrebovať.

 

2. Parametre hovoreného textu.

V tomto bode nastavíme, aký text bude fotografia hovoriť. Máme na výber 3 možnosti zadania:

A: Napíšeme text do textového poľa
B: Pridáme audio nahrávku reálneho hovoreného slova
C: Nahráme vlastný hlas priamo v aplikácii pomocou mikrofónu

Vyberieme si asi najčastejšie používanú a najjednoduchšiu variantu A, teda napíšeme text do formulára.

V tomto príklade využijeme slovenský jazyk, ktorý budeme mať pre text predvolený. Na výber je samozrejme množstvo iných jazykov. Pokiaľ v texte chceme zvýrazniť pauzu, využijeme tlačidlo Pause. Po kliknutí naň nastavíme dĺžku pauzy v sekundách (ak chcem pauzu pol sekundy zadám hodnotu 0,5) a takáto pauza je pridaná do celého textu v mieste umiestnenia kurzoru.

Aj napriek tomu, že tento AI model je veľmi dobre natrénovaný na slovenský jazyk, občas môže mať problém s komplikovanejšími výrazmi, uvediem pár príkladov.

A: niektoré roky, napríklad 1573 je niekedy lepšie napísať slovom: tisíc päťsto sedemdesiat tri
B: komplikovanejšie mená napríklad gróf František Xaver Freiherr von Sternbach je lepšie napísať štýlom píš, ako počuješ, teda František Xaver Frajher fon Šternbach
C: nárečové a slangové slová, ktoré AI model pravdepodobne nepozná taktiež napísať týmto režimom píš, ako počuješ.

Na záver nastavím dodatočné parametre a to hlas AI. V podmienkach slovenského hovorového slova máme na výber len 2 hlasy. Ženský – Viktoria a mužský – Lukas. Napokon v časti Facial Pose môžeme vybrať rozsah od none (žiadna) po big (veľká). Facial Pose (tvárová póza) označuje orientáciu alebo pozíciu tváre v 3D priestore. Ak chceme video aj s titulkami, zaškrtneme možnosť Subtitle.

Ak sme všetko nastavili, výsledné video začneme generovať pomocou tlačidla Generate AI Video. AI model je pomerne rýchly a vytvorenie videa trvá len niekoľko desiatok sekúnd až pár minút.

 

Využitie

Hovoriace fotografie sú mimoriadne vhodné pre použitie v múzeách, kde dokážu napríklad staré portrét grófov, kráľov a známych historických osobností priblížiť informácie predovšetkým mladej generácii. Takto pripravené podklady v ktorých historické osobnosti prehovoria ďalej môžeme spracovať do edukačných videí. Hovoriace portréty môžu byť súčasťou interaktívnych vyučovacích materiálov, kde študenti lepšie pochopia dejiny, literatúru či vedu. Staré fotografie a portréty možno oživiť, aby nestrácali kontakt s moderným mladým publikom. Možnosti praktického využitia je samozrejme mnoho.

Virtuálne prehliadky múzeí a miest – pri návšteve exponátu sa portrét sám spustí a postava sa predstaví.

Informačné kiosky a dotykové obrazovky – návštevník si zvolí osobnosť, ktorá prehovorí a porozpráva svoj príbeh.

Mobilné aplikácie pre turistov – pri návšteve historických miest sa spustí krátky príbeh rozprávaný samotnou postavou.

Propagačné a mediálne využitie - napríklad promo videá pre múzeá a mestá, obsah na sociálne siete, prípadne podpora kultúrnych udalostí.

 

Tipy na záver

Často sa stane, že výsledné video je výborne prerozprávané, sedí časovanie slova s mimikou tváre, ale pri celkovom pohybe (Facial Pose) sa pozadie postavy rozmazáva, alebo inak neprirodzene deformuje. Vtedy je vhodnejšia vopred grafická úprava vstupných fotiek (výrez postavy do samostatnej vrstvy) a následná video post produkcia, napríklad v prostredí Adobe After Effects, kde sa opäť viaceré osamostatnené vrstvy spoja.

 

Praktická úloha – prehovorenie postavy pomocou AI

Nižšie je námet na praktickú úlohu, kde pomocou nástrojov AI vytvoríme realistický portrét historickej osobnosti Jozefa Karola Hella (1713 - 1798), známeho technika a vynálezcu, ktorý pôsobil v Banskej Štiavnici.

Jozef Karol Hell

Historická kresba Jozefa Karola Hella, nie je veľmi kvalitná, ani vhodná pre oživenie (Foto: Virtuálna Banská Štiavnica).

 

Pomocou AI nástrojov sa pokúsime túto kresbu vylepšiť. Použijeme známy ChatGPT, ktorý v bezplatnej verzii umožňuje nahrať a pracovať s určitým počtom fotografií.

1. nahráme kresbu a zadefinujeme prompt:

portrét postavy podľa priloženej kresby, štýl farebný renesančný obraz, zachovaj vzhľad pózu, pridaj detaily tváre, realistické tiene textúra, vysoký kontrast

Jozef Karol Hell

Výsledok je nasledovný. Vidíme, že vznikol pomerne dobrý portrét, ako mohol približne Jozef Karol Hell vyzerať. Ešte ostáva problém, že sa nepozerá priamo, ale bokom. To jednoducho vylepšíme zadaním ďalšieho promptu.

upraviť postava pozerá do objektívu

Jozef Karol Hell

Finálny výsledok je oveľa lepší a vhodnejší na ďalšie spracovanie. Ak sme pripravili portrét historickej osobnosti, ideme sa pokúsiť rozpohybovať ho a nechať prehovoriť.

V rozhraní Mango AI nahráme našu upravenú fotografiu – portrét. Pridáme vhodný text vpísaním do textového poľa. V časti Video Settings sme nastavili AI Voices na Slovenčinu. Keďže ide o muža, zadáme model Lukas. Facial Pose ponecháme na Medium a zaškrtneme aj možnosť vytvoriť titulky. Ostáva už len jediné. Stlačiť tlačidlo Generate AI Video. Generovanie videa trvá niekoľko desiatok sekúnd až minút v závislosti od vstupu, kvality obrázka, prípadne vyťaženia servera.

Mango AI

Mango AI - zadanie vstupných údajov.

 

Mango AI

Mango AI - generovanie videa.

 

Mango AI

Mango AI - vytvorené video.

 

Nižšie je ukážka hotového diela. Vstupná fotografia, text a samotná hovoriaca fotka vo videu + titulky. Výsledok je veľmi dobre spracovaný a môže byť použiteľný ako podklad pre ďalšie spracovanie. Takáto úloha je vhodná aj pre edukačné účely pre žiakov základných a stredných škôl, pričom si žiaci môžu oživiť vlastnú historickú postavu a nechať ju prehovoriť ich vlastný text.

Nižšie trochu vylepšené a editované video, doplnené o pár animácií a nadpis.

 

Aktualizácia 14.12.2025

V rámci akcie Týždeň vedy a techniky v Slovenskom banskom múzeu, ktorá sa konala v termíne 10.11.2025 – 14.11.2025 som mal možnosť prezentovať viaceré témy a praktické ukážky využitia AI práve v podmienkach múzeí pre žiakov 7 – 9. ročníka ZŠ a pre žiakov stredných škôl. Jednou z praktických úloh a výstupov bolo aj využitie umelej inteligencie – hovoriace fotografie historických postáv.

Týždeň vedy a techniky v Slovenskom banskom múzeu

Týždeň vedy a techniky v Slovenskom banskom múzeu.

Virtuálna Banská Štiavnica - historické fotky

Mango AI

Pridať komentár k článku