Digitalizácia, skenovanie, registrácia

Digitalizácia

Údaje po prevode sú vo vektorovej reprezentácii. Patrí v histórii GIS k najstarším spôsobom vstupu priestorových údajov (samozrejme úplne prvý nie je, ak berieme do úvahy manuálne zadávanie súradníc cez klávesnicu/dierny štítok, následné používanie myši atď.) Na vstup sa používa špeciálne hardware-ové zariadenie - digitizér (niekedy sa môžeme stretnúť s označením TABLET, ktoré sa používa pri zariadeniach menších rozmerov), ktoré dokáže odovzdávať počítaču absolútne súradnice polohy pohyblivej časti - kurzora (podobnej klasickej myši). Absolútnosť súradníc spočíva v tom, že kurzor umiestnený dva krát na tom istom mieste na aktívnej ploche digitizéra odovzdá rovnaké súradnice, na rozdiel od relatívnych súradníc, ktoré používa napr. myš - to platiť nemusí. V súčasnosti je táto metóda vhodná predovšetkým k snímaniu menšieho objemu dát, napríklad jednoduchého kartogramu, trasy, umiestnenie značiek. Nie je vhodný k snímaniu priestorovo kontinuálne sa meniacich údajov, ak je to však nutné, používame digitalizáciu izočiar a následnú interpoláciu poprípade extrapoláciu (napr. výškový model, teploty ...), ktorou doplníme údaje "medzi" izočiarami. Touto metódou získavame dáta vo vektorovej reprezentácii (definované súradnicami x,y pre každý lomový bod, hodnotu súradnice z je možné zadať ako atribút priamo pri digitalizácii, alebo ho určiť neskôr). Získané grafické údaje však ešte v žiadnom prípade nie sú použiteľné ako hotové GIS údaje. Aby sme ich mohli začať využívať v GIS, je potrebné získané grafické údaje "oživiť" - zadefinovať topologické vzťahy.

Skenovanie

Údaje po prevode sú v rastrovej reprezentácii. Ako ďalší zo spôsobov získania údajov si predstavíme skenovanie. Pri tomto spôsobe získame údaje v rastrovej reprezentácii. Môžeme si ho rozdeliť na tri zložky:

1. vlastné skenovanie
2. registrácia
3. geometrické korekcie

Vlastné skenovanie Robí sa pomocou zariadenia - skeneru, ktoré je vyrábané v rozličných veľkostiach - formátoch, snímacích vlastnostiach (presnosť - DPI, farebné rozlíšenie a pod.). V súčasnej dobe je však uvedený postup natoľko bežný, že ho nebudeme bližšie opisovať. Dôležitý je výber vhodného formátu - typu súboru. V súčasnosti je ich veľké množstvo, z nich má každý svoje výhody i nevýhody a preto je nevyhnutné dobre zvážiť, ktorý zvoliť z hľadiska ďalšieho použitia. Ak napríklad chceme použiť program IrasB fy Intergraph, je potrebné naskenovať obrázok ako "lineart" čiže booleanovskú bitmapu (len hodnoty 0 a 1), a nie v odtieňoch šedi (GRAYSCALE) či farby (COLOR).

Registrácia

Ako sme už spomenuli, GIS pracuje s údajmi, ktoré súvisia s lokalitou v geografickom priestore. Pri registrácii rastra spĺňame práve túto podmienku a zoskenovaný obrázok "umiestňujeme" v súradnicovom systéme použitej geografickej projekcii. V najjednoduchšom prípade zadefinujeme geogr. súradnice rohu (napríklad ľavého dolného) a veľkosť dx a dy, poprípade jeho rotáciu - veľkosť, rozmery pixla. Na nižšie uvedenom obrázku je znázornený kompletný výpis informácií, použiteľných pri registrácii rastra. Nie všetky sú povinné, závisí to od spôsobu registrácie v systéme.

gis

Pred zoskenovaním si podrobne prezrieme podklad, či na ňom sú viditeľné objekty, pri ktorých je možné určiť súradnice. Ako sme už spomínali, môžu to byť rohy mapového listu, križovatky, sútoky riek a pod. Pokiaľ na ňom takéto objekty absentujú, môžeme si výnimočne jednorázovo pomôcť zakreslením pomocných značiek - krúžkov, krížikov. Takýto postup volíme aj v prípade, keď nie je možné zistiť geografickú projekciu. Takýto podklad však nebude použiteľný v centrálnej ÚB GIS, pretože údaje nebudú priestorovo kompatibilné s údajmi získanými z iných zdrojov. V tomto, ešte raz pripomíname v extrémnom prípade, musíme prepočtom vypočítať relatívne súradnice nami zakreslených značiek (jednu z nich prehlásime počiatkom a súradnice ostatných zistíme pomocou pravítka a prepočtu mierky).

gis

Ak teda bod 1 prehlásime za počiatok (bude mať súradnice x=0, y=0), môžeme si z vyše uvedenej schémy vyvodiť (pri známej mierke) hodnoty súradníc pre bod 2. V našom prípade to bola mierka 1:25 000, teda x2=8100 m, y2=5250 m (za predpokladu, že údaje na schéme sú v cm).

Geometrické korekcie

Ak však jednoduchá registrácia nestačí, napríklad pri nezhode geografickej projekcie podkladu a výstupného súboru, poprípade pri elimináciách perspektívneho skreslenia leteckých snímok je potrebné pristúpiť ku geometrickým korekciám - transformáciám. Ich prevedenie je v počítačovej terminológii označovaný ako WARP (WARPING), niekedy sa tiež môžeme stretnúť s označení Rubber Sheet Transformation (transformácia gumovej stránky). Princíp spočíva v identifikovaní viacerých kontrolných bodov (pri leteckých snímkach je potrebné určiť až okolo 50) a zadefinovaní ich skutočných - cieľových súradníc. Pre bližšie oboznámenie sa s touto veľmi dôležitou časťou si predvedieme registráciu a transformáciu rastra pomocou IrasB, ktorý je MDL (Makro Developmet Language) aplikáciou v prostredí MicroStation, ktorý okrem toho, že patrí k špičkovým CAD systémom (Computer Aided Design), tvorí grafickú platformu pre jeden z najprepracovanejších GIS systémov a to MGE fy. INTERGRAPH. Po zoskenovaní podkladu do vhodného gr. formátu (pcx, tif ...) si v novootvorenom zakreslíme kontrolné body v presných cieľových súradniciach. Pomocou aplikácie IrasB si načítame na ľubovoľné miesto zoskenovaný podklad. Potom stačí zadať funkciu WARP a postupne dvojice bodov zdroj - cieľ, pomocou ktorých sa snímok pretransformuje. Podľa potreby volíme metódu transformácie napr. najjednoduchšiu metódu HELMET, pri ktorej sa raster len natočí, zväčší a posunie v priestore. Na jeho realizáciu stačí zadať len 2 body. Dôležité je (ak nechceme vždy po načítaní raster znovu registrovať) vybrať typ súboru, ktorý dokáže uchovať (pomocou hlavičky, alebo pomocného súboru) aj jeho geografickú polohu (napr. CIT, GeoTIFF). Následná komplexná schéma ilustruje vyššie uvedený postup.

gis

Scanovanie - vektorizácia

Údaje po prevode sú vo vektorovej reprezentácii. V prípade, že potrebujeme získať dáta vo vektorovej reprezentácii a z rôznych dôvodov nie je možné použiť digitizér, musíme pristúpiť ku kombinácii skenovanie-vektorizácia. Etapa skenovania je totožná so skenovaním opísaným v predchádzajúcej kapitole. Po registrácii rastra však musíme pristúpiť k následnej vektorizácii. Podľa správania sa samotného rastra pri vektorizácii a podľa samotnej realizácie rozlišujeme vektorizáciu na:

manuálnu

- aktívny raster
- pasívny raster

poloautomatickú

- aktívny raster
- pasívny raster

automatickú

Pri manuálnej vektorizácii ON SCREEN (angl. na obrazovke), sú pomocou kurzora ovládaného myšou, alebo iným polohovacím zariadením (trackbool a pod.), ktorý je zobrazovaný na monitore (s podsvieteným rastrom) snímané súradnice jednotlivých častí segmentov reprezentujúcich sledované objekty. Raster sa pri samotnom vektorizovaní môže správať pasívne, alebo aktívne. Pri pasívnom rastri sú súradnice ukladané pri kliknutí (myslí sa stlačenie dátového klávesu na polohovacom zariadení) presne v mieste aktuálneho umiestnenia kurzora. Len na presnosti a trpezlivosti operátora závisí, či bude vektor uložený presne na objekte, alebo nie. Pri aktívnom rastri je vektor umiestňovaný (prichytávaný) na raster v pozadí. Ak je teda kurzor pri kliknutí "tesne vedľa" automaticky je prevedená korekcia a vektor je umiestnený podľa preddefinovanej voľby (napr. na stred čiary, jej ľavý okraj a pod.). Ďalším zo spôsobov je využitie technologických možností výpočtovej techniky. V takomto prípade je počítač schopný sám identifikovať súradnice rastra. V takomto prípade hovoríme o automatickej vektorizácii, ktorú si rozdelíme podľa stupňa využitia automatiky. Poloautomatická vektorizácia je veľmi silným nástrojom, ktorý prevádza automatickú vektorizáciu, pričom rozhodovanie - ako ďalej v zložitejších miestach prenecháva na operátora. Plnoautomatická vektorizácia odstraňuje aj tento zásah človeka. Na jej realizáciu však potrebujeme kvalitné podklady a finančne nákladný software. V opačnom prípade strávime nad opravami oveľa viac času, ako keby sme boli vektorizovali poloautomaticky. Požitie automatickej vektorizácie je však veľmi závislé na kvalite podkladu, preto sa doporučuje pred vlastným zoskenovaním upraviť - excerpovať - zvýrazniť obsah ktorý sa má vektorizovať. Platí, že čím viac času strávime pri príprave podkladov, tým rýchlejšie a presnejšie zrealizujeme vlastnú vektorizáciu.

gis

Digitalizácia - rasterizácia - údaje po prevode sú v rastrovej reprezentácii. Opačný prípad nastáva, keď ako vstupné zariadenie sme okolnosťami prinútení použiť digitizér, poprípade získame údaje vo vektorovej reprezentácii - avšak my potrebujeme k realizácii úlohy získať údaje v rastrovej reprezentácii. Tento prevod je však oveľa jednoduchší ako predchádzajúci. Drobné problémy môžu nastať v prípade plošných objektov, ktoré máme zaznačené len hranicou. Vtedy musíme drobnými úpravami "vyplniť" aj pixle vo vnútri.

gis

Tvorba topológie

Digitalizovaním, alebo vektorizovaním sme získali grafické údaje vo vektorovej reprezentácii. Tieto údaje sú zložené z bodov, línií alebo plôch, ktoré nielenže obsahujú viaceré chyby (vzniknuté pri samotnom postupe zberu údajov), ale neobsahujú žiadne informácie o priestorových väzbách medzi sebou. Jedná sa čiste o grafickú informáciu. Aby sme dokázali premeniť údaje čisto grafické na "geografické" musíme zadefinovať práve spomenuté priestorové vzťahy - topológiou, poprípade ich na budovanie topológie pripraviť. Najprv si musíme údaje - grafické elementy očistiť od prípadných nedostatkov - chýb. Medzi najčastejšie patria: preseknutia (INTERSECTIONS), oprava voľných koncov (END POINTS), odstránenie krátkych segmentov (SHORT SEGMENTS), kontrola - poprípade odstránenie duplicitných čiar (DUPLICITE LINE). Možná je tiež určitá grafická úprava (filtrovanie prebytočných zlomových bodov, SMOOTHING - pridanie ďalších potrebných bodov a pod.) v niektorých prípadoch z funkčných a niekedy len z estetických dôvodov. Anglické názvy chýb sme uviedli, nakoľko nástroje na ich odstraňovanie sa často zvyknú nazývať práve podľa nich. Schematické znázornenie jednotlivých chýb je zrejmé z nasledovnej schémy:

gis

Takto vyčistené grafické súbory sa následne pretransformujú na vektorovú digitálnu bázu údajov. Uvedená transformácia je plne závislá na vnútornej koncepcii dátovej - vektorovej štruktúry používanej v konkrétnom SW. Pre ilustráciu uvedieme jej postup v dvoch najsilnejších GIS - ArcInfo a MGE. V ArcInfe je postup veľmi jednoduchý, na vyčistenú kresbu sa použije príkaz CLEAN alebo BUILD, ktorý jednak prevedie finálne opravy (podľa zadaných parametrov), ale predovšetkým vybuduje topológiu v závislosti od typov objektov - bodov, línií, plôch. Podľa typu tiež vytvorí príslušné tabuľky (plochy - Polygon Attribute Table, body - Point Atribute Table, čiary - Arc Attribute Table). V týchto tabuľkách - súboroch sa počet záznamov rovná počtu objektov. Štandardné položky záznamu v tabuľke PAT sú: plocha, obvod, systémový identifikátor, užívateľský identifikátor. V tabuľke AAT sú to: počiatok, koniec, polygón vľavo, polygón vpravo, dĺžka, systémový identifikátor, užívateľský identifikátor. Pokiaľ pri manipulácii s údajmi dôjde k zmene topologických vzťahov je nutné topológiu prebudovať. V MGE je postup omnoho zložitejší. MGE využíva tzv. feature koncept (matematická formalizácia údajov). V tomto koncepte pre všetky objekty, ktoré chceme implementovať do nášho informačného systému, nájdeme, alebo vytvoríme vhodný feature - základnú jednotku grafickej časti databázy. Medzi základné feature môžeme zaradiť čiarové, bodové alebo plošné. Posledne uvedený - plošný feature sa skladá z dvoch samostatných častí (feature), a to z hranice (uzavretý čiarový feature) a centroidu (definičný bod vnútra plochy). K jednotlivým feature si môžeme vytvoriť a pripojiť databázovú tabuľku, v ktorej uchováme informácie o konkrétnom objekte (napr. pri tokoch to môže byť prietok, správca a pod.). Takto pripravenými feature identifikujeme jednotlivé objekty v kresbe. V prípade použitia MGE aj ako nástroja na zber údajov, je možné priamo vektorizovať konkrétny feature. Takto zadefinované údaje sú po opravení grafických chýb plnohodnotnými údajmi v ÚB GIS. O pravom vybudovaní topologických vzťahov však môžeme hovoriť až v prípade vytvorenia tzv. TOPOFILE, ktorý vytvára topologické vzťahy nielen v rámci jedného typu objektov (štandardný prístup v ARCInfo), ale dokáže kombinovať všetky typy objektov (bodové, čiarové, plochy atď.). V niektorých prípadoch, a to hlavne na pracoviskách s neúplnou vybavenosťou na prácu s GIS, je nevyhnutné budovanie topológie zjednodušiť využitím jedným z jej najprimitív-nejšieho modelu a modelu špagetového. Nasledovná schéma stručne ilustruje vybudovanú topológiu.

gis

Manuálne zadávanie pomocou klávesnice

V odbornej literatúre sa často môžeme stretnúť ešte s jedným spôsobom vstupu údajov a to manuálnym zadávaním cez klávesnicu. Tento spôsob je použiteľný predovšetkým pri malom množstve údajov. Používa sa napr. na zadefinovanie kontrolných bodov pri registrácii rastra, zadaní polohy triangulačného bodu.

Import z iných systémov

Samostatným spôsobom napĺňania ÚB GIS je využitie digitálnych zdrojov, bez závislosti či sa jedná o priestorové, alebo nepriestorové údaje. V takomto prípade stojíme pred problémom transformácie údajov do štruktúry používanej naším programovým vybavením. Tomuto postupu sa hovorí import. V najjednoduchšom prípade vystačíme s priamou konverziou. V opačnom prípade musíme najprv pretransformovať údaje do štandardného formátu a následne ho importovať do nášho systému. Medzi štandardy patria napr. TIF - grafický rastrový súbor, rtf - textový súbor, DXF - grafický vektorový súbor, poprípade súbor ASCII.

Zber atribútových údajov

Vstup atribútových údajov je prevádzaný štandardnými metódami používanými pri práci s počítačom. Jedná sa predovšetkým o vstup cez klávesnicu. Ďalším zo spôsobov je naskenovanie dokumentu a použitím automatického rozpoznávania textu (OCR) interpretovať údaje zo zoskenovaného obrazu. Ďalším spôsobom je import údajov z iných systémov, ktorý je uskutočňovaný analogicky ako pri importovaní priestorových údajov. V neposlednom rade však musíme uviesť aj využívanie iných zdrojov v reálnom čase, čiže prístup k údajom v iným IS. V súčasnosti je využívaný systém ODBC (podporovaný op. systémom WINDOWS), ktorý za nás rieši potrebné úlohy a konverzie.

SUDOLSKÁ S., HILBERT R. 2001: Vybrané kapitoly z úvodu do GIS. - 67 pp.

Pridať komentár k článku