Tvorba elektronické dokumentace

Týden 12


Ukládání textových dokumentů

Chceme-li uchovávat v počítači jakákoliv data, tedy i dokumenty, musí být veškeré součásti převe-deny na posloupnost bitů. Všechny běžně používané operační systémy jsou schopny pracovat s pa-měťovými zařízeními, na která ukládají data v podobě souborů. Z hlediska operačního systému je soubor určitý celek specifikovaný souhrnnými atributy – jménem, délkou, fyzickou adresou a po-dobně. Operační systém vnímá obsah každého souboru jako posloupnost bitů (nebo vyšších celků – bytů, sektorů, stop), a to bez ohledu na jejich význam. Teprve aplikační programy se zabývají pro-blémem, jak interpretovat tyto obecné posloupnosti paměťových elementů. Ukládání libovolných dat na paměťová média (v podobě souborů) lze z tohoto hlediska pak klasifikovat na dvě základní kategorie a to dle způsobu jejich vnímání. 

 Jsou-li přiřazeny určité významy posloupnostem bitů obecně různých délek, jedná se o způ-sob uložení nazývaný binární

 Je-li obsah souboru chápán jako posloupnost zobrazitelných znaků, jedná se o způsob ulo-žení nazývaný textový (někdy též znakový). V textově vyjádřených datech se zpravidla nepři-pouštějí jiné, tzv. řídicí znaky, s výjimkou znaků pro konec řádku a pro konec souboru. 


Podle rozsahu použitých znaků lze dále klasifikovat textově vyjádřenou informaci na: 

obyčejný text (angl. plain text). Zobrazitelné znaky příslušné znakové množiny obsahují jen písmana (velké i malé sady), číslice a běžná interpunkční a pomocná znaménka, 

rozšířený text (angl. extended text). Znaková množina obsahuje další zobrazitelné znaky – znaky národních abeced, matematické značky a další symboly, 

vícejazyčný text, kde každý znak je určen kódem jazyka a kódem v daném jazyce. Znaková množina je velmi rozsáhlá, mùže tedy obsahovat speciální znaky nejen latinkových, ale i ne-latinkových písem (azbuka, hebrejské písmo, japonské písmo, nejrůznější značky a symboly apod.). 


Souborové formáty 

Pojem souborový formát vyjadřuje způsob uložení dat v souboru. Z nejobecnějšího pohledu lze všechny souborové formáty rozdělit na dvě kategorie – binární (s binárním uložením dat) a textové (s textovým uložením dat). 

Různé programové systémy ukládají data do souborů nejrůznějším způsobem. Pro některé systémy je tento způsob charakteristický a je zároveň zpracovatelný i jinými programy. Některé souborové TVORBA ELEKTRONICKÉ DOKUMENTACE 128 


formáty nevznikly jako výsledek vývoje určitého produktu, ale vznikly s cílem standardizovat způsob uložení dat určitého druhu pro usnadnění přenosu a zpracování. 

Pro usnadnění odhadu, o jaký formát dat se u určitého souboru jedná, jsou jména souborů doplňo-vána rozšířením, které se od jména odděluje tečkou, například otazky.rtf

Programové systémy určené pro zpracování textů se vyznačují širokým spektrem nejrůznějších sou-borových formátů s mnoha odlišnými vlastnostmi. Nejjednodušší aplikace produkují a zpracovávají neformátovaný text – jedná se o textový soubor (velmi často obyčejný text nebo rozšířený text). Ostatní aplikace zpracovávají formátovaný text, přičemž způsob uložení formátovacích značek ur-čuje do značné míry i celkový formát souboru. 


Next