Týden 12
Ukládání textových dokumentů
Chceme-li uchovávat v počítači jakákoliv data, tedy i dokumenty, musí být veškeré součásti převe-deny na posloupnost bitů. Všechny běžně používané operační systémy jsou schopny pracovat s pa-měťovými zařízeními, na která ukládají data v podobě souborů. Z hlediska operačního systému je soubor určitý celek specifikovaný souhrnnými atributy – jménem, délkou, fyzickou adresou a po-dobně. Operační systém vnímá obsah každého souboru jako posloupnost bitů (nebo vyšších celků – bytů, sektorů, stop), a to bez ohledu na jejich význam. Teprve aplikační programy se zabývají pro-blémem, jak interpretovat tyto obecné posloupnosti paměťových elementů. Ukládání libovolných dat na paměťová média (v podobě souborů) lze z tohoto hlediska pak klasifikovat na dvě základní kategorie a to dle způsobu jejich vnímání.
Jsou-li přiřazeny určité významy posloupnostem bitů obecně různých délek, jedná se o způ-sob uložení nazývaný binární.
Je-li obsah souboru chápán jako posloupnost zobrazitelných znaků, jedná se o způsob ulo-žení nazývaný textový (někdy též znakový). V textově vyjádřených datech se zpravidla nepři-pouštějí jiné, tzv. řídicí znaky, s výjimkou znaků pro konec řádku a pro konec souboru.
Podle rozsahu použitých znaků lze dále klasifikovat textově vyjádřenou informaci na:
obyčejný text (angl. plain text). Zobrazitelné znaky příslušné znakové množiny obsahují jen písmana (velké i malé sady), číslice a běžná interpunkční a pomocná znaménka,
rozšířený text (angl. extended text). Znaková množina obsahuje další zobrazitelné znaky – znaky národních abeced, matematické značky a další symboly,
vícejazyčný text, kde každý znak je určen kódem jazyka a kódem v daném jazyce. Znaková množina je velmi rozsáhlá, mùže tedy obsahovat speciální znaky nejen latinkových, ale i ne-latinkových písem (azbuka, hebrejské písmo, japonské písmo, nejrůznější značky a symboly apod.).
Souborové formáty
Pojem souborový formát vyjadřuje způsob uložení dat v souboru. Z nejobecnějšího pohledu lze všechny souborové formáty rozdělit na dvě kategorie – binární (s binárním uložením dat) a textové (s textovým uložením dat).
Různé programové systémy ukládají data do souborů nejrůznějším způsobem. Pro některé systémy je tento způsob charakteristický a je zároveň zpracovatelný i jinými programy. Některé souborové TVORBA ELEKTRONICKÉ DOKUMENTACE 128
formáty nevznikly jako výsledek vývoje určitého produktu, ale vznikly s cílem standardizovat způsob uložení dat určitého druhu pro usnadnění přenosu a zpracování.
Pro usnadnění odhadu, o jaký formát dat se u určitého souboru jedná, jsou jména souborů doplňo-vána rozšířením, které se od jména odděluje tečkou, například otazky.rtf.
Programové systémy určené pro zpracování textů se vyznačují širokým spektrem nejrůznějších sou-borových formátů s mnoha odlišnými vlastnostmi. Nejjednodušší aplikace produkují a zpracovávají neformátovaný text – jedná se o textový soubor (velmi často obyčejný text nebo rozšířený text). Ostatní aplikace zpracovávají formátovaný text, přičemž způsob uložení formátovacích značek ur-čuje do značné míry i celkový formát souboru.