Analýza dokumentů a artefaktů

Z WikiKnihovna
Přejít na: navigace, hledání

Co je pro daný design výzkumu charakteristické?

Analýza dokumentů a artefaktů je velmi významným zdrojem informací při provádění výzkumu. Opírá se o hmatatelné výsledky činnosti člověka. Na rozdíl od pozorování, které zachycuje aktuální skutečnosti má analýza dokumentů výhodu v tom, že není omezena na krátký časový úsek. Předmětem zkoumání mohou být i úseky přesahující jeden lidký život či dokonce několik po sobě jdoucích generací. Analýza výsledků lidské činnosti má vždy jeden společný znak. To čím se zabývá a co zkoumá, vzniklo nezávisle na výzkumném úkolu. Věci vždy vznikají z docela jiných důvodů než výzkumných a zanechávájí po sobě důkazy své existence v nejrůznější podobě. Účelem výzkumu produktů je tyto stopy shromáždit, utřídit a interpretovat. [1]

Dokumenty mohou být primární, tzn., že jsou to doklady, které byly primárně vytvořeny za nějakým účelem, např. úřední záznamy, soudní záznamy, korespondence, reportáže, údaje o tržbách apod. Sekundární dokumenty jsou ty, které vznikly při analýze primárních dat, nějakým způsobem interpretují primární dokumenty. Pro analýzu jsou vhodná primární data. Zpracování, interpretace, kterou prošly sekundární dokumenty se mohla negativně odrazit na jejich věrohodnosti.[2]

,,Analýzu chápeme jako postup zaměřený na odhalení a pochopení vnitřní struktury věcí, jevů ... celek může být pochopen jen na základě objasnění jeho částí.”[3] Primárním důvodem proč zkoumat dokumenty a artefakty jakožto zdroje dat je to, že vůbec existují. Termín dokument je chápán velmi široce, a to nejen jako text, ale může to být i zvuk, fotografie, video a jakýkoli další materiál, který sebou nese nějaké informace. Aby byly tyto informace snadno nalezeny, musí být dokument určitým způsobem zpracován, tj. musí být o něm vytvořen záznam, který je pak schopen reprezentovat dokument v různých vyhledávacích systémech. Záznam o dokumentu se nazývá sekundární dokument obsahující souhrn vnějších, popř. i obsahových údajů o určitém dokumentu. Tvoří základní jednotku některého nástroje k vyhledávání literatury, ať už je to katalog (jmenný či věcný), bibliografie, rejstřík, kartotéka či jiný nosič záznamu. Zpracováním dokumentů rozumíme bibliografický (identifikační) popis dokumentu, indexování dokumentu, anotování, referování atd. Protože obsah dokumentu chápeme jako informace v něm obsaženy, pak analýza směřující k vytvoření informace o informacích se nazývá informační analýza, tedy ,,soubor operací sloužících transformaci dokumentu a jejich výsledkem je informace o obsahu dokumentu.”[4]

Podle J. Hendla[5] dělíme dokumenty podle tvůrce a jeho činnosti na:

 • Osobní dokumenty zahrnují vše, co bylo jakkoli pořízeno k soukromým účelům. Může se jednat o dopisy, zápisky, deníky, fotografie či videonahrávky.
 • Úřední dokumenty jsou údaje pořízené v podnicích nebo úřadech. Mohou to být například výroční zprávy, zápisy z různých akcí, vyhlášky, předpisy, dokumentace.
 • Archivní data jsou záznamy, které mohou mít podobu psaných dokumentů či podobu statistických informací.
 • Veřejné dokumenty tvoří noviny, časopisy, programy televizních a rozhlasových stanic.
 • Virtuální data jsou data nacházející se na internetu a sociálních sítích, patří sem například obsahy webových stránek, e-mailová pošta, obsahy internetových diskusí.
 • Předmětná data tvoří fyzické stopy důsledků lidské činnosti. Vypovídají o sociálních trendech, zvycích a typech chování v určité skupině lidí. Za předmětná data lze také považovat produkty hmotné kultury jako třeba knihy, umělecké předměty, budovy a jejich zařízení.

Kdy je vhodné tento design/tuto metodu použít?

Analýza dokumentů se využívá v kvalitativním i kvantitativním výzkumu.

Kvalitativní přístup – pokud hledáme co a jak analyzovat a jaké fenomény pro nás budou relevantní.

Kvantitativní přístup – pokud už víme, co budeme analyzovat a chceme o tématu dohledat co nejvíce informací, hodnotit je a dále s nimi pracovat.

Dokumenty a artefakty zkoumáme proto, abychom získali co možná nejvíce informací o studovaném objektu, události, atd. Tyto dokumenty, jak již bylo řečeno, nemusí mít vždy psanou formu. Mohou mít fonetickou (audionahrávky, hudba), obrazovou (fotografie, obrazy), virtuální (informace, pošta, software) či trojrozměrnou (sochy, stavby) podobu. U fyzických artefaktů můžeme sledovat, jak byly studovány. Sledujeme buďto ubývání hmoty - např. stupeň opotřebovanosti knížek, zeslabení papíru opotřebováním, chybějící stránky z knih v knihovnách, vyšlapané cesty k hrobům na hřbitově, opotřebovaná podlahová krytina. Nebo naopak přibývání hmoty - např. obsah popelnic, zarůstání přístupových cest. Životní rytmy populace se dají odvodit i od spotřeby vody, která je významným indikátorem aktivity obyvatel měst.[6] U digitálních informací to může být složitější, nelze přesně určit míru užívání. Lze ale například zjistit, pomocí různých počítačových nástrojů, jak často byl dokument prohlížen nebo kolikrát byla kniha stažena atd.

Analýza dokumentů je založena na jejich porozumění. Při práci s dokumentem musí výzkumný pracovník zvážit hned několik základních otázek:

 • Kdo je autorem dokumentu?
 • Z jaké doby dokument pochází?
 • Co je obsahem dokumentu?
 • Co dokument představuje?
 • S jakými souvislostmi se pojí?
 • Jak je dokument úplný a věrohodný?
 • Jaké závěry lze udělat o faktech obsažených v dokumentu?

Výzkumník musí znát sociální kontext, v jakém byl dokument vytvořen. Zda informace, které obsahují, jsou pravdivé a lze se o ně ve svých studiích opřít. Někdy je velmi obtížné rozeznat, za jakým účelem dokument vznikl a zda je popisovaná realita skutečně pravdivá. Dále je důležité, zda je dokument, který chce zkoumat v rámci své studie, dobře dostupný. Protože pokud je dokument známý, ale přistup k němu je omezen, nemůže jej výzkumník ve své práci použit. To stejné platí v případě, je-li dokument tajný nebo příliš důvěrný.

Jaké jsou výhody a nevýhody analýzy dokumentů?

Zkoumání dokumentů má řadu výhod:

 • efektivní metoda sběru některých druhů dat
 • rozmanitost dokumentů umožňuje přístup k informacím, které by se jiným způsobem těžko získávaly
 • dokumenty obsahují retrospektivní údaje
 • chronologické události
 • údaje nejsou shromažďovány během rozhovorů nebo pozorování (nedochází ke zkreslení působením výzkumníka)
 • subjektivní názory a osobnost výzkumníka mohou mít vliv na výběr dokumentů, ale ne na informace, které obsahují (takzvaný nereaktivní způsob sběru dat)
 • analýza dokumentů má obzvlášť důležité využití v historickém výzkumu - umožňuje zkoumat i časově velmi vzdálené události (přesahující délku lidského života)
 • po stránce finanční je tato technika daleko šetrnější než jsou náklady na terénní práce (např. rozhovory), výpovědi bývají obvykle spontánní, rozhodně v tom smyslu, že nevznikaly jako bezprostřední reakce na prováděné zkoumání. Také platí, že řada dokumentů představuje vyjádření velice kvalitní, neboť jejich tvůrci jsou v mnoha případech profesionálové (fotografové, publicisté, atp.)

Nevýhody:

 • informace mohou být zavádějící
 • špatně zformulovány
 • výzkumník nemůže proniknout hlouběji
 • dokumenty mohou obsahovat nepotřebné údaje
 • nedostupnost či nesrozumitelnost části dokumentů týkajících se zkoumané tématiky tvůrci nemusí být vždy vzdělaní lidé

Jak takový výzkum probíhá?

,,Proces zpracování dokumentu, zejména vytvoření záznamu o dokumentu, který je schopen reprezentovat dokument v různých vyhledávacích systémech a jeho zařazení do nich se nazývá analyticko-syntetickým zpracováním dokumentů.”[7]

Informační analýza se rozděluje na analýzu identifikační a analýzu obsahovou. V procesu analyticko-syntetickém zpracování dokumentů se tyto dvě analýzy oddělují. Identifikační analýza může probíhat samostatně a bez závislosti na ostatních procesech analyticko-syntetického zpracování. Obsahová analýza a na ní závisející procesy předpokládají provedení identifikační analýzy a s jejími produkty pracují, resp. je přebírají. Informační analýza je průzkum dokumentů za účelem výběru informací či informačních zdrojů vztahující se k informačnímu požadavku uživatele. Mluvíme o ní v šiřším i užším smyslu slova. Výsledkem této analýzy je množina slov přirozeného jazyka, v níž lze vymezit identifikační a obsahové údaje představující obraz dokumentu v dalších pracovních postupech.

Identifikační analýza – Účelem je stanovit údaje, které dokument charakterizují po formální i věcné stránce. Slouží tedy pro identifikaci a jednoznačnému určení a označení dokumentu. Jednotkou analyticko-syntetického zpracování se v případě identifikační analýzy rozumí popisná jednotka, tj. dokument uzařený po obsahové i formální stránce.[8] Při identifikační analýze provádíme rozbor především těch částí dokumentu, kde je obsaženo mnoho identifikačních údajů. Rozhodující tedy je titulní list, tiráž, ..Výsledkem identifikační analýzy dokumentu rozumíme strukturu jmenného záznamu. Analýza má za úkol odhalit všechny údaje, jež podle struktury jmenného záznamu patří do popisné části. Ve stručnosti se jedná o název, podnázev, údaje o původcích, označení vydání, nakladatelské údaje, údaje o rozsahu a knihopisná poznámka. Všechny tyto údaje, nalezené v dokumentu, tvoří, po své formální úpravě a uspořádání, identifikační záznam dokumentu, který je základním záznamem, provázejícím dokument i ve všech dalších etapách analyticko-syntetického zpracování.

Postupy identifikační analýzy spočívají ve:

 • stanovení druhu dokumentu a určení jednotky pro zpracování,
 • v zevrubné prohlídce dokumentu,
 • stanovení základních a doplňkových pramenů popisu,
 • přesném zjištění údajů sloužících k identifikaci dokumentu,
 • popř. doplnění chybějících údajů z vnitřních pramenů popisu.

Vedle zjištěných identifikačních údajů přináší identifikační analýza ještě další informace důležité pro následné procesy zpracování dokumentů:

 • určením jednotky zpracování ovlivňuje rozhodnutí o dalším způsobu, popř. hloubce zpracování dokumentu,
 • sémantika identifikačních údajů napomáhá procesu obsahové analýzy, popř. procesům věcného pořádání,
 • identifikační analýzou zjištěné informační vybavení dokumentu pomáhá zpřesnit obsahovou analýzu.

Identifikační analýza, je – li správně provedena zvyšuje informační potence jakéhokoli informačního systému.

Obsahová analýza – Cílem je v dokumentu odhalit soubor přirozeného jazyka, který formuluje obsah celého díla, či jeho části. A použít tento soubor k formulaci textu referátu, anotace, případně recenze, předmětových hesel. Při této analýze nelze ovšem přihlížet pouze k obsahu, ale i o hledisku v jakém se o daném tématu pojednává, k formě, v níž téma navenek působí. Na vědomí také musíme vzít, že jednotlivé druhy dokumentů se od sebe obsahově liší a proto analýza neprobíhá vždy stejně. Zaměřujeme se na informace typu – název a podnázev dokumentu. Informační hodnota názvu a podnázvu závisí na skutečnosti, jak se autorovi podařilo formulovat obsah svého díla. Pro zpřesnění obsahu využíváme některé identifikační údaje, ale ve většině případů se obsahová analýza provádí vlastním studiem a knihovnickou prohlídkou vnitřních částí dokumentu. Jde tedy o prozkoumání všech částí dokumentu – úvod, předmluva, doslov k dílu, obsah, prohlídka kapitol, rozbor rejstříku. Obsahová analýza neprobíhá pouze studováním vlastního dokumentu, jde i o studium pramenů a pomůcek mimo vlastní objekt zkoumání. Můžeme si tedy představit průzkum anotací v národních bibliografiích, referátů, či recenzí v jiných časopisech. V některých případech se s analýzou musí dojít tak daleko, že se konzultuje s autorem samotným.

Všechny pracovní postupy používané při obsahové analýze vedou ke stanovení obsahu dokumentu jako celku a jeho jednotlivých částí umožňující formulovat téma souborem slov přirozeného jazyka. Téma dokumentu může být jednoduché nebo složené. Jednoduché téma se týká jedné věci, předmětu a jevu a lze jej vyjádřit poměrně stručnou anotací či referátem. Složené téma, jemuž se říká také komplex předmětů, se týká většinou celého komplexu předmětů, jevů a komplikovaných vztahů, vazeb a závislostí. Tyto komplexy předmětů, jevů a věcí musíme vyjádřit obsazenějším referátem, anotací nebo komplikovanou strukturou předmětového hesla. U obou témat musíme počítat s nutností vyjádřit i hledisko, z něhož se o tématu pojednává, a formu, v níž se téma navenek projevuje. Úkolem obecné metodiky obsahové analýzy je stanovení jednoho hlavního tématu dokumentu a vedlejších témat, aby mohla být v referátu či anotaci zaznamenána.

Obsahová analýza dokumentu vede vždy k větší či menší redukci textu dokumentu, která reprezentuje dokument v dalších pracovních postupech.[9]

Karasev.jpg

Užívání dokumentů jako zdrojů dat se může někdy zdát jako složitá metoda. A to proto, že dokumenty a fyzické objekty můžou mít tolik různých podob a významů. Proto každá studie obsahuje informace, obsažené v dokumentech, ze kterých byly získány určitou metodou, a zároveň obsahuje informace získané jinými metodami sběru dat. Tento způsob získávání dat se nazývá triangulací – tedy kombinaci užívání různých druhů dat či různých metod při studiu jednoho a téhož problému k dosažení co možná nejvíce platných závěrů.[10]

Jaké jsou příklady využití tohoto designu v ISK?

Možností využití analýzy dokumentů a artefaktů je poměrně mnoho. Jednou z těchto možností je například zkoumání prošlapané podlahy v knihovnách, muzeích nebo jiných institucích podobného typu, kdy můžeme tímto výzkumem určit, o které oblasti je v dané instituci největší zájem (tato metoda má však i svá rizika, a to taková, že nepočítá s možností častého využívání určitých tras, například nejkratší cesta k toaletám může vést kolem něčeho, co návštěvníky většinou nezajímá).

Další možností výzkumu je naturalistický výzkumný design, při kterém je účastník pozorování přímo začleněn do aktivit organizace a má možnost nahlédnout a sbírat údaje nejen z veřejně přístupných dokumentů, ale může nahlédnout i do interních dokumentů organizace a má možnost mnohé z těchto dokumentů získat přímo od jejich tvůrců. Díky tomuto může výzkumník sesbírat všechny nebo téměř všechny relevantní dokumenty.

Třetím příkladem je studie Maxwella[11] z roku 2005, která zkoumala vývoj termínu homeland security v čase a v rámci různých skupin. Ten byl poprvé použit v roce 2000 ve zprávě americké komise pro národní bezpečnost. Zkoumaným vzorkem byla množina 286 dokumentů zahrnujících tiskové zprávy, doporučení a časopisové články. Část těchto dokumentů pocházela od vládních agentur USA a byla identifikována pomocí Lexis-Nexis vyhledávače. Další část dokumentů byla získána z databáze Public Administration Review od akademických a neziskových organizací a zbytek pocházel od organizace GAO, která sleduje manipulaci se státními penězi v USA. Tato metoda získání relevantních dokumentů je odpovídající předmětu studie. Dokumenty, které byly vybrány nejen obsahovaly termín homeland security, ale pojednávaly o něm. Analýza dokumentů byla rozdělena do více fází. V první fázi byly vybrané termíny identifikovány analýzou textů pomocí softwaru. Výsledkem této fáze bylo nahrazení termínů jinými kódovými termíny, kterých bylo 73 (například oversight). V další fázi byly těmito kódovými termíny softwarově nahrazeny původní termíny v dokumentech. V tomto momentě došlo ke snížení počtu analyzovaných termínů (například termíny mutual aid, coordination a facilitation byly nahrazeny termínem cooperative relationships). Na závěr bylo porovnáváno odlišné chápání termínu homeland security v různých agenturách.

Čtvrtou metodu publikoval Dube[12] v roce 2005. Předmětem zkoumání bylo, jak vysokoškolské instituce v Jižní Africe informují jejich studenty o viru HIV. Bylo dotázáno 36 institucí, z toho 33 se průzkumu zúčastnilo. Z výzkumu nebylo jasné, zda na dotazník odpovídal jeden člověk za celou instituci nebo více osob. Dube nevyužíval dat pouze z dotazníků, ale sám navštěvoval kampusy a pozoroval reklamy, plakáty, brožurky a slogany, což je jedna z forem komunikace univerzit s jejich studenty. Vzorek artefaktů byl poměrně úplný a reprezentativní. Neodlišoval jasně mezi výsledky z těchto pozorování a výsledky na základě dotazníků. Studie je příkladem způsobu, jak mohou být artefakty přímo pozorovány, ale také zahrnuty mezi studii používající odlišné metody sběru dat (výzkum). Předností této studijní metody je (díky návštěvě a pozorování kampusu), že shromážděná data jsou spolehlivá.

Poznámky

 1. SURYNEK, A., KOMÁRKOVÁ, R., KAŠPAROVÁ, E. Základy sociologického výzkumu. Praha: Management Press, 2001, s. 129.
 2. SURYNEK, A., KOMÁRKOVÁ, R., KAŠPAROVÁ, E. Základy sociologického výzkumu. Praha: Management Press, 2001, s. 130.
 3. HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomcikých informací, institut UVTEI, 1984. s. 7.
 4. Tamtéž
 5. HENDL, Jan. Kvalitativní výzkum: základní metody a aplikace. Praha: Portál, 2005, s. 204-205.
 6. SURYNEK, A., KOMÁRKOVÁ, R., KAŠPAROVÁ, E. Základy sociologického výzkumu. Praha: Management Press, 2001, s. 131-132.
 7. HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomcikých informací, institut UVTEI, 1984. s. 6.
 8. HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomcikých informací, institut UVTEI, 1984. s. 11.
 9. KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, s.
 10. WILDEMUTH, Barbara M. Applications of social research methods to questions in information and library science. Westport, Conn.: Libraries Unlimited, 2009, s. 161.
 11. MAXWELL, T. A. Constructing consensus: Homeland security as a symbol of government politics and administration. Government Information Quarterly, 2005, 22(2), 152-169.
 12. DUBE, L. Insights into the diffusion of HIV/AIDS information in higher education institutions in South Africa. International Information and Library Review, 2005, 37(4), 315-327.

Použitá literatura

HENDL, Jan. Kvalitativní výzkum: základní metody a aplikace. Praha: Portál, 2005, 407 s. ISBN 80-736-7040-2.

HYHLÍKOVÁ, Věra. Informační analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomcikých informací, institut UVTEI, 1984. 80 s.

KOVÁŘ, Blahoslav. Obsahová analýza dokumentu. Praha: Ústředí vědeckých, technických a ekonomických informací, 1974, 44 s.

REICHEL, Jiří. Kapitoly metodologie sociálních výzkumů. Praha: Grada, 2009, 184 s. Sociologie (Grada). ISBN 978-80-247-3006-6.

SURYNEK, A., KOMÁRKOVÁ, R., KAŠPAROVÁ, E. Základy sociologického výzkumu. Praha: Management Press, 2001, 160 s. ISBN 80-726-1038-4.

WILDEMUTH, Barbara M. Applications of social research methods to questions in information and library science. Westport, Conn.: Libraries Unlimited, 2009, 421 s. ISBN 15-915-8503-1.