Digitalkoot

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Lucie Malúšková

Klíčová slova: digitalkoot, digitalizace, zahraniční projekt, zpracování textu

Synonyma: ---

Související pojmy:

nadřazené- digitalizace, digitalizační projekty, crowdsourcing, OCR
podřazené- ---

Digitalkoot je projekt vytvořený Finskou národní knihovnou a finskou firmou Microtask, který zapojuje uživatele Internetu hraním jednoduchých her do procesu vylepšení kvality digitalizovaných dokumentů z rozsáhlých archivů knihovny.


Cíl projektu

Název Digitalkoot vychází ze spojení slov “Digital” a “Talkoot”. Talkoot znamená ve finštině “pomocník”, v překladu do češtiny se tedy jedná o nějakého digitálního pomocníka nebo také pomocníka při digitalizaci.

Při digitalizaci starých finských dokumentů, především těch v nízké kvalitě, totiž technologie OCR často selhává, protože dochází k chybnému přepisu mnoha znaků. Zde je potřebná lidská práce. Finská národní knihovna se rozhodla tuto nezáživnou práci přenechat internetovým uživatelům a ve spolupráci s Microtask vyvinula online hry, které jsou nejen zábavné, ale také přínosné pro národní kulturní dědictví. Cílem projektu Digitalkoot, který je v Evropě první svého druhu, je totiž vyhledatelnost a zpřístupnění starých dokumentů na Internetu.

Hry

Technologie, kterou poskytuje Microtask, stojí na rozdělení textu na jednotlivá slova, která jsou hráčům dopravována jako malé úkoly. Každý úkol řeší více hráčů. Ve chvíli, kdy se na řešení jednoho úkolu shodne určitý počet hráčů, je úkol považován za hotový a hráčům již není předkládán. Vyřešené úlohy, tedy rozpoznaná slova, se vracejí do Microtask, kde se zasadí zpátky do textu. Jedním ze závažných problémů, se kterými se tvůrci museli vypořádat, byli hráči, kteří zjevně úmyslně zadávali slova chybně. Aby nemuseli do možných řešení úkolů započítávat slova takových hráčů, byla vytvořena sada kontrolních “zlatých slov”. Tato slova jsou již rozpoznaná a slouží k ověření schopností hráče. Jednoduše jsou mu při jeho první hře předložena, aniž by o tom věděl. “Zlatá slova” se občas vkládají i do úkolů již identifikovaných hráčů ke kontrolování, jestli úvodním testem náhodou neprošli často chybující hráči.

Druhým, menším problémem byla registrace hráčů původně závislá na propojení s účtem na Facebooku. Někteří hráči s tímto propojením nesouhlasili, a proto byla později umožněna registrace přes e-mailovou adresu. Nicméně výsledky takto registrovaných hráčů se nezapočítávají do žebříčků nejlepších hráčů.


Mole Hunt
Mole Hunt

V Mole Hunt (Hon na krtky) krtek drží cedulku s původním naskenovaným slovem a jeho přepisem. Hráč musí rozhodnout, jestli je slovo přepsané správně nebo ne. Tak lze rozpoznat mnoho chyb při převodu, ať už jinými hráči nebo pomocí OCR. Pokud je hráč pomalý nebo si není jistý, může počkat na další úkol, najednou může takto přeskočit 4 úkoly, při vynechání pátého je ze hry vyřazen. Za vyřešené úkoly sbírá body v podobě kytiček, pokud systém rozpozná chybnou odpověď, je hráči kytička odebrána.

Mole Bridge


Mole Bridge

Mole Bridge (Most pro krtky) je už hra náročnější na rychlost rozeznávání správných znaků. Hráči musí správně přepsat slovo vyňaté z originálního textu. Ze správných odpovědí se staví bloky mostu, který krtky převádí z jednoho břehu na druhý. Na den sv. Valentýna byla vytvořena verze, která zatím nebyla převedena na verzi původní. Zde se staví most z obláčků, který převádí krtky ke krtčí samičce. Slova musí přesně odpovídat originálu, hráč musí zapsat i čárky, závorky apod. Pokud dojde ke špatnému přepisu, součást mostu vybouchne. Slova, která nelze přečíst, lze jednoduše přeskočit.


Hráči jsou za správné odpovědi odměňováni body. Hry se samozřejmě stávají náročnějšími, jak hráč postupuje do vyšších úrovní, které jsou bodově více hodnocené. Na základě získaných bodů se vytvářejí žebříčky nejlepších hráčů, tím pádem stojí Digitalkoot nejen na hravosti, ale také na soutěživosti.

Budoucnost

Projekt byl spuštěn 8. února 2011 a během prvních 9 měsíců se do něj zapojilo přes 85000 uživatelů, kteří splinili přes 5,2 milionů úkolů.[1] Projekt je zatím ve své první fázi, kdy hráči pomáhají pouze rozlišovat slova. Tvůrci projektu plánují zapojit uživatele i do rozpoznávání struktury dokumentů a označováním obrázků štítky. Dalšími plány jsou možnost rozlišování slov, které patří do nadpisu nebo textu těla, a zařazení tlačítek pro klávesnice bez znaků jako jsou “å, ö, ä”.

Poznámky

  1. Our Work So Far [online]. Microtask [cit. 2012-05-19]. Dostupné z: http://www.microtask.com/cases

Použité zdroje