Využití crowdsourcingu při popisu dat

Z WikiKnihovna

Autor: Dalibor Bláha

Klíčová slova: Crowdsourcing, popis, data, , OCR, digitalizace,

Synonyma:

Související pojmy:

nadřazené – digitalizace dokumentů

podřazené ---

Termín crowdsouricng vznikl spojením anglických slov crowd(dav) a outsorcing. V praxi znamená řešení úloh za pomocí otevřené výzvy uživatelům (např. pomocí sociálních sítí. Tento termín se používá od roku 2006, ikdyž příklady crowdsouricingu můžeme hledat i v daleké minulosti(např. v 18. století Roku britská vláda nabídla veřejnou odměnu za vyřešení úlohy související se zeměpisnou délkou). Pojem crowdsouricng je úzce spojen se seociálními sítěmi, otevřenou komunikací a dalšími prvky technologií webu 2.0. V moderním pojetí má crowdsourcing využití ve všech sférách podnikání a je efektivní hlavně pro firmy s menšími rozpočty, které díky "využití davu" mohou minimalizovat konkurenční rozdíly v inovacích.

Původ termínu

Jeff Howe - autor termínu crowdsourcing

Pojem crowdsouring poprvé využil Jeff Howe ve svém článku pro časpopis Wired v roce 2006.[1] Využití crowdsouringuu bychom mohli najít mnohem dříve než v roce 2006. Například v devadesátých letech devatenáctého století vznil projekt Open english directory, který oslovil otevřenou výzvou několik desítek tisíc dobrovolníků, aby indexovali všechny anglické slova s popisem jejich použití. Tato výzva trvala více než sedmdesát let a vrátilo se více než šest milionů odpovědí[2]

Typy crowdsouricngu

V současnosti se díky rozmachu sociálních sítí crowdsourcing využívá v online formě, což má hned několik výhod. Pohodlnější sdílení, větší otevřenost uživatelů, lepší komunikace atd. Dále existuje několik typů podle způsobu provádení crowdsouringu, jako jsou např. Crowdvoting, Crowdfunding,Crowdpurchasing, Wisdom of the crowd atd.


Využití crowdsourcingu pro popis dat ve světě

Trove

Trove-NLA-logo1.jpg

Národní knihovna v Austrálii v roce 2007 digitazovala dostupné novinové výtisky. Po zjištění, že kvalita OCR je na velmi špatné úrovni a rozhodli se využít crowsourcingu a zapojit do zlepšení OCR širokou veřejnost. Celý tento projekt funguje na principu Open source.

Ukázka projektu Trove

Do projektu se aktivně zapojilo více než devět tisíc přispěvatelů, kteří opravili již více než 12,5 milionu řádků[3]. Jako vedlejší efekt tohoto projektu se dostavilo síťování a propojování uživatelů. Vznikaly komunity s podobnými zájmy, hodnotil se počet opravených článků, vyhlašovali se vítězové a celý tento projekt se postupem času mění čím dál víc ve sociální síť. Po spuštění se uživatelé museli přihlašovat z důvodu obav autorů o nekorektní opravování článků, poté co zjistili, že k ničemu takovému nedochází, zrušili povinnou registraci a opravovat články může i náhodný návštěvník stránek. Uživatelé mohou kromě samotného opravování také tagovat články, psát komentáře, vkládat obrázky atd. Přestože uživatelé nemají z opravování žádný profit, někteří uživatele během dvouletého fungování dokázali opravit desetitisíce chyb. V roce 2010 bylo šest nejvíce aktivních přispěvatelů dokonce oceněno národní knihovnou Austrálie.


What is on the Menu?

Trove-NLA-logo1.jpg

Projekt knihovny NYPL ( New York Public Library), která zdigitalizovala více než 40 000 jídelních lístků od roku 1840 až po současnost. Uživatel může po registraci přepisovat údaje z jídelního lístku, jako je název jídla, cena apod. Vzniká tak databáze jídelních lístků, lze v nich vyhledávat, přiřazovat oblíbená jídla.Při zadání oblíbeného jídla tak uživatel může zjistit, v jakém období se jídlo objevilo na jídelních lístcích, jak se vyvíjela jeho cena apod. Do budoucna plánuje NYPL propojení těchto lístků s mapami restauracích, ze kterých tyto jídelní lístky pocházejí[4]

Digitalkoot

Digitalkoout je společný projet knihovny National Library of Finland společně s firmou Microcast zabývající se vývojem počítačových her. Stejně jako předchozí projekty, cíl tohoto projektu je opravit chyby OCR v digitalizovaných dokumentech (více než 4 miliony digitalizovaných stránek).[[1]] Tento projekt je unikátní v tom, že uživatele opravují OCR při hraní několika jednoduchýh her, a opravování se pro ně zároveň stává zábavou.

Ukázka ze hry Digitalkoot

Princip hry spočívá v opravování slov, díky nimž se herní postava posouvá vpřed a v co nejkratším časovém úseku se snaží dostat do cíle.Hráč vidí na obrazovce dvě slova, když ho správně opraví vytvoří část mostu přes řeku, přes kterou se musí dostat.Tyto stránky navštívilo již více než 100 000 návštěvníků a do opravování textů se zapojilo již přes 25 000 návštěvníků. Tento projekt vyvolal ohlas nejen ve Finsku, ale i ve Švédsku, Velké Británii nebo v USA.[5]

Poznámky

  1. HOWE, Jeff. The Rise of Crowdsourcing. Wired.co.uk [online]. 2006 [cit. 2012-05-27]. Dostupné z: http://www.wired.com/wired/archive/14.06/crowds.html
  2. LANXON, Nate. How the Oxford English Dictionary started out like Wikipedia. Wired.co.uk [online]. 2011 [cit. 2012-05-27]. Dostupné z: http://www.wired.co.uk/news/archive/2011-01/13/the-oxford-english-wiktionary
  3. About Trove. Trove.nla.gov.au [online]. 2012 [cit. 2012-05-27]. Dostupné z: http://trove.nla.gov.au/?q=
  4. NYPL. What's on the Menu? [online]. 2012 [cit. 2012-05-27]. Dostupné z: http://menus.nypl.org/
  5. STERLING, Bruce. Digitalkoot, a game-ified social Finnish cultural endeavor. Wired.co.uk [online]. 2011 [cit. 2012-05-27]. Dostupné z: http://www.wired.com/beyond_the_beyond/2011/03/digitalkoot-a-game-ified-crowdsourced-finnish-cultural-endeavor/

Literatura

1.HANDL, Jan. Crowdsourcing není novinka. Lupa.cz [online]. 2010 [cit. 2012-05-27]. Dostupné z: http://www.lupa.cz/clanky/crowdsourcing-neni-novinka/

2.LACKO, Ľuboslav. Využijte sílu crowd computingu a crowdsourcingu. ICTmanažer.cz [online]. 2010 [cit. 2012-05-27]. Dostupné z: http://www.ictmanazer.cz/2012/03/vyuzijte-silu-crowd-computingu-a-crowdsourcingu/

3.NYPL..org [online]. 2012 [cit. 2012-05-27]. Dostupné z: http://www.nypl.org/