Prediktivní analýza s využitím internetu

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Jakub Procházka

Klíčová slova: internet, prediktivní analýza, monitoring sociálních médií

Synonyma: předpověď budoucnoti, odhad trendů

Související pojmy: digital humanities, sentiment analýza, data-mining, statistika

nadřazené – statistika, web-mining
podřazené – ---

Definice

Prediktivní analýza v prostředí internetu je předpovídání budoucího vývoje události a situací, sledování trendů ve společnosti nebo zjišťování uživatelských vzorů monitorováním a analyzování aktivity uživatelů internetu v sociálních sítích, na blozích, diskusních fórech, nebo na základě využívání služeb spojených s infrastrukturou internetu např. vyhledávání informací.

Prediktivní analýza monitoringem internetu

Z velké části se tedy jedná o monitorování sociálních sítí, blogů a fór. Tyto zdroje se monitorují za účelem sledování zmínek, nebo pozorování jiných ukazatelů (počet fanoušků na Facebooku…) o událostech, které jsou předmětem predikce. Prediktivní analýza s využitím sociálních sítí se dá provést dvěma způsoby. První způsob je sledování a analyzování komunikovaného obsahu. V tomto případě se nejprve sbírají potřebná data, např. příspěvky některého z velkých blogovacích systémů, Twitteru, internetových diskusí, nebo jakéhokoli, ať už specificky nebo obecně zaměřeného fóra. Takto sesbíraná data jsou poté podrobena určitému druhu obsahové analýzy, nejčastěji analýzy sentimentu. Výsledek sentiment analýzy příspěvků, pak může v několika denním předstihu odpovídat vývoji akciového trhu. Takový případ prediktivní analýzy je nastíněn ve studii Erica Gilberta a Karrie Karahalios z University of Illinois. Studie popisuje jak lze z cca 20mil. příspěvků v blogovacím systému LiveJournal vytvořit pomocí sentiment analýzy mechanismus, tzv. anxiety index, který dokáže předpovídat vývoj akciového trhu.

Druhý způsob je o poznání přímočařejší. Jedná se totiž o pouhé pozorování ukazatelů, jako je počet fanoušků Facebookových stránek a profilů, počet následovniků na Twitteru nebo množství přehraných skladeb konkrétního autora na LastFM. Když budeme chtít predikovat výsledky voleb můžeme použít banální metriku: čím více fanoušku na Facebooku politik, či partie má, tím větší je pravděpodobnost úspěchu ve volbách. Přestože je tato metoda velice jednoduchá dokáže vyprodukovat přesvědčivé výsledky. Případ s Facebookem tento jednoduchý předpoklad potvrdil v 74% soubojů ve volbách do House of Representatives a přibližně 80% případů při volbách do senátu v USA v roce 2010. Shrnuto a podtrženo. Dalo by se tedy říci, že prediktivní analýza s využitím internetu je jedním z druhů analýzy dat získaných v rámci monitoringu médií, jejichž základem je internet.

Prediktivní analýza a trendy ve vyhledávání

Jako velmi vhodná se ukázala také data o trendech ve vyhledávání určitých klíčových slov (počet dotazů obsahujících konkrétní klíčová slova) poskytována společností Google Inc. prostřednictvím nástrojů Google Insights nebo Google Trends. Na téma využití dat o trendech ve vyhledávání, pro tvorbu prediktivních analýz, vyhledávačem od googlu, bylo provedeno několik případových studií. Za všechny zmiňme studii týkající se odhadu nezaměstnanosti v Německu z četnosti vyhledávání výrazů souvisejících s hledáním práce. Predikce na základě těchto dat pak byly porovnávány s oficiálními čísly vydávanými německým úřadem práce. V této studii byla zjištěna silná korelace aktivity spojené s vyhledáváním (vyhledávaná klíčová slova pokrývala oblast spojenou s hledáním práce) na internetu a skutečnou nezaměstnaností. V České republice může mít, mimo googlu, podobný potenciál vyhledávač společnosti Seznam. Na základě dat poskytovaných Seznamem však nebyla doposud provedena žádná studie a relevantnost seznamovských dat tedy nebyla prokázána. Princip ovšem zůstává stejný a proto není důvod, proč by i Seznam nemohl poskytovat relevantní data.

Použitá literatura

[1]GILBERT, Eric; Karahalios, Karrie. Widespread Worry and the Stock Market. [online]. 2009. Dostupné z ULR: http://comp.social.gatech.edu/papers/icwsm10.worry.gilbert.pdf.

[2]Facebook Fans Help Predict More Than 70% of Key Races. In: Facebook.com [online]. 3. listopad 2010 v 9:23 [cit. 2012-01-08]. Dostupné z: http://www.facebook.com/notes/us-politics-on-facebook/facebook-fans-help-predict-more-than-70-of-key-races/448981740881

[3]Askitas, Nikos and Zimmermann, Klaus F., Google Econometrics and Unemployment Forecasting. IZA Discussion Paper No. 4201. Dostupné z URL: http://ssrn.com/abstract=1415585

[4]BOLLEN, Johan, Huina MAO a Xiaojun ZENG. Twitter mood predicts the stock market. Journal of Computational Science [online]. 2009, 2(1), 1-8. DOI: 10.1016/j.jocs.2010.12.007. Dostupné z: http://linkinghub.elsevier.com/retrieve/pii/S187775031100007X