Vyhledávání hlasem

Z WikiKnihovna
Přejít na: navigace, hledání

Autor: Jakub Procházka

Klíčová slova: hlasové vyhledávání, prohledávání webu, Google Voice Search, Vlingo Find, Bing Voice Search

Synonyma: hlasové vyhledávání,

Související pojmy: rozpoznání řeči, hlasové ovládání, Human-computer interactivity

nadřazené: rozpoznávání řeči, hlasové ovládání

podřazené: --


Chrakteristika

Voice search neboli česky hlasové vyhledávání je vyhledávání informací pomocí hlasové modality resp. hledáný výraz či klíčová slova se zádávají hlasově nikoli za pomocí klávesnice nebo jiného vstupního zařízení. Tento způsob vyhledávání a ovládání technického zařízení hlasem je nevýhodnější především pro mobilní zařízení. Mobilní zařízení totiž nedisponují tak kvalitními a dobře ergonomicky řešenými HW vstupními možnostmi jako běžné kancelářské počítače nebo notebooky. Další rozdíl je v tom, že mobilní telefony, tablety atd. jsou používány v jiných situacích (ve spěchu v tramvaji, při chůzi městem apod.), kdy je použití hlasového vstupu více uživatelsky přívětivé. Teto trend je také možné vypozorovat z chování nějvětších hráčů na trhu v oblasti hlasového vyhledávání resp. ovládání mobilního zařízení hlasem, jako je Google, který svou aplikaci pro hlasové vyhledávání Voice search nabízí především pro mobilní zařízení fungující na platforě Android verze 2.1 a vyšší nebo pro Apple iPhone. Dalším možným hráčem v oblasti rozpoznávání řeči a hlasového vyhledávání je společnost Vlingo, specializující se pouze na mobilní zařízení (výše zmíněný Google nábízí alternativu i pro nemobilní zařízení v podobě plug-in(u) do svého prohlížeče Chrome), s aplikací Vlingo Find. Další alternativou je Bing Voice Search[1] od společnosti Microsoft, který je prozatím dostupný pouze na americkém trhu. Aplikací pro hlasové vyhledávání a obecně pro hlasový vstup pro jakékoli účely je celá řada, nicméně v současné době pouze Voice search od googlu nabízí možnost vyhledávání v češtině.

Historie

Prvními systémy, které používaly hlasové vyhledávání jsou tzv. Directory assistance jedná se o podobnou službu, která je v České republice dostupná na telefoním čísle 1188. Google tímto způsobem s hlasovým vyhledáváním začínal, když v roce 2007 spustil službu GOOG-411[3]. Uživatel na svém telefonu vytočil číslo 800-466-4411 nebo 877-466-4411, pomocí hlasového vstupu zadal parametry vyhledávání a svůj dotaz, aby mu byla posléze zdělena odpověď na hledaný dotaz prostřednictvím sysntetyzovaného hlasu nebo SMS[4]. Celý proces probýhal automatizovaně bez přičinění operátora. Z této služby se později vyvinula služba Google Voice Search (rok 2008) a poté byla služba GOOG-411 úplně zrušena (rok 2010) [5]. Podobným vývojem prošlo hlasové vyhledávání v podání Microsoftu, který ovšem svou službu BING-411 provozuje souběžně s Bing Voice Search až do dnešních dnů.

Podporované jazyky

Všechy společnosti provozující hlasové vyhledávání omezili poskytování svých služeb pouze na severo-americký kontinent nebo anglicky mluvící země. Jedinou vyjímkou je Google, který “chce tuto funkci postupně zpřístupnit pro všechny světové jazyky”.Google v současnosti poskytuje hlasové vyhledávání v jedenácti jazycích, jimiž jsou[7][8]:

  • angličtina
  • japonština
  • činština
  • němčina
  • španělština
  • francouština
  • italština
  • turečtina
  • polština
  • ruština
  • čeština

Nejnověji je podporována malajsština, indonesština a latinsko-americká španělština[9].

Technické řešení

Po technologické stránce musí mít hlasové vyhledávání velice robustní řešení. To se projevý už když narazíme na počet slov, které musí takové systémy evidovat ve své databázi. Např. české hlasové vyhledávání poskytované googlem má databázi "v rozsahu více než milionu (…) slov"[6]. Takovou databázi je nejdříve nutné vybudovat. To je možné udělat několika způsoby. Jeden z nejvhodnějších je zadat tento úkol přímo uživatelům hlasového vyhledávání. Tento způsob částečně používa Google[9], který všechny záznamy o vyhledávání ukládá, aby tak zlepšil svoje výsledky hledání v závislosti na rozpoznávání řeči. A zároveň takto stále rozšiřuje svou databázi hlasových samplů. Další způsob může být využití databáze jiného systému jako při přechodu z GOOG-411 na Google Voice Search (viz. také BING-411). Nebo celý akustický model vybudují vývojáři sami [2]. Této komponentě systému se říká akustický model. Další komponentou je tzv. pronunciation model, která zajišťuje, aby byly rozpoznány také různé instance téhož slova resp. aby bylo slovo rozpoznáno nezávisle na mluvčím. Třetí komponentou je jazykový model. Ten zajišťuje, aby se ze vstupního dotazu vybral "nejpravděpodobnější výraz"[10]. Celý proces tedy probíhá následovně: uživatel vysloví svůj dotaz, ten se zašle do vzdáleného systému kde se pomocí akustického modelu, pronunciation modelu a jazykového modelu převede vyslovéná fráze do nejpravděpodobnějšího textového ekvivalentu. Následně fráze projde běžným search enginem např. od Googlu a uživatel dostane výsledek. Dotaz může uživatel dále zpřesňovat nebo měnit jako při běžném vyhledávání. Celý proces je ilustrován na obr. 1.


Použíté zdroje

[1] Tyinternety.cz [online]. 2009-10-7 [cit. 2011-05-12]. Microsoft Bing Voice Search k dispozici v USA. Dostupné z WWW: <http://www.tyinternety.cz/mobilne/microsoft-bing-voice-search-k-dispozici-v-usa-270>.

[2] Ye-Yi Wang; Dong Yu; Yun-Cheng Ju; Acero, A.; , An introduction to voice search, Signal Processing Magazine, IEEE , vol.25, no.3, pp.28-38, May 2008 doi: 10.1109/MSP.2008.918411. Dostupné z WWW: <http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4490199&isnumber=4490183>.

[3]Google goog-411 [online]. 2011 [cit. 2011-05-12]. 1-800-GOOG-411. Dostupné z WWW: <http://www.google.com/goog411/index.html>.

[4]Hlasové vyhledávání Google pro chytré telefony přichází do České republiky [online]. 14. 9. 2010 [cit. 2011-05-12]. Dostupné z WWW: <https://docs.google.com/viewer?a=v&pid=sites&srcid=cHJlc3NhdGdvb2dsZS5jb218Y3p8Z3g6NDUzOGZmNTBjYzQ0MTgzYw&pli=1>.

[5]ŠRAJER , Michal. Svět Androida [online]. 11. 6. 2010 [cit. 2011-05-12]. Hlasové vyhledávání v nových jazycích. Dostupné z WWW: <http://www.svetandroida.cz/hlasove-vyhledavani-v-novych-jazycich-201006>.

[6]ŠTŮSEK , Pavel. Svět Androida [online]. 14. 9. 2010 [cit. 2011-05-12]. Google Voice Search – podpora češtiny. Dostupné z WWW: <http://www.svetandroida.cz/google-voice-search-podpora-cestiny-201009>.

[7]HA, Linne. Official Google Mobile Blog [online]. 2011-03-30 [cit. 2011-05-12]. Word of Mouth: Introducing Voice Search for Indonesian, Malaysian and Latin American Spanish. Dostupné z WWW: <http://googlemobile.blogspot.com/2011/03/word-of-mouth-introducing-voice-search.html>.

[8]VYLEŤAL, Martin. Lupa.cz [online]. 15. 9. 2010 [cit. 2011-05-12]. Google spouští českou verzi hlasového vyhledávání. Dostupné z WWW: <http://www.lupa.cz/clanky/google-spousti-ceskou-verzi-hlasoveho-vyhledavani/>.