PageRank: Porovnání verzí

Z WikiKnihovna
(Založena nová stránka: '''Autor:''' Petr Kahoun)
 
m (6 revizí: IMPORT P: import stránek z hlavního jmenného prostoru z KiskWiki (http://kisk.phil.muni.cz/))
 
(Není zobrazeno 5 mezilehlých verzí od stejného uživatele.)
Řádek 1: Řádek 1:
'''Autor:''' Petr Kahoun
+
'''Autor:''' Peter Kahoun
 +
 
 +
'''Klíčová slova:''' WWW, vyhledávače, SEO, SERP Rank
 +
 
 +
'''Synonyma:''' -
 +
 
 +
'''Související pojmy:'''
 +
 
 +
: ''nadřazené'' - vyhledávače
 +
 
 +
: ''podřazené'' - Google Toolbar PageRank
 +
 
 +
== Vymezení významu ==
 +
 
 +
PageRank je algoritmus používaný webovými vyhledávači pro výpočet důležitosti webové stránky. Byl pojmenován po Larry Pageovi, jedním ze dvou zakladatelů společnosti Google (provozující dnes dominantní webový vyhledávač).
 +
 
 +
PageRank, který se počítá zlášť pro každou stránku na webu, vychází z počtu a kvality (hypertextových) odkazů, které na stránku míří. Ty tvoří výsledný PageRank stránky, vyjádřitelný jako číslo od 0 do 1. Tento údaj o stránce by měl něco vypovídat o kvalitě nebo popularitě stránky, což se později zpracovává jako jeden z parametrů ke zjištění relevance stránky.
 +
 
 +
Princip PageRanku je ne nepodobný některým bibliometrickým technikám anebo tzv. Impakt faktoru, který zjedodušeně značí průměrný počet citací na článek daného periodika v určitém období. Mezi citování v odborném tisku a odkazováním na Webu existuje zřejmá paralela, ostatně citační analýza je jedním z potvrzených zdrojů inspirace Pagea a jeho kolegy S. Brina.
 +
 
 +
“PageRank” je obchodní značkou ve vlastnictví společnosti Google. Algoritmus je ve Spojených státech patentován a vlastník patentu (Standfordská univerzita) propůjčuje jeho využívání výlučně společnosti Google. Nicméně je pravděpodobné, že i jiné vyhledávače využívají obdobných algoritmů pro stanovení obdobných hodnot, jako PageRank (důležitost či “citovanost”).
 +
 
 +
== Další fakta o PageRanku ==
 +
 
 +
Stručně řečeno, PageRank je číslo, které se vypočítává z následujících paramterů:
 +
* množství odkazů vedoucích na stránku
 +
* PageRank stránek odkazujících na stránku
 +
* množství odkazů vedoucích ze stránky
 +
 
 +
Výpočet PR je '''iterativní'''. To znamená, že PageRank je pro stránku vypočítáván opakovaně, aby byl co nejvíce odpovídající stavu odkazů. To je nezbytné, protože počet stránek existujících v systému se mění. Protože tyto stránky většinou odkazují na jiné stránky, PageRank všech stránek se v průběhu času mění. Takže aby byl PageRank aktuální, musí se čas od času přepočítávat.
 +
 
 +
== Matematický vzorec ==
 +
 
 +
Výpočet pageranku se dá vyjádřit takto:
 +
 
 +
<math>PR(a) = \sum_{u \in B_a } \frac{PR(u)}{N_u}</math>
 +
 
 +
* ''a'' je hodnocená stránka
 +
* ''u'' je každá stránka odkazující na stránka ''a''
 +
* <math>B_a</math> značí množinu všech stránek odkazujích na stránku ''a''
 +
* <math>N_u</math> je počet odkazů, které vedou z ''u''
 +
 
 +
Zjednodušeně se to dá přepsat jako:
 +
 
 +
<math>PR(a) = frac{PR(u_1)}{N_u_1} + ... + frac{PR(u_n)}{N_u_n}</math>
 +
 
 +
V obou zápisech chybí [http://www.jakpsatweb.cz/seo/pagerank.html několik úprav], které podmiňují opravdovou funkčnost, ale jde zde hlavně o ilustraci nejzákladnějšího principu. Z něj vyplývá mj.:
 +
 
 +
* stránka odkazováním o vlastní PageRank nepřichází (přesto se všeobecně má za to, že odkazováním stránka PR “ztrácí” (anebo: vyhledávače si více cení stránek, na které je hodně odkazováno a samy málo odkazují)
 +
* síla “předávaného” PR odkazem závisí jak na PR stránky s odkazem, tak na množství odkazů na stránce.
 +
** Proto stránka s menším PR může předávat více PR, než stránka s větším PR, avšak více odkazy.)
 +
** Proto jeden odkaz (ze stránky s větším PR) může přinést více PR, než mnoho odkazů ze stránek s (podstatně) menším PR.
 +
 
 +
== Google Toolbar PageRank (GTPR) ==
 +
 
 +
Google poskytuje rozšíření (''toolbar'') pro některé webové prohlížeče, které zobrazuje pro právě prohlíženou stránku jeho “Toolbar PageRank”. Jelikož skutečný PR stránky není zveřejňovaný, tento PR (odlišný od “skutečného” PR) je jedním z mála vodítek, které napovídají hodnotu skutečného PR. Tyto dva termíny bývají nezřídka mylně zaměňovány. Omyl je tím větší, že rozdíl mezi oběma údaji může být zásadní.
 +
 
 +
Protože Toolbar PageRank byl využíván jako argument odůvodňující cenu odkazu při prodeji odkazů (tj. akce, kde dochází k nákupu a prodeji odkazů za účelem umělého zvýšení PR, čili vlastně kupování PR), Toolbar PR byl pro vybrané (odkazy prodávající) weby uměle snížen. (Nákup odkazů byl později vyhledávači trestán i jinými způsoby.)
 +
 
 +
== Projev PR na SERP neboli praktická důležitost PR ==
 +
 
 +
PageRank je jen jedním  z mnoha faktorů ovlivňujících umístění stránky na stránce s výsledky vyhledávání (''search engine results page''). Existují názory, že role PR jako faktoru je minoritní. Tyto faktory se silně vztahují k významu nebo syntaxi vyhledávacího dotazu. Může jít např. "existenci klíčového slova v titulku stránky" anebo abstraktnější hodnoty jako "důvěryhodnost" nebo "autorita webu".
 +
 
 +
== Použitá literatura ==
 +
 
 +
* Janovský, D. JakPsátWeb.cz [online]. 200?. Google PageRank. Dostupné z WWW: http://www.jakpsatweb.cz/seo/pagerank.html
 +
* Google Press Center [online]. 2010. Google Fun Facts. Dostupné z WWW: http://www.google.com/press/funfacts.html
 +
* Wikipedia, The Free Encyclopedia: PageRank [online]. c2010. Dostupný z WWW: http://en.wikipedia.org/w/index.php?title=PageRank&oldid=368048578
 +
* Wikipedie: Otevřená encyklopedie: PageRank [online]. c2010. Dostupný z WWW: http://cs.wikipedia.org/w/index.php?title=PageRank&oldid=5370071
 +
* SEOnotepad.com [online]. 2009-02-18. Myth of the Google Toolbar Ranking. Dostupné z WWW: http://www.seonotepad.com/search-engines/google-seo/myth-of-the-google-toolbar-ranking/
 +
* SEOmoz.org [online]. 2009-08. Search Engine Ranking Factors V3. Dostupné z WWW: http://www.seomoz.org/article/search-ranking-factors

Aktuální verze z 20. 2. 2012, 11:54

Autor: Peter Kahoun

Klíčová slova: WWW, vyhledávače, SEO, SERP Rank

Synonyma: -

Související pojmy:

nadřazené - vyhledávače
podřazené - Google Toolbar PageRank

Vymezení významu

PageRank je algoritmus používaný webovými vyhledávači pro výpočet důležitosti webové stránky. Byl pojmenován po Larry Pageovi, jedním ze dvou zakladatelů společnosti Google (provozující dnes dominantní webový vyhledávač).

PageRank, který se počítá zlášť pro každou stránku na webu, vychází z počtu a kvality (hypertextových) odkazů, které na stránku míří. Ty tvoří výsledný PageRank stránky, vyjádřitelný jako číslo od 0 do 1. Tento údaj o stránce by měl něco vypovídat o kvalitě nebo popularitě stránky, což se později zpracovává jako jeden z parametrů ke zjištění relevance stránky.

Princip PageRanku je ne nepodobný některým bibliometrickým technikám anebo tzv. Impakt faktoru, který zjedodušeně značí průměrný počet citací na článek daného periodika v určitém období. Mezi citování v odborném tisku a odkazováním na Webu existuje zřejmá paralela, ostatně citační analýza je jedním z potvrzených zdrojů inspirace Pagea a jeho kolegy S. Brina.

“PageRank” je obchodní značkou ve vlastnictví společnosti Google. Algoritmus je ve Spojených státech patentován a vlastník patentu (Standfordská univerzita) propůjčuje jeho využívání výlučně společnosti Google. Nicméně je pravděpodobné, že i jiné vyhledávače využívají obdobných algoritmů pro stanovení obdobných hodnot, jako PageRank (důležitost či “citovanost”).

Další fakta o PageRanku

Stručně řečeno, PageRank je číslo, které se vypočítává z následujících paramterů:

  • množství odkazů vedoucích na stránku
  • PageRank stránek odkazujících na stránku
  • množství odkazů vedoucích ze stránky

Výpočet PR je iterativní. To znamená, že PageRank je pro stránku vypočítáván opakovaně, aby byl co nejvíce odpovídající stavu odkazů. To je nezbytné, protože počet stránek existujících v systému se mění. Protože tyto stránky většinou odkazují na jiné stránky, PageRank všech stránek se v průběhu času mění. Takže aby byl PageRank aktuální, musí se čas od času přepočítávat.

Matematický vzorec

Výpočet pageranku se dá vyjádřit takto:

<math>PR(a) = \sum_{u \in B_a } \frac{PR(u)}{N_u}</math>

  • a je hodnocená stránka
  • u je každá stránka odkazující na stránka a
  • <math>B_a</math> značí množinu všech stránek odkazujích na stránku a
  • <math>N_u</math> je počet odkazů, které vedou z u

Zjednodušeně se to dá přepsat jako:

<math>PR(a) = frac{PR(u_1)}{N_u_1} + ... + frac{PR(u_n)}{N_u_n}</math>

V obou zápisech chybí několik úprav, které podmiňují opravdovou funkčnost, ale jde zde hlavně o ilustraci nejzákladnějšího principu. Z něj vyplývá mj.:

  • stránka odkazováním o vlastní PageRank nepřichází (přesto se všeobecně má za to, že odkazováním stránka PR “ztrácí” (anebo: vyhledávače si více cení stránek, na které je hodně odkazováno a samy málo odkazují)
  • síla “předávaného” PR odkazem závisí jak na PR stránky s odkazem, tak na množství odkazů na stránce.
    • Proto stránka s menším PR může předávat více PR, než stránka s větším PR, avšak více odkazy.)
    • Proto jeden odkaz (ze stránky s větším PR) může přinést více PR, než mnoho odkazů ze stránek s (podstatně) menším PR.

Google Toolbar PageRank (GTPR)

Google poskytuje rozšíření (toolbar) pro některé webové prohlížeče, které zobrazuje pro právě prohlíženou stránku jeho “Toolbar PageRank”. Jelikož skutečný PR stránky není zveřejňovaný, tento PR (odlišný od “skutečného” PR) je jedním z mála vodítek, které napovídají hodnotu skutečného PR. Tyto dva termíny bývají nezřídka mylně zaměňovány. Omyl je tím větší, že rozdíl mezi oběma údaji může být zásadní.

Protože Toolbar PageRank byl využíván jako argument odůvodňující cenu odkazu při prodeji odkazů (tj. akce, kde dochází k nákupu a prodeji odkazů za účelem umělého zvýšení PR, čili vlastně kupování PR), Toolbar PR byl pro vybrané (odkazy prodávající) weby uměle snížen. (Nákup odkazů byl později vyhledávači trestán i jinými způsoby.)

Projev PR na SERP neboli praktická důležitost PR

PageRank je jen jedním z mnoha faktorů ovlivňujících umístění stránky na stránce s výsledky vyhledávání (search engine results page). Existují názory, že role PR jako faktoru je minoritní. Tyto faktory se silně vztahují k významu nebo syntaxi vyhledávacího dotazu. Může jít např. "existenci klíčového slova v titulku stránky" anebo abstraktnější hodnoty jako "důvěryhodnost" nebo "autorita webu".

Použitá literatura