Foto: © Dollar Photo Club
Foto: © Dollar Photo Club

Weby od sebe dříve byly na 19 odkazů – a na kolik by to vyšlo dnes?

Vezmeme 2 náhodně zvolené webové stránky, tematicky spolu nesouvisející. Kolika kliknutími se mezi nimi lze přemístit, jak dlouhá mezi nimi existuje v tomto ohledu nejkratší cesta?
Samozřejmě nám jde o průměr, vždyť z webu (nebo na web) nemusí vést vůbec žádný odkaz, stejně tak mohou oba weby být propojeny přímo. Průměr ovšem neznamená žádné „náhodné klikání na odkazy“ (to by nejspíš k cíli nevedlo nikdy), jde o „průměrnou nejkratší cestu“. Průměrná nejkratší cesta rozhodně neznamená ani to, že se budeme snažit rozumně klikat tak, abychom se ze známého místa A co nejrychleji dostali na místo B – takto k cíli nejspíš dojdeme, ale zřejmě za podstatně delší než nejkratší dobu, zkratky nutně nejsou logické.
Jedná se o obdobu populární konceptu „světa na šest kroků“, kdy většina lidí na světě by mezi sebou měla být přes známé propojena v řetězci pouhých 6 spojení. Albert-László Barabási ve své knize V pavučině sítí rozebírá povahu různých sítí. Web (nebo obecně Internet) mu přitom vychází jako síť řídící se mocninným rozdělením. To znamená, že nové weby se přednostně připojují k větším uzlům. Mocninné rozdělení se podstatně liší od normální křivky, ba i od její poloviny; klesá proti Gaussově křivce mnohem pomaleji, tj. velkých uzlů zde existuje relativně více. Je tomu tak proto, že nový web se v tomto modelu nepřipojuje „náhodně“, ale preferenčně k větším uzlům.
V knize vydané v ČR v roce 2005 Barabásimu vychází, že průměrná nejkratší cesta mezi weby by měla být dlouhá 19 kroků, alespoň dle dat z roku 1998. Kolik to bude dnes? Webových stránek od té doby samozřejmě přibylo, nicméně počet kroků na počtu stránek závisí při mocninném rozdělení logaritmicky, takže počet kroků nevzroste řádově. Barabási uvádí vztah 0,43 + 2 x logN.
V roce 1998 se jednalo o 800 milionů stránek, z čehož vyšlo oněch uváděných 19 (nebo 18) kroků. V polovině roku 2019 je webů 5,5 miliardy (dle worldwidewebsize.com), takže nám vychází číslo cca 20. Samozřejmě je tu otázka, jak přesně se vše počítá – a opravdu se objem webu za 20 let nezvětšil víckrát? (Máme např. pokládat jakýkoliv obrázek za samostatný web? Vlastní URL má. Nicméně počet webů indexovaných Googlem je posledních zhruba 5 let už cca konstantní.) Ovšem i kdybychom si řekli, že webů je 10krát tolik, počet kroků/vzdálenost se tím zvýší stále jen o 1.
Je to ovšem složitější o to, že i když uznáme mocninný charakter rozdělení a tedy logaritmickou závislost, nevyplývá z toho nijak konkrétní velikost konstant. Na webech obvykle přibylo odkazů, protože zde přibylo různých plug-inů třetích stran („boxů“, reklamních formátů…). S nástupem sociálních sítí se také „nenáhodnost“ rozdělení ještě zvýraznila, stále více webů je preferenčně připojených k hlavním uzlů, domovským stránkám sociálních sítí apod.
Takže lze odhadnout, že konstanty ve vzorečku se změnily tak, že průměrná nejkratší cesta mezi dvěma náhodnými weby se ještě zkrátila. Třeba teď není ani o nic větší než před 20 lety, nebo i klesla? (Stejně jako jako Barabási nepočítáme dark web.)
Zdroj: Albert-László Barabási: V pavučině sítí, Paseka, 2005 a další

Viz také: Reálné sítě nemají být bezškálové

Exotická fyzika neutronových hvězd: jaderné těstoviny a odkapávání protonů

Neutronové hvězdy jsou extrémní objekty, do jejichž nitra nevidíme. S poloměrem kolem 12 kilometrů mohou …

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *