(c) Graphicstock

Nový algoritmus má předpovědět výsledek kombinací znalosti jednotlivce a moudrosti davu

Lidé dostanou za úkol odpovědět na nějakou otázku, která má jednoznačné řešení, třeba seřadit města podle velikosti. Vás jako nějakou výzkumnou agenturu, marketingové oddělení (apod.) zajímá, jak budou respondenti odpovídat v průměru. Samozřejmě chcete získat co nejpřesnější výsledky a současně s minimem práce/nákladů na dotazování.
Každého respondenta se lze prostě jen zeptat a chtít jeho vlastní odpověď. Nebo se můžete každého zeptat na to, jak si myslí, že odpoví ostatní (tímto způsobem dostanete ve většině případů lepší výsledek). A nebo můžete obě tyto otázky zkombinovat. Takový je základ algoritmu, který už je velmi kvalitní. Kdo odpoví špatně, jeho názor na to, jak odpovědí ostatní (správně či špatně) nemá (údajně) moc cenu (ať už by si myslel „to ví přece každý“, nebo „ostatní jsou blbí, to vím jen já“). Naopak když znáte správnou odpověď, např. jaké je pořadí měst podle velikosti, pak má smysl vzít v potaz i váš názor na to, jak je příslušná znalost rozšířená – samozřejmě s poskytnutím dalších informací typu množiny respondentů.
Otázkou je, jak ale metodu použít tam, kde správná odpověď není známa předem (výsledek voleb nebo sportovního utkání; v těchto případech neexistuje v okamžiku dotazování žádná správná odpověď, podle níž by šlo vybrat, čí názor vzít v potaz). Obecně lepší výsledky při předvolebním průzkumu dává při stejném počtu respondentů ptát se ne na to, koho dotyčný bude volit, ale jak to dopadne celkově. (Poznámka PH: Snad ještě relevantnější by bylo se ptát toho, kdo je na výsledek ochotný vsadit vlastní peníze, tedy sázkařů? Sázkových agentur?)
Hadi Hosseini z Penn State College a jeho kolegové nyní tvrdí, že jejich nové vylepšení podstatně rozšiřuje možnosti celého algoritmu i tam, kde je situace právě takto různě komplikována. Sekundární otázky umožní pak dostat podobně validní výsledek i s pomocí menšího množství vzorků. (PH: Představuji si to nějak tak, že ze vzorku vyselektujete lidi, kteří o politice nebo fotbalu něco vědí dle odpovědi na související otázku, a pak statisticky zpracujete jenom tyto odpovědi. Průvodní tisková zpráva Pennsylvania State University to popisuje poněkud nejasně. Určitě by byla možné vše provádět i ještě jemněji, podle zjištěné znalosti pak dalším předpovědím dávat při zpracování relativní váhy apod. Ale zdaleka ne vždycky dává komplikovanější model přesnější výsledky.)
Každopádně má i rozšíření metody ale potvrzovat, že ptát se na výsledek hlasování dává lepší předpovědi než ptát se vzorku lidí na to, jak budou hlasovat sami. „Zjišťovat, co si myslíte o názoru ostatních, je zásadnější otázka než ptát se na jejich vlastní názor,“ uvádí H. Hosseini. Mimochodem prý tímto způsobem šlo získat celkem relevantní odpovědi i tam, kde by čistá „moudrost davu“ spíše selhala, třeba na ceny abstraktních obrazů.

Surprisingly Popular Voting Recovers Rankings, Surprisingly! faculty.ist.psu.edu/hadi/papers/spvoting.pdf
Zdroj: Pennsylvania State University / Phys.org

Poznámka PH: Ale samozřejmě hned se nabízí i výhrada: ptáte-li se lidí na to, koho budou volit, dostanete jednoduše čísla, z nichž nějak můžete odhadovat výsledek. Můžete se ptát, kdo podle respondentů volby vyhraje, to ale dává výsledek obsahující podstatně méně informací (tedy až na druhá kola voleb už jen ze dvou kandidátů). A „odhadněte výsledek v procentech“ už je složitější otázka, méně lidí bude odpovídat atd.

Komety, izotopy a pozemská voda – je to celé komplikované

Pozemská voda je do nějaké (značné?) míry kometárního původu, tak jsme to všichni čítávali. Jenže …

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *