Foto: kentoh / Dollar Photo Club

Sebevědomí, nesoudní, nekompetentní: Dunningův–Krugerův efekt byl zpochybněn

Dunningův–Krugerův efekt je označení pro neschopnost vyhodnotit objektivně vlastní neschopnost :-). Čím méně kompetentní v daném oboru (apod.) člověk je, tím spíše bude sám sebe přeceňovat, např. při odhadu úspěšnosti v nějakém testu. Populárně řečeno, když je někdo opravdu blb, pak k k tomu patří, aby si ani neuvědomoval, že je blb (tak nějak se vyjádřil John Cleese z Monty Python).
Někdy se též jako související jev uvádí, že lidé hodně znalí daného oboru své výsledky (relativně) naopak podceňují, protože zbytku populace přikládají spíše větší znalosti.
Jinak obecně většina lidí se mírně přeceňuje (většina se považuje za nadprůměrně inteligentní, atraktivní, lepší než průměrné řidiče, většina učitelů „je“ těmi lepšími učiteli…) nejméně kvalifikovaní lidé mají přeceňovat své schopnosti více než kdokoli jiný. Nový rozbor (od matematika) na The Conversation však s ohledem na skutečná čísla tvrdí, že jde spíš o mem/bonmot, eventuálně že to dokumentuje, jak se lidé dopouštějí chyb/nepřesných interpretací při práci s matematickými údaji (autoři původního článku z 90. let, kde byl jev popsán, byli psychologové).
Dunning a Kruger původně zadali studentům logický test a rozdělili je na základě jejich výsledků do čtyř skupin. Čtvrtina studentů s nejnižším skóre měla v průměru 10 z 20 otázek správně. Oproti tomu čtvrtina studentů s nejlepším skóre měla v průměru 17 otázek správně. Obě skupiny odhadovaly, že správně odpověděly přibližně na 14 otázek. A co relativní srovnání? Zde vše vypadá ještě výrazněji. Studenti s nejhoršími výsledky (poslední čtvrtina) odhadovali, že si vedli lépe než 62 % účastníků testu, zatímco studenti s nejvyššími výsledky si mysleli, že dosáhli lepších výsledků než 68 %. Být na konci žebříčku znamená, že v nejlepším případě dotyčný nechá za sebou 25 % lidí, v průměru horšího výsledku dosáhne 12,5 % zúčastněných. Odhad, že si člověk vedl lépe než 62 % kolegů, přičemž skutečnost zní 12,5 %, vypadá jako obrovské nadhodnocení. Další studie měly celý efekt potvrdit.
A proč má být celá interpretace zavádějící, když se to zdá být tak jasně? Eric C. Gaze tvrdí, že celý efekt je spíš důsledkem designu výzkumu než lidského mozku. Lze jej vyvolat i pomocí náhodně generovaných dat.
„Nejprve jsme vytvořili 1 154 fiktivních lidí a náhodně jim přiřadili jak skóre v testu, tak hodnocení sebe sama ve srovnání s jejich kolegy. Poté jsme, stejně jako Dunning a Kruger, rozdělili tyto fiktivní lidi do čtvrtí na základě jejich skóre v testu. Protože i pořadí sebehodnocení bylo náhodně přiřazeno skóre od 1 do 100, každá čtvrtina dojde k průměru 50 bodů. Podle definice bude spodní čtvrtina překonávat v průměru pouze 12,5 % účastníků, ale z náhodného přiřazení skóre sebehodnocení se bude považovat za lepší než 50 % účastníků testu. To dává nadhodnocení o 37,5 procentního bodu.“ (Poznámka: Chápu-li dobře, má tím být řečeno: Nejhorší řešitelé testů nejvíce nadhodnotili svůj výkon, protože jsou jednoduše nejdále od průměru.)
Dále pak Ed Nuhfer a jeho tým zadali studentům test přírodovědné gramotnosti o 25 otázkách. Po zodpovězení každé otázky měli studenti ohodnotit svůj vlastní výkon po každé otázce. V této studii ze studentů, kteří dosáhli skóre ve spodní čtvrtině, pouze 16,5 % výrazně nadhodnotilo své schopnosti/výsledky.
Dunningův a Krugerův experiment ukazuje pouze to, že většina lidí se považuje za nadprůměrné, nic víc, tvrdí alespoň Eric C. Gaze.

Dunningův–Krugerův na Wikipedia.cz

Zdroj: Eric C. Gaze: Debunking the Dunning–Kruger effect, The Conversation/Phys.org a další

Poznámky PH:
Každý potvrdí, že efekt existuje – v tom smyslu, že potkal lidi přesně odpovídající příslušnému popisu. Zde ovšem může jít o efekt výběrový; taková setkání mohou být natolik rozčilující a frustrující, že si je člověk zapamatuje a budou mít pro něj význam až formující. Neznamená to ale, že každý člověk bez hudebního sluchu si o sobě myslí, že je vynikající zpěvák, respektive že by zde bylo příslušné zkreslení nějak výraznější (viz výše – poněkud nadsazené mínění o sobě má většina lidí).
Původní interpretace na mě ale působí přesvědčivěji než tvrzení výše. (Pokud se podprůměrný považuje za nadprůměrného, je to přece větší zkreslení, než když si to myslí průměrný. Kdyby si nejhorší respondenti trochu přeceňovali, což je řekněme normální,ale byli současně soudní, měli by se řadit třeba k mírně podprůměrným.)
U výzkumů typu „jak myslíte, že jste dopadli v testu“, může docházet k řadě zkreslení, lidé nemusí odpovídat, co si opravdu myslí (zde spíše naopak, snaží se nepůsobit přehnaně sebevědomě, ale naopak skromně, atp.). Zřejmě by se měli odpovídající současně odměňovat za to, že se trefí – aby o svém výsledku skutečně říkali, co si myslí.
V některých oblastech je kognitivní zkreslení obtížnější – třeba myslet si, že jsem jedním z nejlepších světových šachistů (maximálně tak v podobě „byl bych, kdybych se tomu věnoval…“). V této souvislosti snad úsměvná perlička. Jefim Bogoljubog byl opravdu jedním z nejlepších světových šachistů, alespoň po určitou dobu (kolem r. 1930), jeho sebevědomí však bylo ještě podstatně vyšší. Když prohrál, nepociťoval prý roztrpčení smutek, hněv apod., ale nezměrný údiv: jak se něco takového mohlo vůbec stát, když přece…

Má smysl namísto života hledat ve vesmíru složitou chemii?

Místo otázky, zda na Enceladu (nebo obdobném místě), existuje život, má možná smysl se ptát …

2 comments

  1. Určitě musí existovat literatura o testování testů.
    Náš učitel chemie a fyziky na gymnasiu na počátku 70. let byl velký nadšenec do testů („zakroužkuj a,b,c, nebo d“). Do testů bez upozornění vkládal otázky, na které jsme nemohli znát správnou odpověď. A po letech prozradil, že statistika výsledků neznámých otázek ho zaskočila, protože nadpoloviční část třídy správnou odpověď uhodla a nemělo to jiné vysvětlení, že musí poladit výběr špatných odpovědí, protože odtud jedině mohlo přijít to statistické překvapení. Ladil, ale nenaladil, na čtvrtinu správných odpovědí se nedostal, pořád to bylo kolem 50 procent.
    Testy zjevně projevují kvantové vlastnosti 🙂

  2. Zajímavé by bylo vysledovat možnou závislost výsledku testu na „preferovaných sociálních hrách v dané kultuře“, které se mohou mezi kulturami radikálně lišit. Na to nás upozorňoval učitel, který v šedesátých letech udělal zkušenost s učením v Kanadě a posléze v sedmdesátých silně rezignovaně učil na ČVUT.
    Ve spojených státech je sebenadhodnocování sociální povinnost.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *