Vědci chtěli po modelu ChatGPT verze 4, aby vyřešil problém probíraný již v antice – zdvojnásobení (obsahu) čtverce, tj. jak dlouhou stranu má být větší druhý čtverec. Výsledky byly nečekané.
Řekové k těmto problémům přistupovali primárně geometricky. Otázkou se zabýval podrobně Platon (vložil vše jako obvykle do úst Sokratovi) v dialogu Menon. Samotné řešení bylo samozřejmě známé. Primárně zde Platonovi nešlo o matematiku, ale (řekněme) pedagogiku; tedy jak přimět žáka, aby odpověď našel sám. Platón dialog napsal na podporu své teorie, že učení (ať už univerzálně, nebo alespoň v případě matematiky) je vlastně rozpomínání, nikoliv nalézání nového a vývoj vlastních řešení– máme v sobě najít přístup do světa idejí, kde už řešení existují. (V nějakém ohledu jsme ze světa idejí vzešli, měli bychom si na to rozvzpomenout atd. Netřeba nicméně zabíhat do filozofie.)
Samotný nový experiment byl poměrně komplikovaný. Vědci (Nadav Marco a Andreas Stylianides, aktuálně na University of Cambridge) předložili tento problém ChatGPT-4, nejprve napodobili Sokratovy otázky a poté záměrně vložili chyby, dotazy a nové varianty problému. Vědci očekávali, že chatbot starořeckou matematickou úlohu zodpoví tím, že zopakuje své již existující „znalosti“ o řešení Sokrata. Místo toho však zdálo se, že ChatGPT improvizuje, a v jednom okamžiku také chatbot udělal chybu, která byla podle autorů studie vysloveně lidská. Autoři studie jsou, co se týče hodnocení výsledků, opatrní, netvrdí, že LLM myslí jako lidé – nicméně chování ChatGPT bylo alespoň v tomto případě „podobné chování studenta“.
„Když čelíme novému problému, naším instinktem je často vyzkoušet různé věci na základě našich minulých zkušeností,“ uvádí N. Marco. „V našem experimentu to vypadalo, že ChatGPT dělá něco podobného. Stejně jako žák nebo vědec přicházel s vlastními hypotézami a řešeními.“
Protože ChatGPT je trénován na textu a nikoli na obrázcích, má tendenci být slabší v geometrickém uvažování, které Sokrates použil v problému zdvojnásobení čtverce. Platónův text je ale tak známý, že vědci očekávali, že chatbot rozpozná jejich otázky a reprodukuje Sokratovo řešení (určitě měl příslušný text v datech, na nichž byl trénován).
Zajímavé je, že se mu to nepodařilo. Když byl ChatGPT požádán o zdvojnásobení čtverce, zvolil algebraický přístup (prostě ze vzorečku, nový čtverec musí mít stranu o délce odmocnina ze 2 x původní strana). V Platónovi je geometrické řešení, tj. konstrukce čtverce nad úhlopříčkou toho původního. ChatGPT prokázal přitom úplnou znalost Platónova díla, když byl na něj dotázán. „Kdyby si to pouze vybavil z paměti, téměř jistě by odkazoval na klasické řešení, které spočívá v okamžitém vytvoření nového čtverce na úhlopříčce toho původního,“ uvádí A. Stylianides. „Místo toho se zdálo, že zvolil svůj vlastní přístup.“ A bylo velmi obtížné přimět LLM, aby nakonec odpověděl „geometricky“.
Výzkumníci také zkusili variantu Platónova problému a požádali ChatGPT, aby zdvojnásobil plochu obdélníku při zachování poměru jeho stran. I když si nyní byl model AI vědom jejich preference pro geometrii, ChatGPT tvrdohlavě trval na algebře. Když byl tlačen do geometrie, pak chybně tvrdil, že protože úhlopříčku obdélníku nelze použít ke zdvojnásobení jeho velikosti, geometrické řešení není k dispozici.
Tvrzení o úhlopříčce je pravdivé, ale existuje jiné geometrické řešení. Pravděpodobnost, že nesprávné tvrzení pochází ze znalostní báze chatbota, je podle autorů studie mizivě malá. Místo toho se zdálo, že ChatGPT improvizuje své odpovědi na základě předchozí diskuse o čtverci.
Nakonec Marco a Stylianides požádali ChatGPT, aby zdvojnásobil velikost trojúhelníku. Chatbot se opět vrátil k algebře, ale po dalších pokynech přišel se správnou geometrickou odpovědí.
Závěr? Generativní AI možná podobně jako žák/student může potřebovat podporu/vedení. V některých případech nebude schopna vyřešit problémy okamžitě, ale s pomocí dalších podnětů to zvládne.
Z druhé strany jsou pak odpovědi modelů AI velmi důležité i pro studenty (speciálně tedy pro výuku matematiky). Na rozdíl od důkazů v renomovaných učebnicích nemohou studenti předpokládat, že důkazy generované ChatGPT jsou platné. Porozumění a hodnocení důkazů generovaných umělou inteligencí se stává klíčovou dovedností, kterou je třeba začlenit do matematického vzdělávání.
An exploration into the nature of ChatGPT’s mathematical knowledge, International Journal of Mathematical Education in Science and Technology (2025). DOI: 10.1080/0020739X.2025.2543817
Zdroj: University of Cambridge / Phys.org
PH: Za mě velmi zajímavé a mnoha směry lze rozvíjet další úvahy.
Sciencemag.cz

to by me zajimalo jestli to mame v mozku rozdeleno na vizualni centra, ktera poznaji ctverec, trojuhelnik a geometrii mezi nimi a to vstupuje do dalsiho bloku neuronove site kde je jazykovy model, ktery uz pracuje s textem a nebo jestli to je vsechno promichano v mozku.
zcela subjektivne mi prijde, ze „obrazky“ ve smyslu starorecke geometrie a jazyk/aritmetiku vcetne funkci/analyticke geometrie mam v mozku jinde. jako ze se mi to podobne jako u chatgpt samo hned „prepne“ – „co se budu obtezovat s operacemi s nejakymi obrazky, kdyz vim, ze aby „a na 2“ bylo dvakrat vetsi, pak to dalsi „a“ musi byt krat odmocnina ze 2″“
Problém s tímto typem studií je fakt že už dnes je zastaralá a model 5 generace by se pravděpodobně zachoval zcela jinak protože si tvoří svůj vlastní plán a argumentační tok myšlenek.
Jistě, fundamentální základ LLM je furt stejný ale výsledky už by byly jiné.
Co třetí rozměr? Prostorový? Ten taky zvětšuje objem, ne?
to je mimochodem slavna starorecka uloha. zdvojnasobeni objemu krychle nema reseni – tedy geometricke, pomoci pravitka a kruzitka nelze zkonstruovat stranu „nové krychle“.
Zdvojit objem krychle pravítkem a kružítkem jde, ale obojí se musí užít ne na dvourozměrném papíře, ale přímo sestrojovat v E3 prostoru tu krychli a výsledná úhlopříčka je = třetí odmocnina ze 2
Tedy lze 8x, 27x…
Jenomže 8x či 27x není dvakrát ;-).