Daboost / Shutterstock

Aktivitáskövető közelmúltbeli elbocsátás és gyors újrafelvétel Sam Altman OpenAI-tól a mesterséges intelligencia (AI) fejlesztésével és használatával kapcsolatos viták ismét a reflektorfénybe kerültek. Ami még szokatlanabb, hogy a média tudósításainak kiemelkedő témája volt a képesség AI rendszerek a matematikához.

Úgy tűnik, hogy az OpenAI-n zajló drámák egy része a vállalat új fejlesztéséhez kapcsolódott Q* nevű AI algoritmus. A rendszerről jelentős előrelépésként beszéltek, és egyik kiemelkedő tulajdonsága a matematikai érvelés képessége volt.

De nem a matematika az AI alapja? Hogyan lehet egy mesterséges intelligencia rendszernek problémája a matematikai érveléssel, mivel a számítógépek és a számológépek képesek matematikai feladatokat végrehajtani?

Az AI nem egyetlen entitás. Stratégiák patchworkje a számítások végrehajtásához közvetlen emberi utasítások nélkül. Amint látni fogjuk, egyes AI-rendszerek kompetensek a matematikában.

Azonban az egyik legfontosabb jelenlegi technológia, a mesterséges intelligencia chatbotok, például a ChatGPT mögött meghúzódó nagy nyelvi modellek (LLM-ek) eddig küszködtek a matematikai érvelés emulálásával. Ez azért van, mert úgy lettek kialakítva, hogy a nyelvre koncentráljanak.


belső feliratkozási grafika


Ha a vállalat új Q* algoritmusa láthatatlan matematikai problémákat tud megoldani, akkor ez jó lehet jelentős áttörést jelent. A matematika az emberi érvelés ősi formája nagy nyelvi modellek (LLM) eddig küzdöttek az utánzásért. Az LLM-ek az olyan rendszerek alapját képező technológia, mint pl OpenAI ChatGPT.

A cikk írásakor a Q* algoritmus részletei és képességei korlátozottak, de nagyon érdekesek. Tehát számos finomságot figyelembe kell venni, mielőtt a Q* sikeresnek ítélné.

Például a matematika olyan tantárgy, amellyel mindenki különböző mértékben foglalkozik, és a matematika Q* kompetens szintje továbbra is homályos. Vannak azonban olyan tudományos munkák, amelyek a mesterséges intelligencia alternatív formáit használják a kutatási szintű matematika előmozdítására (köztük néhány saját magam által írt, és az egyiket matematikusokból álló csapat írta a Google DeepMind kutatóival együttműködve).

Ezek az AI-rendszerek matematikában kompetensnek mondhatók. Valószínű azonban, hogy a Q*-t nem az akadémikusok munkájának segítésére használják, hanem más célra szánják.

Mindazonáltal, még ha a Q* nem is képes feszegetni az élvonalbeli kutatás határait, nagyon valószínű, hogy felépítésének van valami jelentősége, amely csábító lehetőségeket vethet fel a jövőbeli fejlődés számára.

Egyre kényelmesebb

Társadalomként egyre inkább elégedettek vagyunk azzal, hogy a speciális AI-t előre meghatározott típusú problémák megoldására használják. Például, digitális asszisztensek, arcfelismerőés online ajánlórendszerek ismerős lesz a legtöbb ember számára. Ami megfoghatatlan marad, az egy ún „mesterséges általános intelligencia” (AGI) amely az emberéhez hasonló széles érvelési képességekkel rendelkezik.

A matematika olyan alapvető készség, amelyet minden iskolás gyermeknek meg akarunk tanítani, és ez minden bizonnyal alapvető mérföldkőnek számít az AGI keresésében. Tehát hogyan lennének másként a matematikailag kompetens mesterséges intelligencia rendszerek a társadalom segítségére?

A matematikai gondolkodásmód számos alkalmazásban releváns, például a kódolásban és a tervezésben, így a matematikai érvelés létfontosságú átadható készség mind az emberi, mind a mesterséges intelligencia számára. Az egyik irónia az, hogy a mesterséges intelligencia alapvetően a matematikán alapul.

Például az AI-algoritmusok által megvalósított technikák közül sok végső soron egy olyan matematikai területre vezet le, amelyet ún. mátrix algebra. A mátrix egyszerűen egy számrács, amelyre a digitális kép ismerős példa. Minden pixel az nem más, mint számszerű adatok.

A nagy nyelvi modellek is eleve matematikaiak. Hatalmas szövegminta alapján a gép képes megtanulni a szó valószínűségét legvalószínűbb, hogy a felhasználó felszólítását (vagy kérdését) követi a chatbothoz. Ha azt szeretné, hogy egy előre képzett LLM egy adott témára szakosodjon, akkor finomhangolhatja a matematikai irodalomra vagy a tanulás bármely más területére. Az LLM olyan szöveget generálhat, amely úgy olvasható, mintha értené a matematikát.

Sajnos ez egy olyan LLM-et eredményez, amely jó blöffölésben, de rossz a részletekben. A probléma az, hogy egy matematikai állítás definíció szerint olyan, amelyhez hozzá lehet rendelni egy egyértelmű Boole-érték (vagyis igaz vagy hamis). A matematikai érvelés az új matematikai állítások logikai levezetését jelenti a korábban megállapítottakból.

Ördög ügyvédje

Természetesen a matematikai érvelés minden olyan megközelítése, amely a nyelvi valószínűségekre támaszkodik, a sávon kívül fog vezetni. Ennek egyik módja lehet valamilyen formális ellenőrzési rendszer beépítése az architektúrába (pontosan hogyan épül fel az LLM), amely folyamatosan ellenőrzi a nagy nyelvi modell ugrásai mögött meghúzódó logikát.

Ennek nyoma lehet a Q* névben, amely hihetően utalhat erre egészen az 1970-es években kifejlesztett algoritmus hogy segítse a deduktív érvelést. Alternatív megoldásként a Q* utalhat a Q-learningre, amelyben a modell idővel javulhat a helyes következtetések tesztelésével és jutalmazásával.

A matematikailag alkalmas mesterséges intelligencia létrehozása azonban számos kihívás elé állítja. A legérdekesebb matematika például nagyon valószínűtlen eseményekből áll. Sok olyan helyzet van, amikor az ember azt gondolhatja, hogy kis számok alapján létezik egy minta, de az váratlanul felbomlik, ha elegendő számú esetet ellenőriz. Ezt a képességet nehéz beépíteni egy gépbe.

Egy másik kihívás meglepő lehet: a matematikai kutatás rendkívül kreatív lehet. Meg kell lennie, mert a gyakorló szakembereknek új fogalmakat kell kitalálniuk, és mégis ragaszkodniuk kell ahhoz egy ősi alany formai szabályai.

Bármely mesterséges intelligencia módszer, amelyet csak arra tanítottak, hogy megtalálja a mintákat a már meglévő matematikában, feltehetően soha nem tudna valódi új matematikát létrehozni. Tekintettel a matematika és a technológia közötti csővezetékre, ez kizárni látszik az új technológiai forradalmak koncepcióját.

De játsszunk egy pillanatra az ördög szószólóját, és képzeljük el, hogy az AI valóban képes-e új matematikát létrehozni. Az előző érvnek ez ellen van egy hibája, mivel azt is mondhatnánk, hogy a legjobb emberi matematikusokat is kizárólag a már létező matematikára képezték ki. A nagy nyelvi modellek már korábban is megleptek minket, és meg is fognak tenni.A beszélgetés

Tom Oliver, előadó, számítástechnika és mérnök, Westminsteri Egyetem

Ezt a cikket újra kiadják A beszélgetés Creative Commons licenc alatt. Olvassa el a eredeti cikk.