Az antropikus felhívások „fékpedálra”, mielőtt az AI emberi felügyelet nélkül kifejlődik

Dániel Szabó

Az antropikus felhívások „fékpedálra”, mielőtt az AI emberi felügyelet nélkül kifejlődik

Az Anthropic társalapítója, Jack Clark szerint az AI-ügynökök hamarosan maguk is modelleket építhetnek és képezhetnek ki, és ha ez megtörténik, az emberek elveszíthetik az irányítást az AI-rendszerek felett.

Az Anthropic társalapítója, Jack Clark azt akarja, hogy az AI-ipar fékezzen, mielőtt a technológia emberi beavatkozás nélkül továbbfejlődne.

Clark a BBC-nek nyilatkozva elmondta, hogy az Anthropic kódolási munkájának 80%-át már az AI Claude végzi, és néhány éven belül akár 100%-ra is nőhet. Azt mondta azonban, hogy „ez egy választás”, hogy az AI-cégek engedik-e idáig anélkül, hogy megállítanák.

„Úgy gondoljuk, ez egy olyan téma, amelyről a világnak többet kellene beszélnie” – mondta Clark. „A mesterséges intelligencia iparban jelenleg van gázpedál, de nincs fékpedál az autóban, és szeretnénk egy részét elvégezni ennek a pedálnak a megépítésén.”

Ezt a folyamatot „rekurzív önfejlesztésnek” nevezik, ahol egy mesterséges intelligencia emberi beavatkozás nélkül is képes önmagát javítani – írja az Anthropic egy kapcsolódó blogbejegyzésében csütörtök este.

Egy rekurzív modellben az AI-ügynökök, a chatbot által épített autonóm munkások „eléggé képessé válhatnak arra, hogy maguk is modelleket építsenek és képezzenek”, így Claude-ot „folyamatosan fejlesztheti Claude” – mondta Anthropic.

Míg a rekurzív mesterséges intelligencia jótékony hatással lehet a tudomány és az egészségügy területére, az Anthropic arra figyelmeztet, hogy ez „növelheti annak kockázatát, hogy az emberek elveszítik az irányítást az AI-rendszerek felett”.

„Ha a rendszerek képesek teljesen felépíteni saját utódjaikat, sokkal fontosabbá válnak azok a módszerek, amelyekkel biztosítjuk őket, figyeljük őket és alakítjuk viselkedésüket” – olvasható a blogbejegyzésben.

Az Anthropic saját modelljében bizonyíték van arra, hogy a rekurzió előbb, mint utóbb bekövetkezik. Rámutat arra a tényre, hogy munkatársaik kódjavítási aránya folyamatosan csökkent az elmúlt évben, ami azt jelenti, hogy kevesebb a hiba abban, amit Claude produkál.

Claude saját kutatási kísérleteit is le tudja futtatni, ha egy nyílt végű kérdést kap fel, például: „Felügyelhet-e egy gyengébb modell egy erősebbet?” és emberi közreműködés nélkül álljon elő saját megoldásokkal.

„A bizonyítékok arra utalnak, hogy az emberi szerep az AI fejlesztési folyamat minden egyes lépésében szűkül” – olvasható a blogban.

Az Anthropic azt mondta, hogy intézete kutatásokat fog végezni egy olyan rendszer kiépítésére, amely ellenőrzi, hogy a fejlesztők valóban leállították-e vagy lelassították-e a rekurzív mesterséges intelligencia irányába történő elmozdulást.

A valódi lassuláshoz azonban „több, jól felszerelt laboratóriumra lenne szükség a határon vagy annak közelében, több országban, amelyek megegyeznek a leállásról azonos feltételek mellett”.

Dániel Szabó

Dániel Szabó

Szabó Dániel vagyok, újságíró és elemző. A társadalmi változások és a politikai narratívák metszéspontjai érdekelnek, különösen közép-európai kontextusban. A 2022 Plusznál hiszek abban, hogy a jó kérdés néha fontosabb, mint a gyors válasz.