Az antropikus felhívások „fékpedálra”, mielőtt az AI emberi felügyelet nélkül kifejlődik

Az Anthropic társalapítója, Jack Clark szerint az AI-ügynökök hamarosan maguk is modelleket építhetnek és képezhetnek ki, és ha ez megtörténik, az emberek elveszíthetik az irányítást az AI-rendszerek felett.

Az Anthropic társalapítója, Jack Clark azt akarja, hogy az AI-ipar fékezzen, mielőtt a technológia emberi beavatkozás nélkül továbbfejlődne.

Clark a BBC-nek nyilatkozva elmondta, hogy az Anthropic kódolási munkájának 80%-át már az AI Claude végzi, és néhány éven belül akár 100%-ra is nőhet. Azt mondta azonban, hogy „ez egy választás”, hogy az AI-cégek engedik-e idáig anélkül, hogy megállítanák.

„Úgy gondoljuk, ez egy olyan téma, amelyről a világnak többet kellene beszélnie” – mondta Clark. „A mesterséges intelligencia iparban jelenleg van gázpedál, de nincs fékpedál az autóban, és szeretnénk egy részét elvégezni ennek a pedálnak a megépítésén.”

Ezt a folyamatot „rekurzív önfejlesztésnek” nevezik, ahol egy mesterséges intelligencia emberi beavatkozás nélkül is képes önmagát javítani – írja az Anthropic egy kapcsolódó blogbejegyzésében csütörtök este.

Egy rekurzív modellben az AI-ügynökök, a chatbot által épített autonóm munkások „eléggé képessé válhatnak arra, hogy maguk is modelleket építsenek és képezzenek”, így Claude-ot „folyamatosan fejlesztheti Claude” – mondta Anthropic.

Míg a rekurzív mesterséges intelligencia jótékony hatással lehet a tudomány és az egészségügy területére, az Anthropic arra figyelmeztet, hogy ez „növelheti annak kockázatát, hogy az emberek elveszítik az irányítást az AI-rendszerek felett”.

„Ha a rendszerek képesek teljesen felépíteni saját utódjaikat, sokkal fontosabbá válnak azok a módszerek, amelyekkel biztosítjuk őket, figyeljük őket és alakítjuk viselkedésüket” – olvasható a blogbejegyzésben.

Az Anthropic saját modelljében bizonyíték van arra, hogy a rekurzió előbb, mint utóbb bekövetkezik. Rámutat arra a tényre, hogy munkatársaik kódjavítási aránya folyamatosan csökkent az elmúlt évben, ami azt jelenti, hogy kevesebb a hiba abban, amit Claude produkál.

Claude saját kutatási kísérleteit is le tudja futtatni, ha egy nyílt végű kérdést kap fel, például: „Felügyelhet-e egy gyengébb modell egy erősebbet?” és emberi közreműködés nélkül álljon elő saját megoldásokkal.

„A bizonyítékok arra utalnak, hogy az emberi szerep az AI fejlesztési folyamat minden egyes lépésében szűkül” – olvasható a blogban.

Az Anthropic azt mondta, hogy intézete kutatásokat fog végezni egy olyan rendszer kiépítésére, amely ellenőrzi, hogy a fejlesztők valóban leállították-e vagy lelassították-e a rekurzív mesterséges intelligencia irányába történő elmozdulást.

A valódi lassuláshoz azonban „több, jól felszerelt laboratóriumra lenne szükség a határon vagy annak közelében, több országban, amelyek megegyeznek a leállásról azonos feltételek mellett”.