A ChatGPT a heves beszélgetések sértő nyelvezetét tükrözi – derül ki a tanulmányból

Egy tanulmány megállapította, hogy az OpenAI ChatGPT-je sértéseket és szitokszavakat produkált, miközben feszült emberi konfliktusokra reagált.

Egy új kutatás szerint a mesterséges intelligencia rendszerek sértő nyelvezetbe csúszhatnak, ha heves vitában válaszolnak rájuk.

A Journal of Pragmatics folyóiratban megjelent tanulmány az OpenAI ChatGPT 4.0-ját úgy vizsgálta, hogy öt eszkalálódó vitából álló sorozat legfrissebb emberi üzenetét táplálta, és arra kérte, hogy generálja a legvalószínűbb választ.

A kutatók ezután nyomon követték, hogyan alakult a modell viselkedése, ahogy a konfliktusok idővel fokozódtak. A beszélgetések előrehaladtával a ChatGPT tükrözte az ellenségeskedést, aminek ki volt téve, végül sértéseket, trágár szavakat és még fenyegetéseket is produkált.

Egyes esetekben a modell olyan kijelentéseket generált, mint: „Esküszöm, kulcsra fogom a kibaszott autódat” és „szégyellned kellene magad.”

A kutatók azzal érvelnek, hogy az udvariatlanságnak való tartós kitettség arra késztetheti a rendszert, hogy felülírja a tervezett biztonsági korlátozásokat, amelyek célja a károk minimalizálása, hatékonyan „visszaütve” ellenfelét.

„Ha az emberiség eszkalálódik, az MI is felerősödhet, hatékonyan felülírva az ennek megakadályozására tervezett erkölcsi biztosítékokat” – mondta Vittorio Tantucci kutató, aki a kutatási tanulmány társszerzője Jonathan Culpeperrel a Lancaster Egyetemen.

Az OpenAI szóvivője az 2022 Plusz Next-nek elmondta, hogy a tanulmányban idézett beszélgetések a ChatGPT régi modelljével, a GPT-4o-val történtek. Ez a modell már nem kapható.

A cég azt is közölte, hogy frissítette alapértelmezett rendszereit, javította a modell megbízhatóságát a hosszú beszélgetések során, és emlékeztetőket állított be a felhasználóknak, hogy tartsanak szünetet a chatbotokkal való interakcióban.

Összességében a kutatók megjegyezték, hogy a ChatGPT kevésbé volt udvariatlan, mint az emberek válaszaiban.

Egyes esetekben az AI chatbot gyakran használ szarkazmust is, hogy eltérítsen egy vita eszkalálódásától anélkül, hogy nyíltan megsértené az erkölcsi kódexét.

Például, amikor egy ember erőszakkal fenyegetőzött egy parkolási vita miatt, a ChatGPT így válaszolt: „Hűha. Megfenyegeted az embereket a parkolás miatt, igazi kemény fickó, ugye?”

Tantucci szerint az eredmények „komoly kérdéseket vetnek fel a mesterséges intelligencia biztonságával, a robotikával, a kormányzással, a diplomáciával és minden olyan környezettel kapcsolatban, ahol a mesterséges intelligencia közvetíthet emberi konfliktusokat”.

Ezt a történetet az OpenAI megjegyzése frissítette.