A hangulatkódolástól a gyorsabb modellekig: a Google Gemini frissítésének újdonságai

Dániel Szabó

A hangulatkódolástól a gyorsabb modellekig: a Google Gemini frissítésének újdonságai

A Vibe kódolás, a gyorsabb AI-modellek és a valós idejű fordítás a Google új frissítései a Geminiben.

Az ünnepi szezon előtt a Google új frissítéseket adott ki a Geminihez, a mesterséges intelligenciával (AI) működő asszisztenshez, hangsúlyozva a technológiai óriás azon törekvését, hogy lépést tartson a gyorsan változó AI-versenyben.

Az új funkciók a hangulatkódolási eszközöktől, amelyek lehetővé teszik a felhasználók számára, hogy alkalmazásokat készítsenek anélkül, hogy kódot kellene írniuk, a gyorsabb modellekig és a több párbeszédes keresési és fordítási lehetőségig terjednek.

Az 2022 Plusz Next áttekinti a legfontosabb frissítéseket.

Vibe kódolás

Mostantól lehetőség nyílik mesterséges intelligencia-alapú alkalmazás létrehozására közvetlenül a Geminire.

A Google a héten bejelentette, hogy közvetlenül a webböngészőjébe integrálja az Opalt, a Gems néven ismert mini AI-alkalmazások készítésére szolgáló eszközt.

A júliusban bemutatott eszköz egy többlépcsős alkalmazás tervezetét fejleszti ki, amely a promptok, az AI-modellhívások és más eszközök kódsor nélküli összekapcsolásával működik – közölte a vállalat.

Ha a felhasználók módosítani akarják az alkalmazásuk elkészítéséhez használt promptot, új funkciót vagy eszközt szeretnének hozzáadni, a Google szerint mindez lehetséges, ha csak leírják a változtatást, amelyet végrehajtani szeretnének.

Mostantól a felhasználók egy vizuális szerkesztővel rendelkeznek a Geminibe, amely feljegyzi az alkalmazások lépéseit és módosításait. Lehetővé teszi a felhasználóknak, hogy megtekintsék alkalmazásaik előnézetét, mielőtt megosztanák azokat másokkal, akik rendelkeznek Google-fiókkal.

​A vizuális szerkesztő lehetővé teszi a felhasználók számára, hogy képeket vagy videohivatkozásokat töltsenek fel, amelyeket az Opal referenciaként használhat egy alkalmazás elkészítésekor.

Az Opal a hangulatkódoló eszköz egyik példája, egy olyan feltörekvő terület, ahol a mesterséges intelligencia egyszerű nyelvű promptokból tud alkalmazásokat generálni kód használata helyett.

Néhány mesterséges intelligencia-cég, mint például az OpenAI és az Anthropic, az év elején kiadta saját verzióját, míg a svéd hangulatjel-kódoló startup, a Lovable Európa egyik legnagyobb korai szakaszában 200 millió dolláros (170 millió eurós) finanszírozást gyűjtött össze működésének első évében.

Egy gyorsabb, olcsóbb Gemini

Az okosságot és gyorsaságot mutató Gemini modell a Google szlogenje a Gemini 3 Flash-hez.

A vállalat szerint az új Flash-modell PhD szintű érvelési készségekkel rendelkezik, és olyan intelligenciával párosul, amely lépést tart a „gondolatok sebességével”.

Két üzemmódja van: egy „gyors” mód a kérdések gyors megválaszolásához és egy „gondolkodó” mód, amely összetett problémákat old meg.

A Gemini 3 Flash a régebbi modelleknél is sokkal jobb abban, hogy megértse a videókat és képeket, és néhány másodperc alatt „hasznos és megvalósítható tervvé” alakítsa ezt a tartalmat.

A vállalat azt mondta, hogy a régebbi modelleknél jobban megérti a felhasználói kérdések árnyalatait, és „átfogó, vizuálisan emészthető válaszokat tud adni” az internetről származó valós idejű információk felhasználásával.

A Gemini 3 Flash megjelenése néhány héttel azután érkezik, hogy a Google kiadta a Gemini 3 Pro-t, a vállalat „legerősebb” modelljét a hangulatkódoláshoz és az autonóm AI-ügynökökhöz, valamint a Gemini 3 Deep Think-et, egy olyan módot, amely összetett matematikai, tudományos és logikai problémákat old meg.

A Google szerint a Gemini 3 Flash teljesítménye „a nagyobb határmodellekkel vetekszik” az iparág benchmark tesztjein, mint például a GPQA Diamond, amely egy sor összetett kérdés a biológiában, fizikában és kémiában, és felülmúlja a Gemini 2.5 Flash-t, egy korábbi, júniusban kiadott Flash modellt.

Javítások a fordításban, keresésben

A Google a keresési és fordítási funkcióival a közvetlen csevegést is megkönnyítette az Egyesült Államokban élő felhasználók számára.

A Live With Search funkció továbbfejlesztései azt jelentik, hogy a felhasználók oda-vissza hangos beszélgetést folytathatnak, hogy valós idejű segítséget kapjanak a keresőmotortól.

Az AI-alapú hang, amely válaszol a kérdésre, „folyékonyabb és kifejezőbb lesz, mint valaha” – áll a vállalat közleményében.

A múlt héten a Google bejelentette, hogy a Gemini beépült a vállalat kereső- és fordítóalkalmazásaiba, hogy a felhasználók „sokkal intelligensebb, természetesebb és pontosabb szövegfordításokat” biztosítsanak a keresés során.

A cég az élő fordítás béta verzióját is kiadta, amely „valós idejű, természetes hangzású” fordításokat hoz a címszavakon keresztül.

A Fordító egyik fejlesztése, hogy megérti az olyan idiómákat vagy kifejezéseket, mint például a „lopd el a mennydörgésemet”, és ennek természetesebb fordítását adja ahelyett, hogy szóról szóra tenné.

Jelenleg az egyesült államokbeli és indiai felhasználók számára működik, amikor az angolt több mint 20 nyelvre fordítják le, köztük spanyolra, hindire, japánra és németre.

Dániel Szabó

Dániel Szabó

Szabó Dániel vagyok, újságíró és elemző. A társadalmi változások és a politikai narratívák metszéspontjai érdekelnek, különösen közép-európai kontextusban. A 2022 Plusznál hiszek abban, hogy a jó kérdés néha fontosabb, mint a gyors válasz.