Fejlesztő csapat dolgozik a "Strawberry" MI modellen egy modern irodában

Felpörgeti a logikai gondolkodást az OpenAI új MI modellje!

6 perc olvasás
35 Olvasó

“Strawberry” – Hamarosan érkezik!

Az OpenAI a következő két hétben tervezi kiadni új mesterséges intelligencia modelljét, amelynek kódneve “Strawberry”. A modell célja a logikai érvelési képességek javítása, és a ChatGPT-vel való integrációja is szerepel a tervek között. Az új modell bevezetése várhatóan jelentős előrelépést hoz a természetes nyelvi feldolgozás terén, különösen az összetett problémamegoldás és a következtetésalkotás területén. A cég szerint a “Strawberry” nemcsak a felhasználói élményt fogja javítani, hanem számos iparágban is hasznosítható lesz, például az ügyfélszolgálatban, az oktatásban és az üzleti elemzésekben. A modell rugalmassága és fejlett képességei lehetővé teszik majd, hogy a különböző alkalmazásokhoz könnyen adaptálható legyen, így széles körben elterjedhet és hozzájárulhat a mesterséges intelligencia innovációjának további fejlődéséhez.

OpenAI
A Strawberry MI modell célja, hogy támogassa a szoftver- és MI-fejlesztőket logikai képességeivel.

Strawberry: A gondolkodás ideje

A Strawberry modell legfontosabb jellemzője egy 10-20 másodperces “gondolkodási idő” a válaszok előtt. Ez a szünet lehetővé teszi a modell számára, hogy összetett problémákat oldjon meg, például tervezés, matematika és programozás terén, még akkor is, ha még nem találkozott az adott feladattal.

A modell egy különleges “utóképzés” (post-training) módszert alkalmaz, amely az előre betanított modelleket specifikus feladatokra hangolja. Ezzel az eljárással feleslegessé válhatnak a jelenlegi felhasználók által használt további parancsok vagy trükkök, hogy többet hozzanak ki a ChatGPT-ből.

Post-training

A “post-training” egy továbbképzési módszer, amely használja a már előre betanított modelleket, és finomhangolja őket specifikus feladatokra való alkalmazásra. Ez a technika különösen hasznos akkor, amikor a rendelkezésre álló adat mennyisége korlátozott, vagy amikor az alapmodell már jelentős általános tudással rendelkezik egy adott területen. Így a finomhangolás csak egy kisebb mennyiségű, célzott adatkészlettel történik, ami jelentősen csökkenti a további tréninghez szükséges időt és erőforrásokat. A “post-training” módszer lehetővé teszi, hogy a modellek gyorsan és hatékonyan adaptálódjanak új környezetekhez vagy specifikus feladatokhoz, miközben megőrzik az eredeti modell által tanult alapvető mintázatokat és struktúrákat.

Milyen jól teljesít Strawberry?

Belső tesztelések során a Strawberry több mint 90%-os pontosságot ért el a matematikával kapcsolatos feladatokban. A modell példákat is szolgáltat az OpenAI következő GPT-4 utódjának, amelynek kódneve “Orion”. Az Orion fejlesztése során a cél az volt, hogy a mesterséges intelligencia még hatékonyabban kezelje a komplex problémákat, és sokkal szélesebb körű alkalmazási lehetőségeket kínáljon. Az új modell nemcsak a matematikai feladatokban, hanem a nyelvfeldolgozásban, a kreatív írásban és az adatfeldolgozásban is kimagasló teljesítményt nyújt, ezzel jelentősen növelve az AI alkalmazhatóságát különböző iparágakban. Az OpenAI mérnökei és kutatói folyamatosan finomítják az algoritmusokat és bővítik a tanulási adatbázist, hogy az Orion még megbízhatóbb és pontosabb legyen a felhasználók számára.

Belső tesztelések során a Strawberry több mint 90%-os pontosságot ért el a matematikával kapcsolatos feladatokban. A modell példákat is szolgáltat az OpenAI következő GPT-4 utódjának, amelynek kódneve “Orion”.

Az OpenAI megközelítése hasonlít a Stanford kutatásaihoz

A Reuters forrása szerint az OpenAI megközelítése hasonlít egy Stanford kutatók által bemutatott módszerhez, amelyet „Self-Taught Reasoner” (STaR) néven ismernek. A STaR célja, hogy megtanítsa az MI rendszereket a logikus érvelés fejlesztésére.

A márciusban bemutatott Quiet-STaR, a STaR továbbfejlesztése, nyelvi modelleket tanít arra, hogy minden szövegpontban lehetséges folytatási indokokat generáljanak. Próba-hiba módszerrel az MI megtanulja, hogy mely megfontolások eredményeznek jobb kimeneteleket. Minél tovább képes az MI érvelni, annál jobb eredmények születnek.

Egy kiegészítés a ChatGPT-hez?

Bár a Strawberry a ChatGPT részét képezi majd, különálló ajánlatként kerül piacra néhány eltéréssel. Az első verzió csak szöveget fog feldolgozni, ellentétben más jelenlegi OpenAI modellekkel, amelyek többféle inputot, például képeket vagy fájlokat is kezelni tudnak.

Azonban a korai tesztelők néhány problémát is megjegyeztek. A modell néha túl sok időt vesz igénybe egyszerű kérdések feldolgozására is, és még nem alkalmazkodott teljes mértékben bizonyos felhasználói preferenciákhoz, mint például a kódformátumokhoz. Néhány kezdeti tesztelő szerint a Strawberry kissé javított válaszai nem igazolták a plusz 10-20 másodperces várakozási időt.

Céljuk a Strawberry segítségével támogatni a szoftver- és MI-fejlesztőket, lehetővé tenni önálló internetes kereséseket prediktív tervezéssel, és megkönnyíteni a mélyreható kutatást, többek között.

Előfizetési modell és árak

Pekulációk szerint a Strawberry árazása eltérhet a ChatGPT-től, és tartalmazhat sebességkorlátokat. Lehetséges, hogy egy magasabb árú előfizetés gyorsabb válaszokat biztosítana. Az OpenAI állítólag magasabb árakat fontolgat a fejlettebb mesterséges intelligencia modelljeihez általában. Ezen kívül, az árképzési struktúrában további különbségek is lehetnek, mint például a felhasználási kvóták és a támogatási szintek. Az OpenAI célja, hogy különböző opciókat kínáljon a felhasználóknak, akik különböző igényekkel és költségvetéssel rendelkeznek, így biztosítva, hogy a technológia hozzáférhető maradjon mind az egyéni felhasználók, mind a vállalati kliensek számára. Az új árazási modellek bevezetése várhatóan elősegíti az erőforrások optimalizálását és a szolgáltatások minőségének javítását.

decoder