Společnost OpenAI před pár hodinami představila novou rodinu AI modelů GPT-4.1. Jsou specializované na kódování, následování instrukcí a podporují delší kontextové okno než GPT-4o nebo GPT-4.5. S touto výbavou mají lépe pomáhat vývojářům či jiným technickým profesím. Zároveň ale poslouží jako mozek agentů, tedy AI ovládajících počítač či různé programy.
Dva měsíce nazpátek Sam Altman řekl, že si OpenAI uvědomuje, jaký je teď chaos ve výběru různých modelů. A slíbil přitom, že se to do budoucna zlepší. Tehdy také oznámil GPT-4.5, což měl být poslední nepřemýšlivý model (bez reasoningu). A nastínil GPT-5, což má být konečně sjednocení všech různých směrů. První model, který bude multimodální pro práci s textem, obrazem i zvukem, ale zároveň bude přemýšlet.
A do toho nečekaně přicházejí GPT-4.1, GPT-4.1 mini a GPT-4.1 nano. Nejsou přemýšlivé, ale jsou trochu multimodální, protože vedle textu umí na vstupu zpracovat i obraz. O zvuku firma nemluví. Multimodálnost či označení „omni“ v popisu nikde nezmiňuje. Na druhou stranu však rodina GPT-4.1 nezamíří do ChatGPT, ale bude dostupná jen skrz API pro aplikace a služby třetích stran.
Tři taháky
Všechny tři modely mají kontextové okno dlouhé 1 milion tokenů, oproti dřívějším 128 tisícům. OpenAI tak dohání konkurenty, kteří ji tuto laťku také překonali (zejména Gemini od Googlu). Milion tokenů si můžete představit jako hodinové video nebo přes 700 tisíc slov textu, tj. přibližně 2500 českých normostran. V rozsáhlých projektech by tak rodina GPT-4.1 neměla tolik chybovat, protože nezačne tak rychle zapomínat. Znalosti GPT-4.1 končí v červnu 2024.
Pokud jde o kódování, v testu SWE-bench má velký GPT-4.1 skóre 54,6 %, o 21,4 procentního bodu více než GPT-4o a 26,6 bodu více než GPT-4.5. V následování instrukcí podle Scale’s MultiChallenge dosáhl GPT-4.1 výsledku 38,3 %, o 10,5 bodu více než GPT-4o. Další výsledky a příklady najdete na webu OpenAI.
GPT-4.1 má být přibližně stejně rychlý jako GPT-4o, avšak o 26 % levnější. GPT-4.1 mini má v některých ohledech být schopnější než GPT-4o, ale bude o 40 % rychlejší a 83 % levnější. GPT-4.1 nano je pak schopnější, rychlejší a levnější alternativa pro dosavadní GPT-4o mini.

Aby v tom byl ještě trochu větší zmatek, tak OpenAI k 14. červnu odstraní GPT-4.5 z API, ale zůstane zachovaný v ChatGPT. A chatbot bude průběžně ještě dále vylepšovat a optimalizovat GPT-4o na základě zkušeností GPT-4.1. O zlepšování GPT-4.5 firma nemluví, ale to je příliš nákladný model specializovaný na lidské povídání, u něj se s využitím pro programování nebo obecně vědu a techniku nepočítá.
Zdroje a další informace:
OpenAI