OpenAI wykonało kolejny krok w stronę pełnej autonomii sztucznej inteligencji, prezentując model GPT-5.4, który jest nie tylko generatorem tekstu, ale potężnym narzędziem zdolnym do samodzielnej obsługi interfejsów komputerowych i analizy ogromnych zbiorów danych.
GPT-5.4 to największy jak dotąd krok OpenAI w kierunku realnej produktywności w miejscu pracy. Model ten nie tylko sprawniej zarządza wielozadaniowością w wielu aplikacjach jednocześnie, ale wykazuje się też większym zmysłem estetycznym przy tworzeniu prezentacji i skuteczniejszym wykorzystaniem narzędzi graficznych.
Potwierdzeniem skuteczności są dane testu GDPval, symulującym zaawansowaną pracę umysłową, w którym model uzyskał rekordowe 83%. GPT-5.4 ustanowił również nowe standardy w testach obsługi komputera OSWorld-Verified oraz WebArena. Co więcej, zajął pierwsze miejsce w badaniu APEX-Agents firmy Mercor, weryfikującym umiejętności zawodowe w sektorach prawa i finansów.
Najważniejsze nowości w GPT-5.4:
Sterowanie komputerem: Największą innowacją jest natywna zdolność obsługi komputera. Model analizuje obraz ekranu, porusza kursorem, wpisuje tekst i przełącza się między aplikacjami. To fundament dla nowej generacji autonomicznych agentów AI.
Gigantyczny kontekst: Okno kontekstowe rozszerzono do 1 miliona tokenów. Pozwala to na przetwarzanie całych baz danych, długich serii dokumentów czy rozbudowanych repozytoriów kodu w jednym zapytaniu.
Warianty Thinking i Pro: OpenAI stawia na specjalizację. Wersja Thinking dedykowaną do transparentnego rozwiązywania złożonych problemów logicznych, natomiast edycja Pro celuje w najbardziej wymagające zadania korporacyjne i analityczne.
Większa precyzja: Producent chwali się, że GPT-5.4 jest znacznie dokładniejszy - liczba błędów i halucynacji spadła o około 33% względem poprzedników.
Co to oznacza w praktyce?
GPT-5.4 ma stać się cyfrowym współpracownikiem, który samodzielnie przygotuje raport, zdebuguje kod w środowisku programistycznym czy zautomatyzuje wieloetapowe procesy biurowe bez nadzoru człowieka.
Model jest wdrażany stopniowo i trafia już do użytkowników ChatGPT oraz deweloperów korzystających z API. Dostęp do zaawansowanych funkcji zależy od posiadanego planu subskrypcyjnego.