Red Hat zapowiedział nową wersję swojej flagowej platformy do obsługi środowisk sztucznej inteligencji - Red Hat AI 3.4. Rozszerzenie funkcjonalności ma pomóc w zmniejszeniu dystansu między eksperymentami z AI a wdrożeniami produkcyjnymi wymagającymi pełnej kontroli operacyjnej. Nowa odsłona platformy zapewnia spójne środowisko obejmujące cały stos technologiczny - od warstwy sprzętowej po agentów AI - upraszczając tworzenie i wdrażanie procesów obliczeniowych opartych na autonomicznych systemach.
Unowocześnienia ułatwią przedsiębiorstwom proces przejścia od fazy pilotażowej do realizacji skalowalnych wdrożeń AI w całej infrastrukturze IT.
Dzięki wspólnym mechanizmom dla zespołów wdrażających rozwiązania AI oraz ich administratorów, Red Hat zapewnia nowoczesnym przedsiębiorstwom możliwość skalowania autonomicznych systemów przy zachowaniu kontroli, bezpieczeństwa i efektywnego wykorzystania zasobów sprzętowych.
Red Hat AI 3.4 to rozbudowana platforma zapewniająca fundament architektoniczny oraz narzędzia operacyjne potrzebne do skalowania modeli AI i procesów obliczeniowych w agentach AI w środowiskach chmury hybrydowej. Jedną z kluczowych nowości jest wprowadzenie modelu usługowego Model-as-a-Service (MaaS), zapewniającego programistom zunifikowany dostęp do zatwierdzonych modeli AI, a administratorom pozwala kontrolować wykorzystanie zasobów oraz egzekwować reguły polityki bezpieczeństwa i zgodności. Rozwiązanie to bazuje na wydajnym, rozproszonym środowisku inferencyjnym wykorzystującym mechanizmy vLLM i llm-d, co gwarantuje wydajne i zoptymalizowane działanie modeli w różnych środowiskach infrastruktury.
Wraz ze wzrostem znaczenia agentów AI dynamicznie rośnie także zapotrzebowanie na moc obliczeniową niezbędną do prowadzenia inferencji. Red Hat AI ma umożliwiać przedsiębiorstwom wdrażanie oraz zarządzanie agentami na dużą skalę, niezależnie od wykorzystywanego frameworka. Nowe narzędzia AgentOps obejmują cały cykl życia agentów - od etapu tworzenia po środowisko produkcyjne - oferując m.in. śledzenie działań, monitoring, zarządzanie tożsamością kryptograficzną oraz kontrolę nad cyklem życia agentów.
Platforma rozszerza także integrację firmowych danych z modelami i agentami AI. W Red Hat AI 3.4 pojawiło się zarządzanie promptami traktowanymi jako pełnoprawne zasoby danych oraz centralny moduł oceny modeli i agentów pod kątem jakości, trafności odpowiedzi i bezpieczeństwa. Funkcje te wykorzystują platformę MLflow, która zapewnia śledzenie eksperymentów i zarządzanie artefaktami zarówno dla generatywnej AI, jak i klasycznych modeli predykcyjnych. Specjalny nacisk kładziony jest również na bezpieczeństwo w szerokim zakresie - od fazy pilotażowej po produkcyjną. Platforma wykorzystuje technologie firmy Chatterbox Labs oraz projektu Garak do automatycznego testowania bezpieczeństwa i symulowania ataków na modele oraz agenty AI.
Przejście od eksperymentalnych chatbotów do autonomicznych systemów gotowych do wdrożeń produkcyjnych wymaga istotnej zmiany sposobu współpracy zespołów IT. Coraz więcej przedsiębiorstw dostrzega potrzebę przejścia od roli wyłącznie „konsumentów tokenów” do roli ich „dostawców”, co pozwala lepiej kontrolować koszty oraz rozwijać prywatne i suwerenne rozwiązania AI. Jednocześnie napięcia między zespołami tworzącymi aplikacje a administratorami infrastruktury nadal pozostają jedną z głównych barier wdrożeń. Brak wspólnego podejścia sprawia, że ograniczenia infrastrukturalne spowalniają innowacje, a rozwój zjawiska shadow AI zwiększa ryzyko i utrudnia przewidywanie kosztów.
Red Hat AI 3.4 pomaga rozwiązać ten problem, zapewniając korporacyjną platformę do skalowalnej inferencji modeli i wdrażania autonomicznych agentów, oferując przejrzystość oraz kontrolę niezbędną do spełnienia rygorystycznych wymagań dotyczących bezpieczeństwa i nadzoru. Ponieważ agenty AI działają z dużą autonomią, brak wglądu w procesy podejmowania decyzji stwarza istotne ryzyko bezpieczeństwa. Red Hat AI odpowiada na to wyzwanie, udostępniając mechanizmy pozwalające śledzić działania agentów, kolejne etapy ich rozumowania oraz wywołania narzędzi, co umożliwia przeprowadzenie audytu sposobu dojścia do konkretnego wyniku. Dzięki integracji kryptograficznego zarządzania tożsamością platforma przypisuje działania do zweryfikowanej tożsamości, pomagając ustalić, który podmiot wykonał dane zadanie. W rezultacie firmy mogą przejść od rozproszonych projektów pilotażowych do traktowania AI jako skalowalnej, przewidywalnej i - co najważniejsze - rozliczalnej usługi korporacyjnej.
• Skalowalna, wysokowydajna inferencja połączona z nadzorowanym dostępem do modeli: Wydajna inferencja modeli wciąż jest podstawą produkcyjnych wdrożeń sztucznej inteligencji. Dzięki połączeniu w modelu MaaS serwera inferencyjnego vLLM oraz rozproszonego silnika inferencji llm-d, Red Hat AI 3.4 zapewnia niezawodne i wydajne środowisko uruchamiania modeli, upraszczając nadzorowany dostęp do nich zarówno dla użytkowników, jak i agentów AI.
• Łączenie danych z modelami i agentami: Dane w przedsiębiorstwach są paliwem zasilającym modele i agenty AI. W Red Hat AI 3.4 wprowadzone zostały funkcje zarządzania promptami, traktujące je jako pełnoprawne zasoby danych, a także zaimplementowany został centralny moduł ocen służący do analizy jakości, trafności, bezpieczeństwa i ryzyka działania modeli oraz agentów. Funkcje te obsługiwane są przez platformę MLflow, która zapewnia również zintegrowane śledzenie eksperymentów i zarządzanie artefaktami zarówno dla generatywnej AI, jak i klasycznych zastosowań AI/ML bazujących na modelach predykcyjnych.
• Prostsze zarządzanie agentami AI na każdym etapie działania autonomicznych aplikacji: Red Hat AI 3.4 wprowadza rozbudowane funkcje AgentOps, które ułatwiają wdrażanie agentów AI na dużą skalę i zarządzanie nimi. Obejmują one zintegrowane śledzenie działań, monitorowanie i ocenianie, a także zarządzanie tożsamością agentów i ich cyklem życia - od etapu tworzenia po środowisko produkcyjne.
• Zintegrowane bezpieczeństwo modeli i agentów: Aby zapewnić ochronę całego środowiska sztucznej inteligencji w przedsiębiorstwie, Red Hat AI wykorzystuje wielowarstwowe podejście do bezpieczeństwa - od systemu operacyjnego po logikę agentów AI. Dzięki automatycznym testom bezpieczeństwa i symulowanym atakom typu red teaming możliwe jest teraz podejmowanie decyzji dotyczących wyboru i konfiguracji modeli oraz mechanizmów ochronnych na podstawie danych i wyników testów. Takie podejście pozwala lepiej zabezpieczyć środowiska AI przed ewoluującymi zagrożeniami.
• Zaawansowana inferencja i optymalizacja modeli: Moduł Red Hat AI Inference rozszerza funkcjonalność rozproszonej inferencji o priorytetyzowanie zapytań, umożliwiając obsługę ruchu interaktywnego oraz zadań działających w tle w ramach tego samego urządzenia końcowego, przy jednoczesnym nadawaniu priorytetu operacjom wymagającym niskich opóźnień podczas dużego obciążenia. Red Hat AI Inference działa także poza środowiskiem Red Hat OpenShift i obsługuje dodatkowe usługi Kubernetes, w tym CoreWeave i Microsoft Azure, zapewniając spójny zestaw funkcji inferencyjnych w różnych środowiskach. Mechanizm spekulacyjnego dekodowania (speculative decoding), obecnie dostępny produkcyjnie, przyspiesza generowanie odpowiedzi 2-3-krotnie przy minimalnym wpływie na jakość wyników, jednocześnie obniżając koszt pojedynczej interakcji.
• Nadzorowana usługa Model-as-a-Service (MaaS): Funkcja ta umożliwia inżynierom odpowiedzialnym za obsługę platform udostępnianie wyselekcjonowanych i zweryfikowanych modeli poprzez zabezpieczone interfejsy API zgodne ze standardem OpenAI. Pozwala to na jednolite zarządzanie zarówno modelami wewnętrznymi, jak i zewnętrznymi interfejsami API, a także zintegrowanie z mechanizmami uwierzytelniania bazującymi na systemach dostawców tożsamości (IDP).
• Automatyczna ocena modeli i agentów: Red Hat AI 3.4 wprowadza niezależną od frameworków, zunifikowaną warstwę zarządzania oceną systemów AI, przeznaczoną do analizy dużych modeli językowych (LLM), aplikacji AI i agentów. Rozwiązanie to zastępuje rozproszone metody testowania jednolitym podejściem do oceny jakości, trafności odpowiedzi i ryzyka.
• Zintegrowane zarządzanie promptami: Platforma zapewnia zunifikowane narzędzia do tworzenia i zarządzania promptami traktowanymi jako pełnoprawne zasoby danych. Przechowywanie danych wejściowych wykorzystywanych przez modele i agentów w centralnym rejestrze tworzy jedno wspólne źródło informacji zarówno dla programistów, jak i administratorów.
• Wielowarstwowe bezpieczeństwo: Automatyczne skanowanie odporności na ataki zostało bezpośrednio zintegrowane z cyklem tworzenia aplikacji. Platforma Red Hat AI wykorzystuje rozwiązania firmy Chatterbox Labs oraz narzędzie Garak do wykrywania zagrożeń w modelach i systemach agentowych, takich jak jailbreaki, próby wstrzykiwania promptów (prompt injection) czy uprzedzenia modeli. Mechanizmy te współpracują z zestawem reguł i filtrów NVIDIA NeMo Guardrails w celu zapewnienia ochrony użytkowników podczas działania systemów AI.
• Gotowość do zastosowań produkcyjnych: Integracja z MLflow zapewnia pełny wgląd w działanie agentów AI, umożliwiając śledzenie całego przebiegu pracy - od wywołań modeli językowych i etapów wnioskowania, po użycie narzędzi, odpowiedzi modeli oraz zużycie tokenów za pośrednictwem OpenTelemetry. Dzięki temu powstaje przejrzysta ścieżka audytu obejmująca cały cykl życia promptów, embeddingów i konfiguracji RAG, co ułatwia diagnozowanie problemów i prowadzenie audytów. MLflow oferuje również zintegrowane śledzenie eksperymentów oraz zarządzanie artefaktami dla rozwiązań bazujących na generatywnej AI i modelach predykcyjnych.
• Nadzór bazujący na tożsamości: Dzięki wykorzystaniu kryptograficznego zarządzania tożsamością (SPIFFE/SPIRE), Red Hat AI pozwala zastąpić krótkoterminowymi tokenami statyczne, zapisane na stałe klucze. Rozwiązanie to umożliwia wprowadzenie modelu minimalnych uprawnień dla autonomicznych agentów w całym środowisku i pomaga potwierdzić, że działania agentów są powiązane ze zweryfikowaną tożsamością.
• Automatyzacja procesów AI: Narzędzia takie jak AutoRAG i AutoML automatyzują złożone zadania związane z AI - od wyboru najskuteczniejszych strategii wyszukiwania danych dla konkretnych zbiorów po budowę i optymalizację tradycyjnych modeli predykcyjnych.
• Elastyczność sprzętowa i zarządzane chmury: Red Hat AI 3.4 już od dnia premiery obsługuje procesory graficzne NVIDIA Blackwell oraz architekturę AMD MI325X. Rozszerzając zunifikowaną architekturę platformy Red Hat AI o natywną obsługę zewnętrznych chmur zarządzanych (w tym obsługę modułu Red Hat AI Inference w chmurze IBM Cloud), zapewniona została spójność operacyjna w szerokim zakresie środowisk sprzętowych oraz dostawców usług chmurowych.
Red Hat AI 3.4 ma zostać udostępniony jeszcze w maju 2026 r.
Źródło: Red Hat