OpenAI hat kürzlich bedeutende Updates für sein Codex-Modell und die Agent-APIs veröffentlicht, die den Nutzerzugang erweitern und die Entwicklungsmöglichkeiten vertiefen sollen. Eine wichtige Neuerung besteht darin, dass Codex nun auch ChatGPT Plus-Abonnenten zur Verfügung steht, wodurch die Nutzung über Enterprise-, Team- und Pro-Nutzergruppen hinaus ausgeweitet wird. Dies ist ein wichtiger Schritt, um den Zugang zu fortschrittlicher Programmierhilfe breiter zugänglich zu machen.
Darüber hinaus können Nutzer mit Plus-, Pro- und Team-Plänen nun Internetverbindungen während der Task-Ausführung aktivieren. Diese Funktion ermöglicht die unkomplizierte Installation von Abhängigkeiten und das Ausführen von Skripten, die einen externen Staging-Server benötigen – ohne manuelle Einrichtung der Umgebung. Dabei ist der Internetzugang standardmäßig deaktiviert und durch Domainbeschränkungen, HTTP-Methoden-Limits sowie Monitoring gegen Prompt-Injection abgesichert. Nutzer behalten volle Kontrolle darüber, wann und wie die Verbindung genutzt wird, was einen guten Ausgleich zwischen erhöhter Funktionalität und Sicherheitsvorkehrungen schafft.
Im Bereich der Agenten hat OpenAI das SDK für TypeScript auf den gleichen Funktionsumfang wie die Python-Version gebracht, inklusive Übergaben, Guardrails, Tracing und Human-in-the-Loop-Freigaben. Diese neuen Features erlauben es Entwicklern, Agentenaktionen zu pausieren und vor der Ausführung manuell zu bestätigen, was Aufsicht und Zuverlässigkeit verbessert.
Ergänzend stellt OpenAI das neue RealtimeAgent-Feature vor, mit dem Voice Agents sowohl clientseitig als auch auf eigenen Servern via Realtime API betrieben werden können. Diese Agenten folgen ähnlich wie Textagenten einem Workflow und unterstützen Tool-Calls, Übergaben, Guardrails sowie die automatische Verarbeitung von Audioeingaben und Unterbrechungen. Zur Unterstützung der Entwicklung zeigt das aktualisierte Traces-Dashboard jetzt auch Realtime API-Sitzungen an, darunter Audio, Tool-Interaktionen und Unterbrechungen, unabhängig von der Entstehung.
Schließlich wurde das Speech-to-Speech-Modell stark verbessert, um Anweisungen besser zu folgen, bei Tool-Calls konstanter zu bleiben und Unterbrechungen natürlicher zu verarbeiten. Diese aktualisierte Version ist über die Realtime API und die Chat Completions API unter dem Label gpt-4o-realtime-preview-2025-06-03 verfügbar.
Insgesamt spiegeln diese Neuerungen OpenAIs zielgerichteten Einsatz wider, Entwicklungswerkzeuge und Nutzerfunktionen zu optimieren und dabei robuste Sicherheits- und Überwachungsmechanismen einzubauen. Sie bieten vielversprechende Mittel, um interaktivere, zuverlässigere und kontextbewusstere KI-Agenten für Text und Sprache zu entwickeln.