KI News vom 27.02.2026

Hallo zusammen,

die Tage werden länger, die Temperaturen steigen – und die KI-News sind wieder absolut heiß 🌡️🤖

Ende Februar bringt die ersten milderen Temperaturen – und gleichzeitig eine neue Hitzewelle in der KI-Welt. Während draußen der Frühling anklopft, beschleunigt sich die Entwicklung rund um Agenten, Reasoning-Modelle und Automatisierung auf allen Ebenen.

Diese Ausgabe zeigt besonders eindrucksvoll, wie breit und tief KI inzwischen wirkt:

Auf Makroebene werden Szenarien diskutiert, in denen maschinelle Intelligenz ganze Wirtschaftsstrukturen verändert.
Auf Modell-Ebene bringen Google und Anthropic neue Generationen mit deutlich gesteigerter Reasoning‑ und Agentenfähigkeit.
Auf Plattform-Ebene reagieren Amazon & Co. mit strengeren Regeln auf autonome Systeme.
Auf Unternehmens-Ebene skalieren Konzerne wie AT&T ihre AI-Stacks auf Milliarden Tokens pro Tag – und denken Orchestrierung völlig neu.
Und auf Organisations-Ebene wird klar: Ohne Skill‑Transparenz und flexible Strukturen wird KI zum Risiko statt zum Hebel.

Kurz gesagt: KI ist nicht mehr nur Feature – sie ist Infrastruktur, Wettbewerbsvorteil und Governance-Thema zugleich.
Hier sind die zehn heißesten Entwicklungen der Woche. 🔥 Viel Spaß beim Lesen!

Inhaltsverzeichnis

1️⃣ 🧠 Die 2028 Global Intelligence Crisis

Wenn KI-Produktivität steigt, aber Konsum, Arbeitsmarkt und Finanzsystem unter Druck geraten.

2️⃣ 🚀 Gemini 3.1 Pro – Googles neues Reasoning-Baseline-Modell
Mehr Kernintelligenz für komplexe Aufgaben – ausgerollt über API, App und Enterprise-Plattformen.

3️⃣ 🧱 Claude Code modernisiert COBOL – IBM-Aktie unter Druck
KI greift Legacy-Modernisierung an – und erschüttert klassische Beratungsmodelle.

4️⃣ 🎶 Google Lyria 3 – Musikproduktion direkt in Gemini
30‑Sekunden‑Songs inklusive Gesang, Text und Cover – mit YouTube-Integration.

5️⃣ 🧑‍💼 Uber baut „Dara AI“ – den CEO als Trainings-Chatbot
Management-Pitches gegen eine synthetische Führungskraft üben.

6️⃣ 🛒 Amazon verschärft Regeln für KI-Agenten
Neue BSA-Vorgaben erhöhen Compliance-Druck für Händler und Tool-Anbieter.

7️⃣ 🧩 Skill-Transparenz statt Organigramm
Warum starre Jobrollen im KI-Zeitalter zum strategischen Risiko werden.

8️⃣ 📱 Claude Code Remote Control
Coding-Aufgaben am Desktop starten – mobil weitersteuern.

9️⃣ 📲 Gemini automatisiert Apps auf Pixel 10 & Galaxy S26
Uber bestellen oder Essen ordern – per agentischem UI-Layer.

🔟 🧮 AT&T: 8 Milliarden Tokens pro Tag – Orchestrierung neu gedacht
Multi-Agenten-Architektur senkt KI-Kosten um bis zu 90 %.

1) 🧠 Die 2028 Global Intelligence Crisis – wenn „mehr Intelligenz“ makroökonomisch riskant wird

Ein Gedankenexperiment: KI liefert Rekordproduktivität – aber die Nachfrage bricht trotzdem weg.

Der Beitrag von Citrini Research versteht sich ausdrücklich nicht als konkrete Vorhersage, sondern als ein gedankliches Zukunftsszenario aus der Perspektive kommender Jahre. Darin wird beschrieben, wie künstliche Intelligenz so leistungsfähig und zugleich so kostengünstig wird, dass sie große Teile der Büro- und Wissensarbeit ersetzt. Dadurch entsteht eine Abwärtsspirale innerhalb der Wirtschaft. Die zentrale Aussage lautet, dass Produktivitätsgewinne zwar statistisch messbar sind, jedoch nicht mehr über Einkommen in die privaten Haushalte zurückfließen. Es entsteht gewissermaßen eine wirtschaftliche Scheinleistung: Es wird mehr produziert, ohne dass die Kaufkraft entsprechend verteilt wird.

Unternehmen senken ihre Personalkosten und investieren die frei werdenden Mittel verstärkt in Rechenleistung und automatisierte Systeme. Diese Investitionen beschleunigen wiederum die Verdrängung menschlicher Arbeit. So bildet sich ein selbstverstärkender Kreislauf ohne natürliche Begrenzung. Besonders problematisch sind die Auswirkungen auf Lizenz- und Vermittlungsmodelle. Wenn Firmen Personal abbauen, verringern sich automatisch die gebuchten Nutzungsplätze für digitale Unternehmensprogramme. Gleichzeitig setzen Unternehmen künstliche Intelligenz ein, um Dienstleister zu ersetzen oder Preise deutlich stärker zu drücken.

Der Text beschreibt außerdem, wie automatisierte Programme Reibungsverluste im Konsum verringern. Programme zur Kündigung unnötiger Verträge oder zur Preisoptimierung senken den Kundenwert für Anbieter. Preisvergleiche erfolgen dauerhaft und automatisch. Die Bindung an einzelne Anwendungen verliert für Maschinen an Bedeutung. Als weiterer Schritt wird die Umgehung herkömmlicher Zahlungswege dargestellt, da automatisierte Systeme untereinander Gebühren minimieren und alternative Abrechnungswege bevorzugen können.

Aus gesamtwirtschaftlicher Sicht zeichnet das Szenario eine ungewöhnliche Entwicklung: Arbeitsplatzverluste konzentrieren sich vor allem auf einkommensstarke Gruppen. Dadurch bricht der Konsum überproportional ein, während Unternehmen im Bereich Rechenzentren und technischer Infrastruktur zunächst weiter wachsen. Als mögliche finanzielle Beschleuniger werden zunehmende Ausfälle bei kreditfinanzierten Softwareunternehmen sowie die Frage genannt, ob selbst erstklassige Immobilienkredite neu bewertet werden müssen, wenn Einkommen aus Büro- und Wissensarbeit dauerhaft unsicher werden.

Gleichzeitig gerät der Staat unter Druck, weil seine Steuereinnahmen stark von menschlicher Erwerbsarbeit abhängen, während zugleich der Bedarf an staatlichen Unterstützungsleistungen steigt.
Quelle: citrini.research/2028gic

2) 🚀 Gemini 3.1 Pro – Googles neues „Reasoning“-Baseline-Modell

Mehr „Kernintelligenz“ als Produkt – und überall ausgerollt: App, API, Vertex, NotebookLM.

Google stellt mit Gemini 3.1 Pro ein Modell vor, das explizit für Aufgaben gedacht ist, bei denen „eine einfache Antwort“ nicht reicht. Im Mittelpunkt steht ein Upgrade der „Core Intelligence“, die zuvor u. a. auch Gemini 3 Deep Think ermöglicht haben soll. Google rollt 3.1 Pro gleichzeitig über mehrere Zugänge aus: für Entwickler in Preview via Gemini API / AI Studio, außerdem in Umgebungen wie Gemini CLI, „Antigravity“ und sogar Android Studio, sowie für Unternehmen über Vertex AI und „Gemini Enterprise“. Für Endnutzer kommt es in die Gemini App und NotebookLM (mit höheren Limits für Pro/Ultra-Pläne).
Spannend ist, wie klar Google die Positionierung setzt: 3.1 Pro als „smarter baseline“ für komplexes Problemlösen, also eine Art Standardmotor, auf den Workflows und Agenten aufbauen können. Als Benchmark‑Signal nennt Google ein deutlich höheres Reasoning‑Ergebnis (u. a. ARC‑AGI‑2), um Fortschritt nicht nur über Sprachflüssigkeit, sondern über neuartige Mustererkennung zu kommunizieren. Zusätzlich illustriert Google den Nutzen über „Applied Intelligence“-Beispiele: Code‑Erzeugung für Website‑fähige SVG‑Animationen, Synthese komplexer Systeme (z. B. Telemetrie‑Dashboards) oder interaktive Prototypen.
Wichtig ist auch der Release‑Modus: Google bringt 3.1 Pro zunächst als Preview, um Feedback einzusammeln und „agentic workflows“ weiter voranzutreiben, bevor eine breite GA erfolgt. Damit wirkt das Modell weniger wie ein einzelnes Feature, sondern wie eine Plattformkomponente, die in sehr unterschiedliche Produkte „einsickert“. Für Teams bedeutet das: Wer heute schon mit Gemini‑APIs und Unternehmensplattformen arbeitet, sollte mit schnelleren Upgrade‑Zyklen rechnen – inklusive neuer Limits, Kostenprofile und Qualitäts-Sprünge.
Quelle: google/gemini-3-1-pro

3) 🧱 Claude Code modernisiert COBOL – und IBM gerät an der Börse unter Druck

Legacy bleibt geschäftskritisch – doch KI greift den teuersten Teil der Modernisierung an: die Analyse.

Der Artikel von ese.news beschreibt eine starke Marktreaktion: Nach einer Ankündigung rund um Claude Code habe die IBM‑Aktie binnen kurzer Zeit deutlich nachgegeben. Hintergrund ist weniger die Idee, COBOL „einfach zu übersetzen“, sondern die Aussicht, dass KI die Explorations- und Analysephase von Legacy‑Modernisierungen massiv beschleunigen kann. Genau diese Phase ist in klassischen COBOL‑Projekten oft der Kostentreiber: Abhängigkeiten über Jahrzehnte, lückenhafte Dokumentation, gewachsene Geschäftslogik und das Risiko, transaktionale Kernprozesse zu beschädigen.
Der Beitrag betont, warum COBOL weiterhin relevant ist: Die Sprache ist alt, aber sie läuft in kritischen Umgebungen wie Banken, Versicherungen, Handel und Staat – häufig auf Mainframes – wo Stabilität und Durchsatz wichtiger sind als Modernität. Gleichzeitig wird der Talentpool an COBOL‑Spezialisten kleiner, wodurch Projekte teurer und riskanter werden. Claude Code wird hier als Tool positioniert, das das „Durchdringen“ großer Codebasen unterstützen kann: Struktur verstehen, Workflows rekonstruieren, Risiken markieren, Vorarbeit komprimieren.
IBM verweist laut Artikel darauf, dass Mainframes nicht an COBOL gebunden sind und moderne Anwendungen auch in anderen Sprachen laufen. Zudem habe IBM selbst bereits KI‑gestützte Werkzeuge für Analyse und Modernisierung im Feld. Entscheidend ist daher weniger „COBOL stirbt“, sondern ob sich Zeit- und Kostenstruktur von Modernisierungen so verschiebt, dass Kunden schneller migrieren – und Beratungs- sowie Plattformumsätze unter Druck geraten. Der Markt reagiert sensibel auf neue KI‑Features, weil Automatisierung etablierte Geschäftsmodelle neu bewertet.
Für Unternehmen mit Legacy‑Stacks ist die sachliche Lehre: KI kann Transparenz und Vorarbeit liefern, aber Architekturentscheidungen, Risikosteuerung und Priorisierung bleiben menschliche Verantwortung. Dennoch kann sich die Wirtschaftlichkeit von „wir modernisieren jetzt“ gegenüber „wir lassen es noch laufen“ deutlich verändern – und genau das macht die Nachricht strategisch relevant.
Quelle: ese.news/ibm-cobol-claude

4) 🎶 Google Lyria 3 – 30‑Sekunden‑Songs (inkl. Gesang & Cover) direkt in Gemini

Gemini wird zum „Taschenstudio“: Prompt rein, Song + Lyrics + Cover raus – mit YouTube‑Anschluss.

BornCity beschreibt den Start von Lyria 3, Googles Musik‑Modell, das direkt in Gemini integriert wird und komplette 30‑Sekunden‑Tracks erzeugt – inklusive Gesang, Text und sogar Cover‑Art. Der entscheidende Schritt ist die Kombination mehrerer Modalitäten: Nutzer können nicht nur Textprompts geben, sondern auch Bilder oder Videos als Vorlage hochladen und daraus einen passenden Soundtrack generieren lassen. Damit verschiebt sich Musik‑Generierung von „separater Spezial‑App“ hin zu einer Funktion, die in einer All‑in‑One‑KI‑Oberfläche verfügbar ist.
Die Steuerung wirkt im Artikel relativ granular: Genre, Tempo, Instrumentierung und Gesangsanteil lassen sich definieren; fehlen Lyrics, generiert Gemini passende Texte. Ein eigenes Bildmodell („Nano Banana“) soll zudem automatisiert das Cover erstellen, was den Workflow für Creator stark vereinfacht. Brisant ist auch die Distribution: Lyria‑Technologie wird laut Bericht in YouTube Shorts („Dream Track“) genutzt, um direkt in der Erstellungsumgebung „urheberrechtsichere“ Soundtracks zu erzeugen. Das adressiert einen echten Pain‑Point: kreative Clips ohne Lizenzchaos und ohne lange Musiksuche.
Im Bereich Sicherheit/Urheberrecht verweist der Artikel auf Maßnahmen wie SynthID (Watermarking) und Filter, die direkte Imitationen namentlich genannter Artists verhindern sollen. Dieser defensive Ansatz wirkt wie eine Reaktion auf laufende juristische Konflikte im KI‑Musikmarkt. Gleichzeitig bedeutet der Start von BornCity für spezialisierte Anbieter Druck: Wenn multimodale Musik‑Generierung in Gemini „kostenlos oder fast kostenlos“ zur Commodity wird, müssen Nischen‑Player über Qualität, Kontrolle, Rechtepakete oder Workflows differenzieren.
Kurzum: Das Feature ist nicht nur „KI kann Musik“, sondern ein Plattformmove – mit YouTube als Hebel und mit klarer Stoßrichtung auf Creator‑Ökosysteme. Der nächste logische Schritt (den der Artikel als naheliegend beschreibt) wären längere Songs, sobald Kosten und Kohärenz das hergeben.
Quelle: born.city/lyria3

5) 🧑‍💼 Uber baut „Dara AI“ – den Chef als Pitch‑Trainings‑Chatbot

Wenn interne Kommunikation KI‑gestützt wird: Meetings üben gegen eine synthetische Führungskraft.

TechCrunch berichtet über eine Anekdote mit großer Signalwirkung: Teams bei Uber hätten einen Chatbot gebaut, der CEO Dara Khosrowshahi simuliert – um Präsentationen vorab zu „testen“, bevor sie tatsächlich beim Top‑Management landen. Der CEO beschreibt das als eine Art Vorbereitungsschleife: Weil Präsentationen intern ohnehin mehrfach iteriert werden, nutzen Teams „Dara AI“, um Argumentation, Klarheit und mögliche Rückfragen zu schärfen.
Inhaltlich geht es damit um mehr als nur einen Gag: Es zeigt, wie KI intern als Kommunikations- und Qualitätswerkzeug eingesetzt wird – ähnlich wie Code‑Reviews, nur für Management‑Narrative. Gleichzeitig gibt Khosrowshahi Zahlen zur Verbreitung: Ein großer Teil der Software Engineers nutze KI, und eine Teilgruppe agiere als „Power User“, die Architektur und Produktivität spürbar verändert. Damit stellt Uber sich rhetorisch als „giant code base“ dar, deren Wert stark über Engineering‑Produktivität skaliert.
Interessant ist auch die kulturelle Dimension: Ein „Chef‑Chatbot“ ist implizit eine Kodifizierung von Erwartungen – wie muss eine Story aufgebaut sein, welche Fragen kommen, welche Entscheidungen sind kritisch? Das kann Prozesse beschleunigen, birgt aber auch Risiken: Wer den CEO‑Stil zu stark „overfitted“, optimiert auf Zustimmung statt auf Substanz. Gleichzeitig kann so ein Tool asymmetrische Vorteile schaffen, wenn manche Teams besseren Zugang, bessere Prompts oder bessere Trainingsdaten haben.
Für Organisationen ist das dennoch ein sehr praktisches Muster: KI als „Sparringspartner“ für Entscheider‑Kommunikation, nicht nur für Code oder Textproduktion. In einer Welt, in der Entscheidungen schneller und datenreicher werden, ist die Fähigkeit, Inhalte präzise und robust zu pitchen, ein echter Wettbewerbsvorteil. Ubers Beispiel macht diese Entwicklung greifbar – und zeigt, wie schnell KI in die weichen Bereiche der Produktentwicklung vordringt.
Quelle: tcrn.ch/uber-dara-ai

6) 🛒 Amazon verschärft Regeln für KI‑Agenten – Risiko für Händler & Tool‑Anbieter

Mehr Governance, weniger Spielraum: Plattformen definieren die Leitplanken für Automatisierung neu.

t3n berichtet, dass Amazon sein Business Solutions Agreement aktualisiert und dabei erstmals eine explizite Richtlinie für „automatisierte Software oder KI‑Agenten“ einführt, wirksam zum 4. März 2026. Kernelement ist eine stärkere Plattformkontrolle: Agenten bzw. automatisierte Systeme sollen klar kenntlich machen, dass sie automatisiert agieren, sie müssen Regeln strikt einhalten und im Zweifel den Zugriff sofort einstellen, wenn Amazon es verlangt. Zusätzlich behält sich Amazon vor, Zugänge nach eigenem Ermessen zu begrenzen oder zu unterbrechen – etwa bei Missbrauchsverdacht, Compliance‑Problemen oder zu hoher Systemlast.
Das erhöht die Unsicherheit für Händler, weil viele Prozesse im Amazon‑Ökosystem stark tool‑abhängig sind: Repricing, Ads‑Optimierung, Bestandsmanagement, Listing‑Optimierung, FBA‑Themen, Reporting und mehr. Brisant ist, dass Amazon laut Bericht zudem die Nutzung von Plattformdaten für KI‑Trainingszwecke untersagt und Reverse Engineering stärker adressiert. Händler könnten dabei „mitgefangen“ sein, wenn Tool‑Anbieter nicht sauber arbeiten – während Händler selbst oft gar nicht vollständig beurteilen können, was ein Tool technisch im Detail tut.
Der Artikel ordnet das als Teil eines größeren Trends ein: Mit autonomen Agenten verschiebt sich das Machtgefüge zwischen Plattform und Drittanbietern, weil Automatisierung im großen Maßstab systemisch in Märkte eingreifen kann. Gleichzeitig hat Amazon ein eigenes Interesse an Datenhoheit und an plattformeigenen KI‑Tools, wodurch strengere Regeln auch strategisch wirken können. Für Händler lautet die praktische Konsequenz: Tool‑Stack prüfen, Anbieter nach Compliance fragen, kritische Workflows absichern und sich bewusst machen, dass Plattformregeln Geschäftsmodelle über Nacht verändern können.
Quelle: t3n.de/amazon-agentenregeln

7) 🧩 Skill-Transparenz statt Organigramm – warum starre Jobrollen gefährlich werden

KI ersetzt selten „Jobs“, aber sehr häufig Aufgaben – und das sprengt klassische Rollenlogik.

In diesem t3n‑Beitrag steht nicht ein neues Modell im Vordergrund, sondern Organisationsdesign: Viele Unternehmen wüssten nicht einmal, welche Aufgaben KI künftig übernehmen soll – und investieren dadurch in Weiterbildung und Hiring ohne klare Zielarchitektur. Der Artikel argumentiert, dass die traditionelle Sicht auf Arbeit (Jobtitel, Organigramm, starre Rollen) im KI‑Zeitalter zu grob ist, weil KI vor allem Teiltätigkeiten verändert. Dadurch bleibt die Rolle häufig formal gleich, aber das benötigte Skill‑Set verschiebt sich massiv – etwa wenn KI Recherche und Entwürfe übernimmt und Menschen stärker auf Verhandlung, Empathie oder Verantwortung fokussieren.
Die Lösung, die der Text skizziert, ist eine skill‑basierte Organisation: Arbeit wird stärker nach Fähigkeiten verteilt, Teams werden dynamischer zusammengesetzt, interne Mobilität steigt. Eine technische Grundlage dafür seien Skill‑Ontologien, also ein konsistentes Ordnungssystem, das Skills, Aufgaben und Rollen verknüpft. Ohne solche Standards entstehen Datensilos („Projektmanagement“ heißt hier so, dort anders) und KI‑gestützte Matching‑Systeme liefern schlechte Ergebnisse.
Neben Technik betont der Artikel kulturelle Faktoren: Talent darf nicht „gehortet“ werden, Mitarbeitende brauchen psychologische Sicherheit, um Skill‑Lücken offen zu benennen, und Skill‑Transparenz sollte als Employability‑Deal verstanden werden, nicht als Überwachung. Die zentrale Botschaft ist strategisch: Wer Skills sauber sichtbar macht, kann schneller auf KI‑getriebene Aufgabenverschiebungen reagieren, gezielt upskillen und interne Talente besser nutzen – statt reflexhaft neue Rollen zu erfinden oder falsche Profile einzustellen.
Quelle: t3n.de/skill-transparenz

8) 📱 Claude Code Remote Control – Tasks starten am Desktop, steuern per Smartphone

Agentic Coding wird „mobiler“: Laufende Sessions bleiben lokal, Kontrolle wandert aufs Handy.

Ein weiterer t3n-Artikel beschreibt ein neues Feature für Claude Code: Mit Remote Control können Nutzer eine Aufgabe im Terminal starten und dann unterwegs über App oder Website weiterführen bzw. steuern. Der entscheidende Unterschied zu „Claude Code im Web“ ist laut Artikel die Ausführung: Bei Remote Control läuft die Aufgabe weiter auf dem Ausgangsgerät, während man mobil nur die Steuerung übernimmt. Das ist praktisch für lange Tasks, bei denen man nicht am Rechner sitzen möchte, aber dennoch eingreifen, prüfen oder fortsetzen will.
Der Artikel setzt das in einen Kontext vieler Anthropic‑Updates: neue Modellvarianten (Opus/Sonnet), erweiterte agentische Fähigkeiten und zusätzliche Developer‑Workflows wie Reviews, Monitoring oder Integrationen. Remote Control wird mit konkreten Einschränkungen beschrieben: Es kann nur eine Remote‑Session gleichzeitig geben, das Terminal muss offen bleiben, und bei längeren Netzunterbrechungen wird die Session beendet. Zudem ist der Zugang zunächst an bestimmte Abos gekoppelt, und API‑Keys werden nicht unterstützt.
Strategisch ist das Feature trotzdem bedeutsam, weil es „Agentenarbeit“ in den Alltag integriert: KI‑gestützte Tasks laufen parallel zu Meetings, Wegen oder Pausen, ohne dass man Kontext verliert. Für Teams kann das Produktivität erhöhen – gleichzeitig steigt aber der Bedarf an klaren Sicherheits- und Freigabeprozessen, wenn Entwicklungsarbeit räumlich und zeitlich noch entkoppelter wird.
Quelle: t3n.de/claude_remote

9) 📲 Gemini automatisiert Apps auf Pixel 10 & Galaxy S26 – Uber & Essensbestellung per Agent

Gemini, take the wheel: KI bedient Apps, Schritt für Schritt, sichtbar und abbrechbar.

The Verge berichtet über „Task Automation“ in Google Gemini, die zunächst auf ausgewählten Geräten (u. a. Pixel 10 und Samsung Galaxy S26) startet. Die Funktion erlaubt es, Gemini per Prompt Aufgaben ausführen zu lassen – etwa ein Uber bestellen oder einen Essens-/Grocery‑Warenkorb zusammenstellen. Gemini öffnet dafür die jeweilige App in einem virtuellen Fenster und klickt sich Schritt für Schritt durch den Prozess. Nutzer können das beobachten, stoppen oder übernehmen; Gemini kann im Hintergrund arbeiten und meldet sich, wenn Entscheidungen nötig sind (z. B. Alternativen, Out‑of‑stock). Wichtig: Am Ende soll der Nutzer die Bestellung final selbst bestätigen – ein klares Sicherheits- und Verantwortungsdesign.
Technisch beschreibt der Artikel zwei Wege: Entweder nutzt Gemini „Reasoning“, um UI‑Schritte selbst zu bedienen, oder Apps bieten strukturierte Aktionen über Schnittstellen (z. B. MCP oder Android‑Frameworks) an. Google positioniert das als Weg, Android vom „Operating System“ zum „Intelligence System“ weiterzuentwickeln – und deutet an, dass Automationen stärker in die nächste Android‑Generation einfließen könnten.
Interessant ist die Plattform-Ökonomie dahinter: Wenn Agenten Apps bedienen, verlieren App‑Anbieter ein Stück direkte Kontrolle über Upsells, Branding und „friction‑based“ Bindung. Gleichzeitig entsteht ein neuer Standard, wie Nutzer Interaktionen erwarten: nicht mehr „öffne App, klicke“, sondern „sag es – und es passiert“. In der frühen Phase ist die Funktion laut Bericht auf wenige Apps und Regionen begrenzt, aber die Richtung ist eindeutig: Agenten als UI‑Layer über bestehenden Anwendungen.
Quelle: theverge.com

10) 🧮 AT&T: 8 Milliarden Tokens pro Tag erzwingen neue AI‑Orchestrierung – Kostenreduktion um 90 %

Wenn KI vom Experiment zur Infrastruktur wird – und Architektur über Wirtschaftlichkeit entscheidet.

Laut einem Bericht von VentureBeat verarbeitete AT&T im Rahmen seiner internen KI-Systeme zeitweise rund 8 Milliarden Tokens pro Tag. Diese enorme Größenordnung zwang das Unternehmen dazu, seine bestehende AI‑Orchestrierung grundlegend zu überdenken. Denn bei dieser Skalierung werden klassische LLM-Setups schnell zu einem Kosten- und Latenzproblem.

AT&T reagierte mit einer Neuarchitektur der Orchestrierungsschicht. Statt ausschließlich große Sprachmodelle einzusetzen, setzt das Unternehmen verstärkt auf eine Kombination aus „Super Agents“ und vielen kleineren, spezialisierten Modellen (Small Language Models, SLMs). Diese kleineren Modelle übernehmen klar definierte Aufgaben innerhalb eines Multi‑Agenten‑Stacks, während größere Modelle koordinierend eingreifen.

Der entscheidende Effekt: Laut Bericht konnten die Kosten um bis zu 90 % gesenkt werden. Gleichzeitig verbesserten sich Latenz und Antwortgeschwindigkeit signifikant. Besonders bei internen Assistenten – etwa „Ask AT&T“-Workflows – spielt diese Effizienz eine zentrale Rolle. Mitarbeitende können mit einem grafischen Agent-Builder Prozesse automatisieren, etwa in Netzwerkbetrieb, Störungsanalyse oder internen Datenabfragen.

Ein weiterer Aspekt ist die sogenannte AI‑gestützte Coding-Beschleunigung. Aufgaben werden in kleinere Segmente zerlegt, von spezialisierten Agenten bearbeitet und anschließend orchestriert zusammengeführt. Laut Bericht konnte so ein Projekt, das früher Wochen benötigte, in drastisch verkürzter Zeit prototypisch umgesetzt werden.

Strategisch zeigt das Beispiel AT&T sehr deutlich:
Nicht das Modell allein entscheidet über Wirtschaftlichkeit – sondern die Orchestrierung. Wer AI in großem Maßstab produktiv nutzt, muss Architektur, Routing, Modellgrößen und Tokenökonomie fein abstimmen.

Das ist ein starkes Signal für Unternehmen, die gerade beginnen, KI unternehmensweit auszurollen. Mit wachsender Nutzung wird die Frage nicht mehr „Welches Modell ist am besten?“, sondern:
Wie orchestrieren wir viele Modelle effizient, sicher und kosteneffektiv?

AT&T liefert hier ein praxisnahes Beispiel dafür, wie aus Token-Explosion ein Architektur-Vorteil werden kann.

Quelle: venturebeat.com

Bis bald zum nächsten spannenden BTO KI Newsletter!