Hallo zusammen, es ist wieder Donnerstag und damit Zeit für spannende KI News auf unserem BTO Kanal.
Der Herbstwind wirbelt diese Woche nicht nur das Laub durch die Straßen, sondern bringt auch ordentlich Bewegung in die Tech-Welt. Während die Tage kürzer werden, zünden die KI-Entwickler ein wahres Feuerwerk an Innovationen, das uns ordentlich einheizt. Von winzigen Modellen mit Riesenkräften bis zu KIs, die das Ruder am PC übernehmen – mach es dir gemütlich, hier kommen die heißesten News der Woche! 😉
Inhaltsverzeichnis
🤖 Googles KI übernimmt deinen Browser - Stell dir vor, deine KI erledigt Online-Aufgaben komplett allein.
💻 Anthropic's Claude wird zum PC-Assistenten - Diese KI schaut dir nicht nur über die Schulter, sie greift auch zur Maus.
🌐 Ein neuer Browser, der mitdenkt: Dia ist da! - Surfen war gestern – jetzt beginnt der Dialog mit dem Web.
☄️ Perplexity schickt mit "Comet" einen KI-Browser ins Rennen - Warum nach Antworten suchen, wenn der Browser sie dir direkt geben kann?
🐜 David gegen Goliath: Samsungs winzige KI verblüfft die Fachwelt - Ein Zwerg unter Riesen zeigt, dass Größe in der KI nicht alles ist.
🎨 Fotorealismus aus Deutschland: Das neue Bild-Modell Flux 1.1 Pro - Die Konkurrenz für Midjourney spricht jetzt auch Deutsch.
🎬 OpenAIs geheimnisvoller Filmstar: Was kann Sora 2 wirklich? - Alle reden über die neue Video-KI, doch die wichtigsten Fragen sind noch offen.
🇩🇪 KI im Mittelstand: Mehr als nur ein Buzzword? - Eine neue Studie zeigt, wie deutsche Unternehmen die KI-Revolution wirklich nutzen.
...
1. Googles KI übernimmt deinen Browser
Stell dir vor, du bittest deine KI, eine Reise zu buchen, und sie erledigt alles Weitere selbstständig im Browser – vom Flug bis zum Hotel. Genau das wird jetzt Realität.
Google hat ein neues Gemini-Modell vorgestellt, das die Art und Weise, wie wir mit dem Internet interagieren, grundlegend verändern könnte. Diese KI kann den Browser nicht nur durchsuchen, sondern ihn aktiv steuern. Sie ist in der Lage, komplexe, mehrstufige Aufgaben autonom auszuführen, die bisher menschliche Klicks, Eingaben und Entscheidungen erforderten. Das System kann beispielsweise Formulare ausfüllen, durch verschiedene Seiten navigieren, Informationen vergleichen und Aktionen basierend auf den Anweisungen des Nutzers durchführen. Für Unternehmen bedeutet das ein enormes Potenzial zur Automatisierung von Routineaufgaben wie Dateneingabe, Recherche oder der Verwaltung von Online-Konten. Die Technologie steht noch am Anfang, aber sie zeichnet ein klares Bild von der Zukunft: Der KI-Assistent wird vom reinen Informationslieferanten zum aktiven digitalen Mitarbeiter, der uns lästige Online-Arbeiten abnimmt und unsere Effizienz steigert.
Quellen: https://t3n.de/news/neues-gemini-modell-steuert-browser-eigenstaendig-welche-aufgaben-euch-die-ki-k… / https://blog.google/technology/ai/google-ai-updates-september-2025/
2. Anthropic's Claude wird zum PC-Assistenten
Was wäre, wenn deine KI nicht nur im Browser, sondern auf deinem gesamten Computer agieren könnte? Anthropic macht genau das mit seinem neuesten Update für Claude möglich.
Während Googles Gemini den Browser meistert, geht Anthropic mit seiner KI Claude noch einen Schritt weiter. Eine neue Funktion namens "Computer Use" erlaubt es dem Sprachmodell, den Computer eines Nutzers aktiv zu bedienen. Claude kann Screenshots analysieren, die Maus bewegen, auf Schaltflächen klicken und sogar Text in Anwendungen eingeben. Die KI wird damit zu einem echten digitalen Assistenten, der komplexe Workflows über verschiedene Programme hinweg automatisieren kann. Denkbar sind Szenarien wie das Übertragen von Daten aus einer E-Mail in eine Excel-Tabelle, das Bearbeiten von Bildern in einem Grafikprogramm nach Anweisung oder das Durchführen von Software-Tests. Für IT-Spezialisten und Power-User eröffnen sich dadurch völlig neue Möglichkeiten zur Effizienzsteigerung und zur Automatisierung von repetitiven Aufgaben, die weit über das hinausgehen, was bisher möglich war.
Quellen: https://www.theverge.com/2024/10/8/24263914/anthropic-claude-ai-computer-use-feature / https://www.anthropic.com/news/3-5-models-and-computer-use
3. Ein neuer Browser, der mitdenkt: Dia ist da!
Wir sind es gewohnt, Browser als passive Werkzeuge zu sehen, die uns Webseiten anzeigen. The Browser Company will das mit "Dia" ändern und macht das Surfen zu einem interaktiven Erlebnis.
Nachdem sie mit ihrem ersten Browser "Arc" bereits für Aufsehen gesorgt haben, legen die Entwickler nun mit "Dia" nach, der ab sofort für alle macOS-Nutzer verfügbar ist. Dia ist von Grund auf als KI-Browser konzipiert. Anstatt nur eine Suchleiste anzubieten, tritt der Nutzer in einen Dialog mit dem Browser. Man kann Fragen stellen oder Aufgaben formulieren, und Dia durchsucht nicht nur das Web, sondern versucht, die Intention zu verstehen und die Ergebnisse intelligent aufzubereiten oder Aktionen vorzuschlagen. Dieser Ansatz zielt darauf ab, die Informationsflut zu bändigen und den Nutzer schneller zum Ziel zu führen. Für Unternehmen und IT-Profis ist dies ein spannender Blick in die Zukunft der Mensch-Computer-Interaktion, bei der Software uns nicht nur Werkzeuge an die Hand gibt, sondern zu einem proaktiven Partner wird.
Quellen: https://www.theverge.com/2024/10/8/24264585/the-browser-company-dia-ai-browser-macos-open-availabil… / https://skywork.ai/blog/dia-browser-brilliant-useful-and-probably-doomed/
4. Perplexity schickt mit "Comet" einen KI-Browser ins Rennen
Die KI-gestützte Suchmaschine Perplexity, bekannt für ihre direkten und präzisen Antworten, hat nun ihren eigenen, kostenlosen Browser namens "Comet" veröffentlicht.
Perplexity hat sich einen Namen damit gemacht, die klassische Google-Suche durch eine "Antwortmaschine" zu ersetzen. Statt einer Liste von Links liefert die KI eine zusammengefasste Antwort mit Quellenangaben. Diese Philosophie wird nun konsequent in den eigenen Browser "Comet" integriert. Das Ziel ist klar: Der Nutzer soll so schnell wie möglich verlässliche Informationen erhalten, ohne sich durch unzählige Webseiten klicken zu müssen. Comet bündelt die Stärken der Perplexity-Suche direkt im Browser-Erlebnis und richtet sich an alle, die Recherche-Aufgaben effizienter gestalten wollen. Für den Mittelstand könnte dies ein wertvolles Werkzeug sein, um Marktanalysen, Informationsbeschaffung und tägliche Recherchen zu beschleunigen und die Produktivität der Mitarbeiter zu erhöhen. Der Wettbewerb im Browser-Markt wird durch diese KI-gesteuerten Ansätze definitiv neu entfacht.
Quellen: https://www.theverge.com/2024/10/3/24259461/perplexity-ai-comet-browser-search-download / https://www.searchenginejournal.com/perplexity-launches-comet-browser-for-free-worldwide/557432/
5. David gegen Goliath: Samsungs winzige KI verblüfft die Fachwelt
In einer Welt, in der KI-Modelle immer größer und rechenintensiver werden, zeigt ein Forscher von Samsung, dass es auch anders geht – mit einem Modell, das 10.000-mal kleiner ist als die Konkurrenz, aber bei bestimmten Aufgaben besser abschneidet.
Das "Tiny Recursion Model" von Samsung stellt die gängige Annahme "größer ist besser" auf den Kopf. Mit nur 7 Millionen Parametern hat dieses winzige Modell bei spezifischen logischen Problemen und rekursiven Aufgaben deutlich größere Modelle wie OpenAIs o3 Mini geschlagen. Der Schlüssel liegt in der Architektur, die auf Rekursion setzt – die Fähigkeit, ein Problem in kleinere, sich wiederholende Teile zu zerlegen und diese effizient zu lösen. Diese Entwicklung ist revolutionär, denn sie öffnet die Tür für leistungsstarke KI-Anwendungen auf Geräten mit begrenzten Ressourcen, wie Smartphones oder Sensoren. Für mittelständische Unternehmen, die KI-Lösungen implementieren wollen, ohne in teure Server-Farmen zu investieren, könnte dieser Ansatz in Zukunft kostengünstige und energieeffiziente Alternativen ermöglichen.
Quellen: https://venturebeat.com/ai/a-samsung-researcher-introduces-the-tiny-recursion-model-a-7m-parameter-… / https://www.forbes.com/sites/ronschmelzer/2025/10/09/samsung-ai-research-team-builds-a-tiny-model-w…
6. Fotorealismus aus Deutschland: Das neue Bild-Modell Flux 1.1 Pro
Während die Welt über Midjourney und DALL-E staunt, etabliert sich eine leistungsstarke Alternative aus Deutschland. Das neue Text-zu-Bild-Modell Flux 1.1 Pro von Black Forest Labs setzt neue Maßstäbe in Sachen Realismus.
Die Fähigkeit von KI, aus einfachen Textbeschreibungen atemberaubende Bilder zu erzeugen, entwickelt sich rasant weiter. Flux 1.1 Pro ist die neueste Version eines Modells, das speziell darauf trainiert wurde, extrem detaillierte und fotorealistische Bilder zu generieren. Im Gegensatz zu vielen anderen Modellen, die oft einen eher künstlerischen oder illustrativen Stil haben, liegt der Fokus hier klar auf der Erzeugung von Bildern, die von echten Fotos kaum zu unterscheiden sind. Für Unternehmen aus den Bereichen Marketing, Design und E-Commerce ergeben sich dadurch enorme Möglichkeiten: Produktvisualisierungen, Werbekampagnen oder Social-Media-Inhalte können schnell und kostengünstig erstellt werden, ohne auf teure Fotoshootings angewiesen zu sein. Es zeigt eindrucksvoll, dass Spitzenforschung im KI-Bereich auch in Deutschland stattfindet.
Quellen: https://en.wikipedia.org/wiki/Flux_(text-to-image_model / https://flux-ai.io/de/blog/detail/Flux-1-1-Pro%3A-A-New-Chapter-in-AI-Image-Generation-2e2197d8c330/
7. OpenAIs geheimnisvoller Filmstar: Was kann Sora 2 wirklich?
Die Ankündigung von OpenAIs Video-KI Sora hat vor einiger Zeit für Furore gesorgt. Nun steht mit Sora 2 die nächste Generation in den Startlöchern, doch OpenAI hält sich bedeckt und lässt Raum für Spekulationen.
Die Erwartungen an Sora 2 sind gigantisch. Die Community hofft auf längere und noch konsistentere Videos, bessere physikalische Interaktionen und eine höhere Auflösung. Doch während erste Demos beeindrucken, wirft OpenAI mehr Fragen auf, als es beantwortet. Wie genau funktioniert das Modell? Welche Daten wurden für das Training verwendet? Und vor allem: Welche Sicherheitsvorkehrungen gibt es, um den Missbrauch zur Erstellung von Fake News und Desinformation zu verhindern? Diese unbeantworteten Fragen sind für die gesamte Branche von zentraler Bedeutung. Für Unternehmen, die auf den Einsatz von KI-Videogenerierung für Marketing oder Schulungsmaterialien hoffen, ist es entscheidend zu verstehen, wie verlässlich und sicher diese Werkzeuge sind. Die Debatte um Sora 2 zeigt, dass es bei der KI-Entwicklung nicht mehr nur um technische Machbarkeit, sondern auch um Transparenz und Verantwortung geht.
Quellen: https://t3n.de/news/sora-2-zentrale-fragen-openai-video-app-1711285/ / https://www.pcmag.com/news/openais-answer-to-tiktok-is-sora-2-a-fever-dream-of-deepfakes
8. KI im Mittelstand: Mehr als nur ein Buzzword?
Künstliche Intelligenz ist in aller Munde, aber wie kommt die Technologie tatsächlich im Herzen der deutschen Wirtschaft, dem Mittelstand, an? Eine aktuelle Studie von IONOS liefert aufschlussreiche Antworten.
Die Studie von IONOS zeigt ein positives Bild: Die Mehrheit der kleinen und mittleren Unternehmen (KMU) in Deutschland steht der KI offen gegenüber und viele haben bereits erste Anwendungen implementiert. Die Hauptvorteile sehen die Unternehmen vor allem in der Effizienzsteigerung und der Verbesserung des Kundenservice. Eine Studie des Fraunhofer-Instituts bestätigt diese Einschätzung, weist aber auch auf die größten Hürden hin: Mangelndes Fachwissen, Unsicherheiten bezüglich des Datenschutzes und die Kosten für die Implementierung bremsen eine schnellere Adaption. Für Unternehmer wird deutlich, dass eine erfolgreiche KI-Integration nicht nur eine Frage der richtigen Software ist, sondern vor allem eine strategische Entscheidung, die Investitionen in Weiterbildung und eine klare Zielsetzung erfordert. Die Ergebnisse sind ein wichtiger Weckruf: KI ist im Mittelstand angekommen, aber der Weg ist noch lang.
Quellen: https://www.ionos.de/newsroom/news/ki-erobert-den-mittelstand/ / https://www.iao.fraunhofer.de/de/presse-und-medien/aktuelles/studie-ermittelt-status-quo-kuenstlich…
Bis bald zum nächsten spannenden BTO KI Newsletter!