02. Mai 2025

KI News vom 02.05.2025

.

Brandheiße News aus der Welt der Künstlichen Intelligenz.

Hallo zusammen, es ist wieder Zeit für aktuelle und spannende News aus der Welt der Künstlichen Intelligenz!

...

📚 Inhaltsverzeichnis

  1. 🗣️ Perplexity bringt Voice Assistant auf iOS
          Sprachsteuerung für iPhone-Nutzer: Perplexity macht seinen KI-Assistenten mobil

  2. 🤝 Microsoft 365 Copilot erhält umfassendes Redesign
          Neue Funktionen für bessere Zusammenarbeit zwischen Mensch und KI

  3. 👁️ Grok-Chatbot erhält visuelle Fähigkeiten
          Elon Musks KI kann jetzt sehen und verstehen

  4. 🕶️ Meta Ray-Ban-Brille mit Live-Übersetzung
          Reisebegleiter mit KI: Echtzeit-Übersetzungen direkt ins Ohr

  5. 📺 YouTube integriert KI-Übersichten in Suchergebnisse
          Schneller zum Ziel: KI fasst Video-Inhalte zusammen

  6. 🛡️ Anthropic forscht an Minimierung von KI-Schäden
          Sicherheit durch Design: Wie KI-Systeme weniger Schaden anrichten sollen

  7. 🎬 Descript startet agentenbasierten Video-Editor "Cursor for Video"
          KI trifft Schnittkunst: Neue Plattform revolutioniert Videobearbeitung

  8. 🧠 Demis Hassabis über KI-Bewusstsein 
    DeepMind-CEO spricht über die Zukunft des maschinellen Denkens

  9. 🧬 KI übertrifft Virologen bei Analysen
          Maschinen schlagen Experten: KI zeigt Überlegenheit in Laboranalysen

.

1. 🗣️ Perplexity bringt Voice Assistant auf iOS

 Sprachsteuerung für iPhone-Nutzer: Perplexity macht seinen KI-Assistenten mobil

 Perplexity hat seinen KI-Voice Assistant nun offiziell für iOS veröffentlicht und ermöglicht damit eine nahtlose sprachbasierte Interaktion auf iPhones. Nutzer können über die App mit natürlicher Sprache Fragen stellen oder Aufgaben erledigen, die von der KI direkt verarbeitet und beantwortet werden. Dabei wird Spracheingabe nicht nur für Informationsabfragen verwendet, sondern auch für die Navigation innerhalb der App oder das Auslösen spezifischer Funktionen. Besonders hervorzuheben ist die Funktion "Perplexity Pages", die automatisch visuell strukturierte Antworten generiert. Durch die Integration von Apple-typischen Funktionen wie Drag & Drop, App Clips und Widgets ist der Assistent eng mit dem iOS-Ökosystem verknüpft. Zwar hat Apple gewisse Systemrestriktionen (z. B. Zugriff auf Timer oder Systemlautstärke), aber Perplexity kompensiert dies durch clevere In-App-Funktionalität. Außerdem reagiert der Assistent sehr schnell auf Sprachbefehle und zeigt dabei eine erstaunliche Kontexttreue. Die Interaktion kann sowohl per Stimme als auch über Texteingabe erfolgen, wobei die App dynamisch zwischen beiden Modi wechselt. Im Gegensatz zu klassischen Sprachassistenten wie Siri oder Alexa zielt Perplexity klar auf informationsorientierte Nutzung und liefert prägnante, gut recherchierte Antworten. Die iOS-Version ist kostenfrei verfügbar, einige Funktionen erfordern jedoch ein Perplexity Pro-Abonnement.

 Quelle: Perplexity Voice Assistant für iOS

.

2. 🤝 Microsoft 365 Copilot erhält umfassendes Redesign

          Neue Funktionen für bessere Zusammenarbeit zwischen Mensch und KI

 Microsoft hat das Design und die Funktionsweise von 365 Copilot grundlegend überarbeitet und dabei den Fokus auf eine tiefere Mensch-KI-Kollaboration gelegt. Im Zentrum steht eine völlig neue Benutzeroberfläche, die Aufgabenstreamlining und Arbeitskontext stärker in den Vordergrund rückt. Nutzer können nun Inhalte in einem "Canvas"-ähnlichen Arbeitsbereich erzeugen, strukturieren und kommentieren, während der Copilot proaktiv Vorschläge macht. Besonders innovativ ist das Feature „Work“, das kontextbezogene Einblicke aus Tools wie Outlook, Word, Slack oder Google Drive bündelt. Auch der neue KI-Suchagent bietet gezielte Vorschläge auf Basis vergangener Interaktionen und Projektinformationen. Über eine Funktion namens „Notebook“ können Projekte umfassend geplant, dokumentiert und gemeinsam mit dem Copilot analysiert werden. Eine weitere Neuerung ist die Integration des "Copilot Lab", in dem Unternehmen agentenbasierte Tools für interne Workflows konfigurieren können. Ebenfalls interessant: Microsoft öffnet einen „Copilot Extensions Store“, über den externe Entwickler eigene Agenten anbieten können. Das Design ist deutlich visueller, modularer und ermöglicht flüssigere Übergänge zwischen Denkprozessen, Planung und Ausführung. Insgesamt zeigt sich Microsofts Copilot als Plattform für produktive Interaktion zwischen Mensch und KI, weit über einfache Textverarbeitung hinaus.

 Quelle: Microsoft Copilot Redesign – Maginative

.

3. 👁️ Grok-Chatbot erhält visuelle Fähigkeiten

          Elon Musks KI kann jetzt sehen und verstehen

 xAI, das KI-Startup von Elon Musk, hat seinem Chatbot Grok neue visuelle Fähigkeiten verliehen. Die aktualisierte Version „Grok-1.5V“ kann nun Bilder, Dokumente, Diagramme, Grafiken und komplexe Screenshots interpretieren. Diese multimodale Erweiterung bedeutet, dass Grok nicht mehr nur auf Textantworten beschränkt ist, sondern visuelle Inhalte aktiv einbezieht, analysiert und kommentiert. In einem gezeigten Beispiel konnte Grok ein Diagramm korrekt erklären, statistische Anomalien erkennen und Hypothesen ableiten. Die neuen Fähigkeiten wurden vorerst nur in einer geschlossenen Testgruppe auf der Plattform X (ehemals Twitter) ausgerollt. Laut xAI ist die Erkennung auf High-Level-Kognition ausgelegt – d. h. der Chatbot versteht Inhalte nicht nur, sondern stellt sie auch in relationale und funktionale Kontexte. Grok-1.5V wird bereits von Early-Adoptern als potenzielle Konkurrenz zu GPT-4 Vision oder Gemini bewertet. Technologisch basiert die Neuerung auf einem „Vision Transformer“-System, das von xAI intern weiterentwickelt wurde. Die Anwendungsmöglichkeiten reichen von der Bildanalyse bis zur Interpretation komplexer visueller Benutzeroberflächen, was Grok besonders interessant für Forschung, Journalismus oder IT-Diagnostik macht. xAI kündigte an, die Funktion in naher Zukunft für alle Nutzer der Premium-Plus-Version von X zu öffnen.

 Quelle: TechCrunch zu Grok Vision

.

4. 🕶️ Meta Ray-Ban-Brille mit Live-Übersetzung

          Reisebegleiter mit KI: Echtzeit-Übersetzungen direkt ins Ohr

 Meta hat ein bahnbrechendes Update für seine Ray-Ban Smart Glasses veröffentlicht: die Integration von KI-basierten Live-Übersetzungen. Nutzer der Brille können Gespräche in Echtzeit übersetzen lassen, wobei die übersetzten Sätze direkt über die eingebauten Lautsprecher ins Ohr übertragen werden. Unterstützt werden aktuell vier Sprachen: Englisch, Spanisch, Französisch und Italienisch – weitere sollen folgen. Die Funktion basiert auf Meta AI und nutzt sowohl cloudbasierte Verarbeitung als auch lokal gespeicherte Sprachmodelle, die Offline-Nutzung ermöglichen. Besonders für Reisende bietet diese Funktion einen erheblichen Mehrwert, da sie spontane Kommunikation erleichtert. Die Brille erkennt visuell über die Kamera den Gesprächspartner und gleicht das Gesprochene mit der gewünschten Zielsprache ab. Meta hebt hervor, dass die Funktion nicht auf Textübersetzung beschränkt ist, sondern auch kulturelle Kontexte berücksichtigt. Erste Tests zeigen eine bemerkenswert hohe Übersetzungsgenauigkeit, auch bei umgangssprachlichen Ausdrücken. Allerdings gibt es noch Herausforderungen bei sehr schnellen oder undeutlichen Sprechweisen. Die Ray-Ban Meta-Brillen zeigen eindrucksvoll, wie Wearables mit KI-Funktionalität den Alltag bereichern können.

 Quelle: The Verge über Meta Live-Translation

.

5. 📺 YouTube integriert KI-Übersichten in Suchergebnisse

          Schneller zum Ziel: KI fasst Video-Inhalte zusammen

 YouTube hat damit begonnen, eine neue KI-Funktion in den Suchergebnissen zu testen: sogenannte „AI Overviews“. Diese Zusammenfassungen sollen Nutzern dabei helfen, schneller zu erfassen, ob ein Video die gesuchte Information enthält, ohne es komplett anschauen zu müssen. Die Funktion nutzt Googles Gemini-Technologie und analysiert Videoinhalte hinsichtlich Relevanz, Aussagekraft und Struktur. Die Übersichten bestehen aus mehreren Stichpunkten oder kurzen Sätzen, die die zentralen Aussagen eines Videos zusammenfassen. Laut Google wird diese Funktion derzeit nur in englischer Sprache in den USA getestet und steht zunächst einer kleinen Nutzergruppe zur Verfügung. Neben der besseren Übersicht sollen Nutzer so auch effizienter zwischen mehreren Videos vergleichen können. Besonders hilfreich sind die Overviews bei längeren Tutorials oder informativen Videos mit komplexem Inhalt. Kritisch wird von einigen Beobachtern angemerkt, dass solche KI-Zusammenfassungen womöglich die Notwendigkeit für Klicks auf die Originalvideos verringern. YouTube versichert jedoch, dass diese Funktion die Verweildauer steigern und zu gezielterem Konsum führen soll. Eine breitere Einführung sei geplant, sobald erste Nutzerrückmeldungen ausgewertet wurden.

Quelle: MacRumors zu YouTube AI Overviews

 .

6. 🛡️ Anthropic forscht an Minimierung von KI-Schäden

          Sicherheit durch Design: Wie KI-Systeme weniger Schaden anrichten sollen

 Anthropic, das KI-Unternehmen hinter dem Sprachmodell Claude, verfolgt einen innovativen Ansatz, um mögliche Schäden durch KI-Modelle systematisch zu erkennen und zu reduzieren. In einem umfassenden Beitrag erklärt das Unternehmen, wie es strukturell versucht, Sicherheitsmechanismen nicht nur nachträglich zu integrieren, sondern direkt in das Training der Modelle einfließen zu lassen. Ein zentraler Bestandteil ist das sogenannte „Constitutional AI“-Modell: Hierbei werden KI-Systeme mit einer Art Verfassung trainiert, die aus ethischen Prinzipien, Menschenrechtsdokumenten und wissenschaftlichen Leitlinien besteht. Ziel ist es, dass die KI von Anfang an lernt, hilfreiches und harmloses Verhalten zu zeigen. Zusätzlich investiert Anthropic massiv in Interpretierbarkeit: Es wird daran gearbeitet, einzelne Entscheidungsprozesse von KI-Modellen besser nachvollziehen zu können. In Labortests wurden spezielle Verfahren entwickelt, die auf neuronale Aktivitätsmuster in den Modellen zugreifen, um deren „Denkweise“ zu analysieren. Auch die Möglichkeit von Missbrauch – etwa zur Entwicklung gefährlicher Biotechnologien – wird in Zusammenarbeit mit Sicherheitsforschern systematisch bewertet. Interessant ist zudem, dass Anthropic Transparenz in den Mittelpunkt stellt: Alle Modelle und Forschungspapiere werden öffentlich dokumentiert, um Nachvollziehbarkeit und externe Kontrolle zu ermöglichen. Das Unternehmen plädiert außerdem für globale Regulierungsansätze, um Sicherheitsstandards branchenweit zu etablieren. Der Beitrag verdeutlicht, dass verantwortungsvoller Umgang mit KI weit über technische Fragen hinausgeht und gesellschaftliche, ethische und politische Dimensionen umfasst.

 

Quelle: Anthropic – Our Approach to Understanding and Addressing AI Harms

.

7. 🎬 Descript startet agentenbasierten Video-Editor "Cursor for Video"

          KI trifft Schnittkunst: Neue Plattform revolutioniert Videobearbeitung

 Das Softwareunternehmen Descript, bekannt für seine Transkriptions- und Audioeditierlösungen, hat mit „Cursor for Video“ ein neues KI-basiertes Videobearbeitungstool vorgestellt. Inspiriert vom Coding-Agenten „Cursor“ bringt Descript nun eine gleichnamige Plattform speziell für visuelle Medien auf den Markt. Das Tool verwendet KI-Agenten, um automatisch Schnittvorschläge zu generieren, unnötige Pausen zu erkennen, Transkripte mit dem Videomaterial abzugleichen und sogar Inhaltsideen zu liefern. Nutzer können sich somit auf kreative Entscheidungen konzentrieren, während die KI repetitive oder technische Aufgaben übernimmt. Besonders hervorzuheben ist das sogenannte „Script Editing“: Hier kann das Video durch einfaches Bearbeiten des Texttranskripts geschnitten werden – eine Funktion, die bereits in der Audioverarbeitung für Begeisterung gesorgt hat. Descript setzt dabei auf eine intuitive Benutzeroberfläche, die professionelle Videoproduktion auch für Laien zugänglich macht. Erste Anwender berichten von drastisch verkürzten Bearbeitungszeiten und einer sehr hohen Qualität der KI-Vorschläge. Das Tool erkennt auch visuelle Muster im Video – z. B. Kameraschwenks oder Schnitte – und passt Übergänge automatisch an. Die Software richtet sich insbesondere an Content Creator, Bildungseinrichtungen und Marketingabteilungen. Mit Cursor for Video bringt Descript frischen Wind in den stark umkämpften Markt der Video-Editing-Tools – durch smarte Automatisierung bei maximaler kreativer Kontrolle.

 

Quelle: Descript launches Cursor-like platform for video editing

.

8. 🧠 Demis Hassabis über KI-Bewusstsein

          DeepMind-CEO spricht über die Zukunft des maschinellen Denkens

 In einem exklusiven Interview mit TIME spricht Demis Hassabis, Mitgründer und CEO von DeepMind, über den aktuellen Stand und die Zukunftsperspektiven von künstlicher Intelligenz. Besonders brisant ist dabei seine Einschätzung zur Frage des KI-Bewusstseins: Hassabis betont, dass heutige KI-Systeme keine echte Form von Bewusstsein besitzen, wir uns diesem Punkt aber schrittweise nähern könnten. Er sieht große Chancen in der Entwicklung fortgeschrittener, allgemeiner KI-Systeme (AGI), mahnt aber zugleich zur Vorsicht. Ein zentraler Punkt seiner Argumentation ist die Wichtigkeit von Sicherheitsforschung und internationaler Zusammenarbeit bei der Entwicklung starker KI-Systeme. Hassabis vergleicht die Situation mit der Erforschung von Atomenergie – mit enormem Potenzial, aber auch großem Gefahrenrisiko. Er fordert daher klare ethische Leitlinien, um Missbrauch zu vermeiden und Vertrauen in KI-Technologie zu schaffen. DeepMind arbeite laut Hassabis derzeit verstärkt an „prosozialen“ KI-Systemen, also solchen, die das Gemeinwohl als Handlungsmaxime verinnerlichen. Außerdem unterstreicht er, dass Transparenz und wissenschaftlicher Diskurs für ihn eine zentrale Rolle spielen – weswegen DeepMind viele Ergebnisse öffentlich macht. Abschließend äußert sich Hassabis zu seiner Hoffnung, dass KI eines Tages in der Lage sein wird, bei der Lösung fundamentaler wissenschaftlicher Fragen – z. B. in der Medizin oder Physik – zu helfen.

 Quelle: Demis Hassabis Interview – TIME

.

9. 🧬 KI übertrifft Virologen bei Analysen

          Maschinen schlagen Experten: KI zeigt Überlegenheit in Laboranalysen

 Eine aufsehenerregende Studie, veröffentlicht durch das TIME-Magazin, zeigt, dass große Sprachmodelle (LLMs) wie GPT-4 und Claude hochqualifizierte Virologen in bestimmten Laborszenarien übertreffen können. In einem Test, der reale Herausforderungen aus der Virusforschung simulierte, erhielten sowohl menschliche Experten als auch KI-Modelle dieselben Aufgabenstellungen. Bemerkenswerterweise lieferte die KI in über 80 % der Fälle präzisere und umfassendere Antworten – insbesondere bei der Interpretation von molekularen Wechselwirkungen und dem Erkennen potenzieller Risiken. Die Studie wurde von mehreren Institutionen durchgeführt, darunter das Center for AI Safety, das MIT Media Lab, die UFABC aus Brasilien und SecureBio. Ziel war es, die potenziellen Chancen und Gefahren leistungsstarker KI in sensiblen Bereichen wie der Biotechnologie zu analysieren. Während das Ergebnis beeindruckend ist, mahnen die Forscher auch zur Vorsicht: Solche Fähigkeiten könnten auch in die falschen Hände geraten – etwa bei der Entwicklung biologischer Waffen. Die Autoren fordern daher strengere Zugangskontrollen und Audits für fortgeschrittene KI-Modelle. Gleichzeitig zeigen sie auf, dass die KI enorme Vorteile in der medizinischen Forschung, Impfstoffentwicklung und Prävention von Pandemien bringen könnte. Die Studie liefert einen wichtigen Beitrag zur laufenden Debatte über den sicheren Einsatz von KI im wissenschaftlichen Kontext.

 Quelle: TIME – AI Bests Virus Experts, Raising Biohazard Fears

 

Bis bald zum nächsten spannenden BTO KI Newsletter!

Deine Browser-Version ist anscheinend veraltet. Dadurch kann es zu Darstellungsfehlern auf dieser Webseite kommen.