KI News vom 16.05.2024

Hallo zusammen, Zeit wieder für aktuelle und spannende News aus der Welt der Künstlichen Intelligenz:

1. Google DeepMind und Isomorphic Labs veröffentlichen AlphaFold 3

Bei AlphaFold 3, handelt es sich um ein fortschrittliches KI-Modell (Deep Learnin Modell), das darauf abzielt, die Struktur und Wechselwirkungen aller biologischen Moleküle wie Proteinen, DNA, RNA und anderen Molekülen wie Liganden zu modellieren u. vorhersagen. Dieses Modell baut auf dem Erfolg von AlphaFold 2 auf und erweitert dessen Fähigkeiten um ein breiteres Spektrum an Molekültypen. Dies könnte das Verständnis von biologischen Prozessen revolutionieren und die Entdeckung neuer Medikamente beschleunigen.

Das Modell verwendet eine verbesserte Version der Evoformer-Architektur von DeepMind und ist in der Lage, die Struktur großer Biomolekülkomplexe genau vorherzusagen. Dazu wird aus einer Eingabeliste von Molekühlen eine gemeinsame 3D Struktur generiert, um zu zeigen wie diese zueinander passen.
Neben der Modellierung großer Biomoleküle wie RNA, DNA u. Proteine und kleinerer Moleküle sogenannte Liganten können auch chemische Modifikationen dieser Moleküle modelliert werden.
Das Modell zeigt dadurch auch, wie diese Moleküle in Zellen interagieren, was für das Verständnis von Krankheiten und die Entwicklung neuer Therapien wichtig ist.
Sind die Eingaben verarbeitet, erstellt AlphaFold 3 Vorhersagen mithilfe eines Diffusion-Netzwerkes ähnlich wie bei KI-Bildgeneratoren beginnend mit einer Wolke von Atomen, welche über viele Schritte dann
zur endgültigen u. genauesten Molekularstruktur konvergiert werden.
Damit ist es aktuell das einzigste KI-Modell, welches gesamte molekulare Komplexe auf ganzheitliche Weise berechnen kann.

Isomorphic Labs nutzt AlphaFold 3, um die Arzneimittelforschung zu beschleunigen, indem genaue Vorhersagen über die Bindung von Liganden und Antikörpern an Proteine getroffen werden.
Diese Vorhersagen sind deutlich genauer als bisherige Methoden und könnten die Entwicklung von Therapeutika erheblich verbessern.
Das Unternehmen stellt mit dem AlphaFold Server ein kostenloses und benutzerfreundliches Forschungstool zur Verfügung, dass es Forschern ermöglicht, die Funktionen von AlphaFold 3 kostenfrei zu nutzen.
Dieser Service ist insbesondere für Forscher ohne umfangreiche Rechenressourcen gedacht, um den wissenschaftlichen Fortschritt zu fördern und das Verständnis biologischer Prozesse zu verbessern.

Die Entwicklung von AlphaFold 3 stellt einen bedeutenden Fortschritt in der bioinformatischen Forschung dar und könnte langfristig erhebliche Auswirkungen auf das medizinische Verständnis und die Behandlung von Krankheiten haben.
Weitere Informationen zu AlphaFold 3 finden Sie direkt im Blogpost auf Google's Blog .

2. Microsoft arbeitet an neuem Large Language Model MAI-1

Der US-Techgigant entwickelt aktuell ein neues In-House Sprachmodell namens MAI-1, dass mit führenden KI-Modellen wie OpenAIs GPT-4 bzw. Gemini Ultra konkurrieren soll.
MAI-1 verfügt Berichten zufolge über etwa 500 Milliarden Parameter, was es zu einem bedeutenden Konkurrenten in der KI-Branche macht, aber immer noch unter der Zahl von einer Billion Parametern von GPT-4 liegt.
Die Entwicklung von MAI-1 ist Teil von Microsofts breiter angelegter Strategie, eine stärkere Präsenz im KI-Bereich unabhängig von seinen bestehenden Partnerschaften, wie der mit OpenAI, Meta (LLama) bzw. Mistral AI aufzubauen.
Die Leitung der Entwicklung des neuen Modells übernimmt Mustafa Suleyman, ehemaliger Mitbegründer von Google Deepmind und CEO des Startups Inflection. Bei der Entwicklung von MAI-1 kommen daher Technologien und möglicherweise Trainingsdaten von Inflection zum Einsatz, welches kürzlich von Microsoft übernommenen wurde.
Neben propertiären Modellen werden in einer hybriden Strategie auch OpenSource Modelle verwendet, um Innovation u. Unabhängigkeit zu fördern.
Im Trainingsdatensatz sollen neben Daten von Inflection auch andere Arten von Textdaten wie z.B. GPT-4 generierte Texte bzw. aus dem Internet gesammelte Inhalte enthalten sein.
Trotzdem ist MAI-1 eine reine Microsoft-Schöpfung und wird voraussichtlich ein Eckpfeiler in Microsofts Suite von KI-gesteuerten Produkten und Diensten wie Bing, Azure bzw. Microsoft 365 Copilot sein.
Das Modell wird in Microsoft Azure AI Cloud gehostet u. auf Nvidia CPUs trainiert.
Möglicherweise wird Microsoft auf seiner kommenden Entwicklerkonferenz "Build" am 16. Mai 2024 mehr über MAI-1 verraten.
Das Modell befindet sich noch in der Entwicklung, und seine endgültigen Anwendungen werden maßgeblich von seiner Leistung in kommenden Tests abhängen.

Links: Artikel arsTechnica
Artikel Enterprise Management 360
Artikel ITP-GmbH

3. OpenAI ermöglicht Zugang zur KI mit kostenlosem GPT-4o für alle ChatGPT-Nutzer

Das neue von OpenAI vorgestellte innovative Modell GPT-4o (o=omni), dass auf dem bereits beeindruckenden GPT-4 basiert, ist ab sofort jedem Nutzer kostenlos zugänglich.
Mira Murati, CTO von OpenAI, verkündete in einem aufsehenerregenden Livestream am Montag den 13.05.2024, dass GPT-4o „deutlich schneller arbeitet und die Fähigkeiten in den Bereichen Text, Vision und Audio massiv verbessert wurden.“

Intuitive und Multimodale KI-Interaktionen

GPT-4o setzt neue Maßstäbe in der KI-Entwicklung durch seine native Multimodalität, was bedeutet, dass das Modell in der Lage ist,
Inhalte zu generieren oder Befehle in verschiedenen Formaten wie Sprache, Text oder Bildern zu verstehen und zu verarbeiten.
Sam Altman, CEO von OpenAI, hebt hervor, dass Entwickler von der neu gestalteten API profitieren können, die nicht nur halb so teuer, sondern auch doppelt so schnell wie das vorherige Turbo-Modell ist.
Diese verbesserte Zugänglichkeit und Leistung ermöglicht eine breitere und effizientere Nutzung in einer Vielzahl von Anwendungen.

Erweiterte Fähigkeiten und Zugänglichkeit

Im Rahmen der Einführung von GPT-4o kündigte OpenAI auch bedeutende Verbesserungen für den Sprachmodus von ChatGPT an.
Die App wird nun zu einem Echtzeit-Sprachassistenten weiterentwickelt, der ähnlich wie der Assistent aus dem Film „Her“ funktioniert.
Dieser fortgeschrittene Sprachmodus ermöglicht es dem System, in Echtzeit auf seine Umgebung zu reagieren, was eine dynamischere und menschlichere Interaktion ermöglicht.
Nutzer können sich auf eine nahtlose und intuitive Kommunikation mit dem KI-Assistenten freuen, der jetzt noch besser auf ihre Bedürfnisse eingehen kann.

Vision und Verantwortung

In einem reflektierenden Blogpost nach dem Livestream sprach Sam Altman über die ursprüngliche Vision von OpenAI, „vielfältige Vorteile für die Welt zu schaffen“
und wie sich diese Vision in Richtung einer stärkeren Kommerzialisierung durch bezahlte APIs verschoben hat.
Diese strategische Entscheidung ermöglicht es Entwicklern, die fortschrittliche KI von OpenAI zu nutzen, um innovative Lösungen zu entwickeln, die der Gesellschaft zugutekommen.
Altman betont, dass dies eine neue Ära der Kreativität und des Nutzens durch KI einläutet.

Mit dieser strategisch getimten Einführung, kurz vor der großen Google I/O-Konferenz, positioniert sich OpenAI als führender Innovator im schnell fortschreitenden Bereich der Künstlichen Intelligenz.
Detaillerte Informationen sind im Artikel auf The Verge u. auf der Website von OpenAI zu finden.

4. Apple enthüllt leistungsstarken M4-Chip mit neuen KI-Funktionen

Apple hat auf seinem jüngsten iPad-Event eine Vorschau auf die neuesten KI-Verbesserungen gegeben, einschließlich des fortschrittlichen M4-Chips.
Das neue iPad Air und iPad Pro werden von diesem Chip angetrieben, der laut Apple bis zu 50% schneller ist als der Vorgänger M2.
Der M4-Chip ist mit einer fortschrittlichen 10 Core CPU auf 3-Nanometer-Technologie ausgestattet und beinhaltet eine Neural Engine, die auf KI-Anwendungen ausgerichtet ist, bis zu 38 Billionen Rechenoperationen pro Sekunde ausführen kann und
damit schneller ist als die heute zur Verfügung stehende KI PCs.
Die neuen IPad-Geräte bieten erweiterte maschinelle Lernfunktionen wie visuelle Erkennung und Texterfassung in Echtzeit und inkludieren spezialisierte Tools zur Fotooptimierung, die auf über 20 Millionen professionellen Bildern trainiert wurden, um die Fotobearbeitung zu revolutionieren.
Zudem hat Apple darauf hingewiesen, dass die kommenden Versionen von iPadOS neue KI-Funktionen enthalten werden, die Entwickler nutzen können, um leistungsstarke Anwendungen direkt auf den Geräten zu ermöglichen.
Für detaillierte Informationen zu Apples neuem M4-Chip und den neuen KI-Features besuchen Sie bitte TechCrunch bzw.
den Newsroom von Apple .

5. Innovativer Sim-zu-Real-Transfer in der Robotik mit DrEureka

In der Welt der Robotik stellt die Übertragung von simulierten Trainingsumgebung (Digital Twin) in die reale Anwendung eine große Herausforderung dar.
Nvidia hat in Zusammenarbeit mit Forschern der Universität Pennsylvania u. der Univistät Texas (Austin) mit seiner neuesten Lösung "DrEureka" einen bedeutenden Durchbruch erzielt.
DrEureka nutzt fortschrittliche Sprachmodelle, um Robotern das Navigieren und Interagieren in realen Umgebungen beizubringen,
indem es die in Simulationen erlernten Fähigkeiten effektiv überträgt.
Die Ursprünge der Lösung liegen in Nvidias Eureka-Plattform, die bereits eine Automatisierung des Belohnungsdesigns für robotergesteuerte Aufgaben ermöglichte.
Dieses frühe System nahm Aufgaben- und Sicherheitsanweisungen auf und entwickelte daraus standardisierte Belohnungsfunktionen, die in unterschiedlichen simulierten Umgebungen getestet wurden,
um die physikalischen Reaktionen der Roboter zu optimieren.
DrEureka erweitert diese Fähigkeiten durch die Einbindung von großen Sprachmodellen wie GPT-4, die tiefgreifendes Wissen über physikalische Konzepte wie Reibung, Schwerkraft, Dämpfung, Steifigkeit u. weitere physikalische Prinzipien beinhalten.
Dieses Wissen wird genutzt, um Domänenrandomisierungsparameter zu erstellen, welche die Unterschiede zwischen simulierten Trainingsumgebungen und realen Einsatzbedingungen überbrücken.
Die praktische Anwendung wurde in mehreren Szenarien getestet, darunter die vierbeinige Fortbewegung (z.B. Balancieren bzw. Laufen auf Yoga Ball) und geschickte Manipulationsaufgaben wie das Drehen von Würfeln.
Diese Tests haben gezeigt, dass DrEureka in der Lage ist, Roboter so zu trainieren, dass sie auch in komplexen und unvorhersehbaren realen Umgebungen effektiv funktionieren.
Besonders bemerkenswert ist die Fähigkeit des Systems, ohne iterative manuelle Designanpassungen auszukommen und neue Aufgaben zu meistern, die über die ursprünglichen Trainingsszenarien hinausgehen.
Ein wesentlicher Bestandteil der Lösung ist zudem die Integration von Sicherheitsüberlegungen direkt in den Prozess des Belohnungsdesigns.
Dies gewährleistet, dass die trainierten Roboter nicht nur effektiv, sondern auch sicher in ihren Anwendungen sind, was besonders in unstrukturierten oder öffentlichen Umgebungen von Bedeutung ist.
Die zukünftige Entwicklung von DrEureka sieht vielversprechend aus. Nvidia plant, Feedback aus realen Einsatzbedingungen in den Trainingsprozess (LLM-Schleife) zu integrieren, um die Leistungsfähigkeit der Roboter kontinuierlich zu verbessern.
Zusätzlich wird die Einbindung weiterer sensorischer Modalitäten wie visueller oder akustischer Daten erwartet, um die Fähigkeiten der Roboter weiter zu erweitern.
DrEureka von Nvidia steht beispielhaft für die nächste Generation autonomer Systeme und deutet auf eine Zukunft hin, in der Roboter eine immer größere Rolle in Industrie, Gesundheitswesen und anderen wichtigen Sektoren spielen werden.
Links: Artikel NowadAIs
Wissenschaftliches Paper

6. Neue Einblicke in die Sprache der Pottwale durch KI-gestützte Forschung

Forscher haben mithilfe von künstlicher Intelligenz signifikante Fortschritte im Verständnis der Kommunikation von Pottwalen gemacht.
Ein Team vom Massachusetts Institute of Technology (MIT) hat eine Studie durchgeführt, die aufzeigt, wie Pottwale mittels einer Vielzahl von Klicklauten, die einem phonetischen Alphabet ähneln, kommunizieren.
Diese Entdeckung könnte dazu beitragen, die komplexe Sprache dieser majestätischen Meeresbewohner besser zu verstehen.
Die Studie analysierte 8.719 sogenannte "Codas" – spezifische Sequenzen von Klicklauten, die Pottwale zur Kommunikation verwenden.
Durch den Einsatz von Machine Learning (Echoortungs-Klickdetektor auf Basis eines Convolutional Neural Networks) konnten die Forscher wiederkehrende Muster in diesen Lauten identifizieren, die den Bausteinen menschlicher Sprache ähnlich sind.
Diese Entdeckung ist nicht nur für die wissenschaftliche Forschung von Bedeutung, sondern auch für den Schutz und die Erhaltung der Pottwale, da ein besseres Verständnis ihrer Kommunikation effektivere Schutzmaßnahmen ermöglichen könnte.
Der Einsatz von KI in der Erforschung tierischer Kommunikation ist nicht neu, aber die Anwendung auf die komplexen Laute der Pottwale markiert einen wichtigen Durchbruch.
Diese Forschung legt nahe, dass Pottwale möglicherweise eine eigene Sprache besitzen, die aus einer Kombination von Klicklauten besteht, die spezifische Informationen übertragen können.
Dieses "sperm whale phonetic alphabet" enthält Elemente wie Rhythmus, Tempo und Verzierungen, die spezifische kommunikative Absichten tragen könnten.
Die Forschung, die in Zusammenarbeit mit Projekten wie CETI (Cetacean Translation Initiative) durchgeführt wurde, könnte auch Licht auf die sozialen Strukturen und das Verhalten der Pottwale werfen,
die in den tiefen Meeren jagen und kommunizieren. Die Fähigkeit, die Sprache der Pottwale zu entschlüsseln, eröffnet neue Möglichkeiten für interdisziplinäre Studien und könnte langfristig dazu beitragen,
die Beziehung zwischen den Menschen u. diesen Meeresbewohnern neu zu definieren.
Weitere Details zu dieser spannenden Entdeckung und die Implikationen für die Wissenschaft und den Schutz von Meeressäugern finden Sie in den Berichten auf TechCrunch und scientific reports.

7. Daimler stellt autonom fahrenden elektrisch betriebenen Sattelschlepper (LKW) vor

Daimler Truck North America hat in Zusammenarbeit mit Waymo eine bahnbrechende Entwicklung in der Transportbranche vorgestellt: den autonom fahrenden, elektrischen Sattelschlepper eCascadia.
Dieser fortschrittliche LKW, ausgestattet mit der autonomen Fahrsoftware von Torc Robotics und modernster Sensor- und Rechentechnologie, zielt darauf ab, Level 4 der Autonomie zu erreichen.
Dies bedeutet, dass der LKW die meisten Fahrsituationen selbstständig bewältigen kann, auch wenn ein Fahrer noch hinter dem Steuer erforderlich ist.
Er verfügt über den proprietären Detroit ePowertrain und bietet verschiedene Batterie- und Antriebsachsenoptionen mit Reichweitenoptionen von 155, 220 oder 230 Meilen.
Die Batterie kann in nur 90 Minuten bis zu 80% aufgeladen werden und die autonome Sensorik und Rechenleistung sind so konzipiert, dass sie in die kleinere Tageskabine des eCascadia passen.
Ein fortschrittliches Prototyp-Luftkühlsystem für den Compute-Stack, das zwischen Fahrer- und Beifahrersitz positioniert ist, trägt zur Effizienz bei.
Daimler Trucks arbeitet seit 2015 an der Entwicklung und Erprobung von Technologien für autonome LKWs und plant, bis 2027 in den USA mit der Produktion von autonom fahrenden LKWs der Stufe 4 zu beginnen.
Die eCascadia Trucks sollen im Südwesten der USA im Rahmen einens Gütertransportdienstes eingesetzt werden, um Waren von Hub zu Hub zu transportieren.
Der Einsatz von Elektrofahrzeugen zusammen mit autonomer Technologie könnte die Umweltauswirkungen der Logistikbranche erheblich reduzieren und gleichzeitig die Betriebskosten senken.

Weitere Informationen finden Sie auf:

The Verge
Electrek

8. KI am Arbeitsplatz – Microsoft Work Trend Index Bericht

In einer aktuellen Studie von Microsoft wird deutlich, wie schnell Künstliche Intelligenz (KI) in der Arbeitswelt Fuß fasst und welche Herausforderungen und Chancen dies mit sich bringt.
Einige der wesentlichen Erkenntnisse aus dem Bericht sollen hier kurz vorgestellt werden.

a) Verbreitung von KI im Arbeitsumfeld

Die Nutzung generativer KI hat sich in den letzten sechs Monaten fast verdoppelt.
75% der weltweit Befragten nutzen sie bereits in ihrem Arbeitsalltag.
Diese rasante Adaption spiegelt sich auch darin wider, dass 46% der Nutzer angaben, erst in den letzten sechs Monaten mit der Nutzung begonnen zu haben.

b) Nutzen von KI für Mitarbeiter

Die Anwendung von KI am Arbeitsplatz hat signifikante Vorteile für die Mitarbeiter:
90% der Nutzer berichten, dass KI ihnen hilft, Zeit zu sparen.
85% sagen, dass sie sich dank KI auf ihre wichtigsten Aufgaben konzentrieren können.
84% fühlen sich kreativer durch die Nutzung von KI.
83% genießen ihre Arbeit mehr durch den Einsatz von KI-Tools.

c) Führungskräfte und KI

Während 79% der Führungskräfte der Meinung sind, dass ihre Unternehmen KI adoptieren müssen, um wettbewerbsfähig zu bleiben, gibt es auch Bedenken:
59% der Führungskräfte machen sich Sorgen über die Quantifizierung der Produktivitätsgewinne durch KI.
60% glauben, dass es in ihrer Organisation an einem klaren Plan und einer Vision für die Implementierung von KI fehlt.

d) Eigeninitiative bei der KI-Nutzung

Interessanterweise bringen 78% der KI-Nutzer ihre eigenen KI-Tools mit zur Arbeit (BYOAI).
Diese Tendenz ist in kleinen und mittelständischen Unternehmen sogar noch ausgeprägter (80%).
Der BYOAI-Ansatz ist zudem nicht auf Gen-Z beschränkt sondern erfolgt bereits generationenübergreifend
- Boomers(58+) :       73%
- Gen-X (44-57):      76%
- Millennials (29-43): 78%
- Gen-Z (18-28):      85%

e) Herausforderungen und Arbeitsbelastung

68% der Befragten kämpfen mit dem Tempo und dem Umfang der Arbeit.
46% fühlen sich durch ihre Arbeit ausgebrannt.
41% der Führungskräfte sehen das Potenzial von AI darin innerhalb der nächste 5 Jahre neue Geschäftsprozesse zu etablieren u.
erwarten das der ethische Einsatz von KI (47%) sowie Schulung (42%) und Orchestrierung (38%) eines Teams durch KI-Bots zu einem Kernbestandteil der Arbeit wird

f) Ausblick und Fähigkeiten

Die Fähigkeit, KI effektiv zu nutzen, wird zunehmend wichtiger:

76% der Befragten geben an, dass KI-Fähigkeiten notwendig sind, um im Jobmarkt wettbewerbsfähig zu bleiben.
69% glauben, dass KI ihnen helfen kann, schneller befördert zu werden.

Diese Datenpunkte unterstreichen die wachsende Bedeutung von KI am Arbeitsplatz und die Notwendigkeit für Unternehmen,
sowohl strategische Pläne für die Integration von KI zu entwickeln als auch in die Ausbildung ihrer Mitarbeiter zu investieren.
Für weiterführende Informationen und detaillierte Einblicke in diese Studie empfehlen wir den vollständigen Bericht auf der

Microsoft Work Trend Index Website zu lesen.

Viel Spaß beim lesen.

Eure

Blauen Tomaten