Hallo zusammen, es ist wieder Zeit für aktuelle und spannende News aus der Welt der Künstlichen Intelligenz!
1. Meta pausiert Nutzung von EU-Nutzerdaten für KI-Training
Hintergrund der Geschichte
Meta hat angekündigt, vorerst keine Daten von EU-Nutzern für das Training seiner KI-Modelle zu verwenden.
Diese Entscheidung steht im Zusammenhang mit einer Beschwerde der Bürgerrechtsorganisation Noyb (None of your business) , die eine Verletzung der Datenschutz-Grundverordnung (DSGVO) sah.
Ursprünglich plante Meta, personenbezogene Daten der Nutzer aus der EU zu sammeln und für das Training von KI-Modellen ab dem 26. Juni 2024 zu verwenden.
Diese Daten sollten verwendet werden, um die Leistung und Genauigkeit der KI-Systeme zu verbessern.
Dazu gehörten Daten aus sozialen Medien, Kommunikationsplattformen und anderen Meta-Diensten wie öffentlichte Beiträge, Fotos u. Bildunterschriften sowie Bildbeschreibungen,
die ohne ausdrückliche Zustimmung der Nutzer verarbeitet werden sollten.
Das Ziel war es, personalisierte Dienste zu optimieren und neue KI-Funktionen zu entwickeln.
Reaktion der Aufsichtsbehörden
Die Datenschutzbehörden, insbesondere die irische Datenschutzkommission (DPC), hatten Metas Pläne zunächst genehmigt.
Jedoch wuchs der Druck, die Nutzung von Nutzerdaten zu stoppen, da die Methoden von Meta als unzulänglich und rechtswidrig angesehen wurden.
Die DPC überprüft nun die Beschwerde von Noyb und weitere regulatorische Maßnahmen werden diskutiert.
Die Hauptkritikpunkte betreffen Metas Ansatz, Daten basierend auf "berechtigtem Interesse" und einer Opt-out-Option zu nutzen, anstatt eine vorherige Zustimmung einzuholen.
Datenschützer argumentieren, dass diese Praxis die Rechte der Nutzer verletzt und nicht im Einklang mit der DSGVO steht.
Es wird gefordert, dass Meta eine explizite Einwilligung der Nutzer einholt, bevor deren Daten verwendet werden.
Reaktion von Meta
Meta hat auf die Kritik reagiert, indem es das KI-Training in der EU vorläufig stoppte.
Das Unternehmen betonte seine Transparenz und das Bestreben, weiterhin innovative KI-Dienste in Europa anbieten zu können.
Meta plant, an einer Lösung zu arbeiten, die sowohl die gesetzlichen Anforderungen erfüllt als auch die Entwicklung von KI-Technologien vorantreibt.
Widerspruch über Opt-Out-Verfahren
Europäische Nutzer haben das Recht, der Nutzung ihrer Daten für das KI-Training zu widersprechen.
Meta bietet hierfür ein Opt-out-Verfahren an, das über die Datenschutzeinstellungen der jeweiligen Plattformen zugänglich ist.
Um auf Instagram zum Widerspruchsformular zu gelangen, öffnet man die Einstellungen, wählt den Menüpunkt Info, tippt auf Datenschutzrichtlinie und dann auf Widerspruchsrecht.
Auf Facebook navigiert man zu Einstellungen und Privatsphäre, wählt Einstellungen, Datenschutzrichtlinie und schließlich Widerspruchsrecht.
Nutzer müssen in einem Formular erklären, warum sie nicht einverstanden sind, dass ihre Daten für das KI-Training verwendet werden.
Weitere Details zu den Widerspruchsformularen findet ihr auf der Website von https://www.verbraucherzentrale.de/aktuelle-meldungen/digitale-welt/ihre-daten-bei-facebook-und-instagram-fuer-ki-so-widersprechen-sie-95646.
Quellen:
Artikel auf https://deinkikompass.de/blog/meta-pausiert-ki-training-mit-eu-nutzerdaten
Artikel auf swiss iT Magazine
Artikel auf https://www.datenschutzticker.de/2024/06/meta-stoppt-vorerst-ki-training-in-der-eu/
Artikel auf https://onlinemarketing.de/technologie/meta-daten-ki-training-widerspruch-how-to
Artikel auf https://www.verbraucherzentrale.de/aktuelle-meldungen/digitale-welt/ihre-daten-bei-facebook-und-instagram-fuer-ki-so-widersprechen-sie-95646
2. Qwen2: Wieder ein neue Sprachmodell
Das Qwen Team von Alibaba das neue Modell Qwen2 vorgestellt, das nach intensiver Entwicklung als Nachfolger von Qwen1.5 auf den Markt kommt.
Qwen steht für "Quantum Wide Extension Network" und ist eine Familie von Sprachmodellen, die auf modernster KI-Technologie basieren.
Qwen2 umfasst fünf Modelle unterschiedlicher Größe: Qwen2-0.5B, Qwen2-1.5B, Qwen2-7B, Qwen2-57B-A14B und Qwen2-72B.
Diese Modelle sind in der Lage, Daten in 27 zusätzlichen Sprachen neben Englisch und Chinesisch zu verarbeiten und zeichnen sich durch eine beeindruckende Leistungssteigerung in Benchmarks aus.
Key Features:
Multilingualität:
Qwen2 wurde auf Daten in 27 Sprachen trainiert, darunter Deutsch, Französisch, Spanisch, Arabisch, Japanisch und viele mehr.
Erweiterte Kontextlänge: Mit einer Unterstützung für Kontextlängen von bis zu 128.000 Token kann Qwen2 lange Texte besser verarbeiten.
Überlegene Leistung: Qwen2 übertrifft seine Vorgängermodelle und andere führende Modelle wie Llama-3-70B in vielen Bereichen, einschließlich natürlichem Sprachverständnis, Codierung und Mathematik.
Sicherheit und Verantwortung:
Qwen2-72B-Instruct zeigt vergleichbare Sicherheitsstandards wie GPT-4 und übertrifft andere Modelle in der Handhabung von mehrsprachigen unsicheren Abfragen.
Use Cases:
Qwen2 kann in einer Vielzahl von Anwendungen eingesetzt werden:
Automatisierte Übersetzungen:
Dank seiner Multilingualität kann Qwen2 nahtlose Übersetzungen zwischen verschiedenen Sprachen ermöglichen.
Codegenerierung und -überprüfung:
Die Modelle sind besonders stark in der Codierung und können in der Softwareentwicklung eingesetzt werden, um Code zu generieren oder zu überprüfen.
Lange Dokumentenanalyse:
Mit der Fähigkeit, lange Kontextlängen zu verarbeiten, eignet sich Qwen2 hervorragend für die Analyse umfangreicher Dokumente und Daten.
Multimodale Anwendungen:
Zukünftig plant Qwen2, multimodale Fähigkeiten zu integrieren, die sowohl visuelle als auch auditive Informationen verarbeiten können.
Performance:
Qwen2-72B übertrifft andere führende Modelle in vielen Benchmarks wie bspw
Natürliche Sprachverarbeitung:
Mit einer MMLU (Massive Multitask Language Understanding) Punktzahl von 84.2 übertrifft es Modelle wie Llama-3-70B.
Codierungsfähigkeiten:
Qwen2-72B erreicht eine HumanEval-Punktzahl von 64.6, was eine deutliche Verbesserung gegenüber früheren Modellen darstellt.
Mathematische Problemlösung:
Mit einer GSM8K Punktzahl von 89.5 zeigt Qwen2-72B beeindruckende mathematische Fähigkeiten.
Die Performance von Qwen2-72B in diesen Bereichen unterstreicht seine Vielseitigkeit und Überlegenheit gegenüber anderen aktuellen Modellen.
Zukünftiger Ausblick:
Qwen2 wird weiterentwickelt, um noch größere Modelle zu schaffen und multimodale Fähigkeiten zu integrieren.
Diese Weiterentwicklungen zielen darauf ab, Qwen2 als führendes Modell in der KI-Forschung und -Anwendung zu etablieren.
Für weitere Informationen besucht die Website von Qwen bzw. auf Hugging Face
oder seht euch gern auch den Artikel von writingmate.ai an
3. Dream Machine: Das neue Text-zu-Video-Tool von Luma AI
Luma AI hat 2 Tage nach der Einführung von Kling die "Dream Machine" vorgestellt, ein neuartiges Text-zu-Video-Tool, das die Erstellung von Videoinhalten erheblich verbessert.
Dieses Tool ermöglicht es Nutzern, mit einfachen Textanweisungen beeindruckende Videoclips zu erstellen.
Was ist die Dream Machine?
Die Dream Machine von Luma AI ist ein KI-basiertes Tool, das Textanweisungen in hochwertige Videos umwandelt.
Dieses Tool ist besonders attraktiv für Content Creator, Unternehmen und Kreativagenturen, die schnell und kostengünstig ansprechende visuelle Inhalte benötigen. Die Dream Machine kann realistische Videos in hoher Auflösung generieren und dabei komplexe Szenen und Bewegungen realistisch nachbilden.
Vergleich mit Sora und Kling
Im Vergleich zu anderen Text-zu-Video-Modellen wie Sora von OpenAI und Kling von Kuaishou Technology, bietet die Dream Machine von Luma AI mehrere einzigartige Vorteile:
Videoqualität und -länge:
Während Sora Videos von bis zu einer Minute Länge erzeugen kann, ermöglicht Kling die Erstellung von Videos bis zu zwei Minuten in 1080p-Auflösung bei 30 Bildern pro Sekunde.
Die Dream Machine steht diesen Modellen in nichts nach und bietet ebenfalls hochwertige Videoproduktion mit beeindruckenden Details und Realismus.
Technologie und Realismus:
Kling nutzt einen 3D-Raum-Zeit-Mechanismus, um physikalisch korrekte Bewegungen zu modellieren, und kann sogar fiktive Szenen wie eine Katze, die ein Auto fährt, generieren.
Die Dream Machine von Luma AI bietet ähnliche fortschrittliche Technologien, um realistische Videos aus einfachen Textbeschreibungen zu erzeugen
Benutzerfreundlichkeit und Zugänglichkeit:
Ein großer Vorteil der Dream Machine ist ihre sofortige Verfügbarkeit für eine breite Nutzerschaft, während Kling derzeit nur als öffentliche Demo in China verfügbar ist und Sora Zugangsbeschränkungen hat.
Anwendungsbereiche
Die Dream Machine kann in vielen Bereichen eingesetzt werden:
Content Creation: Ideal für die schnelle Erstellung von Videoinhalten für Blogs, soziale Medien und andere digitale Plattformen.
Marketing und Werbung: Perfekt für die Erstellung von Werbevideos, die spezifische Kampagnen und Zielgruppen ansprechen.
Bildung und Training: Ermöglicht die Entwicklung interaktiver und immersiver Schulungsvideos.
E-Commerce: Verbessert das Online-Shopping-Erlebnis durch detaillierte Produktvideos.
Fazit
Die Dream Machine von Luma AI stellt eine bedeutende Weiterentwicklung in der Text-zu-Video-Technologie dar und bietet umfassende Möglichkeiten für Kreative und Unternehmen.
Mit ihrer hohen Videoqualität, Benutzerfreundlichkeit und den vielseitigen Einsatzmöglichkeiten hebt sie sich von anderen Modellen ab und ebnet den Weg für die Zukunft der Videoproduktion.
Weitere Details findet ihr auf
CreativeBlog ,The Indian Express, bzw. PYMNTS
Einige Beispiele könnt ihr auf YouTube auf dem Kanal von Luma AI
oder dem Kanal von Gavin Herman ,bzw. Theoretically Media
4. Gentype: Der neue KI-Alphabet-Generator von Google
Google hat mit Gentype ein neues, innovatives Tool vorgestellt, das die KI gestützte Generierung von Buchstaben ermöglicht.
Der KI-basierte Alphabet-Generator, nutzt Googles generativem Bildmodell Imagen 2. Dieses Tool ermöglicht es, durch einfache Texteingaben individuelle und kreative Buchstabenbilder in verschiedenen Stilen und Designs zu erzeugen.
Der Prozess kombiniert tiefes textuelles Verständnis mit einer Diffusionsmodell-Architektur, um qualitativ hochwertige und visuell ansprechende Buchstaben zu kreieren.
Die Buchstabengenerierung mit Gentype erfolgt durch die Eingabe einfacher Textanweisungen.
Nutzer können spezifische Beschreibungen eingeben, wie zum Beispiel "ein glitzernder goldener Buchstabe A" oder "ein Buchstabe B im Graffiti-Stil".
Die KI verarbeitet diese Eingaben und erstellt entsprechende Bilder, die den Anforderungen und Wünschen der Nutzer entsprechen.
Dieser Prozess ermöglicht eine nahezu unbegrenzte kreative Freiheit und Anpassungsmöglichkeiten.
Gentype kann in verschiedenen Bereichen eingesetzt werden:
Grafikdesign: Designer können einzigartige Buchstaben für Logos, Poster und andere visuelle Projekte erstellen.
Bildung: Lehrer und Pädagogen können personalisierte Lehrmaterialien und interaktive Lernwerkzeuge entwickeln.
Marketing: Unternehmen können maßgeschneiderte Buchstaben für Werbekampagnen und Markenbildung nutzen.
Kunst und Kreativität: Künstler und Kreative können mit Gentype neue und innovative Kunstwerke schaffen.
Ein Hauptvorteil von Gentype ist die Kombination aus einfacher Bedienung und hoher Qualität der Ergebnisse,
da die zugrunde liegende Imagen 2-Technologie für eine hohe Bildqualität und Detailgenauigkeit sorgt.
Gentype von Google eröffnet neue Möglichkeiten in der Buchstabengenerierung und Kreativarbeit.
Mit seiner leistungsstarken Technologie und vielseitigen Anwendungsmöglichkeiten ist es ein wertvolles Tool für Designer, Pädagogen, Künstler und Unternehmen.
Für weitere Infos schaut auch gern in die Artikel von
ZDNet, Medium (leider nur mit Account zugänglich) oder Popular AI Tools.
5. Neues Tool NotebookLM von Google - Notizenverwaltung für jedermann
NotebookLM, kurz für "Notebook Language Model", ist ein personalisierte Ki-Recherche u. Schreibassistent von Google, der darauf abzielt, das Arbeiten mit Notizen für eine Vielzahl von Benutzern zu verbessern.
Diese Technologie ermöglicht es, Notizen automatisch zu organisieren, zu durchsuchen und zu analysieren.
Durch Nutzung des fortschrittlichesten KI-Modells Gemini 1.5 kann NotebookLM Inhalte verstehen und dabei helfen, wichtige Informationen schneller und effizienter zu finden und zu nutzen.
Unterstützte Dokumenttypen
NotebookLM iunterstützt eine breite Palette von Dokumenttypen wie Textdokumente, PDFs, Bilder, Tabellen und sogar handschriftliche Notizen.
Des Weiteren können Google Slides und Web-Urls als Quellen verwendet werden.
Alle wichtigen Informationen können an einem zentralen Ort gespeichern und effizient verwaltet werden.
Was kann man mit NotebookLM machen?
Notizen erstellen und bearbeiten:
Notizen können direkt in der Anwendung erstellt werden und bei Bedarf ist eine Unterstützung durch die KI für das Generieren von Texten möglich.
Informationen extrahieren:
Die intelligente Suche kann verwendet werden, um spezifische Informationen oder Datenpunkte schnell zu finden.
Zusammenfassungen erstellen:
Um einen schnellen Überblick zu erhalten kann mithilfer der KI Zusammenfassungen Ihrer Notizen erstellt werden.
Inhalte analysieren:
Komplexe Inhalte lassen sich von der KI durch Analyse von Mustern und wichtigen Punkte hervorheben.
Nutzung Mulitmodalität:
Durch die nativen mulitodalen Fähigkeiten des KI Modells Gemini 1.5 können nun auch Fragen zu Bildern oder Diagrammen in angegebenen Quellen gestellt werden.
Notizen visualisieren:
Interaktive Diagramme und Grafiken können ebenfalls hinzugefügt werden, um Notizen visuell ansprechender und verständlicher zu machen.
Zusammenarbeit erleichtern:
Zur effizienteren Gestaltung von Projketen können Notizen geteilt werden bzw. ist es möglich in Echtzeit direkt mit anderen an den Notizen zu arbeiten.
Für wen ist NotebookLM sinnvoll?
Studierende: Organisieren von Vorlesungsnotizen, erstellen von Zusammenfassungen bzw. schnelle Suche nach wichtige Informationen für Prüfungen.
Berufstätige: Verwalten von Meeting-Notizen, Projektpläne und wichtige Dokumente.
Forscher und Wissenschaftler: Nutzung der KI-gestützte Analyse, um komplexe Daten und Forschungsergebnisse zu strukturieren und zu interpretieren.
Journalisten und Autoren: Sammeln und organisieren von Recherchen, und Unterstützung beim Verfassen und Überarbeiten der Texte durch die KI.
NotebookLM wird derzeit als Experimental Feature von Google angeboten und kann mit einem Google Account direkt ausprobiert werden.
Der Ki Assistenz kann derzeit in 200 Ländern (auch in den DACH - Staaten) genutzt werden.
Für weitere Informationen besucht direkt die Homepage von NotebookLM bei Google
bzw. schaut gern in die folgenden Google Blogs :
Google Blog 1
Google Blog 2
6. Die Zukunft der Politik? AI Steve, ein KI-Avatar, der für das britische Parlament kandidiert
Im Wahljahr 2024 sorgt ein außergewöhnlicher Kandidat für Aufsehen: AI Steve, ein KI-Avatar, der für das Parlament im Wahlbezirk Brighton Pavilion (Brighton u. Hove) in Großbritannien kandidiert.
Diese innovativ Idee stammt von Steve Endacott, der mit seiner neuen Partei SmarterUK die Art und Weise, wie Politik gemacht wird, revolutionieren will.
Entwickelt von Neural Voice, einem auf Konversations-KI spezialisierten Unternehmen soll AI Steve Tausende von Gesprächen mit Wählern führen und deren Anliegen direkt ins Parlament tragen.
AI Steve: Ein Blick auf die Zukunft der Politik
AI Steve nutzt eine Online-Plattform, um rund um die Uhr mit Wählern zu kommunizieren und ihre Meinungen zu sammeln.
Die Kampagne möchte 5.000 Menschen als "Creators" rekrutieren, die mit dem Chatbot diskutieren, um potenzielle Politiken zu ermitteln.
Gleichzeitig sollen 5.000 Menschen als "Validators" die Politiken bewerten. Nur Vorschläge, die mehr als 50 Prozent Zustimmung erhalten, werden weiterverfolgt.
Steve Endacott würde diese im Parlament vertreten und gemäß den Anweisungen der Wähler abstimmen, was eine direkte Demokratie in bisher unbekanntem Ausmaß ermöglichen würde.
Vorteile eines KI-Avatars in der Politik
Effizienz und Erreichbarkeit:
AI Steve kann rund um die Uhr mit Wählern interagieren u. bis zu 10.000 Gespräche gleichzeitig führen.
Das bedeutet, dass kein Anliegen unbeachtet bleibt und die Wähler jederzeit ihre Meinungen äußern können
Transparenz:
Alle Interaktionen werden dokumentiert bzw. transkribiert und analysiert, um transparente u. datenbasierte politische Entscheidungen zu treffen.
Inklusive Politik:
Durch die Einbeziehung einer breiten Wählerschaft und die Umsetzung ihrer Meinungen wird die Politik bürgernäher und die Demokratie gestärkt.
Nachteile und Herausforderungen
Fehlende menschliche Intuition:
AI Steve fehlt die menschliche Intuition, die oft für politische Entscheidungen notwendig ist.
Potenzielle Verzerrungen:
Algorithmen können voreingenommene oder fehlerhafte Antworten liefern, was zu einer problematischen Politik führen könnte.
Abhängigkeit von Technologie:
Die starke Abhängigkeit birgt Risiken wie technische Ausfälle und Sicherheitsbedenken.
AI Steve ist ein erster Prototyp für zukünftige KI-Mensch-Kollaboration in der Politik und es ist geplant, die Technologieplattform weiter auszubauen. Ziel ist es, die Demokratie durch direkte Wählerbeteiligung und technologische Innovationen zu stärken.
Erfahre mehr über dieses faszinierende Experiment und wie es die politische Landschaft verändern könnte in den Artikeln (Quellen) auf
singularityHub, Techstrong.ai oder Euronews.
bzw. seht euch dazu auch den Beitrag der CNBC Journalistin Daniele Hamamdjian über AI Steve auf YouTube auf dem Kanal von CNBC News an.
7. McDonald's beendet Drive-Thru-Experiment mit KI
McDonald's hat beschlossen, sein KI-gesteuertes Drive-Thru-Experiment am 26.07.2024 zu beenden.
Das 2021 in Zusammenarbeit mit IBM gestartete Projekt sollte die Effizienz und Genauigkeit der Bestellprozesse an den Drive-Thru-Schaltern verbessern.
Trotz der anfänglichen Erwartungen und umfangreichen Investitionen wurde das Experiment nun eingestellt.
Laut einem Bericht von The Verge war das Ziel des Projekts, mithilfe von künstlicher Intelligenz Bestellungen schneller und fehlerfrei entgegenzunehmen.
Die Technologie sollte die menschlichen Mitarbeiter entlasten und gleichzeitig die Wartezeiten für die Kunden verkürzen.
Die praktischen Tests wurden in ausgewählten Filialen in den USA durchgeführt, wo die KI Bestellungen aufnahm und verarbeitete.
Trotz einiger Fortschritte stieß das Projekt auf mehrere Herausforderungen.
Technische Probleme und eine unzureichende Akzeptanz seitens der Kunden führten dazu, dass die gewünschten Effizienzgewinne ausblieben.
Schwierigkeiten bei der Spracherkennung und der präzisen Interpretation von Kundenwünschen trugen maßgeblich zur Entscheidung bei, das Experiment zu beenden.
Insbesondere wurden häufig Bestellfehler gemeldet, da die KI Schwierigkeiten hatte, Dialekte, Akzente und Hintergrundgeräusche korrekt zu verarbeiten.
Dies führte zu Frustrationen bei den Kunden und verlängerte letztlich die Bestellzeiten.
So wurde bspw. bei einfachen Bestellungen wie Eiscreme zusätzliche Artikel wie Butter oder Ketchup oder aber mehrere hundert Dollar bei Bestellung von ChickenNuggets von der KI hinzugefügt
oder Mitarbeiter mussten in den Bestellprozess manuell eingreifen weil die KI den Kunden bzgl. seiner Wünsche nicht verstehen konnte.
Ein weiterer Aspekt war die niedrige Genauigkeit der Bestellungen. Die KI erreichte nur eine Genauigkeit von etwa 85 %, was bedeutete,
dass bei fast jeder fünften Bestellung menschliche Mitarbeiter eingreifen mussten.
Diese Mängel wurden in sozialen Medien vielfach dokumentiert, was den Druck auf McDonald's weiter erhöhte, das Experiment zu überdenken.
Kunden äußerten ihre Frustration über fehlerhafte Bestellungen und lange Wartezeiten, was zu negativen Erfahrungen führte und den Ruf des Systems beeinträchtigte.
Ein Sprecher von McDonald's erklärte, dass das Unternehmen weiterhin an innovativen Technologien interessiert sei, um das Kundenerlebnis zu verbessern, jedoch werde man sich auf andere Initiativen konzentrieren.
Dies schließt die Verbesserung der digitalen Bestellplattformen und die Optimierung der bestehenden Drive-Thru-Systeme ein.
Quellen:
Artikel auf The Verge
Artikel auf GlobalNews
Artikel auf Restaurant Business