Neue Funktionen für Profi-Nutzer :
Tech-Wettlauf: Drei KI-Innovationen binnen 12 Stunden
Es war vielleicht der ereignisreichste Tag in der noch jungen Geschichte der Künstlichen Intelligenz. Mit Google, OpenAI und Mistral haben gleich drei Anbieter ihre neuen KI-Modelle gestartet. Viele der Funktionen sind vor allem für Profi-Anwender interessant.
Das Wettrennen um die schnellsten und cleversten KI-Tools wird vom Tagesgeschäft zum Stundengeschäft. Mit Google, OpenAI und dem französischen Startup Mistral haben jetzt gleich drei Unternehmen innerhalb von gut zwölf Stunden die neuesten und weiter verbesserten Versionen ihre Modelle für Künstliche Intelligenz veröffentlicht.
Nur wenige Stunden zuvor hatte Nick Clegg, Metas President of Global Affairs, angekündigt, dass auch Version 3 von Llama, der KI-Plattform des Zuckerberg-Konzerns, innerhalb der nächsten Wochen startet. W&V verrät, was die Updates von Google, OpenAI und Mistral leisten.
Google Gemini Pro 1.5
In der neuesten Version kann Googles KI Audioinhalte verstehen. Diese Fähigkeit ermöglicht es ihr, Informationen aus Audiodateien wie Earnings Calls oder aus Videos zu extrahieren, ohne auf schriftliche Transkripte angewiesen zu sein. Laut Google übertrifft Gemini 1.5 Pro bereits jetzt die Leistung des größeren Modells Gemini Ultra, insbesondere bei der Verarbeitung komplexer Anweisungen ohne spezifisches Finetuning. Zunächst ist der Zugang auf Nutzer von Googles Profi-Werkzeugen Vertex AI und AI Studio beschränkt.
Zu den ersten Anwendern gehört WPP, die Google Gemini Pro 1.5 in all ihre Marketing-, Kreativ- und Mediaplanungstools einbauen. Davon profitieren dann unter anderem Marken wie Coca-Cola L'Oréal und Nestlé.
OpenAI GPT-4 Turbo
Beim neuen KI-Modell des ChatGPT-Erfinders dreht sich alles ums Thema Multimodalität. GPT-4 Turbo kann Videos, Bilder, Audio, Text und Code gleichzeitig verarbeiten und verstehen. Dadurch lernt die Software sozusagen, zu "sehen". Das soll vor allem für Entwickler als auch für Unternehmen ganz neue Möglichkeiten schaffen, in vielen Bereichen wie Chatbots, KI-gestützten Texten, Bildbearbeitung oder Codegenerierung.
Durch die Nutzung von vorkonfigurierten Modellen und APIs lässt sich die Entwicklungszeit deutlich verkürzen. Auch OpenAIs neuer KI-Turbo ist zunächst nur für professionelle Entwickler verfügbar. Aber laut des kalifornischen Unternehmens sollen die Fähigkeiten bald auch in ChatGPT für die Allgemeinheit bereitstehen. Zahlende Nutzer von Microsoft Copilot haben im Rahmen ihres 30-Dollar-Monatsabos bereits jetzt Zugang zu den Funktionen von GPT-4 Turbo.
Mixtral 8x22B
Das KI-Startup Mistral aus Paris, bei dem viele ehemalige Mitarbeiterinnen und Mitarbeiter von Meta und Google an Bord sind, hat sein neuestes Modell veröffentlicht. Mixtral 8x22B gilt als eines der bisher leistungsfähigsten Open-Source-KI-Modelle. Nachdem schon der dreimal kleinere Vorgänger Mixtral 8x7B in Benchmarks vor Metas Llama 2 gelandet war, soll die neue Version weiter zulegen – unter anderem durch ein enorm großes Kontextfenster mit 65.000 Token. Das beschreibt die Menge an Text, die sich gleichzeitig verarbeiten lässt.
Mistral setzt auf Open Source. Auch Entwickler anderer Unternehmen sollen in der Lage sein, auf der Plattform aufzusetzen. Der Code von Mixtral 8x22B ist per Torrent zum Download verfügbar. Die Open-Source-Strategie ist allerdings umstritten. Kritiker sehen darin ein potenzielles Risiko. Denn Entwickler können bei Software, die lokal auf Rechnern installiert ist, nicht eingreifen, um den Missbrauch ihrer Systeme zu verhindern oder Modelle bei Entdeckung von Schwachstellen vom Netz zu nehmen. Befürworter argumentieren dagegen, dass eine große Entwicklergemeinde schneller auf Probleme reagieren kann.
Die Grenzen der Technik
Ob sich die großen KI-Sprachmodelle auch weiterhin im aktuellen Tempo weiterentwickeln lassen, ist unter Experten umstritten. Elon Musk, Chef von Tesla und Twitter/X, hat jetzt bereits für Ende 2025 den Start einer "allgemeinen KI" prophezeit, die schlauer als der Mensch sein soll. O-Ton des umstrittenen Technik-Gurus: "KI ist die am schnellsten fortschreitende Technologie, die ich je gesehen habe. Die Zahl der KI-Hardware und der Computer, die speziell für Künstliche Intelligenz online gehen, steigt jedes Jahr um den Faktor 10, wenn nicht sogar alle sechs bis neun Monate."
Der KI-Forscher Yann LeCun widerspricht Musk: "Das ist einfach nicht der Fall. Wir haben KI-Systeme, die die Anwaltsprüfung bestehen – aber sie können nicht den Esstisch abräumen und die Spülmaschine einräumen. Wir haben Systeme, die Sprache manipulieren und die uns vorgaukeln, sie seien intelligent. Aber sie können die Welt nicht verstehen." Stattdessen, so LeCun, sollten Entwickler an der Vision einer KI arbeiten, die in der Lage ist, über die Welt nachzudenken und die Zukunft zu planen, anstatt nur Worte und Sprache zu verarbeiten.
Wer sind die Macherinnen und Macher, die 2024 prägen? ... Hier findest Du die W&V 100 Köpfe 2024.
Wenn du KI-Tools verstehen und in deine Arbeit erfolgreich anwenden willst, bist bei den Fortbildungsangeboten von W&V genau richtig. Hier gehts zu unseren Hands-on-Trainings.