Aktuelles

OpenAI stellt neues KI-Model GPT-4o vor - und es ist kostenlos

GPT-4oOpenAI, der Platzhirsch unter den KI-Unternehmen, hat sein neuestes KI-Modell namens GPT-4o vorgestellt. Bei der Präsentation in San Francisco erklärte Mira Murati, ihres Zeichens Technikchefin von OpenAI, dass das neue Modell deutlich verbesserte Fähigkeiten in den Bereichen Text, Bild und Audio bietet. „GPT-4o kann Sprache, Text und Bild verarbeiten“ so Murati. Was so bescheiden klingt, stellt tatsächlich eine Revolution im Umgang mit künstlicher Intelligenz dar: Man kann sich in Echtzeit per Sprache mit GPT-4o unterhalten, die KI ist in der Lage, emotionale Hinweise zu lesen und auf visuelle Eingaben zu reagieren.

Zudem kündigte Murati an, dass GPT-4o allen Nutzern kostenlos zur Verfügung gestellt wird, ein ChatGPT Plus Abonnement sei nicht mehr nötig.

Entsprechend heftig waren in den letzten Stunden die Reaktionen auf die Ankündigungen von OpenAI.

Die Fakten:

  • GPT-4o ist das neueste und leistungsfähigste Sprachmodell von OpenAI.
  • Es baut auf dem Vorgängermodell GPT-4 auf, das im Sommer 2023 veröffentlicht wurde, und bietet eine erhebliche Leistungssteigerung.
  • GPT-4o enthält mehr Parameter als GPT-3.5 und GPT-4, was seine Fähigkeit, komplexe Sprachaufgaben zu bewältigen, erhöht. Damit ist GPT-4o deutlich effektiver, als seine Vorgängermodelle.
  • Das Modell wurde mit einer wesentlich größeren und diverseren Datenmenge trainiert, einschließlich Web-Texten, Büchern, Zeitschriften, akademischen Arbeiten und anderen hochqualitativen Quellen.

Laut OpenAI übertrifft GPT-4o GPT-4 deutlich in Bezug auf Allgemeinwissen, Textverständnis, Problemlösefähigkeiten und kreative Fähigkeiten.

Omni

Das „o“ in GPT-4o steht für "omni". Denn OpenAI arbeitet an einer viel natürlicheren Interaktion zwischen Mensch und Computer als das etwa bei GPT-3 der Fall war - also sind als Eingabe beliebige Kombinationen der von Murati genannten Medien möglich.

Besonders die Möglichkeiten der Spracheingabe lassen aufhorchen. Benutzer können per ChatGPT beispielsweise eine Frage stellen und die KI sogar unterbrechen, während sie antwortet. Das Modell reagiert laut OpenAI "in Echtzeit" und kann sogar Nuancen in der Stimme des Nutzers erkennen, indem es Stimmen in "einer Reihe verschiedener emotionaler Stile" (einschließlich Gesang) erzeugt.

GPT-4o verbessert insbesondere die "Sehfähigkeiten" von ChatGPT. Anhand eines Fotos oder eines Screenshots kann ChatGPT nun schnell Fragen auf Basis eines Bildes beantworten, etwa "Was passiert in diesem Software-Code?" bis hin zu "Wie heißt die Marke des Hemdes, dass diese Person trägt".

Möglichkeiten und Anwendungen

  • GPT-4o kann für eine Vielzahl von Aufgaben eingesetzt werden, darunter das Schreiben von Texten aller Art (z.B. Aufsätze, Berichte, Geschichten), das Beantworten von Fragen, das Lösen von Problemen, die Erstellung von Zusammenfassungen und Überblicken sowie die Durchführung von Analysen und Forschungsarbeiten.
  • Das Modell zeigt beeindruckende Fähigkeiten im logischen Denken, im Verständnis von Kontexten und Zusammenhängen sowie im kreativen und innovativen Problemlösen.
  • GPT-4o kann in verschiedensten Branchen und Anwendungsfeldern eingesetzt werden, z.B. in der Bildung, im Gesundheitswesen, in der Forschung, im Journalismus, im Marketing und in der Produktentwicklung.
  • Es ist nicht vorgesehen, dass GPT-4o mit Hilfe von DALL-E im freien Modus Bilder erstellen kann. Die DALL-E-Funktionen Benutzern der Plus-, Team- und Enterprise-Tarife vorbehalten. Allerdings kann GPT-4o Bildinhalte lesen, verarbeiten und in die Textausgabe einbeziehen.
  • Ebenso gibt es zeitliche Beschränkungen im freien Modus. GPT-4o lässt sich nur für eine begrenzte Anzahl von Anfragen innerhalb eines Zeitfensters von drei Stunden verwenden. Nutzer werden benachrichtigt, wenn das Limit erreicht ist und bietet an, die Konversation mit GPT-3.5 fortzusetzen oder auf ChatGPT Plus zu aktualisieren.

Nutzung und Verfügbarkeit

Nachdem GPT-4o bis jetzt nur ausgewählten Forschungseinrichtungen und Unternehmen zur Verfügung stand, die mit OpenAI zusammenarbeiten, soll das verbesserte Modell „in den kommenden Wochen“ allen Nutzern zur Verfügung stehen. Natürlich werden zahlende Kunden nach wie vor bevorzugt bedient können mehr Anfragen pro Tag stellen dürfen, als nicht zahlende Nutzer.

OpenAI betont, dass der Einsatz von GPT-4o mit hoher Verantwortung und Sorgfalt erfolgen muss, um mögliche negative Auswirkungen zu vermeiden.

Insgesamt stellt GPT-4o einen bedeutenden Fortschritt in der Entwicklung leistungsfähiger Sprachmodelle dar und bietet vielfältige Möglichkeiten für Forschung, Innovation und praktische Anwendungen. Die sorgfältige und ethische Nutzung des Modells wird eine zentrale Herausforderung für OpenAI und dessen Nutzer sein.

Übrigens: Vorgänger GPT4 steht bereits seit längerer Zeit allen Microsoft-Copilot-Nutzern zur Verfügung, zwar eingeschränkt, aber ebenfalls gratis.

Mehr Daten und Fakten zu KI-Modellen gibt es bei artificialanalysis.ai.

Foto: OpenAI

14.05.2024

RSS Newsfeed
Alle News vom TAGWORX.NET Neue Medien können Sie auch als RSS Newsfeed abonnieren, klicken Sie einfach auf das XML-Symbol und tragen Sie die Adresse in Ihren Newsreader ein!