Aktuelles

Eine neue Super-KI? Google stellt Gemini vor

Ist Google Gemini die bessere KI?Dass in der Welt der Künstlichen Intelligenz ein harter Konkurrenzkampf tobt, ist kein Geheimnis. ChatGPT, Microsoft und deren Kooperation hatten bislang die Nase vorn und Konkurrent Google konnte mit seiner generativen KI Bard nicht wirklich punkten. Aber auch andere Player sind deutlich performanter, darunter Elon Musk und Firmen wie Samsung, die mit eigenen Modellen experimentieren. Im Gegenteil, die Mutter aller Suchmaschinen scheint in Sachen KI ganz schön ins Hintertreffen geraten zu sein und der Erfolg der Anderen bedroht sogar das Kerngeschäft, die Google-Suche - einfach, weil die Rückmeldungen von ChatGPT und Co. besser und zielführender sind.

Diese Umstände haben in den letzten Monaten für heftige Betriebssamkeit in den Laboren von Google gesorgt. Nun kündigt der Suchmaschinenriuese nicht weniger als eine Revolution in der Welt der künstlichen Intelligenz an und präsentiert eine Reihe von Sprachmodellen der nächsten Generation (LLM), die das Unternehmen aus Mountain View wieder auf Kurs bringen sollen. Gemini heißt das Hexenwerk, dass das Ruder herumreissen soll und zeitnah in Googles Suchmaschine, Google-Werbeprodukte, den Chrome-Browser und in viele weitere Anwendungen auf der ganzen Welt integriert wird, so Google CEO Sundar Pichai. Der ist davon überzeugt, dass Gemini "besser ist als andere Modelle".

Was ist Gemini?

Gemini-Modelle sind multimodal, d. h. sie können verschiedene Formen von Daten verstehen und erzeugen, darunter Text, Bilder, Code und sogar Musik. Selbst Gesten kann das Werkzeug verstehen und verarbeiten. Das macht die KI offenbar deutlich vielseitiger als etwa ChatGPT. Nutzer können viele Arbeitsschritte mit einem einzigen Tool erledigen, müssen nicht zwischen verschiedenen Anwendungen hin- und herspringen.

Gemini ist in der Lage, verblüffend realistische Bilder und Videos zu erstellen. Mit nur wenigen Zeilen Code (Prompts) ist es möglich, Produktmockups, Illustrationen oder sogar ganze Animationen und Videosequenzen zu erstellen.

Ebenso soll Gemini nie dagewesene Textinhalte generieren können: Von Blogbeiträgen über Produktbeschreibungen, von Marketingtexten bis hin zu Musikstücken soll Gemini Content ausspucken, der bisher Wunschtraum von Content-Creatoren war. Ebenso sollen sich Sprachbarrieren Überwinden lassen, die Algorithmen sind darauf getrimmt, dank einer präzisen Echtzeit-Übersetzung Inhalte in jeder Sprache der Welt auszugeben. Doch die KI soll noch mehr können, beispielsweise im Bereich der Datenanalyse: Gemini soll Erkenntnisse aus komplexen Datensätzen extrahieren können und Unternehmen dabei helfen, bessere Entscheidungen zu treffen und Probleme effektiver zu lösen. Darüber hinaus kann Gemini in bestehende Unternehmensprozesse eingebunden werden und sich wiederholende Aufgaben automatisieren.

Besonders Kreative sollen von der KI profitieren: Schriftsteller, Musiker und bildende Künstler sollen individuelle, interaktive, lebendige  und bisher nicht gekannte Multimedia-Inhalte erzeugen können.

Gemini soll in drei verschiedenen Versionen erscheinen:

  • Gemini Nano, für mobile Anwendungen, insbesondere für Nutzer des Google-Pixel-Smartphones.
  • Gemini Pro werkelt für Bard und soll in naher Zukunft in weitere KI-Dienste von Google integriert werden.
  • Gemini Ultra ist das ambitionierteste und leistungsfähigste Modell, mit denen Unternehmen hochkomplexe Aufgaben lösen können - bisher ressourcenintensiv und langsam. Gemini Ultra soll bereits im nächsten Jahr den KI-Markt umkrempeln.
Hands-on with Gemini: Interacting with multimodal AI (Quelle: Google)

Entwickler und Unternehmenskunden sollen ab 13. Dezember über das Google Generative AI Studio oder Vertex AI auf Gemini Pro zugreifen können, so das IT-Portal The Verge.

08.12.2023

RSS Newsfeed
Alle News vom TAGWORX.NET Neue Medien können Sie auch als RSS Newsfeed abonnieren, klicken Sie einfach auf das XML-Symbol und tragen Sie die Adresse in Ihren Newsreader ein!