Sprachmodelle#

Modell-Auswahl#

Im Prompt-Assistenten kannst du auswählen, welches Sprachmodell (LLM) du für die Aufgabe nutzen möchtest. Welche Modelle angezeigt werden, hängt davon ab, was dein Administrator gebucht hat. Die AI-Tools unterstützen zur Zeit die Modelle von OpenAI/Azure, Anthropic, Mistral und Perplexity.

Nicht alle Modelle können die Werkzeuge wie „Webseiten besuchen“ oder „Charts erzeugen“ verwenden. Das ist in der folgenden Übersicht vermerkt. Einige Modelle können hochgeladene Bilder verarbeiten und zum Beispiel Texte extrahieren. Diese Modelle sind mit Vision gekennzeichnet.

OpenAI

GPT-4.1 (Texte): Vision. Stärkstes Modell von OpenAI. Kann eine Million Token auf einmal verarbeiten. 20% günstiger als der Vorgänger GPT-4 Omni. Wissen bis Juni 2024.
GPT-4 Omni (Texte): Vision. Ein sehr leistungsfähiges Modell für professionelle Anwendungen. Es enthält Informationen bis Oktober 2023.
GPT-4 Omni Search (Recherche): GPT-4 Omni verbunden mit einer Internetsuche. Bei jedem Aufruf wird automatisch eine Internetsuche ausgeführt. Kann keine Tools verwenden.
GPT-4 Omni mini: Vision. Schnell - der kleine Bruder von GPT-4 Omni. Es enthält Informationen bis Oktober 2023.
o3 mini: Das kleine Reasoning-Modell, das ‚nachdenken‘ kann. Es ist sehr schnell. Die Preise sind halb so hoch wie bei GPT-4 Omni. Informationen bis Oktober 2023.
o1 mini: Optmiert für Deep Reasoning. Geeignet für komplexe Planungs-Aufgaben. Die kleine Version von o1. Es ist schnell. Die Preise sind halb so hoch wie bei GPT-4 Omni. Informationen bis Oktober 2023. Kann keine Tools verwenden.

Anthropic

Alle Anthropic-Modelle haben eine integrierte Internetsuche.

Claude 4 Sonnet (Texte, Reports, Suche, Code): Vision. Das stärkste Anthropic-Modell. Sehr gut für Code-Erstellung. Es enthält Informationen bis Oktober 2024.
Claude 3.7 Sonnet (lange Texte / Reports): Vision. Starkes Anthropic-Modell mit integriertem Extended Thinking-Modus. Es enthält Informationen bis Oktober 2024.
Claude 3.5 Sonnet: Vision. Ausgewogenes Allround-Modell für Code und Business-Anwendungen. Es ist gesprächiger als GPT-4 Omni und etwas langsamer. Es enthält Informationen bis April 2024.
Claude 3.5 Haiku: Vision. Das kleine und schnelle Modell von Anthropic. Vergleichbar mit GPT4 Omni mini. Es enthält Informationen bis Juli 2024. Die Kosten liegen um den Faktor 4 höher als beim Vorgänger Claude 3 Haiku.

Mistral

Die Modelle der französischen Firma Mistral AI mit Servern in Europa.

Mistral Large (Texte): Stärkstes Modell von Mistral zum Generieren von Texten und für komplexe Aufgaben mit Reasoning. Etwa halb so teuer wie GPT-4o.
Mistral Small: Vision. Kleines und schnelles Modell. Die Preise liegen unter denen von GPT-4o mini.
Codestral (Programmieren): Speziell trainiert zum Programmieren: Python, Javascript, Typescript. Etwas teurer als GPT-4o mini. Kann 256k Token verarbeiten.

Perplexity

Die Perplexity-Modelle kombinieren Suchmaschine und Sprachmodell. Sie eignen sich hervorragend für Recherchen. Abgerechnet wird nach Token und Suchen. Bei einem Aufruf können eine oder mehrere Suchen durchgeführt werden.

Die Perplexity-Modelle können keine Tools verwenden.

Sonar Reasoning pro (Recherche): Reasoning-Modell, das zuerst über eine Aufgabe nachdenkt und die Internetsuche verwendet.
Sonar Deep Research (Tiefenrecherche): Für aufwendige Recherchen. Je nach Aufgabenstellung kann das Modell 5-10 Minuten unterwegs sein.
Sonar: Kleine und schnellere Version von Sonar.
R1: Das chinesische R1-Modell als Offline-Version. Es kann nicht im Internet suchen. Die Anfragen werden auf Servern in den USA verarbeitet.

Veraltet

GPT-4 Turbo: Enthält Trainingsdaten bis Dezember 2023. (Nicht mehr in den AI-Tools.)
GPT-3.5 Turbo: Kann einfache Textaufgaben erfüllen. Der Wissensstand reicht bis September 2021. (Nicht mehr in den AI-Tools.)
Claude 3 Haiku: Kleines Anthropic-Modell und Vorgänger der Version 3.5. Es enthält Informationen bis August 2023. (Nicht mehr in den AI-Tools.)

Lege dir bei einem oder mehreren dieser KI-Provider einen Account an und übermittele die API-Keys an das Radio Creator Team.

OpenAI#

Vorteil: Es sind immer die neuesten Modelle verfügbar. Nachteil: Die Server stehen in den USA und die Daten werden dort verarbeitet.

Auf der OpenAI-Plattform wird ein API-Key für die AI-Tools erstellt. Dieser Key wird an das Radio Creator Team übermittelt. Der Key hat dieses Format: sk-1234567890abcdef1234567890abcdef

OpenAI-Konto erstellen: https://platform.openai.com/signup

Account für GPT Image verifizieren#

Um den Bildgenerator GPT Image nutzen zu können, muss der Account einmalig verifiziert werden. Das geht ganz einfach über diesen Link, der zu den Einstellungen in deinem OpenAI-Account führt:

https://platform.openai.com/settings/organization/general

Klicke auf „Verify Organization“. Danach kann es bis zu 15 Minuten dauern, bis GPT Image freigegeben wird.

Microsoft Azure OpenAI#

Vorteil: Europäische Server und Datenverarbeitung. Nachteile: Die Modelle sind nicht immer auf dem neuesten Stand. Die Einrichtung ist umständlich.

Zunächst ist ein kostenloses Microsoft Azure-Konto erforderlich. Dort muss eine neue Ressource erstellt werden: https://learn.microsoft.com/de-de/azure/ai-services/openai/how-to/create-resource?pivots=web-portal
Um die Microsoft KI-API nutzen zu dürfen, muss man ein Formular ausfüllen, indem man erklärt, was man mit der KI machen möchte. Microsoft möchte sich damit vor Missbrauch schützen. Es kann danach einen Tag dauern, bis man Zugriff bekommt. Zum Formular: https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUNTZBNzRKNlVQSFhZMU9aV09EVzYxWFdORCQlQCN0PWcu
Jetzt den API-Endpunkt und eine Ressource mit KI-Modellen einrichten. Nicht alle KI-Modelle sind auf allen Microsoft Regional-Servern vorhanden. Die für die AI-Tools erforderlichen Modelle (GPT 3.5, GPT4, DALL-E3) sind in der Region Europe/Schweden verfügbar. Deshalb bitte diese Region wählen.
Beim Einrichten der Ressource muss man den Modellen Namen geben. Bitte diese Namen verwenden: gpt-4-turbo, gpt-35-turbo, dall-e-3.

Anthropic#

Ehemalige Mitarbeiter von OpenAI haben im US-Bundesstaat Delaware die Firma Anthropic gegründet. Sie haben die Modelle Claude 3.7 Sonnet, Claude 3.5 Sonnet und Claude 3.5 Haiku entwickelt. Diese Modelle sind in den AI-Tools verfügbar.

Die Leistungsfähigkeit der Anthropic-Modelle ist mit der von OpenAI vergleichbar. Die Modelle sind etwas langsamer und gesprächiger. Die Token-Preise sind etwas günstiger.

Anthropic-Konto erstellen: https://console.anthropic.com/
In der Konsole unter API keys einen Key erstellen und an das Radio Creator Team übermitteln. Der Key hat dieses Format: sk-ant-api12-3456…

Mistral#

Bei großen Sprachmodellen (LLM) ist Mistral AI in Europa führend. Die Gründer waren zuvor Forscher bei Meta und Google. Neben Open Source-Modellen wie Mistral Small bietet Mistral auch kommerzielle Modelle an. Codestral ist ein Modell, das speziell für Programmieraufgaben trainiert wurde. Es kann 256k Token verarbeiten. Das große Reasoning-Modell Mistral Large ist für komplexe Aufgaben geeignet. Die Leistungsfähigkeit beim „Nachdenken“ und nutzen von Tools liegt etwas unter Anthropic und OpenAI.

Ein großer Vorteil von Mistral AI ist, dass die Server in Europa stehen. Die Datenverarbeitung erfolgt in der EU.

Mistral-Konto erstellen: https://console.mistral.ai/
In der Konsole unter API-Schlüssel einen Key erstellen und an das Radio Creator Team übermitteln.

Perplexity#

Das Startup aus San Francisco kombiniert ein Sprachmodell mit einer Suchmaschine. Perplexity verwendet dazu einen eigenen Crawler, den Perplexitybot, der regelmäßig das Internet durchsucht.

Die Sprachmodelle haben Reasoning-Fähigkeiten, überlegen also zuerst, wie sie eine Aufgabe angehen. Perplexity ist damit hervorragend für Recherchen geeignet.

Am weitesten geht dabei das Modell Sonar Deep Research. Es kann umfangreiche Recherchen durchführen und benötigt dafür 5-10 Minuten.

Abgerechnet wird nach Token und Suchen. Pro Aufgabe können eine oder mehrere Suchen ausgeführt werden.

Zusätzlich stellt Perplexity das chinesische Modell R1 als Offline-Version zur Verfügung. Es kann nicht im Internet suchen. Die Anfragen werden auf den Perplexity-Servern in den USA verarbeitet.

Perplexity-Konto erstellen: https://docs.perplexity.ai/guides/getting-started