Sprachmodelle#
Modell-Auswahl#
Im Prompt-Assistenten kannst du auswählen, welches Sprachmodell (LLM) du für die Aufgabe nutzen möchtest. Welche Modelle angezeigt werden, hängt davon ab, was dein Administrator gebucht hat. Die AI-Tools unterstützen zur Zeit die Modelle von OpenAI/Azure, Anthropic, Google, Mistral und Perplexity.
Nicht alle Modelle können die Werkzeuge wie „Webseiten besuchen“ oder „Charts erzeugen“ verwenden. Das ist in der folgenden Übersicht vermerkt. Einige Modelle können hochgeladene Bilder verarbeiten und zum Beispiel Texte extrahieren. Diese Modelle sind mit Vision gekennzeichnet.
OpenAI#
GPT-5.2 (Code, Agenten): Vision. Verbesserte Version von GPT-5.1. Sehr gut für komplexe Aufgaben, Analysen und Software-Entwicklung. Benötigt exakte Prompts. Vision. Wissen bis August 2025.
GPT-5.1 (Code, Agenten): Vision. Stärkstes Modell von OpenAI. Sehr gut für komplexe Aufgaben, Analysen und Software-Entwicklung. Benötigt exakte Prompts. Vision. Wissen bis Oktober 2024.
GPT-5 (Texte, Code): Vision. Starkes Modell von OpenAI. Erwartet exakte Prompts. Schaltet intern bei Bedarf „starkes Nachdenken“ ein. Kann 400.000 Token auf einmal verarbeiten. Preise wie GPT-4 Omni. Wissen bis Oktober 2024.
GPT-5 Chat (Texte): Vision. Das gleiche Modell wie in ChatGPT. Kann keine Tools verwenden. Kann also nicht Suchen. Kontext-Fenster: 400.000 Token. Wissen bis September 2024.
GPT-5 mini (Texte): Vision. Schnelle Version von GPT-5. Kontext-Fenster: 400.000 Token. Wissen bis Mai 2024.
GPT-5 nano (Texte): Vision. Sehr schnell und günstig. Kontext-Fenster: 400.000 Token. Wissen bis Mai 2024.
GPT-4.1 (Texte): Vision. Sehr großes Kontext-Fenster: Kann eine Million Token auf einmal verarbeiten. 20% günstiger als der Vorgänger GPT-4 Omni. Wissen bis Juni 2024.
GPT-4 Omni (Texte): Vision. Ein sehr leistungsfähiges Modell für professionelle Anwendungen. Es enthält Informationen bis Oktober 2023.
GPT-4 Omni Search (Recherche): GPT-4 Omni verbunden mit einer Internetsuche. Bei jedem Aufruf wird automatisch eine Internetsuche ausgeführt. Kann keine Tools verwenden.
GPT-4 Omni mini: Vision. Schnell - der kleine Bruder von GPT-4 Omni. Es enthält Informationen bis Oktober 2023.
o3 mini: Das kleine Reasoning-Modell, das ‚nachdenken‘ kann. Es ist sehr schnell. Die Preise sind halb so hoch wie bei GPT-4 Omni. Informationen bis Oktober 2023.
o1 mini: Optmiert für Deep Reasoning. Geeignet für komplexe Planungs-Aufgaben. Die kleine Version von o1. Es ist schnell. Die Preise sind halb so hoch wie bei GPT-4 Omni. Informationen bis Oktober 2023. Kann keine Tools verwenden.
Anthropic#
Alle Anthropic-Modelle haben eine integrierte Internetsuche.
Claude 4.5 Opus (komplexe Aufgaben, Agenten): Vision. Geeignet für komplexe Arbeitsabläufe und Agenten. Die Tokens kosten knapp das Doppelte im Vergleich zu Claude 4.5 Sonnet. Es enthält Informationen bis März 2025.
Claude 4.5 Sonnet (Reports, Code, Agenten): Vision. Starkes Anthropic-Modell. Sehr gut für Code-Erstellung und Texte. Es enthält Informationen bis Januar 2025.
Claude 4.5 Haiku (schnell, fast das Niveau von Claude 4): Vision. Das kleine und schnelle Modell von Anthropic. Es enthält Informationen bis Februar 2025.
Claude 4 Sonnet (Texte, Reports, Suche, Code): Vision. Das stärkste Anthropic-Modell. Sehr gut für Code-Erstellung. Es enthält Informationen bis Oktober 2024.
Google#
Mit den Gemini-Modellen von Google kann die Google KI-Suche genutzt werden. Alle Modelle können Eingabe-Bilder erkennen und verarbeiten.
Gemini 3 Pro (Texte, komplexes Denken, Code): Vision. Das stärkste KI-Modell von Google. Komplexes Denken, kreatives Schreiben, Recherche, Agenten, Datenanalyse, Programmieren. Google KI-Suche. Internes Wissen bis Januar 2025.
Gemini 2.5 Pro (Texte, Denken, Code): Vision. Verbessertes Denken und Schlussfolgern, multimodales Verständnis, erweitertes Programmieren. Google KI-Suche. Internes Wissen bis Januar 2025.
Gemini 2.5 Flash (Texte, Google KI-Suche): Vision. Starkes und schnelles Reasoning-Modell, das die Google KI-Suche verwenden kann. Internes Wissen bis Januar 2025.
Gemini 2.5 Flash Lite (schnell, günstig): Vision. Sehr schnelles und günstiges Modell für einfache Aufgaben. Google KI-Suche. Internes Wissen bis Januar 2025.
Mistral#
Die Modelle der französischen Firma Mistral AI mit Servern in Europa.
Mistral Large (Texte): Stärkstes Modell von Mistral zum Generieren von Texten und für komplexe Aufgaben mit Reasoning. Etwa halb so teuer wie GPT-4o.
Mistral Medium (Texte): Das mittlere Modell von Mistral zum Generieren von Texten völlig ausreichend.
Mistral Small: Vision. Kleines und schnelles Modell. Die Preise liegen unter denen von GPT-4o mini.
Codestral (Programmieren): Speziell trainiert zum Programmieren: Python, Javascript, Typescript. Etwas teurer als GPT-4o mini. Kann 256k Token verarbeiten.
Perplexity#
Die Perplexity-Modelle kombinieren Suchmaschine und Sprachmodell. Sie eignen sich hervorragend für Recherchen. Abgerechnet wird nach Token und Suchen. Bei einem Aufruf können eine oder mehrere Suchen durchgeführt werden.
Die Perplexity-Modelle können keine Tools verwenden.
Sonar Reasoning pro (Recherche): Reasoning-Modell, das zuerst über eine Aufgabe nachdenkt und die Internetsuche verwendet.
Sonar Deep Research (Tiefenrecherche): Für aufwendige Recherchen. Je nach Aufgabenstellung kann das Modell 5-10 Minuten unterwegs sein.
Sonar: Kleine und schnellere Version von Sonar.
Lege dir bei einem oder mehreren dieser KI-Provider einen Account an und übermittele die API-Keys an das Radio Creator Team.
Compliance & Datenschutz#
Die Server auf denen die AI-Tools gehostet werden, stehen in Limburg in Hessen (Deutschland). Für alle KI-Aufgaben werden deine Prompts und die Antworten an die Server der jeweiligen KI-Anbieter in der EU oder den USA gesendet. Das geschieht über eine Software-Schnittstelle (API) und die Daten werden nicht zum Training der Modelle verwendet.
Falls die Richtlinien deiner Organisation es erfordern, dass die Daten nur in der EU verarbeitet werden, kannst du die KI-Modelle von Microsoft Azure OpenAI und Mistral AI nutzen.
Accounts erstellen#
Für den Betrieb der AI-Tools sind API-Keys bei den verschiedenen KI-Anbietern erforderlich. Wenn du Gemini von Google, Mistral, Anthropic, OpenAI oder Perplexity nutzen möchtest, musst du einen Account bei diesen Anbietern erstellen. Dein Token-Verbrauch wird dann über diese Accounts abgerechnet.
Du kannst Sprachmodelle aber auch ohne eigenen Account nutzen. Wir richten dann alles für dich ein und die Abrechnung erfolgt über dein Token-Guthaben.
OpenAI Account#
Für die KI-Modelle von OpenAI (ChatGPT) gibt es zwei Möglichkeiten: Du nutzt sie direkt bei OpenAI in den USA oder über Microsoft Azure in Europa (Schweden). Die Anleitung für Microsoft Azure OpenAI findest du weiter unten.
Eröffne zunächst ein kostenloses Konto bei OpenAI: https://platform.openai.com/signup
Erstelle dann auf der OpenAI-Plattform den API-Key für die AI-Tools und übermittele ihn an das Radio Creator Team. Der Key hat dieses Format: sk-1234567890abcdef1234567890abcdef
Account für GPT Image verifizieren#
Um den Bildgenerator GPT Image nutzen zu können, muss der Account einmalig verifiziert werden. Das geht ganz einfach über diesen Link, der zu den Einstellungen in deinem OpenAI-Account führt:
https://platform.openai.com/settings/organization/general
Klicke auf „Verify Organization“. Danach kann es bis zu 15 Minuten dauern, bis GPT Image freigegeben wird.
Microsoft Azure OpenAI Account#
Die Einrichtung von Sprachmodellen bei Microsoft ist leider etwas umständlich. Dein Administrator kann dir helfen und wenn es Probleme gibt, wende dich an das Radio Creator Team.
Zunächst ist ein kostenloses Microsoft Azure-Konto erforderlich. Dort muss eine neue Ressource erstellt werden: https://learn.microsoft.com/de-de/azure/ai-services/openai/how-to/create-resource?pivots=web-portal
Um die Microsoft KI-API nutzen zu dürfen, muss man ein Formular ausfüllen, indem man erklärt, was man mit der KI machen möchte. Microsoft möchte sich damit vor Missbrauch schützen. Es kann danach einen Tag dauern, bis man Zugriff bekommt. Zum Formular: https://customervoice.microsoft.com/Pages/ResponsePage.aspx?id=v4j5cvGGr0GRqy180BHbR7en2Ais5pxKtso_Pz4b1_xUNTZBNzRKNlVQSFhZMU9aV09EVzYxWFdORCQlQCN0PWcu
Jetzt den API-Endpunkt und eine Ressource mit KI-Modellen einrichten. Nicht alle KI-Modelle sind auf allen Microsoft Regional-Servern vorhanden. Die für die AI-Tools erforderlichen Modelle (GPT 3.5, GPT4, DALL-E3) sind in der Region Europe/Schweden verfügbar. Deshalb bitte diese Region wählen.
Beim Einrichten der Ressource muss man den Modellen Namen geben. Bitte diese Namen verwenden: gpt-4o, gpt-4.1, gpt-4o-mini, gpt-5-chat, o3-mini, o1-mini, gpt-image-1, dall-e-3.
Anthropic Account#
Ehemalige Mitarbeiter von OpenAI haben im US-Bundesstaat Delaware die Firma Anthropic gegründet. Sie haben die Claude-Modelle entwickelt. Die Leistungsfähigkeit ist mit der von OpenAI vergleichbar.
Anthropic-Konto erstellen: https://console.anthropic.com/
In der Konsole unter API keys einen Key erstellen und an das Radio Creator Team übermitteln. Der Key hat dieses Format: sk-ant-api12-3456…
Google Account#
Die Gemini-Modelle von Google zählen zu den derzeit leistungsfähigsten LLMs. Sie können die Google KI-Suche nutzen, um Informationen aus dem Internet zu erhalten.
Um Gemini und die Google KI-Suche nutzen zu können, ist ein API-Schlüssel erforderlich. Hier geht es zur Anleitung: https://ai.google.dev/gemini-api/docs/api-key?hl=de
API-Key in Google AI Studio erstellen: https://aistudio.google.com/app/apikey
WICHTIG: Verwende unbedingt den kostenpflichtigen Tarif. Nur dann werden deine Daten nicht für Trainingszwecke verwendet. Im Google AI Studio kannst du bei jedem API-Schlüssel den Tarif auswählen.
Mistral Account#
Bei großen Sprachmodellen (LLM) ist Mistral AI in Europa führend. Die Gründer waren zuvor Forscher bei Meta und Google. Neben Open Source-Modellen wie Mistral Small bietet Mistral auch kommerzielle Modelle an.
Codestral ist ein Modell, das speziell für Programmieraufgaben trainiert wurde. Es kann 256k Token verarbeiten. Das große Reasoning-Modell Mistral Large ist für komplexe Aufgaben geeignet. Die Leistungsfähigkeit beim „Nachdenken“ und nutzen von Tools liegt etwas unter Anthropic und OpenAI.
Ein großer Vorteil von Mistral AI ist, dass die Server in Europa stehen. Die Datenverarbeitung erfolgt in der EU.
Mistral-Konto erstellen: https://console.mistral.ai/
In der Konsole unter API-Schlüssel einen Key erstellen und an das Radio Creator Team übermitteln.
Perplexity Account#
Das Startup aus San Francisco kombiniert ein Sprachmodell mit einer Suchmaschine. Perplexity verwendet dazu einen eigenen Crawler, den Perplexitybot, der regelmäßig das Internet durchsucht.
Die Sprachmodelle haben Reasoning-Fähigkeiten, überlegen also zuerst, wie sie eine Aufgabe angehen. Perplexity ist damit hervorragend für Recherchen geeignet.
Am weitesten geht dabei das Modell Sonar Deep Research. Es kann umfangreiche Recherchen durchführen und benötigt dafür 5-10 Minuten.
Abgerechnet wird nach Token und Suchen. Pro Aufgabe können eine oder mehrere Suchen ausgeführt werden.
Perplexity-Konto erstellen: https://docs.perplexity.ai/guides/getting-started
Kosten und Guthaben#
Während du die AI-Tools verwendest, fallen Kosten bei verschiedenen Anbietern an. Die KI-Nutzung wird üblicherweise in Tokens gemessen. Ein Token entspricht etwa 4 Zeichen Text oder 0,75 Wörtern.
Unterschieden wird nach Eingabe-Tokens (die Prompts, die du eingibst) und Ausgabe-Tokens (die Antworten der KI).
Bei einzelnen Modellen gibt es noch so genannte Reasoning-Tokens. Diese werden verwendet, wenn die KI „nachdenkt“. Oder Citation-Tokens, um Quellen zu zitieren.
Außerdem werden Werkzeuge, wie die Google KI-Suche oder Google-Maps berechnet.
Und bei jedem Sprachmodell sind die Kosten, je nach Leistungsfähigkeit, unterschiedlich hoch:
Anthropic: https://platform.claude.com/docs/en/about-claude/pricing
Google Gemini: https://ai.google.dev/gemini-api/docs/pricing?hl=de
Mistral-Modelle: https://mistral.ai/pricing#api-pricing
Perplexity: https://docs.perplexity.ai/getting-started/pricing
Sprachmodelle mit Guthaben nutzen#
Falls deine Organisation keinen eigenen Account bei einem KI-Anbieter hat, kannst du die Sprachmodelle dennoch nutzen. Wir richten diese Modelle für dich ein und die Abrechnung erfolgt über dein Token-Guthaben.
Ein Beispiel: Deine Organisation hat keinen eigenen Account bei Google. Du kannst trotzdem die Google-KI-Suche und Google Maps für die Recherche verwenden. Die Abrechnung dafür erfolgt über das Token-Guthaben.
Wir berechnen die Preise nach den offiziellen Tarifen der Anbieter und erheben für die Verwaltung eine Service-Gebühr von 20 Prozent. Mehr zu Guthaben und Abrechnung erfährst du im Abschnitt Guthaben und Abrechnung.