Kategorie: ‘Ritchy’
Erster Produktivrelease nach öffentlicher Testphase [1.0.0]
29. Juni 2026 | von Melisa Berisha
Erste Hauptversion des einsatzfähigen Produkts nach Abschluss der öffentlichen Testphase.
Funktionen:
- Query Planner – Überarbeitung des RAG-Retrievals: Ein vorgeschalteter, ressourcenschonender LLM-Aufruf (gpt-5.4-mini) erzeugt vor der Dokumentensuche eine bereinigte, themenreine Suchanfrage und ersetzt die bisherige embeddingbasierte Heuristik zur Themenwechsel-Erkennung. Ergebnis: präzisere RAG-Treffer und keine Themenvermischung mehr (z. B. die Verschmelzung von VPN und HPC zu einer fehlerhaften Anfrage). Vollständig zur Laufzeit über einen neuen Reiter im Env Manager konfigurierbar; robuster Fallback, der einen Chat bei Planner-Fehler oder Timeout nie unterbricht.
- Themenspezifische Suchsprache: HPC-/Cluster-Anfragen werden auf Englisch durchsucht (die Wissensdatenbank ist englischsprachig), während die Antwort in der Sprache des Nutzers verbleibt.
- Expliziter Sprachwechsel: Aufforderungen wie „answer in English“ oder „auf Deutsch bitte“ wechseln nun die Antwortsprache.
- Präzisere Störungserkennung: Ein Störungsblock wird nur noch eingeblendet, wenn der Nutzer tatsächlich nach einer Störung fragt, und nicht bereits bei der bloßen Erwähnung eines Dienstes.
- Screenshot-Upload (Vision-Unterstützung): Bilder lassen sich per Einfügen, Dateiauswahl oder Drag-and-drop anhängen. Der Client skaliert auf WebP herunter, der Server validiert und kodiert die Daten über Pillow neu. Screenshots bleiben über Folgefragen hinweg im Kontext; Aufbewahrungsbereinigung nach konfigurierbarer Anzahl von Tagen.
- Dark Mode: Neues Theme-System mit dunklem Stylesheet und Umschaltfunktion.
- Testfälle pro Nachricht und promptfoo-Export: Administratoren können einen Frage-Antwort-Turn als Testfall markieren, die erwartete Antwort sowie die korrekten Dokumentationslinks erfassen und alles als promptfoo-kompatible YAML-Datei für die automatisierte Qualitätsbewertung exportieren.
Intern/Architektur
- Die monolithische bot.py (775 Zeilen) wurde in ein strukturiertes Paket app/bot/ aufgeteilt (pipeline, client, search, language, tokens, incidents, query_planner).
- routes.py wurde in Unterpakete unter app/routes/ modularisiert.
- Integrierter Deployment-Webhook (seko_deploy_webhook), erweiterte Testsuite, Aktualisierungen der CI/CD.
Fehlerbehebungen und Verbesserungen:
- Quellenangaben: Nachverfolgung der RAG-Dokumente; geteilte Chats weisen nun die verwendeten Quellen aus („Quellen“).
- Überarbeitung des Feedback-Review-Systems: modularisierte Review-Oberfläche, eine Flag-Queue für auffällige Chats sowie eine Datenbanknormalisierung (Enums und Lookup-Tabellen für Feedback-Kategorien und KI-Modelle).
- Überarbeitung des Env Managers: datenbankbasierte Konfiguration mit bidirektionaler .env-Synchronisierung, Side-by-Side-Oberfläche, dediziertem Schreib-Benutzer und Export einer zusammengeführten .env.
- Störungsverarbeitung: Priorisierung nach Schweregrad, zeitbasierte Filterung, Kürzung nach Token-Budget sowie klickbare Links.
- Aktuelle GPT-Modelle: Token-Erfassung und Modell-Routing für die neuesten GPT-5.x-Deployments aktualisiert.
- Eval-API: neuer Endpunkt für automatisierte Evaluierungsläufe.
Neues Modell (GPT-5.2), Integration von Störungsmeldungen und verbesserte Dokumentensuche
22. April 2026 | von Melisa Berisha
Funktionen:
- Neues Sprachmodell:
- Ritchy nutzt ab sofort GPT-5.2 von OpenAI als Sprachmodell. Dieses Modell bietet verbesserte Reasoning-Fähigkeiten und ein tieferes Sprachverständnis gegenüber dem bisherigen GPT-4.1.
- Automatische Einbindung von Störungsmeldungen:
- Ritchy erkennt jetzt automatisch, ob eine Nutzeranfrage zu einer aktuellen Störung oder Wartungsarbeit des IT Centers passt. Liegt eine Übereinstimmung vor, wird die Störungsmeldung direkt in die Antwort einbezogen – inklusive Status und Link zur Störungsseite. Störungen werden dabei nach Schweregrad priorisiert (Störung > Teil-Störung > Wartung > Warnung > Hinweis)
- Verbesserte Dokumentensuche:
- Die Art, wie Ritchy auf die hinterlegte IT Center-Dokumentation zugreift, wurde grundlegend überarbeitet. Die Suche nutzt jetzt ein dreistufiges Verfahren (Stichwortsuche, Vektorsuche und semantisches Re-Ranking), um relevantere Artikel zu finden. Zusätzlich wird mehr Dokumentenkontext in die Antwort einbezogen, was zu präziseren und vollständigeren Antworten führt.
- Zuverlässigere Spracherkennung:
- Die automatische Spracherkennung wurde robuster gestaltet. Insbesondere bei Anfragen mit englischen Fachbegriffen (z. B. Produktnamen wie „Cisco AnyConnect“) wird die eigentliche Sprache des Nutzers jetzt zuverlässiger erkannt und die Antwort durchgängig in dieser Sprache formuliert.
- Strukturelle Verbesserungen:
- Die interne Architektur der Anwendung wurde modularisiert, um zukünftige Erweiterungen und Wartung zu vereinfachen. Für Endnutzer ergeben sich daraus keine sichtbaren Veränderungen.
Einrichtung der Chatweiche
15. Oktober 2025 | von Melisa Berisha
- Während der Erreichbarkeitszeiten ist nun eine Chatweiche eingerichtet
- Bei der Auswahl der Support-Chat-Funktion auf der IT Center Webseite, auf IT Center Help, oder in RWTHmoodle können Nutzende nun auswählen, ob sie mit Ritchy oder Mitarbeitenden des IT ServiceDesks chatten möchten

Quelle: IT Center Help
Integration von GPT-5 Chat
20. August 2025 | von Melisa Berisha
- GPT-5 Chat als Sprachmodell integriert
- GPT-5 Chat priorisiert Konversationston, sofortige Hilfsbereitschaft und schnellere Antworten
- Optimiert für Klarheit, Kürze, Freundlichkeit und konsistentes Chat-Verhalten
Erreichbar über die Footer der IT Center Websites
07. Mai 2025 | von Melisa Berisha
- Erreichbar über die Footer der verschiedenen IT Center-Webseiten
Einführung Ritchy
08. April 2025 | von Melisa Berisha
- Ritchy ist nun über IT Center Help erreichbar
- Sprachmodell: 4o Mini
- Öffentlicher Zugriff außerhalb der regulären Öffnungszeiten über den Chat-Support


