Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 7 Min.

Wissensquellen liefern Daten für präzise Antworten

Wissensquellen (Knowledge Sources) stellen dem KI-Agenten zusätzliche, durchsuchbare Informationen bereit, um fundierte, kontextbezogene Antworten auf Basis von Unterneh-menswissen oder fachspezifischen Informationen zu generieren.
© EMGenie

Wissensquellen liefern zusätzlichen Retrieval-Kontext für KI-Agenten, ohne das Large Language Model (LLM) selbst zu verändern. Sie erweitern den Wissensraum, auf den der Agent zugreift – ihre Inhalte können laufend oder statisch aktualisiert werden. Copilot Studio nutzt Grounding-Techniken, um relevante Passagen zu extrahieren und als Kontext für die Antwortgenerierung bereitzustellen, wodurch Halluzinationen reduziert werden. Je nach Quelle kommen Retrieval-augmentierte Verfahren wie Graph-Verankerung oder Dataverse-RAG zum Einsatz, die Antworten des Agenten zuverlässig an Unternehmenswissen binden.

Voraussetzungen, Zielsetzungen und Nutzenpotenzial von Wissensquellen

Wissensquellen (Bild 1) arbeiten in Copilot Studio mit generativen Antworten zusammen und dienen als primäre Quelle oder Fallback, wenn kein Thema/Topic greift oder zusätzliche Fakten erforderlich sind.

Copilot Studio erschließt dem Agenten eine Vielzahl von Wissensquellen – diese Abbildung zeigt die in Copilot Studio empfohlenen an (Bild 1)

Copilot Studio erschließt dem Agenten eine Vielzahl von Wissensquellen – diese Abbildung zeigt die in Copilot Studio empfohlenen an (Bild 1)

© Autor

Über RAG und Grounding werden relevante Passagen herangezogen, wodurch Halluzinationen reduziert werden. Da die Antwortqualität von der Datenqualität abhängt, müssen Konsistenz, Korrektheit und Berechtigungen der Quellen sichergestellt werden. Vor der Bereitstellung sollte die Wissensextraktion anhand definierter Testfälle – etwa Multi-Turn-Tests und Analyse generativer Antworten – validiert werden, sodass die KI relevante Textabschnitte korrekt findet und zusammenfasst.

Wissensquellen reduzieren erheblich den Aufwand für eine manuelle Erstellung von Topic- und Trigger-Phrasen. Topics orchestrieren prozessuale Abläufe und führen Aktionen aus, während generative Antworten auf Basis von Wissensquellen informationsorientierte Anfragen beantworten und fachlich präzisere Ergebnisse liefern. Trigger-Phrasen und Topics haben Vorrang; generative Antworten dienen als Fallback, wenn weder Trigger noch Topics passen. Wissensquellen ersetzen nicht die Intentionserkennung – sie liefern Kontext für generative Antworten, während Orchestrierung/Conversational Language Understanding (CLU) die Benutzerabsicht bestimmt. Ohne spezifisches Topic erweitern Wissensquellen flexibel den Antwortraum. Die Aktualität hängt von Indexierungs- und Synchronisierungszyklen ab; es gibt keine Echtzeit-Garantie.

Für Zugriffe unterstützt Copilot Studio bei Aktionen Benutzerauthentifizierung und Agent-/App-Identität. Der Agent handelt im Sicherheitskontext des Benutzers oder der App; Wissensquellen und Aktionen geben nur solche Informationen zurück, für die Berechtigungen vorliegen. Eine modulare Struktur nach fachlichen Domänen erhöht die Wartbarkeit des Agenten. Klare Domänenschnitte und aussagekräftige Beschreibungen helfen bei Skalierung und präziserer Quellenauswahl; die Websuche kann parallel zur Suche in konfigurierten öffentlichen Websites erfolgen. Der strategische Einsatz von Wissensquellen verbessert die Verlässlichkeit des Agenten. Zusätzliche Transparenz – etwa durch Zitate in generativen Antworten – stärkt die User Experience (UX) und damit das Vertrauen der Endbenutzer.

 


Aktuelles zu Wissensquellen in Copilot Studio

Copilot Studio unterstützt mehrere Arten von Wissensquellen und respektiert dabei Microsoft‑Entra‑Authentifizierung, Berechtigungen und Compliance‑Vorgaben. Ein OneDrive‑Account erscheint nicht als eigene, native Wissensquelle; vollständiger Zugriff auf dessen Inhalte ist jedoch über Microsoft Graph oder Konnektoren möglich.

Für einige Wissensquellen gelten aktuell bestimmte Beschränkungen (Crawl-Tiefe bei URLs, Anzahl der Quellen, Dateigröße, Dateitypen).

In der generativen Orchestrierung stehen weder benutzerdefinierte Wissensquellen noch die Bing‑Websuche zur Verfügung. Benutzerdefinierte Wissensquellen und optional auch Bing-Grounding können jedoch innerhalb von generativen Antwortknoten in einzelnen Themen/Topics verwendet werden, sofern sie dort explizit eingebunden sind.

Externe Suchindizes oder kompatible Such‑APIs lassen sich über generative Antwortknoten als Grundlage einbinden (Bild 2); vollständig eigene Vektor‑ oder RAG‑Pipelines lassen sich nicht als First‑Class-Wissensquellen registrieren.


Wissensquellen werden einem generativen Antwortknoten in den Knoteneigenschaften über „+ Wissen hinzufügen“ zugeordnet (Bild 2)

Wissensquellen werden einem generativen Antwortknoten in den Knoteneigenschaften über „+ Wissen hinzufügen“ zugeordnet (Bild 2)

© Autor

Der Agent nutzt GenAI mit vektorbasierter Indizierung und semantischer Suche

Damit ein Agent dem Benutzer fundiert antwortet, bindet Copilot Studio Wissensquellen über Retrieval‑Augmented Generation (RAG), eventuell ergänzt um Grounding, in generative Antworten ein. RAG wird für Wissensquellen genutzt, nicht jedoch für alle Antworttypen – Topics/Themen, Aktionen und gegebenenfalls zugelassenes Modellwissen bleiben eigenständige Komponenten. Dabei stellt Copilot Studio keine eigenen Such- und Indizierungs-Engines bereit, sondern nutzt bestehende Such- und Indexdienste sowie optional externe Indizes als Bestandteil der RAG-Pipeline. Diese Vorgehensweise erhöht die Relevanz der Treffer, kann diese jedoch nicht garantieren.

Für alle Arten von Wissensquellen, die indiziert werden können, kommen Retrieval‑augmentierte Verfahren zum Einsatz. Microsoft hat Suchdienste wie Bing, Microsoft Graph/Microsoft Search, Dataverse und optional Azure AI Search integriert. Je nach Wissensquelle greift Copilot Studio auf etablierte, jeweils passende Such- und Indizierungsdienste zurück: öffentliche Websites (Bing Suche), Dataverse (RAG-basierter Abruf aus der verbundenen Dataverse-Umgebung), SharePoint/OneDrive (Microsoft Graph/Microsoft Search) sowie Unternehmensdaten (Microsoft-Search-Konnektoren). Optional kann der Agent den semantischen Index des Mandanten nutzen (erfordert eine Microsoft-365-Copilot-Lizenz im Mandanten). Für Microsoft-365-Inhalte setzt Copilot Studio auch Hybrid Search ein – eine Kombination von Keyword- und Vektorsuche.

Mit einer Microsoft-365-Copilot-Lizenz greift ein Agent über Graph-Verankerung mit semantischer Suche auf den semantischen Index zu. Diese Kombination erhöht deutlich die Kontextualität und Relevanz der Antworten gegenüber klassischen Suchansätzen. Der Zugriff erfolgt über Microsoft Graph in der Grounding-Pipeline; Voraussetzungen sind ein aktivierter semantischer Index und Microsoft-Authentifizierung. Optionale Copilot-Konnektoren erweitern den Index um weitere Unternehmensdaten. Der tatsächliche Zugriff auf Inhalte (E-Mails, Teams-Chats) hängt von Berechtigungen, Lizenzierung, Datenschutzrichtlinien und Indexkonfiguration ab, wobei die Inhalte von Dokumenten in der Regel als allgemeines Wissen fungieren, was keine benutzerspezifische Authentifizierung erfordert.

Die GenAI verbindet isolierte Datenquellen über RAG/Grounding-Pipeline und fasst relevante Informationen kontextbezogen zusammen. Ein zentrales Merkmal ist die Nachvollziehbarkeit: Zitate/Belege aus Wissensquellen stärken Transparenz und Vertrauen. Inhalte werden je nach Quelle indiziert und über angebundene Suchdienste abgerufen; Details zur internen Vorverarbeitung (Chunking) sind nicht öffentlich dokumentiert. Die Antworten bewegen sich innerhalb der konfigurierten Wissensquellen und des Modells; optional können Websuche oder Allgemeinwissen zugeschaltet werden. Transparente Quellenangaben erhöhen die Akzeptanz, ersetzen jedoch keine eigenständige Prüfung auf Widersprüche oder Fehler.

Klassifizierung von Wissen und ihre praktische Eignung für Agenten

Die Einteilung von Wissensquellen nach Format/Struktur, Herkunft/Quelle und Verwendungszweck bietet einen Überblick oder Orientierung zu unterschiedlichen Typen von Wissen und der Verarbeitung ihrer Inhalte. Diese Klassifikation ist flexibel genug, um sowohl aktuelle als auch zukünftige Daten- und Dokumenttypen abzudecken:

  • Format/Struktur: Unterscheidet zwischen strukturierten, halb strukturierten und unstrukturierten Wissensquellen. Strukturierte Daten (Tabellen, Datenbankinhalte) werden nicht als Wissensquellen indexiert, sondern über Aktionen/Konnektoren analysiert. Halb strukturierte Formate wie HTML, JSON oder XML werden beim Indizieren als Text behandelt. Copilot Studio nutzt Wissensquellen primär als unstrukturierte Inhalte: Dateien (Uploads, OneDrive, SharePoint) und Websites. Während direkte Dateiuploads in Microsoft Dataverse gespeichert werden, verbleiben SharePoint- und OneDrive-Inhalte an ihrem Ursprungsort und werden über Microsoft Graph indiziert. Alle Inhalte werden in semantischen Indizes (Vektor-Embeddings) verarbeitet und für die Antwortgenerierung (RAG) genutzt. Änderungen werden durch geplante Synchronisationsläufe berücksichtigt.
  • Herkunft/Quelle: Die unterschiedlichen Typen von Wissen stammen aus internen oder externen Systemen. Interne Quellen umfassen Unternehmensdokumente (Dateiupload, OneDrive, SharePoint), SharePoint-URLs und Dataverse; ein Zugriff erfolgt mit Microsoft Entra ID mit Live-Berechtigungsprüfung. Externe Quellen sind öffentliche, von Bing indexierte Websites ohne Authentifizierung; passwortgeschützte Websites sind nicht zulässig. Systembasierte Quellen werden über Konnektoren eingebunden (Microsoft 365/Dynamics 365, Salesforce, ServiceNow, Confluence, Zendesk); deren Ergebnisse werden grundsätzlich durch Benutzerberechtigungen eingeschränkt.
  • Verwendungszweck: Beschreibt, wie Quellen im Agenten genutzt werden. Es gibt drei funktionale Kategorien: Grounding Knowledge – basiert auf Antworten mit Inhalten aus Dateien (Upload in Dataverse semantisch indiziert, OneDrive/SharePoint über Microsoft Graph indiziert), Dataverse, SharePoint‑URLs sowie öffentlichen Websites; Websuche kann optional aktiviert werden. Instructional Knowledge – Richtlinien/Prozess‑ und Stilvorgaben über Prompt Modification beziehungsweise AI Prompts; als Dateien nur referenziert, nicht verhaltenssteuernd. Actionable Knowledge – beschreibt Logik/Parameter für Aktionen; deren Ausführung erfolgt über konfigurierte Funktionen/Konnektoren außerhalb der Wissensquelle.

Optimierung der Einbindung von Wissensquellen mit GenAI steuern

Copilot Studio bietet verschiedene Stellhebel, um das Verhalten der GenAI (also die Antworten des Agenten) und die Nutzung der Wissensquellen zu steuern. In den Einstellungen des Agenten (Bild 3) lassen sich unter anderem Anweisungen (Systemprompt), Wissensquellen, Websuche, Sicherheits-/Moderationsregeln und – sofern freigeschaltet – die Modellwahl konfigurieren:

  • Moderierung (Content Moderation): Über die Moderationsebene (Schieberegler Inhaltsmoderationsebene) werden potenziell schädliche oder nicht konforme Inhalte gefiltert (zum Beispiel Hass/Fairness, Sexualität, Gewalt, Selbstverletzung) und zentral konfiguriert. Im Systemprompt können zusätzliche Verhaltens- und Eskalationsregeln definiert werden; die technischen Moderationsfilter bleiben davon unberührt.
  • Modelle/Reasoning: Für komplexe Aufgaben können Reasoning‑optimierte Modelle ausgewählt werden (Modellkategorie Tief). Diese verbessern vor allem Analyse‑, Planungs‑ und Denkaufgaben, können jedoch Einschränkungen wie eine deaktivierte Temperatursteuerung mitbringen.
  • Tiefgehende Begründung (Deep Reasoning): Aktiviert größere, Reasoning‑optimierte Modelle, die komplexere Schlussfolgerungen ziehen können. Sie verbessern die Qualität bei Aufgaben wie Analyse, Planung oder logischem Denken. Nutzt der Agent fortschrittliche Reasoning-Modelle, erhöht sich die Qualität der generativen Antworten.
  • Informationen aus dem Web verwenden: Die optional aktivierbare Websuche nutzt Bing, um aktuelle öffentliche Informationen einzubeziehen. In der generativen Orchestrierung läuft sie parallel zu konfigurierten öffentlichen Website‑Quellen; Ergebnisse werden kombiniert. Ist die Websuche deaktiviert, antwortet der Agent ausschließlich auf Basis der freigegebenen Wissensquellen.
  • Work IQ aktivieren: Work IQ ist eine zentrale Intelligenzschicht, die – über Work-IQ‑MCP‑Tools und mit passender Microsoft-365-Copilot‑Lizenz sowie Admin‑Freigaben – kontextuelles Organisationswissen und Signale (zum Beispiel aus E‑Mails, Meetings, Teams‑Chats oder Dateien) in Echtzeit bereitstellt. Der Zugriff erfolgt stets mit dem Berechtigungsmodell des Mandanten und zentraler Governance.

 

Wissensquellen werden einem generativen Antwortknoten in den Knoteneigenschaften über „+ Wissen hinzufügen“ zugeordnet (Bild 2)Die Einstellungen eines Agenten im Bereich Generative KI nehmen eine Orchestrierung für die Antworten des Agenten vor (Bild 3)

Wissensquellen werden einem generativen Antwortknoten in den Knoteneigenschaften über „+ Wissen hinzufügen“ zugeordnet (Bild 2)Die Einstellungen eines Agenten im Bereich Generative KI nehmen eine Orchestrierung für die Antworten des Agenten vor (Bild 3)

© Autor

Neueste Beiträge

Infinite AI Conference: So setzt Du KI in jedem Schritt des Software-Lifecycle ein - KI gehört in Deinen Workflow
Von den Anforderungen über Design, Implementierung bis zum Testen, Deployment und Monitoring: Auf der Infinite AI Conference 2026 erfährst Du, wie Dich die KI im gesamten Lifecycle unterstützen kann.
4 Minuten
SQLite: Wenn weniger mehr ist - SQLite für .NET-Entwickler, Teil 1
Für Entwicklerteams, die jeden Tag mit der Komplexität von Kubernetes, Cloud-Datenbanken und Terraform-Skripten ringen, liegt der eigentliche Gewinn von SQLite in der architektonischen Vereinfachung.
6 Minuten
SignalRC und Ping - Der DDC-Truck, Teil 10
Wie schnell ist die Verbindung zwischen Browser und Fahrzeug eigentlich?
9 Minuten
26. Mär 2026

Das könnte Dich auch interessieren

00:00
Vibe Coding war gestern – Vise Coding ist die Zukunft - KI-gestützte Softwareentwicklung
Der Begriff Vibe Coding geistert durch die Branche – aber was steckt wirklich dahinter? Gregor Biswanger erklärt im DWX-Interview, warum nicht alle KI-Agenten-Workflows gleich sind, wo Vise Coding den Unterschied macht und warum die Branche gerade eine ziemlich wilde Dating-Show erlebt.
31. Mär 2026
Mit Entitäten strukturierte Informationen extrahieren - Low Code/No Code und KI mit Copilot Studio, Teil 2
Entitäten in Copilot Studio strukturieren Benutzereingaben als typisierte, wiederverwendbare Informationen. Sie erkennen und extrahieren aus unstrukturierter Sprache klar definierte Daten für Dialoglogik und zur Übergabe an Aktionen (Power Automate, Konnektoren/Plug-ins).
7 Minuten
23. Mär 2026
Topics als Kernbausteine eines KI-Agenten - Low Code/No Code und KI mit Copilot Studio, Teil 1
Topics (Themen) bilden in Copilot Studio die zentralen Bausteine für die Steuerung von Dialogabläufen. Sie ermöglichen eine modulare und wartbare Struktur des KI-Agenten, indem sie fachlich klar abgegrenzte Gesprächslogiken kapseln.
6 Minuten
9. Mär 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige