Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Text to speech service

Gemessen daran, wie gut die Übertragung von Text in Sprache bereits funktioniert, wird diese Technologie noch von sehr wenigen Apps genutzt. Microsoft bietet mit Azure Speech eine einfache Möglichkeit Texte den Nutzern per Sprachausgabe näherzubringen.
Laut Microsoft wird die Ausgabe nahezu in Echtzeit generiert und sie lässt sich sogar als Audio-Datei speichern, um sie später ohne Neugenerierung parat zu haben. Auch die Sprecher hören sich dabei weitaus besser an, als die in Windows enthaltenen Muster, welche man direkt in jeder App dank des .NET-APIs System.Speech.Synthesis nutzen kann.Die Sprachsynthese in Azure steht in 45 Sprachen zur Verfügung, darunter auch deutsch. Für viele Sprachen gibt es sowohl eine männliche als auch eine weibliche Stimme für die Sprachausgabe. Auf dieser Seite können Sie sich die englischen, die deutschen sowie ein paar weitere Stimmen anhand von Mustersätzen anhören. Einstellbar sind laut Microsoft Tonhöhe, Geschwindigkeit, Lautstärke, Betonung sowie zusätzliche Pausen.Die Dokumentation dazu finden Sie auf dieser Seite. Dort gibt es unter anderem einen Schnellstart, der zeigt, wie man mithilfe von Python und dem Text-to-Speech-REST-API Text in Sprache konvertiert. Für die Schnellstartanleitung wird ein Azure-Cognitive-Services-Konto mit einer Ressource für den Speech-Dienst benötigt. Wer über kein Konto verfügt, kann über die kostenlose Testversion einen Abonnementschlüssel abrufen.Den direkten Einstieg in die Thematik finden Sie auf dieser Seite, wobei dort neben API-Keys für Text to Speech auch für Speech to Text sowie die Übersetzung und – als Preview – auch eine Sprecher-Erkennung angeboten werden.Nicht nur die Standard-Stimmen können genutzt werden, sondern man kann Stimmen auch selbst anlegen und trainieren. Allerdings gibt es solche Custom Voice Models derzeit nur für englisch und chinesisch.Beispiele: azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/Dokumentation: docs.microsoft.com/en-us/azure/cognitive-services/speech-service/how-to-text-to-speechAusprobieren: azure.microsoft.com/en-us/try/cognitive-services/?api=speech-services
Miscellaneous

Neueste Beiträge

SignalRC mit ReactFlow – alles im Fluss - Der DDC-Truck, Teil 9
ReactFlow verwandelt ein abstraktes Signalverarbeitungsproblem in etwas, das man buchstäblich sehen und anfassen kann. Dabei ist die Signalverarbeitungskette vollständig datengetrieben.
13 Minuten
19. Mär 2026
Mit Entitäten strukturierte Informationen extrahieren - Low Code/No Code und KI mit Copilot Studio, Teil 2
Entitäten in Copilot Studio strukturieren Benutzereingaben als typisierte, wiederverwendbare Informationen. Sie erkennen und extrahieren aus unstrukturierter Sprache klar definierte Daten für Dialoglogik und zur Übergabe an Aktionen (Power Automate, Konnektoren/Plug-ins).
7 Minuten
23. Mär 2026
OpenTelemetry als Fundament einer vertrauenswürdigen Observability-Infrastruktur
Observability wird zum Bindeglied zwischen Technologie und Sicherheit, zwischen Erkennen und Handeln, zwischen operativer Realität und strategischer Steuerung.
5 Minuten
17. Mär 2026

Das könnte Dich auch interessieren

Elektronische Schaltkreise im Browser simulieren - Simulation
Statt mit Steckfeld oder Lötkolben kann man auf dieser Website Schaltungen per Drag and Drop zusammenstellen und deren Verhalten testen.
2 Minuten
26. Jul 2018
Topics als Kernbausteine eines KI-Agenten - Low Code/No Code und KI mit Copilot Studio, Teil 1
Topics (Themen) bilden in Copilot Studio die zentralen Bausteine für die Steuerung von Dialogabläufen. Sie ermöglichen eine modulare und wartbare Struktur des KI-Agenten, indem sie fachlich klar abgegrenzte Gesprächslogiken kapseln.
6 Minuten
9. Mär 2026
Mit Entitäten strukturierte Informationen extrahieren - Low Code/No Code und KI mit Copilot Studio, Teil 2
Entitäten in Copilot Studio strukturieren Benutzereingaben als typisierte, wiederverwendbare Informationen. Sie erkennen und extrahieren aus unstrukturierter Sprache klar definierte Daten für Dialoglogik und zur Übergabe an Aktionen (Power Automate, Konnektoren/Plug-ins).
7 Minuten
23. Mär 2026
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige