Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige
Lesedauer 3 Min.

Text to speech service

Gemessen daran, wie gut die Übertragung von Text in Sprache bereits funktioniert, wird diese Technologie noch von sehr wenigen Apps genutzt. Microsoft bietet mit Azure Speech eine einfache Möglichkeit Texte den Nutzern per Sprachausgabe näherzubringen.
Laut Microsoft wird die Ausgabe nahezu in Echtzeit generiert und sie lässt sich sogar als Audio-Datei speichern, um sie später ohne Neugenerierung parat zu haben. Auch die Sprecher hören sich dabei weitaus besser an, als die in Windows enthaltenen Muster, welche man direkt in jeder App dank des .NET-APIs System.Speech.Synthesis nutzen kann.Die Sprachsynthese in Azure steht in 45 Sprachen zur Verfügung, darunter auch deutsch. Für viele Sprachen gibt es sowohl eine männliche als auch eine weibliche Stimme für die Sprachausgabe. Auf dieser Seite können Sie sich die englischen, die deutschen sowie ein paar weitere Stimmen anhand von Mustersätzen anhören. Einstellbar sind laut Microsoft Tonhöhe, Geschwindigkeit, Lautstärke, Betonung sowie zusätzliche Pausen.Die Dokumentation dazu finden Sie auf dieser Seite. Dort gibt es unter anderem einen Schnellstart, der zeigt, wie man mithilfe von Python und dem Text-to-Speech-REST-API Text in Sprache konvertiert. Für die Schnellstartanleitung wird ein Azure-Cognitive-Services-Konto mit einer Ressource für den Speech-Dienst benötigt. Wer über kein Konto verfügt, kann über die kostenlose Testversion einen Abonnementschlüssel abrufen.Den direkten Einstieg in die Thematik finden Sie auf dieser Seite, wobei dort neben API-Keys für Text to Speech auch für Speech to Text sowie die Übersetzung und – als Preview – auch eine Sprecher-Erkennung angeboten werden.Nicht nur die Standard-Stimmen können genutzt werden, sondern man kann Stimmen auch selbst anlegen und trainieren. Allerdings gibt es solche Custom Voice Models derzeit nur für englisch und chinesisch.Beispiele: azure.microsoft.com/en-us/services/cognitive-services/text-to-speech/Dokumentation: docs.microsoft.com/en-us/azure/cognitive-services/speech-service/how-to-text-to-speechAusprobieren: azure.microsoft.com/en-us/try/cognitive-services/?api=speech-services

Neueste Beiträge

DWX hakt nach: Wie stellt man Daten besonders lesbar dar?
Dass das Design von Websites maßgeblich für die Lesbarkeit der Inhalte verantwortlich ist, ist klar. Das gleiche gilt aber auch für die Aufbereitung von Daten für Berichte. Worauf besonders zu achten ist, erklären Dr. Ina Humpert und Dr. Julia Norget.
3 Minuten
27. Jun 2025
DWX hakt nach: Wie gestaltet man intuitive User Experiences?
DWX hakt nach: Wie gestaltet man intuitive User Experiences? Intuitive Bedienbarkeit klingt gut – doch wie gelingt sie in der Praxis? UX-Expertin Vicky Pirker verrät auf der Developer Week, worauf es wirklich ankommt. Hier gibt sie vorab einen Einblick in ihre Session.
4 Minuten
27. Jun 2025
„Sieh die KI als Juniorentwickler“
CTO Christian Weyer fühlt sich jung wie schon lange nicht mehr. Woran das liegt und warum er keine Angst um seinen Job hat, erzählt er im dotnetpro-Interview.
15 Minuten
27. Jun 2025
Miscellaneous

Das könnte Dich auch interessieren

UIs für Linux - Bedienoberflächen entwickeln mithilfe von C#, .NET und Avalonia
Es gibt viele UI-Frameworks für .NET, doch nur sehr wenige davon unterstützen Linux. Avalonia schafft als etabliertes Open-Source-Projekt Abhilfe.
16 Minuten
16. Jun 2025
Mythos Motivation - Teamentwicklung
Entwickler bringen Arbeitsfreude und Engagement meist schon von Haus aus mit. Diesen inneren Antrieb zu erhalten sollte für Führungskräfte im Fokus stehen.
13 Minuten
19. Jan 2017
Evolutionäres Prototyping von Business-Apps - Low Code/No Code und KI mit Power Apps
Microsoft baut Power Apps zunehmend mit Features aus, um die Low-Code-/No-Code-Welt mit der KI und der professionellen Programmierung zu verbinden.
19 Minuten
Anzeige
Anzeige
Anzeige
Anzeige
Anzeige