Cognitive Services Speech SDK pro JavaScript
Přehled
Pro zjednodušení vývoje aplikací s podporou řeči poskytuje Microsoft sadu Speech SDK pro použití se službou Speech. Sada Speech SDK poskytuje konzistentní nativní rozhraní API pro převod řeči na text a překlad řeči.
Instalace modulu npm
Instalace modulu npm sady Cognitive Services Speech SDK
npm install microsoft-cognitiveservices-speech-sdk
Příklad
Následující fragmenty kódu ukazují, jak provést jednoduché rozpoznávání řeči ze souboru:
// Pull in the required packages.
var sdk = require("microsoft-cognitiveservices-speech-sdk");
var fs = require("fs");
// Replace with your own subscription key, service region (e.g., "westus"), and
// the name of the file you want to run through the speech recognizer.
var subscriptionKey = "YourSubscriptionKey";
var serviceRegion = "YourServiceRegion"; // e.g., "westus"
var filename = "YourAudioFile.wav"; // 16000 Hz, Mono
// Create the push stream we need for the speech sdk.
var pushStream = sdk.AudioInputStream.createPushStream();
// Open the file and push it to the push stream.
fs.createReadStream(filename).on('data', function(arrayBuffer) {
pushStream.write(arrayBuffer.buffer);
}).on('end', function() {
pushStream.close();
});
// We are done with the setup
console.log("Now recognizing from: " + filename);
// Create the audio-config pointing to our stream and
// the speech config specifying the language.
var audioConfig = sdk.AudioConfig.fromStreamInput(pushStream);
var speechConfig = sdk.SpeechConfig.fromSubscription(subscriptionKey, serviceRegion);
// Setting the recognition language to English.
speechConfig.speechRecognitionLanguage = "en-US";
// Create the speech recognizer.
var recognizer = new sdk.SpeechRecognizer(speechConfig, audioConfig);
// Start the recognizer and wait for a result.
recognizer.recognizeOnceAsync(
function (result) {
console.log(result);
recognizer.close();
recognizer = undefined;
},
function (err) {
console.trace("err - " + err);
recognizer.close();
recognizer = undefined;
});
Předchozí příklad používá jednorázové rozpoznávání, které rozpoznává jednu promluvu. K řízení, kdy se má rozpoznávání ukončit, můžete také použít průběžné rozpoznávání . Podívejte se na náš podrobný rychlý start , kde najdete mnoho dalších možností.
Ukázky
- Podrobný rychlý start pro JavaScript
- Podrobný rychlý start pro prohlížeč
- Další ukázky najdete v našem ukázkovém úložišti sady Speech SDK.
Azure SDK for JavaScript