Delen via


Het Speech CLI-gegevensarchief configureren

De Speech CLI kan afhankelijk zijn van instellingen in configuratiebestanden, waarnaar u kunt verwijzen met behulp van een @ symbool. Met de Spraak-CLI wordt een nieuwe instelling opgeslagen in een nieuwe ./spx/data-submap, die wordt gemaakt in de huidige werkmap voor de Spraak-CLI. De Speech CLI zoekt eerst naar een configuratiewaarde in uw huidige werkmap, vervolgens in het gegevensarchief bij ./spx/dataen vervolgens in andere gegevensarchieven, waaronder een definitief alleen-lezen gegevensarchief in het spx binaire bestand.

In de quickstart van Speech CLI hebt u het gegevensarchief gebruikt om uw @key gegevens en @region waarden op te slaan, dus u hoeft ze niet op te geven bij elke spx opdracht. U kunt configuratiebestanden gebruiken om uw eigen configuratie-instellingen op te slaan, of zelfs gebruiken voor het doorgeven van URL's of andere dynamische inhoud die tijdens runtime is gegenereerd.

Voer de volgende opdracht in voor meer informatie over gegevensarchiefbestanden, inclusief het gebruik van standaard configuratiebestanden (@spx.default, @default.configen @*.default.config voor opdracht-specifieke standaardinstellingen):

spx help advanced setup

nodefaults

In het volgende voorbeeld wordt het configuratiebestand @my.defaults gewist, worden sleutelwaardeparen toegevoegd voor sleutel en regio in het bestand, en wordt de configuratie gebruikt in een aanroep van spx recognize.

spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus

spx config @my.defaults

spx recognize --nodefaults @my.defaults --file hello.wav

Dynamische configuratie

U kunt ook dynamische inhoud naar een configuratiebestand schrijven met behulp van de --output optie.

Met de volgende opdracht maakt u bijvoorbeeld een aangepast spraakmodel en slaat u de URL van het nieuwe model op in een configuratiebestand. De volgende opdracht wacht tot het model op die URL gereed is voor gebruik voordat het wordt geretourneerd.

spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait

In het volgende voorbeeld worden twee URL's naar het configuratiebestand @my.datasets.txt geschreven. In dit scenario kan --output een optioneel toevoegen-trefwoord bevatten om een configuratiebestand te maken of toe te voegen aan de bestaande.

spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt

spx config @my.datasets.txt

SPX-configuratie toevoegen

Voor leesbaarheid, flexibiliteit en gemak kunt u een vooraf ingestelde configuratie gebruiken met geselecteerde uitvoeropties.

U hebt bijvoorbeeld de volgende vereisten voor bijschriften:

  • Herkennen vanuit het invoerbestand caption.this.mp4.
  • WebVTT- en SRT-bijschriften uitvoeren voor de bestanden caption.vtt en caption.srt respectievelijk.
  • Voer de offset, duration, en resultidtext van elke herkennings gebeurtenis uit naar het bestandeach.result.tsv.

U kunt een vooraf ingestelde configuratie met de naam @caption.defaults maken, zoals hier wordt weergegeven:

spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt

De instellingen worden opgeslagen in de huidige map in een bestand met de naam caption.defaults. Dit zijn de bestandsinhoud:

output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt

Als u vervolgens bijschriften wilt genereren, kunt u deze opdracht uitvoeren waarmee instellingen worden geïmporteerd uit de @caption.defaults vooraf ingestelde configuratie:

spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults

Het gebruik van de vooraf ingestelde configuratie zoals eerder wordt weergegeven, is vergelijkbaar met het uitvoeren van de volgende opdracht:

spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text

Volgende stappen