Het Speech CLI-gegevensarchief configureren
De Speech CLI kan afhankelijk zijn van instellingen in configuratiebestanden, waarnaar u kunt verwijzen met behulp van een @
symbool. Met de Spraak-CLI wordt een nieuwe instelling opgeslagen in een nieuwe ./spx/data
-submap, die wordt gemaakt in de huidige werkmap voor de Spraak-CLI. De Speech CLI zoekt eerst naar een configuratiewaarde in uw huidige werkmap, vervolgens in het gegevensarchief bij ./spx/data
en vervolgens in andere gegevensarchieven, waaronder een definitief alleen-lezen gegevensarchief in het spx
binaire bestand.
In de quickstart van Speech CLI hebt u het gegevensarchief gebruikt om uw @key
gegevens en @region
waarden op te slaan, dus u hoeft ze niet op te geven bij elke spx
opdracht. U kunt configuratiebestanden gebruiken om uw eigen configuratie-instellingen op te slaan, of zelfs gebruiken voor het doorgeven van URL's of andere dynamische inhoud die tijdens runtime is gegenereerd.
Voer de volgende opdracht in voor meer informatie over gegevensarchiefbestanden, inclusief het gebruik van standaard configuratiebestanden (@spx.default
, @default.config
en @*.default.config
voor opdracht-specifieke standaardinstellingen):
spx help advanced setup
nodefaults
In het volgende voorbeeld wordt het configuratiebestand @my.defaults
gewist, worden sleutelwaardeparen toegevoegd voor sleutel en regio in het bestand, en wordt de configuratie gebruikt in een aanroep van spx recognize
.
spx config @my.defaults --clear
spx config @my.defaults --add key 000072626F6E20697320636F6F6C0000
spx config @my.defaults --add region westus
spx config @my.defaults
spx recognize --nodefaults @my.defaults --file hello.wav
Dynamische configuratie
U kunt ook dynamische inhoud naar een configuratiebestand schrijven met behulp van de --output
optie.
Met de volgende opdracht maakt u bijvoorbeeld een aangepast spraakmodel en slaat u de URL van het nieuwe model op in een configuratiebestand. De volgende opdracht wacht tot het model op die URL gereed is voor gebruik voordat het wordt geretourneerd.
spx csr model create --name "Example 4" --datasets @my.datasets.txt --output url @my.model.txt
spx csr model status --model @my.model.txt --wait
In het volgende voorbeeld worden twee URL's naar het configuratiebestand @my.datasets.txt
geschreven. In dit scenario kan --output
een optioneel toevoegen-trefwoord bevatten om een configuratiebestand te maken of toe te voegen aan de bestaande.
spx csr dataset create --name "LM" --kind Language --content https://crbn.us/data.txt --output url @my.datasets.txt
spx csr dataset create --name "AM" --kind Acoustic --content https://crbn.us/audio.zip --output add url @my.datasets.txt
spx config @my.datasets.txt
SPX-configuratie toevoegen
Voor leesbaarheid, flexibiliteit en gemak kunt u een vooraf ingestelde configuratie gebruiken met geselecteerde uitvoeropties.
U hebt bijvoorbeeld de volgende vereisten voor bijschriften:
- Herkennen vanuit het invoerbestand
caption.this.mp4
. - WebVTT- en SRT-bijschriften uitvoeren voor de bestanden
caption.vtt
encaption.srt
respectievelijk. - Voer de
offset
,duration
, enresultid
text
van elke herkennings gebeurtenis uit naar het bestandeach.result.tsv
.
U kunt een vooraf ingestelde configuratie met de naam @caption.defaults
maken, zoals hier wordt weergegeven:
spx config @caption.defaults --clear
spx config @caption.defaults --add output.each.recognizing.result.offset=true
spx config @caption.defaults --add output.each.recognizing.result.duration=true
spx config @caption.defaults --add output.each.recognizing.result.resultid=true
spx config @caption.defaults --add output.each.recognizing.result.text=true
spx config @caption.defaults --add output.each.file.name=each.result.tsv
spx config @caption.defaults --add output.srt.file.name=caption.srt
spx config @caption.defaults --add output.vtt.file.name=caption.vtt
De instellingen worden opgeslagen in de huidige map in een bestand met de naam caption.defaults
. Dit zijn de bestandsinhoud:
output.each.recognizing.result.offset=true
output.each.recognizing.result.duration=true
output.each.recognizing.result.resultid=true
output.each.recognizing.result.text=true
output.all.file.name=output.result.tsv
output.each.file.name=each.result.tsv
output.srt.file.name=caption.srt
output.vtt.file.name=caption.vtt
Als u vervolgens bijschriften wilt genereren, kunt u deze opdracht uitvoeren waarmee instellingen worden geïmporteerd uit de @caption.defaults
vooraf ingestelde configuratie:
spx recognize --file caption.this.mp4 --format any --output vtt --output srt @caption.defaults
Het gebruik van de vooraf ingestelde configuratie zoals eerder wordt weergegeven, is vergelijkbaar met het uitvoeren van de volgende opdracht:
spx recognize --file caption.this.mp4 --format any --output vtt file caption.vtt --output srt file caption.srt --output each file each.result.tsv --output all file output.result.tsv --output each recognizer recognizing result offset --output each recognizer recognizing duration --output each recognizer recognizing result resultid --output each recognizer recognizing text