Freigeben über


AudioTranslationSegment Klasse

  • java.lang.Object
    • com.azure.ai.openai.models.AudioTranslationSegment

public final class AudioTranslationSegment

Erweiterte Informationen zu einem einzelnen Segment übersetzter Audiodaten. Segmente stellen in der Regel etwa 5-10 Sekunden Spracherkennung dar. Segmentgrenzen treten in der Regel zwischen Wörtern auf, aber nicht unbedingt zwischen Sätzen.

Methodenzusammenfassung

Modifizierer und Typ Methode und Beschreibung
double getAvgLogprob()

Abrufen der avgLogprob-Eigenschaft: Die durchschnittliche Protokollwahrscheinlichkeit, die diesem Audiosegment zugeordnet ist.

double getCompressionRatio()

Abrufen der Komprimierungsverhältnis-Eigenschaft: Das Komprimierungsverhältnis dieses Audiosegments.

Duration getEnd()

Abrufen der Endeigenschaft: Der Zeitpunkt, zu dem dieses Segment relativ zum Anfang des übersetzten Audios beendet wurde.

int getId()

Abrufen der ID-Eigenschaft: Der 0-basierte Index dieses Segments innerhalb einer Übersetzung.

double getNoSpeechProb()

Abrufen der NoSpeechProb-Eigenschaft: Die Wahrscheinlichkeit, dass keine Spracherkennung in diesem Audiosegment vorhanden ist.

int getSeek()

Abrufen der seek-Eigenschaft: Die Suchposition, die der Verarbeitung dieses Audiosegments zugeordnet ist.

Duration getStart()

Abrufen der Starteigenschaft: Der Zeitpunkt, zu dem dieses Segment relativ zum Anfang des übersetzten Audios gestartet wurde.

double getTemperature()

Abrufen der Temperatureigenschaft: Die Diesem Audiosegment zugeordnete Temperaturbewertung.

String getText()

Abrufen der Texteigenschaft: Der übersetzte Text, der Teil dieses Audiosegments war.

List<Integer> getTokens()

Tokeneigenschaft abrufen: Die Token-IDs, die dem übersetzten Text in diesem Audiosegment entsprechen.

Geerbte Methoden von java.lang.Object

Details zur Methode

getAvgLogprob

public double getAvgLogprob()

Abrufen der avgLogprob-Eigenschaft: Die durchschnittliche Protokollwahrscheinlichkeit, die diesem Audiosegment zugeordnet ist.

Returns:

der avgLogprob-Wert.

getCompressionRatio

public double getCompressionRatio()

Abrufen der compressionRatio-Eigenschaft: Das Komprimierungsverhältnis dieses Audiosegments.

Returns:

der compressionRatio-Wert.

getEnd

public Duration getEnd()

Abrufen der Endeigenschaft: Der Zeitpunkt, zu dem dieses Segment relativ zum Anfang des übersetzten Audios beendet wurde.

Returns:

der Endwert.

getId

public int getId()

Abrufen der ID-Eigenschaft: Der 0-basierte Index dieses Segments innerhalb einer Übersetzung.

Returns:

der ID-Wert.

getNoSpeechProb

public double getNoSpeechProb()

Abrufen der noSpeechProb-Eigenschaft: Die Wahrscheinlichkeit, dass innerhalb dieses Audiosegments keine Spracherkennung vorhanden ist.

Returns:

der NoSpeechProb-Wert.

getSeek

public int getSeek()

Abrufen der seek-Eigenschaft: Die Suchposition, die der Verarbeitung dieses Audiosegments zugeordnet ist. Suchpositionen werden als Hundertstel Sekunden ausgedrückt. Das Modell kann mehrere Segmente von einer einzelnen Suchposition aus verarbeiten, sodass die Suchposition nie einen späteren Zeitpunkt als der Start des Segments darstellt, kann der Start des Segments einen deutlich späteren Zeitpunkt als die zugeordnete Suchposition des Segments darstellen.

Returns:

der Suchwert.

getStart

public Duration getStart()

Abrufen der Starteigenschaft: Der Zeitpunkt, zu dem dieses Segment relativ zum Anfang des übersetzten Audios gestartet wurde.

Returns:

der Startwert.

getTemperature

public double getTemperature()

Abrufen der Temperatureigenschaft: Die Diesem Audiosegment zugeordnete Temperaturbewertung.

Returns:

der Temperaturwert.

getText

public String getText()

Abrufen der Texteigenschaft: Der übersetzte Text, der Teil dieses Audiosegments war.

Returns:

der Textwert.

getTokens

public List getTokens()

Tokeneigenschaft abrufen: Die Token-IDs, die dem übersetzten Text in diesem Audiosegment entsprechen.

Returns:

der Tokenwert.

Gilt für: