Consultas de desempenho do lado do servidor

Artigo
06/01/2023

Um bom desempenho de renderização no servidor é essencial para taxas de quadros estáveis e uma boa experiência de usuário. É importante monitorar com cuidado as características de desempenho no servidor e otimizar quando necessário. Os dados de desempenho podem ser consultados por meio de funções de API dedicadas.

A maior parte do impacto do desempenho de renderização são os dados de entrada do modelo. É possível ajustar os dados de entrada conforme descrito em Configurar o modelo de conversão.

O desempenho do aplicativo no lado do cliente também pode ser um gargalo. Para uma análise detalhada do desempenho no lado do cliente, recomenda-se fazer um performance trace.

Linha do tempo do cliente/servidor

Antes de entrar em detalhes sobre os diversos valores de latência, vale a pena observar os pontos de sincronização entre o cliente e o servidor na linha do tempo:

Pipeline timeline

A ilustração mostra o processo:

uma Estimativa de pose é inicializada pelo cliente com uma taxa de quadros constante de 60-Hz (a cada 16,6 ms)
o servidor, em seguida, inicia a renderização, com base na pose
o servidor envia de volta a imagem do vídeo codificada
o cliente decodifica a imagem, executa processamento de CPU e GPU nela e, em seguida, exibe a imagem

Consultas de estatísticas de quadro

As estatísticas de quadro apresentam algumas informações gerais sobre o último quadro, como latência. Os dados fornecidos na estrutura FrameStatistics são medidos no lado do cliente, portanto, a API é uma chamada síncrona:

void QueryFrameData(RenderingSession session)
{
    FrameStatistics frameStatistics;
    if (session.GraphicsBinding.GetLastFrameStatistics(out frameStatistics) == Result.Success)
    {
        // do something with the result
    }
}

void QueryFrameData(ApiHandle<RenderingSession> session)
{
    FrameStatistics frameStatistics;
    if (session->GetGraphicsBinding()->GetLastFrameStatistics(&frameStatistics) == Result::Success)
    {
        // do something with the result
    }
}

O objeto FrameStatistics recuperado contém os seguintes membros:

Membro	Explicação
LatencyPoseToReceive	A latência da câmera representa a estimativa no dispositivo cliente até que um quadro de servidor para essa pose esteja totalmente disponível para o aplicativo cliente. Esse valor inclui viagem de ida e volta da rede, tempo de renderização do servidor, decodificação de vídeo e compensação de tremulação. Veja o intervalo 1 na ilustração acima.
LatencyReceiveToPresent	Latência da disponibilidade de um quadro remoto recebido até que o aplicativo cliente chame PresentFrame na CPU. Veja o intervalo 2 na ilustração acima.
LatencyPresentToDisplay	Latência da apresentação de um quadro na CPU até a tela acender. Esse valor inclui a hora da GPU do cliente, qualquer buffer de quadro executado pelo sistema operacional, reprojeção de hardware e tempo de varredura de exibição dependente do dispositivo. Veja o intervalo 3 na ilustração acima.
TimeSinceLastPresent	O tempo entre as chamadas subsequentes para PresentFrame na CPU. Valores maiores que a duração da exibição (por exemplo, 16,6 ms em um dispositivo cliente de 60 Hz) indicam problemas causados pelo aplicativo cliente que não conclui sua carga de trabalho de CPU no tempo desejado.
VideoFramesReceived	O número de quadros recebidos do servidor no último segundo.
VideoFrameReusedCount	Número de quadros recebidos no último segundo que foram usados no dispositivo mais de uma vez. Valores diferentes de zero indicam que os quadros tinham que ser reutilizados e reprojetados devido à tremulação da rede ou ao tempo excessivo de renderização do servidor.
VideoFramesSkipped	Número de quadros recebidos no último segundo que foram decodificados, mas não mostrados na exibição porque um quadro mais recente chegou. Valores diferentes de zero indicam que a tremulação da rede fez com que vários quadros ficassem atrasados e chegassem ao dispositivo cliente de modo intermitente.
VideoFramesDiscarded	Muito semelhante ao VideoFramesSkipped, mas o motivo para ser descartado é que um quadro chegou tão tarde que ele nem chegou a ser correlacionado com qualquer pose pendente. Se esse descarte acontecer, ocorrerá uma contenção grave de rede.
VideoFrameMinDelta	Quantidade mínima de tempo entre dois quadros consecutivos chegando no último segundo. Junto com o VideoFrameMaxDelta, esse intervalo fornece uma indicação de tremulação causada pela rede ou pelo codec do vídeo.
VideoFrameMaxDelta	Quantidade máxima de tempo entre dois quadros consecutivos chegando no último segundo. Junto com o VideoFrameMinDelta, esse intervalo fornece uma indicação de tremulação causada pela rede ou pelo codec do vídeo.

A soma de todos os valores de latência é normalmente muito maior do que o tempo de quadro disponível a 60 Hz. Não há problema nisso, pois vários quadros estão em trânsito em paralelo e novas solicitações de quadros são iniciadas na taxa de quadros desejada, conforme mostrado na ilustração. No entanto, se a latência se tornar muito grande, ela afetará a qualidade da reprojeção de fase tardia e poderá comprometer a experiência geral.

VideoFramesReceived, VideoFrameReusedCount e VideoFramesDiscarded podem ser usados para medir o desempenho da rede e do servidor. A combinação de um valor VideoFramesReceived baixo e um valor VideoFrameReusedCount alto pode indicar o congestionamento da rede ou o mau desempenho do servidor. Um valor alto de VideoFramesDiscarded também indica o congestionamento da rede.

Por fim, TimeSinceLastPresent, VideoFrameMinDelta e VideoFrameMaxDelta dão uma ideia da variação de quadros de vídeo recebidos e de chamadas locais presentes. Uma variação alta significa uma taxa de quadros instável.

Nenhum dos valores acima fornece uma indicação clara de latência pura de rede (as setas vermelhas na ilustração), pois o tempo exato que o servidor está ocupado processando precisa ser subtraído do valor de ida e volta LatencyPoseToReceive. A parte da latência geral do lado do servidor são informações que não estão disponíveis para o cliente. No entanto, o próximo parágrafo explica como esse valor é aproximado pela entrada extra do servidor e exposto por meio do valor de NetworkLatency.

Consultas de avaliação de desempenho

As consultas de avaliação de desempenho apresentam informações mais detalhadas sobre a carga de trabalho da CPU e da GPU no servidor. Como os dados são solicitados para o servidor, a consulta de um instantâneo de desempenho segue o padrão assíncrono usual:

async void QueryPerformanceAssessment(RenderingSession session)
{
    try
    {
        PerformanceAssessment result = await session.Connection.QueryServerPerformanceAssessmentAsync();
        // do something with result...
    }
    catch (RRException ex)
    {
    }
}

void QueryPerformanceAssessment(ApiHandle<RenderingSession> session)
{
    session->Connection()->QueryServerPerformanceAssessmentAsync([](Status status, PerformanceAssessment result) {
        if (status == Status::OK)
        {
            // do something with result...
        }
    });
}

Ao contrário do objeto FrameStatistics, o objeto PerformanceAssessment contém informações do servidor:

Membro	Explicação
TimeCPU	Tempo médio de CPU do servidor por quadro em milissegundos
TimeGPU	Tempo médio de GPU do servidor por quadro em milissegundos
UtilizationCPU	Utilização total da CPU do servidor em porcentagem
UtilizationGPU	Utilização total da GPU do servidor em porcentagem
MemoryCPU	Total de utilização de memória principal do servidor em porcentagem
MemoryGPU	Utilização total da memória de vídeo dedicada em porcentagem da GPU do servidor
NetworkLatency	A latência de rede de ida e volta média aproximada em milissegundos. Na ilustração acima, esse valor corresponde à soma das setas vermelhas. O valor é calculado com a subtração do tempo de renderização do servidor real do valor `LatencyPoseToReceive` de `FrameStatistics`. Embora essa aproximação não seja precisa, ela fornece alguma indicação da latência da rede, isolada dos valores de latência computados no cliente.
PolygonsRendered	O número de triângulos renderizados em um quadro. Esse número também inclui os triângulos que são refigurados posteriormente durante a renderização. Isso significa que esse número não varia muito em posições de câmera diferentes, mas o desempenho pode variar drasticamente, dependendo da taxa de remoção do triângulo.
PointsRendered	O número de pontos em nuvens de ponto renderizadas em um quadro. Os mesmos critérios de abate mencionados acima para `PolygonsRendered` aplicar aqui.

Para ajudar a avaliar os valores, cada parte vem com uma classificação de qualidade, como excelente, bom, medianaou ruim. Essa métrica de avaliação fornece uma indicação aproximada da integridade do servidor, mas não deve ser vista como absoluta. Por exemplo, vamos supor que você veja uma pontuação "mediana" para a hora da GPU. Ela é considerado mediana porque fica perto do limite do orçamento do tempo geral do quadro. No entanto, no seu caso pode ser um bom valor, pois você está renderizando um modelo complexo.

Saída de depuração de estatísticas

A classe ServiceStatistics é uma classe C# que encapsula as consultas de avaliação de desempenho e as estatísticas de quadro, e apresenta uma funcionalidade conveniente para retornar estatísticas como valores agregados ou uma cadeia de caracteres criada previamente. O código a seguir é a maneira mais fácil de mostrar estatísticas no lado do servidor em seu aplicativo cliente.

ServiceStatistics _stats = null;

void OnConnect()
{
    _stats = new ServiceStatistics();
}

void OnDisconnect()
{
    _stats = null;
}

void Update()
{
    if (_stats != null)
    {
        // update once a frame to retrieve new information and build average values
        _stats.Update(Service.CurrentActiveSession);

        // retrieve a string with relevant stats information
        InfoLabel.text = _stats.GetStatsString();
    }
}

O código acima preenche o rótulo de texto com o seguinte texto:

ArrServiceStats string output

A API de GetStatsString formata uma cadeia de caracteres de todos os valores, mas cada valor também pode ser consultado programaticamente a partir da instância de ServiceStatistics.

Também há variantes dos membros, que agregam os valores ao longo do tempo. Veja membros com o sufixo *Avg, *Max ou *Total. O membro FramesUsedForAverage indica quantos quadros foram usados para essa agregação.

Compartilhar via

Consultas de desempenho do lado do servidor

Linha do tempo do cliente/servidor

Consultas de estatísticas de quadro

Consultas de avaliação de desempenho

Saída de depuração de estatísticas

Documentação da API

Próximas etapas

Comentários

Recursos adicionais