Nvidia Maxine usa IA para melhorar chamadas de vídeo
Nvidia Maxine pode incrementar resolução, reduzir largura de banda, realinhar rostos e até fazer tradução em tempo real
Nvidia Maxine pode incrementar resolução, reduzir largura de banda, realinhar rostos e até fazer tradução em tempo real
Não raramente, chamadas de vídeo implicam em imagens borradas ou congelamentos frequentes. Para quem sofre com esses problemas, a plataforma Nvidia Maxine traz esperança: anunciada nesta segunda-feira (5), a novidade promete melhorar a qualidade das videoconferências com a ajuda da inteligência artificial.
De acordo com a companhia, a Nvidia Maxine consegue otimizar diversos parâmetros da chamada. Um deles é a largura de banda. Em vez de transmitir pixel por pixel, a plataforma pode traçar os pontos faciais do usuário e enviar para o outro lado apenas as informações que correspondem aos movimentos do seu rosto.
Como o conteúdo estático, a exemplo do cenário de fundo, não é retransmitido em cada frame, a quantidade de dados necessária para a transmissão cai sem prejudicar a qualidade de imagem.
A Nvidia sinaliza que, graças à compressão de dados proporcionada por um sistema de inteligência artificial executado por suas GPUs, o consumo de largura de banda pode chegar a um décimo do que é exigido para transmissões em H.264.
A Nvidia Maxine também é capaz de realinhar automaticamente rostos e olhares para que os participantes da videoconferência pareçam sempre estar de frente para o outro e mantendo contato visual, mesmo quando eles não estiverem olhando diretamente para a câmera.
Tem mais. Recursos de inteligência artificial podem ser usados para remover ruídos sonoros, eliminar artefatos que aparecem na imagem quando o usuário está em um ambiente com baixa iluminação, criar avatares e aprimorar automaticamente a resolução caso um dos participantes esteja em uma conexão com baixa velocidade.
O aprimoramento consiste na reconstrução da imagem depois que esta é recebida por uma das partes, logo, não é necessário aumentar o tráfego de dados para a chamada de vídeo atingir um nível satisfatório de qualidade.
Graças à integração da plataforma com o framework Nvidia Jarvis (que nome peculiar, não?), as transmissões podem ainda ser complementadas com funcionalidades como traduções em tempo real e transcrição de conversas.
Agora vem o balde de água fria: a Nvidia Maxine não é uma plataforma voltada diretamente ao usuário final, mas um sistema oferecido a empresas que queiram otimizar as suas ferramentas de videoconferência. A Avaya é uma das primeiras companhias a apostar na ideia.