Imagem: VideoLAN
A VideoLAN lançou uma nova versão do reprodutor de mídia VLC que inclui suporte para RTX Video Super Resolution (VSR), a nova tecnologia da NVIDIA para upscaling de vídeo de baixa qualidade com a ajuda de IA e uma rede de aprendizado profundo. VLC 3.0.19 RTX Vetinari é uma versão especial do ramo “Vetinari” do popular reprodutor de mídia com upscaling RTX, o VideoLAN confirmou e, de acordo com o log de alterações, esta versão do VLC ativa o upscaling VSR por padrão nas GPUs NVIDIA GeForce RTX que suportam o recurso (ou seja, GeForce RTX 30 e 40 Series). Alguns usuários afirmam que o NVIDIA VSR é capaz de aumentar a escala de vídeo tão bem quanto o madVR, o renderizador de vídeo extremamente popular da madshi que permite aos usuários escolher entre vários upscalers de alta qualidade, incluindo os modelos NGU intensivos em GPU, mas com base em algumas das comparações que foram compartilhadas online (1, 2), a recepção dos resultados certamente varia de usuário para usuário.
De uma postagem NVIDIA:
RTX VSR é um avanço no processamento de pixel AI que melhora drasticamente a qualidade do conteúdo de vídeo transmitido além da detecção de borda e nitidez de recursos.
Os artefatos de compactação em blocos são um problema persistente no vídeo transmitido. Seja por culpa do servidor, do cliente ou do próprio conteúdo, os problemas geralmente se amplificam com o upscaling tradicional, deixando uma experiência visual menos agradável para quem assiste ao conteúdo transmitido.
O RTX VSR reduz ou elimina artefatos causados pela compactação vídeo — como blocos, artefatos circulares nas bordas, esmaecimento de detalhes de alta frequência e faixas em áreas planas — ao mesmo tempo em que reduz a perda de texturas. Ele também aprimora bordas e detalhes.
A tecnologia usa uma rede de aprendizado profundo que realiza upscaling e redução de artefatos de compactação em uma única passagem. A rede analisa o quadro de vídeo de resolução mais baixa e prevê a imagem residual na resolução de destino. Essa imagem residual é então sobreposta sobre uma imagem aprimorada tradicional, corrigindo erros de artefato e aguçando as bordas para corresponder à resolução de saída.
A rede de aprendizado profundo é treinada em uma ampla variedade de conteúdo com vários níveis de compactação. Ele aprende sobre os tipos de artefatos de compactação presentes em vídeos de baixa resolução ou baixa qualidade que, de outra forma, estariam ausentes em imagens não compactadas como referência para treinamento de rede. Uma extensa avaliação visual é empregada para garantir que o modelo gerado seja eficaz em quase todo o conteúdo do mundo real e de jogos.
Participe da discussão desta postagem em nossos fóruns…