Image : VideoLAN
VideoLAN a lancé une nouvelle version du lecteur multimédia VLC qui inclut la prise en charge de RTX Video Super Resolution (VSR), la nouvelle technologie de NVIDIA pour la mise à l’échelle des vidéos de qualité inférieure à l’aide de l’IA et d’un réseau d’apprentissage en profondeur. VLC 3.0.19 RTX Vetinari est une version spéciale de la branche”Vetinari”du populaire lecteur multimédia avec la mise à l’échelle RTX, VideoLAN a confirmé, et selon le journal des modifications, cette version de VLC active la mise à l’échelle VSR par défaut sur les GPU NVIDIA GeForce RTX qui prennent en charge la fonctionnalité (c’est-à-dire les séries GeForce RTX 30 et 40). Certains utilisateurs affirment que NVIDIA VSR est capable de mettre à l’échelle la vidéo tout aussi bien que madVR, le moteur de rendu vidéo extrêmement populaire de madshi qui permet aux utilisateurs de choisir parmi différents convertisseurs ascendants de haute qualité, y compris les modèles NGU gourmands en GPU, mais basés sur certaines des comparaisons qui ont été partagées en ligne (1, 2), la réception des résultats variera certainement d’un utilisateur à l’autre.
De un article NVIDIA :
RTX VSR est une percée dans le traitement des pixels IA qui améliore considérablement la qualité du contenu vidéo diffusé en continu au-delà de la détection des contours et de la netteté des fonctionnalités.
Les artefacts de compression en bloc sont un problème persistant dans la vidéo en streaming. Qu’il s’agisse de la faute du serveur, du client ou du contenu lui-même, les problèmes sont souvent amplifiés avec la mise à l’échelle traditionnelle, laissant une expérience visuelle moins agréable pour ceux qui regardent le contenu en streaming.
RTX VSR réduit ou élimine les artefacts causés par la compression vidéo — tels que les blocs, les artefacts de sonnerie autour des bords, le lavage des détails à haute fréquence et les bandes sur les zones planes — tout en réduisant les textures perdues. Il affine également les contours et les détails.
La technologie utilise un réseau d’apprentissage en profondeur qui effectue la mise à l’échelle et la réduction des artefacts de compression en une seule passe. Le réseau analyse la trame vidéo de résolution inférieure et prédit l’image résiduelle à la résolution cible. Cette image résiduelle est ensuite superposée à une image mise à l’échelle traditionnelle, corrigeant les erreurs d’artefacts et accentuant les contours pour correspondre à la résolution de sortie.
Le réseau d’apprentissage en profondeur est entraîné sur une large gamme de contenus avec différents niveaux de compression. Il apprend les types d’artefacts de compression présents dans les vidéos basse résolution ou de faible qualité qui sont autrement absents des images non compressées comme référence pour la formation réseau. Une évaluation visuelle approfondie est utilisée pour s’assurer que le modèle généré est efficace sur presque tous les contenus du monde réel et de jeu.
Rejoignez la discussion pour ce post sur nos forums…