ChatGPT y Midjourney ahora son noticia no solo en los medios tecnológicos sino también en otras áreas. Esto podría cambiar pronto, ya que la próxima gran tecnología de inteligencia artificial está en camino. NVIDIA ha demostrado una nueva tecnología que pronto podría elevar sus GIF a nuevas alturas.
Gizchina Noticias de la semana
Use la tecnología de conversión de texto a video de NVIDIA para crear videos
No hace mucho tiempo, NVIDIA desató un producto interesante llamado VideoLDM. Ese es un modelo de IA para la conversión de texto a video. Por cierto, NVIDIA ha creado esta tecnología uniéndose a investigadores de la Universidad de Cornell. En términos simples, este modelo de IA puede generar videos con una resolución de hasta 2048 x 1280 píxeles, una velocidad de fotogramas de 24 fotogramas por segundo y un tiempo de ejecución de hasta 4,7 segundos basado en texto.
El modelo utiliza avances en difusión estable Redes neuronales. La solución de NVIDIA tiene hasta 4100 millones de parámetros. Pero solo 2.700 millones fueron capacitados mediante video. Aunque podría pensar que es un número enorme, es pequeño para los estándares de IA actuales.
Además, el modelo puede capturar videos con escenas de conducción. Pueden durar hasta 5 minutos y tienen una resolución de 1024 x 512 píxeles. Esto se debe a que las secuencias de conducción son difíciles de filmar en la vida real. Como resultado, cuando se trata de esos momentos, esta tecnología puede ayudar a los cineastas. El modelo puede pronosticar posibilidades de movimiento multimodal mediante la creación de una gran cantidad de misiones posibles a partir de una sola imagen de origen.
En este momento, las tecnologías de texto a video como la presentada por NVIDIA son buenas para usar para creación de miniaturas y GIF. Pero sabemos que NVIDIA está creciendo rápidamente en el campo de la IA. Por lo tanto, suponemos que NVIDIA no tardará mucho en ofrecer tecnologías más avanzadas para crear clips de texto a video más largos.
Este estudio se presentará en la Conferencia Machine Vision and Pattern Recognition, que tendrá lugar celebrada en Vancouver del 18 al 22 de junio.
Fuente/VIA: