ChatGPT và Midjourney hiện đang trở thành tin tức không chỉ trên các phương tiện truyền thông công nghệ mà còn ở các lĩnh vực khác. Điều này có thể sớm thay đổi vì công nghệ AI lớn tiếp theo đang được triển khai. NVIDIA đã trình diễn một công nghệ mới có thể sớm nâng ảnh GIF của bạn lên một tầm cao mới.

Tin tức trong tuần của Gizchina

Sử dụng công nghệ chuyển văn bản thành video của NVIDIA để tạo video

Cách đây không lâu, NVIDIA ra mắt một sản phẩm thú vị có tên là VideoLDM. Đó là một mô hình AI để chuyển đổi văn bản thành video. Nhân tiện, NVIDIA đã tạo ra công nghệ này bằng cách chung tay với các nhà nghiên cứu của Đại học Cornell. Nói một cách đơn giản, mô hình AI này có thể tạo video có độ phân giải lên tới 2048 x 1280 pixel, tốc độ khung hình 24 khung hình/giây và thời gian chạy tối đa 4,7 giây dựa trên văn bản.

Mô hình sử dụng những tiến bộ trong khuếch tán ổn định mạng lưới thần kinh. Giải pháp NVIDIA có tới 4,1 tỷ tham số. Nhưng chỉ có 2,7 tỷ người được đào tạo bằng video. Mặc dù bạn có thể nghĩ rằng đây là một con số khổng lồ, nhưng nó là nhỏ so với các tiêu chuẩn AI ngày nay.

Ngoài ra, kiểu máy này có thể quay video với các cảnh lái xe. Chúng có thể kéo dài tối đa 5 phút và có độ phân giải 1024 x 512 pixel. Điều này là do các cảnh lái xe rất khó quay trong đời thực. Nhờ vậy, khi đến những khoảnh khắc như vậy, công nghệ này có thể hỗ trợ các nhà làm phim. Mô hình này có thể dự đoán các khả năng chuyển động đa phương thức bằng cách tạo ra một số lượng lớn các nhiệm vụ có thể thực hiện được từ một hình ảnh nguồn duy nhất.

Hiện tại, các công nghệ chuyển văn bản thành video chẳng hạn như công nghệ do NVIDIA giới thiệu rất phù hợp để sử dụng cho tạo hình thu nhỏ và ảnh GIF. Nhưng chúng tôi biết rằng NVIDIA đang phát triển nhanh chóng trong lĩnh vực AI. Vì vậy, chúng tôi đoán rằng NVIDIA sẽ không mất nhiều thời gian để mang đến những công nghệ tiên tiến hơn để tạo các đoạn văn bản chuyển thành video dài hơn.

Nghiên cứu này sẽ được trình bày tại Hội nghị về Thị giác Máy và Nhận dạng Mẫu, sẽ được tổ chức được tổ chức tại Vancouver từ ngày 18 đến ngày 22 tháng 6.

Nguồn/VIA:

Categories: IT Info