Xếp hạng của người biên tập: Xếp hạng của người dùng: [Tổng: 0 Trung bình: 0].ilfs_responsive_below_title_1 {width: 300px; } @media (min-width: 500px) {.ilfs_responsive_below_title_1 {width: 300px; }} @media (min-width: 800px) {.ilfs_responsive_below_title_1 {width: 336px; }}
Tạo văn bản thành hình ảnh là kỹ thuật tạo hình ảnh dựa trên mô tả văn bản bằng Trí tuệ nhân tạo . Nó sử dụng các mô hình Text-to-Image khác nhau bắt đầu được phát triển vào năm 2010 do có rất nhiều tiến bộ trong lĩnh vực mạng nơ-ron. Các mô hình học máy này chấp nhận mô tả ngôn ngữ tự nhiên làm đầu vào và tạo ra hình ảnh phù hợp với mô tả nhất có thể.
Có sẵn một số mô hình Chuyển văn bản thành hình ảnh dành cho nhà nghiên cứu và nhà phát triển, phổ biến nhất trong số đó là DALL-E, Imagen (Google), MidJourney và Stable Diffusion . Cả DALL-E và MidJourney đều không phải là mã nguồn mở, không giống như Ổn định khuếch tán được phát hành vào năm 2022.
Ổn định khuếch tán là sự hợp tác giữa AI ổn định , LMU (Đại học Ludwig Maximilian của Munich) và một số liên doanh khác và chủ yếu được triển khai để tạo hình ảnh dựa trên mô tả văn bản. Khả năng khuếch tán ổn định đã được đào tạo trên hàng tỷ hình ảnh và có khả năng tạo ra kết quả phù hợp với chất lượng của ảnh thật và nghệ thuật do con người vẽ. Nhấp vào đây để đọc thêm về Khuếch tán ổn định.
Trong bài viết này, chúng tôi sẽ khám phá 5 Trình tạo hình ảnh AI dựa trên mô hình khuếch tán ổn định Văn bản thành hình ảnh.
1. Web Khuếch tán Ổn định
Đúng như tên gọi, trang web này sử dụng mô hình Khuếch tán Ổn định để tạo ra những hình ảnh gần giống như ảnh thực tế hoàn toàn từ một đầu vào văn bản. Chỉ cần nhập một vài từ về hình ảnh mà bạn muốn tạo bằng ngôn ngữ tự nhiên, sau đó nhấp vào’Tạo hình ảnh’.
Hãy kiên nhẫn chờ đợi vì sẽ mất một lúc để Ổn định khuếch tán xử lý văn bản và tạo một vài hình ảnh bằng cách sử dụng mô hình AI của nó. Kích thước của mỗi hình ảnh là 512 x 512 pixel và bạn có thể sử dụng các hình thu nhỏ bên dưới để xem hình ảnh ở kích thước đầy đủ. Để tải xuống bất kỳ hình ảnh nào, hãy nhấp chuột phải vào hình ảnh đó và chọn’Lưu Hình ảnh thành’.
Nhấp vào đây để điều hướng đến Web khuếch tán ổn định.
2. Quán cà phê đêm
Đây là một Trình tạo văn bản thành hình ảnh khác dựa trên Sự khuếch tán ổn định có thể giúp bạn tạo ra những hình ảnh vô cùng thẩm mỹ từ lời nhắc văn bản. Trình tạo này cũng cho phép bạn chọn Kiểu của hình ảnh như NightCafe, Artistic và Bon Voyage.
Chỉ cần nhập một vài từ/cụm từ bằng ngôn ngữ tiếng Anh tự nhiên của bạn, chọn kiểu của hình ảnh và nhấp vào’Tạo ra’. CNTT có thể mất vài giây để mô hình chuyển văn bản thành hình ảnh xử lý lời nhắc và tạo hình ảnh cho bạn.
Bạn có thể nhấp vào’Tùy chọn khác’để sử dụng các Kiểu bổ sung như Ảnh, B & Chân dung W, Truyện tranh hiện đại, v.v. Ngoài ra, bạn có thể bật’Tùy chọn nâng cao’bằng cách sử dụng công tắc chuyển đổi ở trên cùng để chọn Tỷ lệ khung hình, Trọng lượng lời nhắc (lượng hình ảnh cuối cùng khớp với lời nhắc văn bản), Số lượng hình ảnh được tạo và khác.
Khi hình ảnh được tạo, bạn có thể nhấp vào’Xem sáng tạo’và chọn Tải xuống ở định dạng JPG hoặc Chia sẻ chúng với người khác. Bạn cũng có thể nhấp vào’Tiến hóa’để sử dụng hình ảnh đã tạo trước đó làm hình ảnh cơ sở và điều chỉnh cài đặt của nó để tạo ra bất kỳ thứ gì bạn thích.
Mỗi lần tạo hình ảnh có 0,5 tín dụng và Night Café cung cấp cho bạn 5 Tín dụng miễn phí. nghĩa là bạn có thể tạo tối đa 10 hình ảnh, sau đó bạn có thể mua thêm tín dụng bằng cách nhấp vào nút’Mua tín dụng’.
Hãy tiếp tục và sử dụng Night Café bằng cách nhấp vào liên kết này .
3. Khuôn mặt ôm
Đây là một Trình tạo văn bản sang hình ảnh khuếch tán ổn định phổ biến khác hoạt động ít nhiều giống với Web khuếch tán ổn định mà chúng ta đã thảo luận trước đó. Chỉ cần nhập văn bản ngôn ngữ tự nhiên để mô tả hình ảnh và nhấp vào ‘Tạo hình ảnh’. Khuôn mặt ôm sẽ tạo ra 4 hình ảnh có kích thước 512 x 512 pixel mỗi hình. Bạn có thể nhấp vào bất kỳ hình thu nhỏ nào để xem hình ảnh ở kích thước đầy đủ. Nhấp chuột phải vào hình ảnh và chọn’Lưu hình ảnh dưới dạng’để tải xuống hệ thống của bạn ở định dạng JPG.
Để sử dụng Khuôn mặt ôm để tạo hình ảnh, hãy nhấp vào đây
4. Replicate
Hãy chuyển sang Replicate, đây là trình tạo Văn bản thành hình ảnh tiếp theo dựa trên mô hình Khuếch tán ổn định. Trang web trình tạo này cho phép bạn định cấu hình một số cài đặt quan trọng như Kích thước của hình ảnh đầu ra (chiều rộng và chiều cao), Cường độ nhanh, Số lượng hình ảnh được tạo và hơn thế nữa.
Quá trình tạo hình ảnh vẫn như cũ. Chỉ cần nhập Mô tả hình ảnh bằng một vài từ sử dụng ngôn ngữ tự nhiên, chỉ định Cài đặt nếu cần và nhấp vào nút’Gửi’ở cuối trang web.
Phải mất vài giây để tạo (các) hình ảnh mà bạn có thể nhấp để xem chúng ở kích thước đầy đủ (512 x 512 pixel) hoặc nhấp chuột phải và chọn’Lưu hình ảnh dưới dạng’để tải chúng xuống hệ thống của bạn ở định dạng PNG. Ngoài ra, bạn cũng có thể chọn Chia sẻ hình ảnh lên GitHub hoặc Discord.
Bạn cũng có thể sử dụng API Replicate để tạo Văn bản thành Hình ảnh hoặc chạy mô hình trên Máy tính của riêng bạn nếu cần. Nhấp vào các tab có liên quan trên trang web để tìm hiểu thêm về điều này.
Để truy cập Replicate, hãy nhấp vào đây .
5. Deep AI
Đây là công cụ cuối cùng trong danh sách các trình tạo Văn bản thành Hình ảnh sử dụng Khuếch tán ổn định. Cách làm việc không khác gì những cái khác mà chúng tôi đã liệt kê ở trên.
Chỉ cần nhập các từ hoặc cụm từ để mô tả hình ảnh bằng ngôn ngữ Tự nhiên và nhấp vào’Tạo’. Trong vài giây, Deep AI sẽ hiển thị một hình ảnh duy nhất mà bạn có thể tải xuống dưới dạng tệp JPG với kích thước 512 x 512 pixel. Không có cài đặt liên quan nào khác để định cấu hình tạo hình ảnh như chúng ta đã thấy trong một số trang web khác ở trên.
Nhấp vào đây để truy cập Deep AI
Bạn có thể dùng thử từng Trình tạo hình ảnh AI khuếch tán ổn định ở trên và so sánh độ linh hoạt và kết quả để đưa ra kết luận như nào là phù hợp nhất cho yêu cầu của bạn. Phiếu bầu của tôi sẽ ủng hộ Night Café vì nó mang lại nhiều sự linh hoạt và kiểm soát trong quá trình tạo hình ảnh do các cài đặt và tùy chọn mà nó cung cấp. Hãy cho chúng tôi biết cảm nhận của bạn.