Trong khi cơn sốt DeepSeek tiếp tục lan rộng trong lĩnh vực chatbot AI thì công ty của Trung Quốc này đã tiếp tục ra mắt mô hình AI tạo hình ảnh đầu tiên của mình. Được đặt tên là Janus Pro, đây là mô hình ngôn ngữ lớn của DeepSeek kết hợp khả năng xử lý dữ liệu đa phương thức và tạo hình ảnh nhằm cạnh tranh với các mô hình hiện có như Stable Diffusion, Imagen 3 của Google và DALL-E 3 của OpenAI. Vậy Janus Pro của DeepSeek có đủ sức đánh bại các đối thủ hàng đầu hiện nay hay không?

Thử nghiệm so sánh DeepSeek với các công cụ AI tạo hình ảnh khác

Điểm nổi bật của DeepSeek là chi phí xây dựng tiết kiệm và cho phép người dùng truy cập miễn phí trong khi vẫn đạt được hiệu suất và độ chính xác cao giống như ChatGPT của OpenAI. Vì vậy nếu mô hình AI tạo hình ảnh của họ có thể sánh ngang hoặc vượt qua các AI tốt nhất hiện nay thì sẽ là mối đe dọa nghiêm trọng đối với những thương hiệu lớn.

Hiện nay các nội dung do AI tạo ra ngày càng trở nên phổ biến, do đó các mô hình AI tạo hình ảnh được kỳ vọng sẽ kết hợp cả sự linh hoạt sáng tạo và độ chính xác giống như ảnh chụp. Nhưng liệu Janus Pro có đáp ứng được những kỳ vọng đó hay không?

DeepSeek trên điện thoại thông minh (Ảnh: Internet)
DeepSeek trên điện thoại thông minh (Ảnh: Internet)

Dưới đây là thử nghiệm so sánh Janus Pro với 5 mô hình AI tạo ảnh hàng đầu hiện nay bao gồm Stable Diffusion, Dall-E 3 của OpenAI, Imagen 3 của Google, Meta AI và Adobe Firefly. Cả 6 mô hình đều được cung cấp yêu cầu giống nhau, sau đó chúng ta sẽ so sánh câu trả lời đầu tiên của chúng thay vì chọn lọc những kết quả tốt nhất.

So sánh về độ chân thực của hình ảnh

Thử nghiệm đầu tiên nhằm kiểm tra xem các mô hình AI có thể tạo ra hình ảnh chân thực như thế nào. Yêu cầu được đưa ra là: Một hình ảnh thực tế về một chú mèo cam béo đang đuổi theo một sợi len trong một khu vườn đầy nắng.

Hình ảnh chân thực là vấn đề đặc biệt khó đối với các mô hình AI vì nó đòi hỏi sự chính xác về nguồn sáng, chi tiết kết cấu và chiều sâu không gian. Do đó hãy tập trung vào các yếu tố như bộ lông của chú mèo, hiệu ứng ánh sáng mặt trời trên khu vườn được thể hiện chân thực đến mức nào, sợi len có cảm giác chuyển động và 3 chiều hay không.

So sánh hình ảnh chú mèo do các mô hình AI tạo ra (Ảnh: Internet)
So sánh hình ảnh chú mèo do các mô hình AI tạo ra (Ảnh: Internet)

Chỉ cần nhìn lướt qua cũng có thể nhận ra rằng hình ảnh của Janus Pro có nhiều điểm giống với phiên bản đầu tiên của mô hình DALL-E hơn là các mô hình ra mắt gần đây, tức là độ phân giải khá thấp và cảm giác không thực tế. Ngược lại, Stable Diffusion cho ra hình ảnh chân thực rất giống với yêu cầu, mặc dù phần đuôi của chú mèo quá to.

Hình ảnh của Firefly của Adobe có cảm giác như một bức ảnh chụp đã được chỉnh sửa nhiều, nhưng khuôn mặt của chú mèo không giống thực tế. Các công cụ khác là Imagen 3, Dall E và Meta AI đều làm tốt nhưng không đủ để gọi là hình ảnh chân thực.

Kiểm tra khả năng tạo hình ảnh đa dạng và rõ chi tiết

Bài kiểm tra thứ hai sẽ tăng mức độ khó hơn. Các mô hình AI thường gặp khó khăn trong việc tạo ra khuôn mặt và bàn tay của con người, cũng như tạo hình ảnh một nhóm người đa dạng. Lần này yêu cầu được đưa ra rất chi tiết: Ảnh selfie nhóm của những sinh viên đại học đa văn hóa đang ăn trưa bên ngoài một khu nghỉ dưỡng trượt tuyết, với khuôn mặt chi tiết – nam, nữ, đa dạng – vào buổi trưa mùa đông, dưới bầu trời xanh và một phần nhiều mây.

Ở đây có rất nhiều thách thức cho các mô hình AI, từ việc tạo ra các tông màu da khác nhau cho đến thể hiện biểu cảm khuôn mặt chân thực và bàn tay của con người không bị méo mó.

So sánh hình ảnh selfie nhóm người do các mô hình AI tạo ra (Ảnh: Internet)
So sánh hình ảnh selfie nhóm người do các mô hình AI tạo ra (Ảnh: Internet)

Một lần nữa, Janus Pro lại tụt hậu rất xa so với các mô hình AI khác. Mặc dù tất cả các bức ảnh đều có những chi tiết bất thường do AI tạo ra nhưng Stable Diffusion, Adobe Firefly và Imagen 3 đều cho ra hình ảnh khá tốt, đặc biệt là Imagen 3.

Kiểm tra khả năng sáng tạo

Bài kiểm tra này nhằm đánh giá xem các mô hình AI có thể cho ra hình ảnh sáng tạo đến mức nào. Yêu cầu được đưa ra là: Một nhân vật hoạt hình dựa trên các nhân vật Disney cổ điển, hoàn chỉnh với đôi mắt to và các đặc điểm kỳ ảo, vui nhộn.

Trên thực tế, điểm nổi bật và hấp dẫn của các nhân vật lấy cảm hứng từ Disney là đôi mắt biểu cảm, các yếu tố thiết kế kỳ quặc và tỷ lệ cơ thể đáng yêu.

So sánh hình ảnh các nhân vật hoạt hình do các mô hình AI tạo ra (Ảnh: Internet)
So sánh hình ảnh các nhân vật hoạt hình do các mô hình AI tạo ra (Ảnh: Internet)

Hình ảnh nhân vật Disney của Janus Pro có vẻ khá kỳ lạ, trong khi Stable Diffusion tạo ra phiên bản trẻ hơn của Elsa trong phim Frozen. Có thể xem Stable Diffusion là tốt nhất trong bài kiểm tra này. Hình ảnh của các mô hình AI khác không thực sự đạt được tính thẩm mỹ giống như Disney, trong đó kết quả của Meta AI gần giống với hoạt hình Pixar hơn.

Tóm lại: Janus Pro có phải là đối thủ đáng gờm của các AI tạo hình ảnh hiện nay không?

Nhiều người không thích sử dụng các công cụ AI tạo hình ảnh nói chung bởi vì chúng thiếu linh hồn và sự sáng tạo mà chỉ có thể đến từ một nghệ sĩ thực thụ. Tuy nhiên AI có thể hữu ích khi cần tạo hình mẫu nhanh, phác thảo ý tưởng hoặc bổ sung hình ảnh đơn giản để minh họa cho bài thuyết trình.

Ví dụ, các chuyên gia marketing thường sử dụng AI để đăng bài trên mạng xã hội hoặc tạo bản mô phỏng trực quan một cách nhanh chóng, trong khi những người làm giáo dục có thể sử dụng AI cho các bài học sáng tạo. Các nhà thiết kế game có thể dùng AI để tạo ra các môi trường kỳ ảo hoặc lên ý tưởng về nhân vật để các nghệ sĩ tinh chỉnh sau đó. Nhưng liệu những mô hình AI này có thực sự thay thế được trí tưởng tượng của người thật hay không? Đó vẫn là một điều gây tranh cãi.

Janus Pro đánh dấu sự gia nhập của DeepSeek vào lĩnh vực AI tạo hình ảnh, nhưng rõ ràng vẫn còn một chặng đường dài trước khi mô hình này có thể sánh ngang với những AI đã có tên tuổi như Stable Diffusion, Adobe Firefly và Imagen 3.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm

Facebook sẽ tạo ra tài khoản ảo bằng AI có thể tương tác với người dùng như thật?

Các công cụ AI ngày càng trở nên thông minh và giống người thật, đặc biệt là các chatbot. Giờ đây Facebook đang có kế hoạch tiến xa hơn nữa bằng việc tạo ra các tài khoản người dùng bằng AI một cách hoàn chỉnh, có ảnh đại diện và thông tin giới thiệu giống như người thật, thậm ...
Theo dõi bình luận
Thông báo về
guest
1 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận