Dưới đây là thử nghiệm so sánh Janus Pro với 5 mô hình AI tạo ảnh hàng đầu hiện nay bao gồm Stable Diffusion, Dall-E 3 của OpenAI, Imagen 3 của Google, Meta AI và Adobe Firefly. Cả 6 mô hình đều được cung cấp yêu cầu giống nhau, sau đó chúng ta sẽ so sánh câu trả lời đầu tiên của chúng thay vì chọn lọc những kết quả tốt nhất.
Thử nghiệm đầu tiên nhằm kiểm tra xem các mô hình AI có thể tạo ra hình ảnh chân thực như thế nào. Yêu cầu được đưa ra là: Một hình ảnh thực tế về một chú mèo cam béo đang đuổi theo một sợi len trong một khu vườn đầy nắng.
Hình ảnh chân thực là vấn đề đặc biệt khó đối với các mô hình AI vì nó đòi hỏi sự chính xác về nguồn sáng, chi tiết kết cấu và chiều sâu không gian. Do đó hãy tập trung vào các yếu tố như bộ lông của chú mèo, hiệu ứng ánh sáng mặt trời trên khu vườn được thể hiện chân thực đến mức nào, sợi len có cảm giác chuyển động và 3 chiều hay không.
Chỉ cần nhìn lướt qua cũng có thể nhận ra rằng hình ảnh của Janus Pro có nhiều điểm giống với phiên bản đầu tiên của mô hình DALL-E hơn là các mô hình ra mắt gần đây, tức là độ phân giải khá thấp và cảm giác không thực tế. Ngược lại, Stable Diffusion cho ra hình ảnh chân thực rất giống với yêu cầu, mặc dù phần đuôi của chú mèo quá to.
Hình ảnh của Firefly của Adobe có cảm giác như một bức ảnh chụp đã được chỉnh sửa nhiều, nhưng khuôn mặt của chú mèo không giống thực tế. Các công cụ khác là Imagen 3, Dall E và Meta AI đều làm tốt nhưng không đủ để gọi là hình ảnh chân thực.
Bài kiểm tra thứ hai sẽ tăng mức độ khó hơn. Các mô hình AI thường gặp khó khăn trong việc tạo ra khuôn mặt và bàn tay của con người, cũng như tạo hình ảnh một nhóm người đa dạng. Lần này yêu cầu được đưa ra rất chi tiết: Ảnh selfie nhóm của những sinh viên đại học đa văn hóa đang ăn trưa bên ngoài một khu nghỉ dưỡng trượt tuyết, với khuôn mặt chi tiết – nam, nữ, đa dạng – vào buổi trưa mùa đông, dưới bầu trời xanh và một phần nhiều mây.
Ở đây có rất nhiều thách thức cho các mô hình AI, từ việc tạo ra các tông màu da khác nhau cho đến thể hiện biểu cảm khuôn mặt chân thực và bàn tay của con người không bị méo mó.
Một lần nữa, Janus Pro lại tụt hậu rất xa so với các mô hình AI khác. Mặc dù tất cả các bức ảnh đều có những chi tiết bất thường do AI tạo ra nhưng Stable Diffusion, Adobe Firefly và Imagen 3 đều cho ra hình ảnh khá tốt, đặc biệt là Imagen 3.
Bài kiểm tra này nhằm đánh giá xem các mô hình AI có thể cho ra hình ảnh sáng tạo đến mức nào. Yêu cầu được đưa ra là: Một nhân vật hoạt hình dựa trên các nhân vật Disney cổ điển, hoàn chỉnh với đôi mắt to và các đặc điểm kỳ ảo, vui nhộn.
Trên thực tế, điểm nổi bật và hấp dẫn của các nhân vật lấy cảm hứng từ Disney là đôi mắt biểu cảm, các yếu tố thiết kế kỳ quặc và tỷ lệ cơ thể đáng yêu.
Hình ảnh nhân vật Disney của Janus Pro có vẻ khá kỳ lạ, trong khi Stable Diffusion tạo ra phiên bản trẻ hơn của Elsa trong phim Frozen. Có thể xem Stable Diffusion là tốt nhất trong bài kiểm tra này. Hình ảnh của các mô hình AI khác không thực sự đạt được tính thẩm mỹ giống như Disney, trong đó kết quả của Meta AI gần giống với hoạt hình Pixar hơn.
Nhiều người không thích sử dụng các công cụ AI tạo hình ảnh nói chung bởi vì chúng thiếu linh hồn và sự sáng tạo mà chỉ có thể đến từ một nghệ sĩ thực thụ. Tuy nhiên AI có thể hữu ích khi cần tạo hình mẫu nhanh, phác thảo ý tưởng hoặc bổ sung hình ảnh đơn giản để minh họa cho bài thuyết trình.
Ví dụ, các chuyên gia marketing thường sử dụng AI để đăng bài trên mạng xã hội hoặc tạo bản mô phỏng trực quan một cách nhanh chóng, trong khi những người làm giáo dục có thể sử dụng AI cho các bài học sáng tạo. Các nhà thiết kế game có thể dùng AI để tạo ra các môi trường kỳ ảo hoặc lên ý tưởng về nhân vật để các nghệ sĩ tinh chỉnh sau đó. Nhưng liệu những mô hình AI này có thực sự thay thế được trí tưởng tượng của người thật hay không? Đó vẫn là một điều gây tranh cãi.
Janus Pro đánh dấu sự gia nhập của DeepSeek vào lĩnh vực AI tạo hình ảnh, nhưng rõ ràng vẫn còn một chặng đường dài trước khi mô hình này có thể sánh ngang với những AI đã có tên tuổi như Stable Diffusion, Adobe Firefly và Imagen 3.
Mời bạn xem thêm các bài liên quan:
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
Nhận xét của bạn sẽ giúp cho mình có cơ sở để cải thiện và phát triển bài viết trong tương lai. Hãy chia sẻ nhé.