Trang Chủ Công nghệ Internet 24h Qwen Max – Mô hình AI mới ra mắt của Alibaba có...

Qwen Max – Mô hình AI mới ra mắt của Alibaba có mạnh hơn DeepSeek hay không?

31/01/2025

Trong khi DeepSeek vẫn đang thu hút sự chú ý của giới công nghệ thì một mô hình AI khác của Trung Quốc đã xuất hiện và có khả năng vượt qua nó. Gã khổng lồ thương mại điện tử Trung Quốc Alibaba đã công bố phiên bản mới của mô hình AI Qwen có rất nhiều điều đáng chú ý, thậm chí tốt hơn DeepSeek và ChatGPT ở một số khía cạnh quan trọng.

Nội dung chính

Qwen Max là gì?
Qwen có tốt hơn DeepSeek không?

So sánh các phép đo hiệu suất

Qwen Max là gì?

Qwen Max là mô hình AI mới nhất và mạnh mẽ nhất trong dòng Qwen AI của Alibaba. Hiện tại các mô hình AI Qwen đang hoạt động bao gồm:

Qwen2.5-Plus
Qwen2.5-Max
Qwen2.5-VL-72B-Instruct
Qwen2.5-14B-Instruct-1M
QVQ-72B-Preview
QwQ-32B-Preview
Qwen2.5-Coder-32B-Instruct
Qwen2.5-Turbo
Qwen2.5-72B-Instruct

Tất cả các mô hình trên đều miễn phí sử dụng và người dùng chỉ cần tạo tài khoản qua email, Google hoặc GitHub. Các mô hình AI của Qwen cũng là mã nguồn mở, nghĩa là bất cứ ai cũng có thể tìm thấy chúng trên GitHub hay HuggingFace. Mọi người cũng có thể cài đặt chúng offline ngay trên thiết bị của mình (tùy theo thông số kỹ thuật của từng thiết bị), cho phép sử dụng khi không có kết nối mạng Internet.

Qwen2.5-Max là mô hình Mixture-of-Experts (MoE) với 72 tỷ tham số, hỗ trợ 29 ngôn ngữ và được huấn luyện với hơn 20 nghìn tỷ token. Nó cũng có thể xử lý tối đa 128.000 token trong một cuộc chat duy nhất, nghĩa là người dùng có thể tải các tài liệu dài lên để AI xử lý một cách nhanh chóng. Nếu bạn cần làm việc với dữ liệu thì Qwen có thể xử lý các định dạng có cấu trúc đặc biệt như bảng, CSV và file JSON.

Đúng như tên gọi, một số mô hình Qwen có khả năng thực hiện tốt các tác vụ cụ thể. Ví dụ như Qwen2.5-Coder-32B-Instruct vượt trội trong các tác vụ về code, trong khi QwQ-32B-Preview có khả năng suy nghĩ và lập luận logic. Không phải mô hình nào cũng có thể làm được mọi việc, nhưng hầu hết các mô hình đều có khả năng xử lý lời nhắc văn bản cũng như tạo hình ảnh và video.

Một tính năng khá độc đáo khác là kết hợp hai mô hình với nhau. Trải nghiệm thực tế cho thấy có thể nhận được kết quả tốt hơn một chút khi kết hợp 2 mô hình thành một phiên bản mới mạnh hơn. Ví dụ khi kết hợp Qwen2.5-Max với Qwen2.5-Coder-32B-Instruct sẽ giúp tạo code chính xác hơn mà không cần người dùng đưa ra yêu cầu chi tiết.

Mô hình Qwen 2.5 Max tạo hình ảnh bằng AI (Ảnh: Internet)

Trang web của Qwen là cách duy nhất để truy cập chính thức vào mô hình AI này. Người dùng có thể nhập yêu cầu và xử lý văn bản, ngoài ra cũng có khả năng tạo hình ảnh và video với nhiều tỷ lệ khung hình khác nhau. Đặc biệt còn có một tính năng Tìm kiếm trên web vẫn chưa được ra mắt.

Nhược điểm là đôi khi Qwen mất thời gian khá lâu để xử lý yêu cầu của người dùng, đến nỗi nhiều người tưởng rằng trang web bị trục trặc. Thực tế cho thấy yêu cầu đầu tiên mà người dùng đưa ra trong một cuộc chat có thể mất khoảng 30 giây để tạo câu trả lời, sau đó tốc độ sẽ nhanh hơn.

Trong khi đó hình ảnh và video được tạo khá nhanh. Mặc dù chất lượng và tính chân thực của hình ảnh không phải là xuất sắc nhưng nếu bạn cần tạo hình ảnh nhanh trong trường hợp cấp bách thì vẫn khá tốt. Có thể thấy nhiều vật thể ngẫu nhiên xuất hiện trong hầu hết các hình ảnh được tạo ra.

Thời gian phản hồi lâu có thể chỉ là do máy chủ bị quá tải giống như hầu hết các chatbot AI khác khi mới ra mắt, bao gồm cả DeepSeek và ChatGPT. Đôi khi có thể xảy ra lỗi kết nối trong lúc sử dụng Qwen vì có quá nhiều người muốn sử dụng nó cùng một lúc.

Qwen 2.5 Max gặp sự cố kết nối (Ảnh: Internet)

Qwen có tốt hơn DeepSeek không?

Về mặt kỹ thuật, Qwen tốt hơn DeepSeek trên mọi phương diện. Mô hình AI của Alibaba đưa ra câu trả lời có cảm giác tự nhiên hơn và tốc độ xử lý nhanh hơn một chút. Nhưng nếu bạn không quan tâm đến các phép đo chuyên nghiệp thì rất khó nhận thấy sự khác biệt giữa hai mô hình này.

Ưu điểm chính của Qwen so với DeepSeek là được thiết kế phù hợp hơn với sở thích của người dùng, giúp bạn dễ dàng nhập các yêu cầu phức tạp và nhận được câu trả lời chính xác mà không cần tinh chỉnh nhiều. Ngay cả những câu lệnh đơn giản cũng có thể tạo ra phản hồi khá chi tiết với nhiều thông tin hữu ích. Trong khi đó DeepSeek mặc dù là một mô hình AI tuyệt vời nhưng có thể phải xử lý vài lần và đưa ra yêu cầu phù hợp mới nhận được kết quả như mong muốn.

Ứng dụng DeepSeek trên cửa hàng ứng dụng của Apple (Ảnh: Internet)

So sánh về kiến thức chung và độ chính xác thực tế, cả hai mô hình đều cho kết quả tương tự nhau nhưng Qwen tốt hơn một chút về tính ổn định thực tế.

Tuy nhiên có một yếu tố mà DeepSeek vượt trội hơn rõ ràng là chi phí sử dụng. DeepSeek có giá 0,25 USD cho 1 triệu token, trong khi Qwen có giá 0,38 USD. Dù sao mức giá này vẫn rẻ hơn nhiều so với 5 USD và 3 USD của GPT-4o và Claude 3.5.

So sánh các phép đo hiệu suất

Như đã nêu trên, Qwen vượt trội hơn DeepSeek về mọi mặt khi thực hiện các phép đo hiệu suất như bảng dưới đây.

Các phép đo cho thấy rõ ràng Qwen có khả năng hiểu rõ hơn và phù hợp hơn với ngôn ngữ tự nhiên của con người. Ngoài ra về mặt kiến thức và lý luận, kiến thức chung, làm code và khả năng tổng thể, Qwen chỉ tốt hơn DeepSeek một chút.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm