Thông tin DeepSeek-R2 có thể ra mắt trong tháng 8 nhanh chóng lan truyền trên các diễn đàn công nghệ ở Trung Quốc, nhất là khi chính AI của DeepSeek từng gợi ý về mốc thời gian này. Tuy nhiên, một nguồn tin nội bộ khẳng định điều đó không xảy ra và cho biết công ty đang chịu nhiều áp lực trong quá trình phát triển.

Vì sao DeepSeek-R2 vẫn chưa ra mắt?

Trong buổi sáng cùng ngày, nhiều trang tin công nghệ dẫn lại thông tin từ cộng đồng mạng Trung Quốc rằng DeepSeek đang chuẩn bị tung ra thế hệ mô hình ngôn ngữ mới R2 trong khoảng từ 15 đến 30 tháng 8. Điều đáng chú ý là chính DeepSeek AI, khi trả lời người dùng, cũng gợi ý về khung thời gian này.

Câu trả lời từ AI của DeepSeek gợi ý R2 có thể ra mắt trong tháng 8 (Ảnh: Internet)
Câu trả lời từ AI của DeepSeek gợi ý R2 có thể ra mắt trong tháng 8 (Ảnh: Internet)

Thế nhưng, chỉ vài giờ sau, một nguồn tin nội bộ đã khẳng định không hề có kế hoạch ra mắt R2 trong tháng 8. Đây không phải là lần đầu tiên lộ trình của DeepSeek khiến công chúng bối rối. Hồi đầu năm, cũng từng rộ tin R2 sẽ ra mắt vào ngày 17 tháng 3, nhưng cuối cùng thông tin này hoàn toàn không chính xác.

R2 được kỳ vọng sẽ là bước tiến lớn của DeepSeek, đặc biệt trong khả năng lập luận đa ngôn ngữ và tạo mã, đủ sức cạnh tranh với những mô hình hàng đầu như GPT-4 hay GPT-5. Tuy nhiên, quá trình phát triển đã gặp không ít trở ngại. Theo The Information, CEO Liang Wenfeng vẫn chưa hài lòng với hiệu năng của R2 dù nhóm phát triển đã dành nhiều tháng để tinh chỉnh.

CEO Liang Wenfeng chưa hài lòng với hiệu năng của DeepSeek-R2 dù nhóm phát triển đã nỗ lực tinh chỉnh trong nhiều tháng (Ảnh: Internet)
CEO Liang Wenfeng chưa hài lòng với hiệu năng của DeepSeek-R2 dù nhóm phát triển đã nỗ lực tinh chỉnh trong nhiều tháng (Ảnh: Internet)

Ngoài yếu tố kỹ thuật, vấn đề hạ tầng cũng là nguyên nhân quan trọng. DeepSeek đang phải hoạt động trong điều kiện hạn chế về năng lực tính toán, nhất là sau khi chip Nvidia H20 bị cấm xuất khẩu sang Trung Quốc. Một số nguồn tin cho biết công ty lo ngại rằng nếu tung R2 quá sớm, hệ thống có thể bị quá tải khi lượng người dùng tăng đột biến, gây ảnh hưởng đến uy tín sản phẩm.

Bức tranh có phần sáng hơn khi gần đây Nvidia và AMD đạt thỏa thuận với chính phủ Mỹ để tiếp tục bán chip AI tại Trung Quốc, đổi lại sẽ trích 15% doanh thu tại thị trường này. Tuy nhiên, ảnh hưởng thực sự tới DeepSeek sẽ cần thêm thời gian mới thấy rõ. Trong thời gian chờ đợi, công ty đang huấn luyện R2 trên chip Ascend 910B của Huawei, có hiệu năng đạt khoảng 91% so với cụm Nvidia A100. Đây là tín hiệu tích cực nhưng vẫn chưa đủ để bảo đảm cho một đợt ra mắt ở quy mô lớn.

DeepSeek đang huấn luyện R2 trên chip Ascend 910B của Huawei, có hiệu năng tương đương khoảng 91% cụm Nvidia A100 (Ảnh: Internet)
DeepSeek đang huấn luyện R2 trên chip Ascend 910B của Huawei, có hiệu năng tương đương khoảng 91% cụm Nvidia A100 (Ảnh: Internet)

Tạm kết

Có thể thấy, DeepSeek-R2 vẫn đang được phát triển tích cực, nhưng công ty tỏ ra thận trọng trước khi công bố chính thức. Trong cuộc đua AI khốc liệt, một mô hình mạnh thôi chưa đủ. Nó cần phải ổn định, có khả năng xử lý tốt khi lượng người dùng tăng cao và sẵn sàng phục vụ hàng triệu người ngay khi ra mắt.

Hiện tại, câu hỏi không còn là R2 có tồn tại hay không, mà là khi nào DeepSeek cảm thấy đủ tự tin để đặt nó trước ánh nhìn của cả thế giới. Và cho đến lúc đó, mọi đồn đoán vẫn chỉ dừng lại ở mức tin hành lang.

Xem thêm

Pixel 10 Pro & Pixel 10 Pro XL Ra Mắt: Flagship AI của Google với mức giá cao cấp

Google vừa chính thức giới thiệu hai mẫu flagship mới nhất của mình, Pixel 10 Pro và Pixel 10 Pro XL. Điểm nhấn của dòng máy này không chỉ nằm ở phần cứng nâng cấp mạnh mẽ mà còn ở các tính năng phần mềm thông minh, đặc biệt là những công cụ AI tiên tiến, hứa hẹn mang ...
Theo dõi bình luận
Thông báo về
guest
1 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận