Các mô hình cao cấp của DeepSeek không chỉ gần như ngang bằng với các đối thủ hiện nay mà còn vượt trội hơn ở một số khía cạnh. Mô hình mới nhất là DeepSeek-V3 đạt điểm cao hơn trong một số phép đo về làm code, tính toán và xử lý ngôn ngữ tiếng Trung so với GPT-4o của OpenAI và Claude-3.5 của Anthropic – vốn được coi là các tiêu chuẩn cao nhất về hiệu suất AI cho đến khi DeepSeek hạ bệ chúng một cách dễ dàng.
Trên thực tế DeepSeek đã xuất hiện được một thời gian, nhưng đến ngày 20 tháng 1 năm 2025 nó mới bắt đầu trở nên phổ biến. Đó là ngày phiên bản DeepSeek-R1 được phát hành – mô hình AI đầu tiên của công ty có khả năng lý luận như con người.
Ngay cả những người sử dụng AI khá thường xuyên cũng phải thừa nhận rằng mô hình DeepSeek-R1 có vẻ rất thông minh khi nó dường như suy nghĩ trước khi đưa ra câu trả lời cho câu hỏi của người dùng như hình dưới đây.
Mặc dù chúng ta đã thấy AI có khả năng suy luận kể từ khi OpenAI phát hành GPT-o1 vào tháng 9 năm 2024 nhưng nó vẫn nằm ngoài khả năng tiếp cận của hầu hết mọi người. Điều đó vẫn đúng cho đến hiện tại – người dùng sẽ phải trả 20 USD mỗi tháng đăng ký ChatGPT Plus để sử dụng mô hình GPT-o1.
Đối với các nhà phát triển muốn tích hợp các mô hình AI vào ứng dụng của riêng mình, DeepSeek là lựa chọn tuyệt vời khi rẻ hơn khoảng 20 đến 30 lần so với mô hình cơ bản của ChatGPT. Tất cả các yếu tố này kết hợp lại khiến DeepSeek trở thành đối thủ đáng gờm trong cuộc đua AI, mặc dù nó xuất hiện một cách đầy bất ngờ.
Mặc dù hiện tại DeepSeek vượt trội hơn các chatbot AI khác về mặt kỹ thuật nhưng nhiều người cho rằng nó không thực sự là đột phá như giới truyền thông đang thổi phồng. Thứ nhất, mô hình này vẫn dễ mắc sai lầm giống như bất kỳ AI nào khác và trên thực tế nó hoàn toàn có thể bịa ra thông tin sai sự thật vô căn cứ khi được hỏi về điều gì đó mà nó không hiểu biết. Điều này khiến khả năng sử dụng của nó chỉ giới hạn theo tình huống cụ thể – không khác nhiều so với ChatGPT.
Ngay cả DeepSeek-R1 là mô hình có khả năng suy luận giống con người cũng chỉ hoạt động tốt trong các trường hợp rất hạn chế. Ngoại trừ việc tạo code phức tạp hay giải các bài toán thông thường, mô hình này sẽ không đưa ra được kết quả tốt hơn so với mô hình cơ bản là DeepSeek-V3. Mô hình V3 không có khả năng lý luận nhưng nó hoạt động nhanh hơn đáng kể và gần như thành thạo trong việc trả lời các câu hỏi và các nhiệm vụ thông thường.
Do đó hiện tại không có nhiều lý do để chuyển sang DeepSeek, kể cả khi bạn đang sử dụng phiên bản thông thường của ChatGPT và Gemini. Trong khi đó Gemini có hệ sinh thái được xây dựng hoàn thiện hơn nhiều với các tính năng như tầm nhìn và trò chuyện 2 chiều bằng giọng nói của Gemini Live được nhiều người đánh giá cao. Hiện tại DeepSeek chỉ hỗ trợ trò chuyện bằng văn bản, mặc dù điều đó có thể sẽ sớm thay đổi.
Bên cạnh đó cũng có một vấn đề nan giải: quyền riêng tư và kiểm duyệt. Nhiều người không quan tâm đến nguồn gốc của DeepSeek là từ Trung Quốc, nhưng đó là vì họ không sử dụng AI cho các công việc đòi hỏi sự thận trọng và bí mật. Trong khi đó OpenAI phải tuân thủ các quy định về quyền riêng tư dữ liệu ở Châu Âu và Bắc Mỹ nên ít nhất người dùng có thể thay đổi cài đặt của nó để ngăn dữ liệu từ các cuộc trò chuyện của mình bị sử dụng cho việc huấn luyện AI trong tương lai. Đối với DeepSeek thì không thể chắc chắn về điều đó, trừ khi bạn sử dụng nó offline trên thiết bị của riêng mình.
Nếu sử dụng phiên bản online của DeepSeek, bạn cũng sẽ phải đối mặt với vấn đề kiểm duyệt. Hiện tại chatbot này né tránh các chủ đề nhạy cảm liên quan đến Trung Quốc, nhưng trong tương lai nó có thể bị sử dụng cho việc lan truyền thông tin sai lệch. Vì vậy nếu bạn muốn sử dụng chatbot với độ trung thực và chính xác cao nhất thì DeepSeek không hoàn toàn phù hợp.
DeepSeek thuộc sở hữu của doanh nhân Trung Quốc Liang Wenfeng, đây cũng là người sáng lập của một quỹ đầu cơ có tên là High-Flyer. Trên thực tế, thành tích vượt trội của công ty này sẽ không được chú ý nhiều bên ngoài lĩnh vực AI nếu không phải vì nguồn gốc từ Trung Quốc và ngân sách khiêm tốn. DeepSeek đã thành công trong việc hạ bệ các dự án trị giá hàng tỷ đô la như OpenAI, đồng thời chứng minh rằng đầu tư lớn hơn không phải lúc nào cũng mang lại kết quả tốt hơn.
Trung Quốc từ trước đến nay vẫn tụt hậu so với phương Tây trong cuộc đua AI, phần lớn là do chính phủ Mỹ áp đặt các biện pháp kiểm soát xuất khẩu nghiêm ngặt đối với các công ty Mỹ như Nvidia bắt đầu từ năm 2022. Các biện pháp kiểm soát này cấm bán phần cứng AI cao cấp cho các công ty Trung Quốc. Hơn nữa, nếu không có sự hỗ trợ của những gã khổng lồ công nghệ như Microsoft và Google rót hàng tỷ đô la vào nghiên cứu và phát triển AI thì có lẽ Trung Quốc sẽ không bao giờ bắt kịp.
Tuy nhiên giờ đây chúng ta đã thấy một công ty khởi nghiệp nhỏ của Trung Quốc phát triển được một mô hình AI có hiệu suất cao với chi phí đầu tư chỉ khoảng 6 triệu USD – một phần nhỏ so với ngân sách mà OpenAI và Google đã sử dụng. DeepSeek đã đạt được thành tích này bằng cách sử dụng GPU NVIDIA H800 đời cũ mà công ty này đã mua được bất chấp lệnh kiểm soát xuất khẩu của Mỹ. Đồng thời chatbot này cũng sử dụng chip do Huawei sản xuất trong nước, qua đó chứng minh thêm rằng Trung Quốc không cần phần cứng của Mỹ để cạnh tranh trong cuộc đua AI.
Thành công của DeepSeek đã làm rung chuyển cả chính phủ Mỹ và các công ty công nghệ khổng lồ của Mỹ, nhưng có lẽ chỉ trong ngắn hạn. Định giá của NVIDIA trên sàn chứng khoán đã giảm 600 tỷ USD trong khi chỉ số NASDAQ 100 tập trung vào cổ phiếu công nghệ đã giảm 4% chỉ trong một phiên giao dịch. Tuy nhiên hầu hết các chỉ số đó đã đảo ngược xu hướng ngay vào ngày hôm sau, báo hiệu rằng thị trường vẫn lạc quan về tương lai của AI.
Mời bạn xem thêm các bài liên quan:
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
Mình rất mong muốn biết ý kiến của các bạn về bài viết này, hãy để lại bình luận giúp mình nhé.