ChatGPT của OpenAI và Gemini của Google đều là những công cụ chatbot AI rất mạnh với khả năng tạo văn bản, xử lý hình ảnh và làm code. Phiên bản miễn phí của chúng có thể thực hiện tốt các công việc cơ bản, nhưng phiên bản cao cấp trả phí còn có nhiều tính năng hấp dẫn hơn. ChatGPT Plus đang dẫn đầu trên thị trường hiện nay, nhưng liệu Gemini Advanced của Google có phải là đối thủ xứng tầm? Hãy cùng khám phá nhé!
- Giao diện người dùng
- Khả năng trả lời câu hỏi ở nhiều dạng khác nhau
- Tóm tắt nội dung trang web
- Tóm tắt nội dung hình ảnh
- Nhận dạng ký tự văn bản trong hình ảnh
- Tóm tắt nội dung video
- So sánh ứng dụng di động
- Tính toán và lý luận
- Tạo hình ảnh
- Giá đăng ký và giới hạn sử dụng
- Tóm lại: Nên chọn ChatGPT Plus hay Gemini Advanced?
ChatGPT và Gemini là những đối thủ ngang tài ngang sức, nhất là khi GPT-4 và Gemini Advanced – các mô hình ngôn ngữ lớn cao cấp của chúng – có khả năng hoạt động tương tự nhau trong một số lĩnh vực. Dưới đây là so sánh ChatGPT Plus và Gemini Advanced giúp bạn đưa ra lựa chọn phù hợp nhất.
Giao diện người dùng
Cả hai đều có giao diện tương tự nhau theo kiểu chatbot đối thoại, dù là người mới bắt đầu hay người dùng chuyên nghiệp đều có thể sử dụng dễ dàng và có đầy đủ chức năng.
Giao diện có nhiều điểm giống nhau nhưng phong cách trò chuyện của các AI này lại khác biệt: ChatGPT hiển thị từng từ, trong khi Gemini tạo ra từng dòng văn bản. Điều này tùy theo sở thích cá nhân của mỗi người, nhưng có lẽ chatbot nên đưa ra tùy chọn cả hai cách hiển thị thay vì mặc định không thể thay đổi như hiện tại.
Một điểm khác biệt là ChatGPT đưa ra một câu trả lời duy nhất, nếu bạn không hài lòng thì có thể yêu cầu trả lời lại bằng cách nhấn Regenerate (Tạo lại). Trong khi đó Gemini tạo ra một số phiên bản câu trả lời khác nhau để người dùng lựa chọn, ngoài ra còn có sẵn một số chức năng để điều chỉnh câu trả lời phù hợp nhất, ví dụ bạn có thể chọn câu trả lời ngắn hơn, dài hơn, đơn giản hơn hoặc chuyên nghiệp hơn, Gemini sẽ đáp ứng theo yêu cầu đó.
Cả hai chatbot đều có thể đưa ra nguồn của thông tin nếu bạn yêu cầu. ChatGPT hiển thị nguồn ở cuối mỗi đoạn, trong khi Gemini hiển thị nguồn ngay sau mỗi câu.
Tóm lại, mặc dù giao diện khá giống nhau nhưng các tính năng bổ sung của Gemini được đánh giá cao hơn một chút so với ChatGPT.
Khả năng trả lời câu hỏi ở nhiều dạng khác nhau
Để trả lời câu hỏi một cách chính xác, AI phải hiểu nội dung và mục đích của câu hỏi, từ đó tạo kết quả đầu ra – nếu thiếu bất kỳ yếu tố nào cũng không có được câu trả lời phù hợp.
Tóm tắt nội dung trang web
Thử nghiệm yêu cầu ChatGPT và Gemini tóm tắt một trang trên Wikipedia, vì cả hai chatbot này đều có thể truy cập URL bên ngoài và tóm tắt văn bản là điểm mạnh của chúng. Kết quả đều rất tốt như hình dưới đây.
Tóm tắt nội dung hình ảnh
Khi được yêu cầu tóm tắt một hình ảnh, cả hai chatbot đều không thể truy cập hình ảnh thông qua URL được người dùng cung cấp, mặc dù hình ảnh đó không bị chặn bởi tường lửa và trang web đó cũng không chặn AI, vì vậy chỉ có thể tải file hình ảnh trực tiếp vào chatbot. Cả hai đều xác định đúng các chi tiết của hình ảnh và đưa ra bản tóm tắt chính xác.
Nhận dạng ký tự văn bản trong hình ảnh
Thử nghiệm trước đây cho thấy AI có thể nhận diện được văn bản trong hình ảnh, nhưng khi sử dụng văn bản có kích thước và màu sắc khác nhau thì sẽ thế nào?
Cả hai công cụ dường như đều hoạt động tốt lúc đầu, ChatGPT tạo ra kết quả rất chính xác nhưng Gemini lại gặp trục trặc giữa chừng và chuyển sang tóm tắt nội dung trong ảnh. Tất nhiên điều này không có nghĩa là Gemini Advanced kém thông minh hơn, nhưng nó không thực hiện đúng yêu cầu được đưa ra.
Tóm tắt nội dung video
Có thể yêu cầu chatbot tóm tắt video giống như văn bản được không? Hiện tại người dùng không thể tải video trực tiếp vào ChatGPT, khi nhập link của video YouTube sẽ thấy thông báo rằng ChatGPT không thể tạo bản thuyết minh cho video trực tuyến. Tuy nhiên chatbot này có tích hợp thư viện GPT của bên thứ ba và bạn có thể tìm thấy các mô hình GPT như Full Video Transcript để thuyết minh nội dung video.
Đối với Gemini thì ngược lại, công cụ này có sẵn plugin dành riêng để xử lý video YouTube. Tuy nhiên trải nghiệm thực tế cũng mắc lỗi như trên, chatbot chuyển sang tóm tắt nội dung video thay vì tạo ra bản thuyết minh đầy đủ như yêu cầu. Lưu ý rằng đây chỉ là video YouTube, ngoài ra không thể lấy video từ các trang khác.
Thử nghiệm về mức độ hiểu nội dung video của AI bằng cách đặt một câu hỏi cụ thể cùng với mốc thời gian trong video. Kết quả ChatGPT sai về mốc thời gian nhưng lại trả lời đúng câu hỏi, trong khi Gemini không tìm được câu trả lời trong video. Như vậy ChatGPT được đánh giá cao hơn ở mục này.
So sánh ứng dụng di động
Camera và micrô có sẵn trong điện thoại cho phép thực hiện các chức năng nâng cao trong ứng dụng di động của cả hai chatbot. Dưới đây là thử nghiệm trên điện thoại Google Pixel.
Nhận dạng hình ảnh
Chụp ảnh một bộ tai nghe headphone và đặt câu hỏi cho chatbot trong ứng dụng. Đầu tiên, tại sao tai nghe lại có cổng USB thay vì jack 3,5mm thông thường? Cả hai đều giải thích khá rõ ràng, và khi được hỏi làm sao để kết nối tai nghe với điện thoại để nghe âm thanh, cả hai đều trả lời đúng.
Khi được yêu cầu xác định tên của mẫu tai nghe, Gemini đã trả lời đúng, sau đó cũng tìm được link mua sản phẩm.
Chuyển giọng nói thành văn bản
Đây cũng là một tính năng quan trọng của AI. ChatGPT lắng nghe cho đến khi bạn dừng nói, sau đó chuyển thành văn bản một cách chính xác.
Google cũng rất mạnh về tính năng này nên Gemini Advanced có thể nhận diện giọng nói một cách rất trực tiếp, liền mạch và chính xác.
Ngoài ra ChatGPT được tích hợp sẵn tính năng trò chuyện bằng giọng nói, thậm chí có thể dịch ngôn ngữ theo yêu cầu, vì vậy được đánh giá cao hơn Gemini.
Tính toán và lý luận
Một trong những chức năng tốt nhất của AI là giải quyết các vấn đề logic phức tạp, kể cả khi bạn cung cấp rất nhiều dữ liệu thì chatbot vẫn có thể đưa ra câu trả lời trong chớp mắt. Vậy hãy so sánh ChatGPT Plus và Gemini Advanced về khả năng giải quyết vấn đề logic.
Bài toán đơn giản
Đặt câu hỏi cho cả hai công cụ: “Một số học sinh lên kế hoạch đi dã ngoại. Ngân sách dành cho đồ ăn là 24 đô la. Vì 4 học sinh không đi dã ngoại nên chi phí thức ăn cho mỗi học sinh tăng thêm 1 đô la. Có bao nhiêu học sinh tham dự buổi dã ngoại?”
Cả ChatGPT 4 và Gemini Advanced đều trả lời 12 – sai. Đây là suy luận logic đơn giản: nếu có 12 người và mỗi người cần 2 USD thì tổng là 24 USD, nếu 4 người không đi thì 8 người còn lại sẽ được thêm 1 đô la cho mỗi người. Vậy câu trả lời là 8.
ChatGPT đã sử dụng lập trình Python để tìm câu trả lời, trong khi Gemini sử dụng giải phương trình. Trong toán học, chính xác là điều quan trọng nhất, vì vậy cả hai công cụ đều thất bại ở mục này.
Điều đặc biệt là Gemini đã đưa ra một đáp án đúng là 8 trong số các bản nháp, tức là nó đã tính toán và tìm ra đáp án khác so với thông thường. Lẽ ra nó nên kiểm tra kỹ hơn khi phát hiện có sự khác biệt.
Tuy nhiên mới đây ChatGPT đã phát hành phiên bản mới GPT-4 Turbo được cho là giỏi tính toán logic hơn, và thực tế đúng là như vậy.
Câu đố mẹo
Đưa ra câu đố về những con chim đậu trên dây như hình dưới đây để đánh giá khả năng hiểu thế giới thực của AI. Kết quả ChatGPT trả lời đúng còn Gemini vẫn mắc sai lầm.
Khả năng vẽ biểu đồ
Cung cấp dữ liệu cho cả hai chatbot và yêu cầu vẽ biểu đồ, cả ChatGPT và Gemini đều cho kết quả chính xác. Gemini có sẵn một số tùy chọn để thay đổi dạng biểu đồ, bạn cũng có thể làm tương tự với ChatGPT bằng cách đưa ra yêu cầu.
Khả năng lập trình
Đây được coi là chức năng quan trọng nhất của AI khi có thể biến ý tưởng dưới dạng văn bản bình thường trở thành code hoạt động hiệu quả. Với yêu cầu tạo code để trì hoãn việc nhập văn bản, cả ChatGPT và Gemini Advanced đều làm rất tốt, mặc dù phải chỉnh sửa vài lần để phù hợp với mục đích sử dụng nhưng cuối cùng code đã hoạt động. Hai công cụ ngang bằng nhau ở mục này.
Sáng tạo văn bản
Thử nghiệm yêu cầu cả hai công cụ viết một câu chuyện 100 từ về chủ đề AI, kết quả đều rất tốt.
Tạo hình ảnh
Khả năng tạo hình ảnh của GPT không ngừng được cải thiện để kết quả trông giống thật hơn thay vì hình ảnh đơn giản của các phiên bản trước. ChatGPT hiện có một công cụ chỉnh sửa cho phép bạn chọn một vùng nhất định trong hình ảnh sau khi tạo và chỉnh sửa bằng lời nhắc.
Ngược lại, Gemini không có tính năng như vậy nên khi được yêu cầu chỉnh sửa nó sẽ tạo ra hình ảnh hoàn toàn mới. Do đó ChatGPT được đánh giá cao hơn ở mục này.
Giá đăng ký và giới hạn sử dụng
Cả ChatGPT Plus và Gemini đều có giá 20 USD mỗi tháng. ChatGPT giới hạn 40 tin nhắn mỗi 3 giờ, trong khi Gemini cho phép 50 tin nhắn.
ChatGPT cho phép người dùng tạo mô hình GPT tùy chỉnh để mở rộng khả năng sử dụng ngoài những tính năng gốc của OpenAI, ví dụ ChatGPT có thể chơi game nhưng cửa hàng GPT của nó cũng có rất nhiều game. Trong khi đó Gemini có rất ít tiện ích mở rộng, chủ yếu là các sản phẩm của Google. Như vậy ChatGPT tốt hơn ở mục này.
Tóm lại: Nên chọn ChatGPT Plus hay Gemini Advanced?
Tổng hợp các kết quả trên cho thấy ChatGPT tốt hơn một chút nhưng Gemini cũng không thua kém đáng kể. Ở một góc nhìn khác, chỉ riêng các mô hình GPT tùy chỉnh của ChatGPT đã có giá trị hơn nhiều, vì vậy nếu phải chọn một trong hai thì hãy sử dụng ChatGPT Plus.
Mời bạn xem thêm các bài liên quan:
- Công cụ chỉnh sửa hình ảnh Luminar Neo ra mắt 3 tính năng AI mới cực kỳ thú vị
- 6 công cụ AI tạo hình ảnh chân thực giống như ảnh chụp ngoài đời thật
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
Các bạn có thắc mắc hoặc góp ý gì về bài viết này không? Đừng ngần ngại để lại nhận xét của mình nhé!