ChatGPT của OpenAI và Gemini của Google đều là những công cụ chatbot AI rất mạnh với khả năng tạo văn bản, xử lý hình ảnh và làm code. Phiên bản miễn phí của chúng có thể thực hiện tốt các công việc cơ bản, nhưng phiên bản cao cấp trả phí còn có nhiều tính năng hấp dẫn hơn. ChatGPT Plus đang dẫn đầu trên thị trường hiện nay, nhưng liệu Gemini Advanced của Google có phải là đối thủ xứng tầm? Hãy cùng khám phá nhé!

ChatGPT và Gemini là những đối thủ ngang tài ngang sức, nhất là khi GPT-4 và Gemini Advanced – các mô hình ngôn ngữ lớn cao cấp của chúng – có khả năng hoạt động tương tự nhau trong một số lĩnh vực. Dưới đây là so sánh ChatGPT Plus và Gemini Advanced giúp bạn đưa ra lựa chọn phù hợp nhất.

Giao diện người dùng

Cả hai đều có giao diện tương tự nhau theo kiểu chatbot đối thoại, dù là người mới bắt đầu hay người dùng chuyên nghiệp đều có thể sử dụng dễ dàng và có đầy đủ chức năng.

Giao diện của ChatGPT Plus (Ảnh: Internet)
Giao diện của ChatGPT Plus (Ảnh: Internet)

Giao diện có nhiều điểm giống nhau nhưng phong cách trò chuyện của các AI này lại khác biệt: ChatGPT hiển thị từng từ, trong khi Gemini tạo ra từng dòng văn bản. Điều này tùy theo sở thích cá nhân của mỗi người, nhưng có lẽ chatbot nên đưa ra tùy chọn cả hai cách hiển thị thay vì mặc định không thể thay đổi như hiện tại.

Giao diện của Gemini Advanced (Ảnh: Internet)
Giao diện của Gemini Advanced (Ảnh: Internet)

Một điểm khác biệt là ChatGPT đưa ra một câu trả lời duy nhất, nếu bạn không hài lòng thì có thể yêu cầu trả lời lại bằng cách nhấn Regenerate (Tạo lại). Trong khi đó Gemini tạo ra một số phiên bản câu trả lời khác nhau để người dùng lựa chọn, ngoài ra còn có sẵn một số chức năng để điều chỉnh câu trả lời phù hợp nhất, ví dụ bạn có thể chọn câu trả lời ngắn hơn, dài hơn, đơn giản hơn hoặc chuyên nghiệp hơn, Gemini sẽ đáp ứng theo yêu cầu đó.

Tính năng điều chỉnh câu trả lời của Gemini (Ảnh: Internet)
Tính năng điều chỉnh câu trả lời của Gemini (Ảnh: Internet)

Cả hai chatbot đều có thể đưa ra nguồn của thông tin nếu bạn yêu cầu. ChatGPT hiển thị nguồn ở cuối mỗi đoạn, trong khi Gemini hiển thị nguồn ngay sau mỗi câu.

Tóm lại, mặc dù giao diện khá giống nhau nhưng các tính năng bổ sung của Gemini được đánh giá cao hơn một chút so với ChatGPT.

Khả năng trả lời câu hỏi ở nhiều dạng khác nhau

Để trả lời câu hỏi một cách chính xác, AI phải hiểu nội dung và mục đích của câu hỏi, từ đó tạo kết quả đầu ra – nếu thiếu bất kỳ yếu tố nào cũng không có được câu trả lời phù hợp.

Tóm tắt nội dung trang web

Thử nghiệm yêu cầu ChatGPT và Gemini tóm tắt một trang trên Wikipedia, vì cả hai chatbot này đều có thể truy cập URL bên ngoài và tóm tắt văn bản là điểm mạnh của chúng. Kết quả đều rất tốt như hình dưới đây.

ChatGPT tóm tắt nội dung trang web (Ảnh: Internet)
ChatGPT tóm tắt nội dung trang web (Ảnh: Internet)
Gemini tóm tắt nội dung trang web (Ảnh: Internet)
Gemini tóm tắt nội dung trang web (Ảnh: Internet)

Tóm tắt nội dung hình ảnh

Khi được yêu cầu tóm tắt một hình ảnh, cả hai chatbot đều không thể truy cập hình ảnh thông qua URL được người dùng cung cấp, mặc dù hình ảnh đó không bị chặn bởi tường lửa và trang web đó cũng không chặn AI, vì vậy chỉ có thể tải file hình ảnh trực tiếp vào chatbot. Cả hai đều xác định đúng các chi tiết của hình ảnh và đưa ra bản tóm tắt chính xác.

ChatGPT tóm tắt nội dung hình ảnh (Ảnh: Internet)
ChatGPT tóm tắt nội dung hình ảnh (Ảnh: Internet)
Gemini tóm tắt nội dung hình ảnh (Ảnh: Internet)
Gemini tóm tắt nội dung hình ảnh (Ảnh: Internet)

Nhận dạng ký tự văn bản trong hình ảnh

Thử nghiệm trước đây cho thấy AI có thể nhận diện được văn bản trong hình ảnh, nhưng khi sử dụng văn bản có kích thước và màu sắc khác nhau thì sẽ thế nào?

Cả hai công cụ dường như đều hoạt động tốt lúc đầu, ChatGPT tạo ra kết quả rất chính xác nhưng Gemini lại gặp trục trặc giữa chừng và chuyển sang tóm tắt nội dung trong ảnh. Tất nhiên điều này không có nghĩa là Gemini Advanced kém thông minh hơn, nhưng nó không thực hiện đúng yêu cầu được đưa ra.

ChatGPT nhận diện văn bản trong hình ảnh (Ảnh: Internet)
ChatGPT nhận diện văn bản trong hình ảnh (Ảnh: Internet)
Gemini nhận diện văn bản trong hình ảnh (Ảnh: Internet)
Gemini nhận diện văn bản trong hình ảnh (Ảnh: Internet)

Tóm tắt nội dung video

Có thể yêu cầu chatbot tóm tắt video giống như văn bản được không? Hiện tại người dùng không thể tải video trực tiếp vào ChatGPT, khi nhập link của video YouTube sẽ thấy thông báo rằng ChatGPT không thể tạo bản thuyết minh cho video trực tuyến. Tuy nhiên chatbot này có tích hợp thư viện GPT của bên thứ ba và bạn có thể tìm thấy các mô hình GPT như Full Video Transcript để thuyết minh nội dung video.

Các mô hình GPT tóm tắt video (Ảnh: Internet)
Các mô hình GPT tóm tắt video (Ảnh: Internet)

Đối với Gemini thì ngược lại, công cụ này có sẵn plugin dành riêng để xử lý video YouTube. Tuy nhiên trải nghiệm thực tế cũng mắc lỗi như trên, chatbot chuyển sang tóm tắt nội dung video thay vì tạo ra bản thuyết minh đầy đủ như yêu cầu. Lưu ý rằng đây chỉ là video YouTube, ngoài ra không thể lấy video từ các trang khác.

Kết quả tạo bản thuyết minh video của Gemini (Ảnh: Internet)
Kết quả tạo bản thuyết minh video của Gemini (Ảnh: Internet)

Thử nghiệm về mức độ hiểu nội dung video của AI bằng cách đặt một câu hỏi cụ thể cùng với mốc thời gian trong video. Kết quả ChatGPT sai về mốc thời gian nhưng lại trả lời đúng câu hỏi, trong khi Gemini không tìm được câu trả lời trong video. Như vậy ChatGPT được đánh giá cao hơn ở mục này.

ChatGPT trả lời về nội dung video và mốc thời gian (Ảnh: Internet)
ChatGPT trả lời về nội dung video và mốc thời gian (Ảnh: Internet)
Gemini trả lời về nội dung video và mốc thời gian (Ảnh: Internet)
Gemini trả lời về nội dung video và mốc thời gian (Ảnh: Internet)

So sánh ứng dụng di động

Camera và micrô có sẵn trong điện thoại cho phép thực hiện các chức năng nâng cao trong ứng dụng di động của cả hai chatbot. Dưới đây là thử nghiệm trên điện thoại Google Pixel.

Nhận dạng hình ảnh

Chụp ảnh một bộ tai nghe headphone và đặt câu hỏi cho chatbot trong ứng dụng. Đầu tiên, tại sao tai nghe lại có cổng USB thay vì jack 3,5mm thông thường? Cả hai đều giải thích khá rõ ràng, và khi được hỏi làm sao để kết nối tai nghe với điện thoại để nghe âm thanh, cả hai đều trả lời đúng.

ChatGPT và Gemini trả lời câu hỏi về ảnh chụp (Ảnh: Internet)
ChatGPT và Gemini trả lời câu hỏi về ảnh chụp (Ảnh: Internet)

Khi được yêu cầu xác định tên của mẫu tai nghe, Gemini đã trả lời đúng, sau đó cũng tìm được link mua sản phẩm.

Kết quả xác định mẫu tai nghe với ChatGPT và Gemini (Ảnh: Internet)
Kết quả xác định mẫu tai nghe với ChatGPT và Gemini (Ảnh: Internet)

Chuyển giọng nói thành văn bản

Đây cũng là một tính năng quan trọng của AI. ChatGPT lắng nghe cho đến khi bạn dừng nói, sau đó chuyển thành văn bản một cách chính xác.

Chuyển giọng nói thành văn bản với ChatGPT (Ảnh: Internet)
Chuyển giọng nói thành văn bản với ChatGPT (Ảnh: Internet)

Google cũng rất mạnh về tính năng này nên Gemini Advanced có thể nhận diện giọng nói một cách rất trực tiếp, liền mạch và chính xác.

Chuyển giọng nói thành văn bản với Gemini (Ảnh: Internet)
Chuyển giọng nói thành văn bản với Gemini (Ảnh: Internet)

Ngoài ra ChatGPT được tích hợp sẵn tính năng trò chuyện bằng giọng nói, thậm chí có thể dịch ngôn ngữ theo yêu cầu, vì vậy được đánh giá cao hơn Gemini.

Tính toán và lý luận

Một trong những chức năng tốt nhất của AI là giải quyết các vấn đề logic phức tạp, kể cả khi bạn cung cấp rất nhiều dữ liệu thì chatbot vẫn có thể đưa ra câu trả lời trong chớp mắt. Vậy hãy so sánh ChatGPT Plus và Gemini Advanced về khả năng giải quyết vấn đề logic.

Bài toán đơn giản

Đặt câu hỏi cho cả hai công cụ: “Một số học sinh lên kế hoạch đi dã ngoại. Ngân sách dành cho đồ ăn là 24 đô la. Vì 4 học sinh không đi dã ngoại nên chi phí thức ăn cho mỗi học sinh tăng thêm 1 đô la. Có bao nhiêu học sinh tham dự buổi dã ngoại?”

Cả ChatGPT 4 và Gemini Advanced đều trả lời 12 – sai. Đây là suy luận logic đơn giản: nếu có 12 người và mỗi người cần 2 USD thì tổng là 24 USD, nếu 4 người không đi thì 8 người còn lại sẽ được thêm 1 đô la cho mỗi người. Vậy câu trả lời là 8.

ChatGPT trả lời câu đố logic toán học (Ảnh: Internet)
ChatGPT trả lời câu đố logic toán học (Ảnh: Internet)
Gemini trả lời câu đố logic toán học (Ảnh: Internet)
Gemini trả lời câu đố logic toán học (Ảnh: Internet)

ChatGPT đã sử dụng lập trình Python để tìm câu trả lời, trong khi Gemini sử dụng giải phương trình. Trong toán học, chính xác là điều quan trọng nhất, vì vậy cả hai công cụ đều thất bại ở mục này.

Điều đặc biệt là Gemini đã đưa ra một đáp án đúng là 8 trong số các bản nháp, tức là nó đã tính toán và tìm ra đáp án khác so với thông thường. Lẽ ra nó nên kiểm tra kỹ hơn khi phát hiện có sự khác biệt.

Tuy nhiên mới đây ChatGPT đã phát hành phiên bản mới GPT-4 Turbo được cho là giỏi tính toán logic hơn, và thực tế đúng là như vậy.

Câu đố mẹo

Đưa ra câu đố về những con chim đậu trên dây như hình dưới đây để đánh giá khả năng hiểu thế giới thực của AI. Kết quả ChatGPT trả lời đúng còn Gemini vẫn mắc sai lầm.

ChatGPT trả lời câu đố mẹo (Ảnh: Internet)
ChatGPT trả lời câu đố mẹo (Ảnh: Internet)
Gemini trả lời câu đố mẹo (Ảnh: Internet)
Gemini trả lời câu đố mẹo (Ảnh: Internet)

Khả năng vẽ biểu đồ

Cung cấp dữ liệu cho cả hai chatbot và yêu cầu vẽ biểu đồ, cả ChatGPT và Gemini đều cho kết quả chính xác. Gemini có sẵn một số tùy chọn để thay đổi dạng biểu đồ, bạn cũng có thể làm tương tự với ChatGPT bằng cách đưa ra yêu cầu.

Khả năng lập trình

Đây được coi là chức năng quan trọng nhất của AI khi có thể biến ý tưởng dưới dạng văn bản bình thường trở thành code hoạt động hiệu quả. Với yêu cầu tạo code để trì hoãn việc nhập văn bản, cả ChatGPT và Gemini Advanced đều làm rất tốt, mặc dù phải chỉnh sửa vài lần để phù hợp với mục đích sử dụng nhưng cuối cùng code đã hoạt động. Hai công cụ ngang bằng nhau ở mục này.

Sáng tạo văn bản

Thử nghiệm yêu cầu cả hai công cụ viết một câu chuyện 100 từ về chủ đề AI, kết quả đều rất tốt.

ChatGPT sáng tác câu chuyện theo yêu cầu (Ảnh: Internet)
ChatGPT sáng tác câu chuyện theo yêu cầu (Ảnh: Internet)
Gemini sáng tác câu chuyện theo yêu cầu (Ảnh: Internet)
Gemini sáng tác câu chuyện theo yêu cầu (Ảnh: Internet)

Tạo hình ảnh

Khả năng tạo hình ảnh của GPT không ngừng được cải thiện để kết quả trông giống thật hơn thay vì hình ảnh đơn giản của các phiên bản trước. ChatGPT hiện có một công cụ chỉnh sửa cho phép bạn chọn một vùng nhất định trong hình ảnh sau khi tạo và chỉnh sửa bằng lời nhắc.

Ngược lại, Gemini không có tính năng như vậy nên khi được yêu cầu chỉnh sửa nó sẽ tạo ra hình ảnh hoàn toàn mới. Do đó ChatGPT được đánh giá cao hơn ở mục này.

Giá đăng ký và giới hạn sử dụng

Cả ChatGPT Plus và Gemini đều có giá 20 USD mỗi tháng. ChatGPT giới hạn 40 tin nhắn mỗi 3 giờ, trong khi Gemini cho phép 50 tin nhắn.

ChatGPT cho phép người dùng tạo mô hình GPT tùy chỉnh để mở rộng khả năng sử dụng ngoài những tính năng gốc của OpenAI, ví dụ ChatGPT có thể chơi game nhưng cửa hàng GPT của nó cũng có rất nhiều game. Trong khi đó Gemini có rất ít tiện ích mở rộng, chủ yếu là các sản phẩm của Google. Như vậy ChatGPT tốt hơn ở mục này.

Tóm lại: Nên chọn ChatGPT Plus hay Gemini Advanced?

Tổng hợp các kết quả trên cho thấy ChatGPT tốt hơn một chút nhưng Gemini cũng không thua kém đáng kể. Ở một góc nhìn khác, chỉ riêng các mô hình GPT tùy chỉnh của ChatGPT đã có giá trị hơn nhiều, vì vậy nếu phải chọn một trong hai thì hãy sử dụng ChatGPT Plus.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm

iPadOS 18 có thể đi kèm ứng dụng Máy tính tích hợp, sau 14 năm "thiếu vắng"

Tại sự kiện ra mắt năm ngoái, Apple đã giới thiệu tính năng "đặt nhiều hẹn giờ cùng lúc" cho ứng dụng Đồng hồ trên các thiết bị của hãng. Craig Federighi, đại diện Apple, không quên pha trò "Chúng ta đang thực sự sống trong thời đại của những điều kỳ diệu", như ngầm thừa nhận sự "chậm ...
Theo dõi bình luận
Thông báo về
guest
1 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận