Gemini là mô hình AI do Google phát triển và được người dùng chờ đợi từ lâu, cuối cùng đã chính thức xuất hiện. Liệu nó có thể soán ngôi ChatGPT của OpenAI hay không, và cách sử dụng như thế nào? Hãy cùng khám phá nhé!

Google đã nhiều lần tuyên bố rằng mô hình AI Gemini của họ sẽ tốt hơn GPT-4 của OpenAI, mô hình làm nền tảng cho ChatGPT Plus. Giờ đây Gemini đã chính thức ra mắt và chúng ta có thể thực sự trải nghiệm để xem Gemini so với GPT-4 như thế nào.

Gemini của Google đã chính thức ra mắt (Ảnh: Internet)
Gemini của Google đã chính thức ra mắt (Ảnh: Internet)

Khi Google ra mắt công cụ AI Bard vào tháng 3/2023, rất nhiều người đã vui mừng vì ChatGPT của OpenAI không còn độc quyền trên thị trường chatbot AI nữa, thay vào đó là sự cạnh tranh tích cực có lợi cho người dùng. Nhưng đến nay Bard vẫn chưa thực sự trở thành gã khổng lồ AI như kỳ vọng và GPT-4 vẫn là nền tảng chatbot AI thống trị. Giờ đây Gemini của Google đã xuất hiện, liệu nó có thể đe dọa vị trí độc tôn của ChatGPT không?

Gemini của Google là gì?

Gemini là mô hình AI có khả năng sáng tạo cao nhất của Google, có thể hiểu và xử lý nhiều định dạng dữ liệu khác nhau như văn bản, âm thanh, hình ảnh và video. Sản phẩm này là nỗ lực của Google nhằm tạo ra khả năng vẽ AI thống nhất từ các công nghệ AI tốt nhất của họ.

Gemini của Google đã chính thức ra mắt (Ảnh: Internet)
Gemini của Google đã chính thức ra mắt (Ảnh: Internet)

Hiện tại Gemini có 3 biến thể khác nhau:

  • Gemini Ultra: Biến thể lớn nhất và mạnh nhất có khả năng xử lý các tác vụ có độ phức tạp cao.
  • Gemini Pro: Mô hình tốt nhất để nâng cấp và có hiệu suất cao cho nhiều tác vụ nhưng kém hơn Ultra.
  • Gemini Nano: Mô hình hiệu quả nhất được thiết kế để thực hiện tác vụ trên thiết bị. Ví dụ: các nhà phát triển có thể sử dụng Gemini Nano để xây dựng các ứng dụng di động hoặc hệ thống tích hợp, đưa AI vào thiết bị di động.

Trên trang blog chính thức The Key, Google cho biết Gemini Ultra vượt trội hơn so với các công cụ AI hiện đại nhất khi thực hiện một số bài test, thậm chí họ tuyên bố Gemini Ultra đánh bại GPT-4 ở một số bài test quan trọng.

Với số điểm 90,0% chưa từng có ở bài test MMLU gồm 57 chủ đề khác nhau, Google cho biết Gemini Ultra là mô hình AI đầu tiên vượt qua bài test này với kết quả cao hơn trình độ con người.

Bên cạnh đó Gemini Ultra cũng có khả năng hiểu, giải thích và tạo code chất lượng cao bằng một số ngôn ngữ lập trình phổ biến hiện nay như Go, JavaScript, Python, Java và C++. Đây là những kết quả tuyệt vời trên lý thuyết, nhưng các phép đo không phải lúc nào cũng nói lên tất cả. Vậy Gemini thực hiện các nhiệm vụ thực tế tốt đến mức nào?

Cách sử dụng công cụ AI Gemini

Trong 3 biến thể của mô hình AI Gemini, hiện tại bạn có thể sử dụng Gemini Pro được tích hợp với chatbot Bard của Google. Hãy truy cập bard.Google.com và đăng nhập bằng tài khoản Google của bạn.

Google cho biết Gemini Ultra sẽ ra mắt vào tháng 1/2024, vì vậy hiện tại chúng ta chỉ có thể thử nghiệm so sánh Gemini Pro với ChatGPT.

So sánh Gemini với GPT-3.5 và GPT-4

Khi một mô hình AI mới ra mắt, nó luôn được so sánh với các mô hình GPT của OpenAI vì chúng thường được công nhận là mô hình AI tốt nhất hiện nay. Vì vậy chúng ta có thể sử dụng Bard và ChatGPT để kiểm tra khả năng toán học, viết sáng tạo, lập trình và xử lý hình ảnh của Gemini.

Bắt đầu với câu hỏi toán học đơn giản yêu cầu giải phép tính: -1 x -1 x -1. Đối với Bard, khi lặp lại câu hỏi 2 lần đều cho ra kết quả sai. Lần thứ 3 có kết quả đúng nhưng không được tính.

Bard thực hiện phép tính (Ảnh: Internet)
Bard thực hiện phép tính (Ảnh: Internet)

Đối với ChatGPT sử dụng mô hình GPT-3.5, ngay lần đầu tiên đã cho kết quả đúng.

ChatGPT thực hiện phép tính (Ảnh: Internet)
ChatGPT thực hiện phép tính (Ảnh: Internet)

Để kiểm tra khả năng hiểu hình ảnh của Gemini, thử yêu cầu nó diễn giải một số meme phổ biến. Nó từ chối và nói rằng nó không thể giải thích hình ảnh có chứa người. Trong khi đó ChatGPT với mô hình GPT-4V sẵn sàng thực hiện và đưa ra câu trả lời hoàn hảo.

Một ví dụ khác yêu cầu diễn giải hình ảnh đồng thời kiểm tra khả năng giải quyết vấn đề và tạo code của AI. Công cụ Bard sử dụng mô hình Gemini Pro được cung cấp một ảnh chụp màn hình như dưới đây và được yêu cầu diễn giải hình ảnh đó cùng với viết mã HTML và CSS để sao chép hình ảnh.

Ảnh chụp màn hình (Ảnh: Internet)
Ảnh chụp màn hình (Ảnh: Internet)

Dưới đây là kết quả của Gemini Pro diễn giải và sao chép ảnh trên bằng HTML và CSS.

Kết quả sao chép ảnh của Bard (Ảnh: Internet)
Kết quả sao chép ảnh của Bard (Ảnh: Internet)

Còn dưới đây là kết quả của GPT-4 với yêu cầu tương tự.

Kết quả sao chép ảnh chụp màn hình bằng ChatGPT (Ảnh: Internet)
Kết quả sao chép ảnh chụp màn hình bằng ChatGPT (Ảnh: Internet)

Kết quả không có gì lạ vì GPT-4 vốn rất mạnh về khả năng lập trình, thậm chí có thể dùng nó để tạo ra ứng dụng web từ đầu.

Khi yêu cầu Gemini Pro sáng tác một bài thơ về hãng xe điện Tesla, kết quả cho thấy có cải thiện so với những lần thử nghiệm trước với Bard:

Bard với mô hình AI Gemini Pro sáng tác thơ (Ảnh: Internet)
Bard với mô hình AI Gemini Pro sáng tác thơ (Ảnh: Internet)

Ởnhiệm vụ này, có lẽ so sánh Gemini với GPT-3.5 sẽ hợp lý hơn là mô hình GPT-4 quá mạnh, vì vậy dưới đây là kết quả của ChatGPT sử dụng GPT-3.5 khi được yêu cầu sáng tác một bài thơ tương tự.

Bài thơ do ChatGPT tạo ra (Ảnh: Internet)
Bài thơ do ChatGPT tạo ra (Ảnh: Internet)

Đánh giá tùy theo cảm nhận của mỗi người, nhưng có vẻ Gemini Pro thực hiện việc này tốt hơn.

Tóm lại: Gemini có mạnh hơn ChatGPT không?

Khi Google ra mắt Bard, người dùng đã hy vọng ChatGPT có một đối thủ xứng tầm, nhưng thực tế lại không như vậy. Bây giờ Gemini đã xuất hiện nhưng phiên bản Gemini Pro dường như cũng chưa đủ sức cạnh tranh ngang ngửa với ChatGPT.

Google cho biết rằng Gemini Ultra sẽ mạnh hơn nhiều, và chúng ta sẽ hy vọng điều đó là sự thật. Nhưng trong khi phiên bản tốt nhất của công cụ AI này vẫn chưa được tiết lộ, chúng ta vẫn không biết liệu nó có thể đánh bại các đối thủ AI khác hay không. Hiện tại GPT-4 vẫn là mô hình AI vô địch không thể tranh cãi.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm

Thực tế ảo tăng cường: Công nghệ đột phá cho tương lai

Thực tế ảo tăng cường (AR) là một công nghệ cho phép tạo ra những trải nghiệm kết hợp giữa thế giới thực và thế giới ảo. AR có thể mở rộng khả năng của con người trong việc học tập, làm việc, giải trí và giao tiếp. AR cũng có thể mang lại những lợi ích kinh tế, ...
Theo dõi bình luận
Thông báo về
guest
1 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận