Gã khổng lồ công nghệ Google luôn khiến mọi người ngạc nhiên với những kế hoạch đầy tham vọng, và giờ đây họ muốn tạo ra cuộc cách mạng về trí tuệ nhân tạo với dự án Gemini. Mặc dù vẫn đang trong quá trình phát triển nhưng Gemini đã thu hút sự chú ý khi có khả năng cạnh tranh với ChatGPT của OpenAI. Hãy cùng khám phá dự án AI này nhé!
Gemini là gì?
Trí tuệ nhân tạo ChatGPT đã tạo nên cơn địa chấn cho toàn bộ giới công nghệ với những khả năng phi thường trong việc sáng tạo văn bản. Để cạnh tranh với sự thành công của ChatGPT, Google đã khởi động dự án trí tuệ nhân tạo mới nhất của mình mang tên Gemini. Theo tin đồn, dự án khổng lồ này sẽ tập hợp những bộ óc giỏi nhất của Google.
Nhưng chính xác thì Gemini là gì? Demis Hassabis, Giám đốc điều hành của Google DeepMind đã nói với trang tin Wired như sau:
“Ở cấp độ cao, bạn có thể coi Gemini như sự kết hợp một số điểm mạnh của hệ thống kiểu AlphaGo với khả năng ngôn ngữ tuyệt vời của các mô hình lớn.”
Cụ thể hơn, Gemini là mô hình ngôn ngữ lớn (LLM) có khả năng xử lý văn bản tương tự như GPT-4 là mô hình AI nền tảng của ChatGPT. Trong khi đó AlphaGo là chương trình AI đã đánh bại nhà vô địch thế giới cờ vây vào năm 2016.
Tháng 4/2023, Google đã kết hợp Google Brain – đơn vị nghiên cứu AI học sâu của họ, cùng với DeepMind – đội ngũ tạo ra AlphaGo, để thành lập Google DeepMind. Đơn vị này chịu trách nhiệm cho toàn bộ quá trình phát triển Gemini.
Trước đây Google và DeepMind đã cố gắng tạo ra một đối thủ xứng tầm với ChatGPT, tương tự như chatbot Bard của Google đang cạnh tranh với ChatGPT. Nhưng với sự hợp tác mạnh mẽ của hai ông lớn hiện nay, Google hy vọng Gemini sẽ thực sự có thể đánh bại ChatGPT.
Tại sao Google muốn tạo ra Gemini?
Lý do để phát triển Gemini rất đơn giản: Google muốn nâng cao chất lượng của các sản phẩm dành cho doanh nghiệp như Google Docs và Slides, đồng thời hỗ trợ Bard trong cuộc đua AI và giúp nó sử dụng tài nguyên hiệu quả hơn.
Hơn nữa, các nhà phát triển phải trả tiền cho Google để truy cập ứng dụng Gemini AI thông qua bộ phận cho thuê máy chủ Google Cloud. Động thái này sẽ là thách thức trực tiếp đối với Microsoft và kế hoạch tích hợp AI của họ trong các sản phẩm Office 365.
Bên cạnh đó, Gemini có khả năng sẽ ra mắt trong cuối năm 2023, điều này sẽ tạo điều kiện cho những bước phát triển tiên tiến trong lĩnh vực y học vì các robot và chatbot AI phục vụ y tế có thể chạy trên nền tảng Gemini.
Gemini có cấu trúc và cơ chế hoạt động như thế nào?
Google có nền tảng kiến thức sâu rộng và nền tảng ứng dụng dựa trên dữ liệu phong phú, đây sẽ là nguồn tài nguyên chính để huấn luyện cho Gemini AI. Thêm vào đó là sự hiểu biết sâu sắc, kinh nghiệm dày dạn và đội ngũ nhân tài tập trung vào việc phát triển mô hình ngôn ngữ lớn, Gemini có tiềm năng sẽ trở thành “bom tấn”.
Gemini sử dụng cấu trúc mới để hợp nhất hệ thống mã hóa và giải mã đa phương thức. Hệ thống mã hóa có chức năng chuyển đổi các loại dữ liệu khác nhau thành một ngôn ngữ chung mà hệ thống giải mã có thể hiểu và hành động theo. Ngoài ra bộ giải mã có thể tạo kết quả theo nhiều phương thức khác nhau, đây là điểm nổi bật của Gemini. Người dùng có thể mong đợi những câu trả lời mới của Gemini vì nó không chỉ phụ thuộc vào việc huấn luyện dựa trên dữ liệu cơ sở, thay vì vậy nó có thể học hỏi và phát triển theo thời gian mà không cần dựa vào huấn luyện ban đầu.
Gemini vs ChatGPT: Cuộc cạnh tranh gay gắt
Liệu ChatGPT và Gemini có đối đầu với nhau hay không? Trên thực tế, Google có tham vọng “kết liễu” đối thủ bằng việc ra mắt ứng dụng mới của mình. Ở thời điểm hiện tại, chúng ta chỉ biết một số điều về cách Gemini có thể cạnh tranh với đối thủ lớn nhất là ChatGPT.
GPT-4 là mô hình ngôn ngữ lớn với khoảng 1 nghìn tỷ đến 1,7 nghìn tỷ tham số, có khả năng viết tiểu luận, dịch ngôn ngữ và trả lời nhanh các câu hỏi thông thường, nhưng ChatGPT cũng có nhiều hạn chế. Trong khi đó Gemini được cho là một mạng thông minh đa phương thức có khả năng xử lý nhiều nhiệm vụ khác nhau, các yêu cầu liên quan đến dữ liệu, hình ảnh, âm thanh, video, mô hình 3D và thậm chí cả đồ thị. Vì Gemini là sự kết hợp của các mạng mô hình nên nó có thể xử lý nhiều công việc đồng thời mà không bị giới hạn.
Ngày phát hành chính thức của Gemini vẫn chưa được công bố, có thể rơi vào khoảng tháng 9 đến tháng 12 năm 2023, theo những tin đồn của giới công nghệ hiện nay.
Tóm lại
Google Gemini và OpenAI sẽ cạnh tranh nhau trên thị trường mở sau khi Gemini được phát hành vào cuối năm nay. Nếu như ChatGPT của OpenAI đã thu hút sự chú ý của cả thế giới trong thời gian qua, thì Gemini AI sẽ mang đến một luồng gió mới khiến mọi người bất ngờ với các khả năng nâng cao của AI. Vậy Gemini có thể cạnh tranh và đánh bại ChatGPT không? Chỉ có thời gian mới trả lời được vì chúng ta vẫn chưa biết rõ AI này có thể làm được những gì.
Mời bạn xem thêm các bài viết liên quan:
- Trí tuệ nhân tạo có thể hỗ trợ công việc nhiếp ảnh như thế nào?
- Google Brain có vai trò gì đối với sự phát triển của trí tuệ nhân tạo?
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
Mình mong muốn nhận được ý kiến đóng góp từ các bạn về bài viết này, hãy để lại bình luận để mình biết với nhé.