ChatGPT ngày càng phát triển mạnh mẽ, mới đây đã ra mắt phiên bản GPT-4o mang đến nhiều tính năng và nâng cấp mới cho chatbot AI hàng đầu thế giới này. Vậy GPT-4o là gì và có khả năng đặc biệt như thế nào? Hãy cùng khám phá nhé!

GPT-4o là gì?

GPT-4o là phiên bản AI mới nhất của ChatGPT do OpenAI phát triển và được giới thiệu ở sự kiện Spring Update (Cập nhật mùa xuân) mới đây. GPT-4o sẽ hoạt động song song với phiên bản mạnh nhất hiện tại là GPT-4 Turbo và mang đến nhiều tính năng cập nhật mới cho công cụ AI này.

Phiên bản GPT-4o mới được bổ sung trong ChatGPT (Ảnh: Internet)
Phiên bản GPT-4o mới được bổ sung trong ChatGPT (Ảnh: Internet)

Không giống như các phiên bản trước, GPT-4o có khả năng xử lý đa phương thức hoàn toàn ngay từ khi ra mắt (“o” trong tên của nó là viết tắt của omnimodal – đa phương thức). Sự kiện Spring Update của OpenAI đã trình diễn các khả năng của GPT-4o như trò chuyện trôi chảy với người dùng, liên tục thay đổi các kiểu tương tác khác nhau, thể hiện “tính cách” của riêng nó và cho thấy tiềm năng có thể trở thành trợ lý ảo đáng mơ ước.

GPT-4o có thể xử lý dữ liệu đầu vào ở dạng kết hợp âm thanh, văn bản, hình ảnh và video, nhưng đầu ra mới chỉ có văn bản, âm thanh và hình ảnh – chưa hỗ trợ video nhưng hy vọng sẽ được bổ sung thêm trong tương lai khi công cụ Sora chuyển văn bản thành video của OpenAI chính thức ra mắt.

Số liệu thô do OpenAI cung cấp cho thấy GPT-4o vượt trội hơn tất cả các phiên bản trước đó cũng như các đối thủ AI cạnh tranh hiện nay như Claude 3 Opus, Gemini phiên bản Pro 1.5 và Ultra 1.0, và Llama 3 400B.

Biểu đồ hiệu suất của GPT-4o do OpenAI đưa ra tháng 5/2024 (Ảnh: Internet)
Biểu đồ hiệu suất của GPT-4o do OpenAI đưa ra tháng 5/2024 (Ảnh: Internet)

Có thể thấy số liệu rất tốt, nhưng ý nghĩa thực sự là gì? OpenAI cho biết rằng GPT-4o “sánh ngang với hiệu suất của GPT-4 Turbo” khi viết tiếng Anh và làm code, nhanh hơn đáng kể khi xử lý các ngôn ngữ không phải tiếng Anh, quan trọng nhất là nhanh hơn và rẻ hơn khi so sánh về sử dụng API.

GPT-4o có khả năng đặc biệt như thế nào?

Trong lĩnh vực công nghệ có rất nhiều sản phẩm được giới thiệu hoành tránh nhưng không thực sự hoạt động hiệu quả. Tuy nhiên màn trình diễn đối thoại của GPT-4o ở sự kiện ra mắt đã khiến mọi người cảm thấy ấn tượng. Mô hình AI này có thể duy trì cuộc nói chuyện theo đúng ý của người dùng, thậm chí cho phép bạn ngắt lời, thay đổi chủ đề và trọng tâm cuộc trò chuyện,v.v. mà gần như không hề bị chậm lại.

Khả năng trò chuyện nhanh chóng của phiên bản này mang lại rất nhiều tiềm năng ứng dụng mới. Hiện nay mặc dù ChatGPT đã có chức năng trò chuyện bằng giọng nói nhưng bị hạn chế vì trước tiên nó phải tạo ra câu trả lời ở dạng văn bản rồi sau đó mới chuyển thành âm thanh. Bạn cũng có thể tương tác với ChatGPT bằng cách nói trực tiếp nhưng sẽ mất thời gian khá lâu để xử lý. Giờ đây các vấn đề này đã được khắc phục khi GPT-4o phát ra lời nói theo thời gian thực gần như ngay lập tức, hơn nữa có khả năng thể hiện cảm xúc và phong cách cụ thể khi nói chuyện, điều mà trước đây không làm được.

GPT-4o có khả năng trò chuyện nhanh hơn và thông minh hơn (Ảnh: Internet)
GPT-4o có khả năng trò chuyện nhanh hơn và thông minh hơn (Ảnh: Internet)

Ưu điểm này cũng được áp dụng với chức năng dịch ngôn ngữ trực tiếp khi GPT-4o cho thấy sự cải tiến vượt bậc so với trước đây, ví dụ như dịch trực tiếp từ tiếng Anh sang tiếng Ý và ngược lại có kết quả rất tốt. Điều này giúp cho việc giao tiếp với người nước ngoài trở nên dễ dàng hơn, nhất là khi tốc độ dịch rất nhanh. Google Dịch cũng có thể giúp bạn dịch đơn giản trong nhiều trường hợp nhưng thường không hiểu được ngữ cảnh của cuộc trò chuyện một cách chính xác, trong khi đó khả năng dịch trực tiếp của GPT-4o được cho là tốt hơn nhiều.

Làm code

GPT-4o cũng được nâng cấp đáng kể về khả năng hiểu code và hỗ trợ người dùng, nhờ tính chất xử lý đa phương thức của nó. ChatGPT trước đây cũng có thể thực hiện điều này, nhưng phiên bản mới được cải thiện để làm tốt hơn.

Đáng chú ý là khả năng gỡ lỗi code của GPT-4o khi người dùng đưa ra yêu cầu bằng giọng nói. Tuy nhiên hiệu quả thực sự của nó chỉ được đánh giá chính xác khi những người làm code chuyên nghiệp sử dụng công cụ này phổ biến hơn. Hiện tại chức năng làm code của ChatGPT rất hữu ích nhưng chỉ phù hợp với những người có hiểu biết về lập trình – giống như hầu hết các công cụ AI sáng tạo nói chung.

Khi nào GPT-4o ra mắt và có miễn phí hay không?

GPT-4o chưa được cung cấp cho người dùng ChatGPT miễn phí (Ảnh: Internet)
GPT-4o chưa được cung cấp cho người dùng ChatGPT miễn phí (Ảnh: Internet)

GPT-4o được cung cấp ngay hiện tại cho những người đã đăng ký ChatGPT Plus trả phí hàng tháng với giá 20 USD. Tuy nhiên OpenAI tiết lộ rằng phiên bản mới này sẽ ra mắt cho tất cả người dùng – kể cả tài khoản miễn phí – vào thời điểm thích hợp. Chưa có ngày cụ thể được đưa ra, nhưng với tốc độ triển khai các mô hình AI trước đây của OpenAI thì có lẽ không mất quá nhiều thời gian.

Lưu ý răng các tính năng khác của GPT-4o cũng chưa được giới thiệu cho người dùng, ví dụ như giọng nói trực tiếp, kể cả đối với tài khoản đăng ký ChatGPT Plus lâu năm. Bên cạnh đó GPT-4o được cho là sẽ xuất hiện cùng với phiên bản ứng dụng ChatGPT trên máy tính đã được người dùng chờ đợi từ lâu, bắt đầu với macOS, nhưng hiện tại vẫn chưa được triển khai.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm

ChatGPT bổ sung thêm nhiều tính năng mới: Tương tác bằng giọng nói và phân tích dữ liệu nâng cao

OpenAI vừa tung ra bản cập nhật ChatGPT vào đầu tháng 5/2024 mang đến nhiều tính năng mới cho chatbot AI hàng đầu thế giới này. Hầu hết các thay đổi và nâng cấp đều tập trung vào tăng cường tương tác với người dùng, bổ sung chức năng mới và cải thiện hiệu suất tổng thể. Hãy cùng ...
Theo dõi bình luận
Thông báo về
guest
1 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận