GPT-4 của OpenAI hiện là mô hình trí tuệ nhân tạo tốt nhất trên thị trường, nhưng người dùng luôn kỳ vọng AI mạnh hơn trong tương lai. Với việc Sam Altman – CEO của OpenAI thường xuyên đưa ra những phát biểu gợi ý về GPT-5, có thể chúng ta sẽ thấy mô hình AI mới ra mắt trong thời gian sắp tới. Mặc dù chưa rõ chính xác khi nào GPT-5 sẽ xuất hiện nhưng có một số tính năng đặc biệt được mọi người mong đợi.

GPT-5 của OpenAI là gì?

GPT-5 là thế hệ tiếp theo của mô hình trí tuệ nhân tạo GPT-4 của công ty OpenAI, được nhiều người kỳ vọng là mô hình AI sáng tạo tốt nhất trên thị trường. Mặc dù hiện tại chưa có ngày phát hành chính thức nhưng có nhiều dấu hiệu cho thấy GPT-5 có thể ra mắt sớm nhất là trong mùa hè năm 2024.

GPT-5 được kỳ vọng sẽ là bước phát triển vượt bậc so với GPT-4 (Ảnh: Internet)
GPT-5 được kỳ vọng sẽ là bước phát triển vượt bậc so với GPT-4 (Ảnh: Internet)

Hiện tại có rất ít thông tin chi tiết về mô hình này, nhưng có một số điều chắc chắn đã được công khai:

  • OpenAI đã nộp đơn đăng ký nhãn hiệu GPT-5 với Văn phòng Nhãn hiệu và Bằng sáng chế Mỹ.
  • Một số giám đốc điều hành của OpenAI đã thảo luận hoặc gợi ý về các khả năng mà mô hình AI này có thể thực hiện.
  • Sam Altman – Giám đốc điều hành của OpenAI đã nhiều lần nhắc đến mô hình này trong cuộc phỏng vấn với Lex Fridman trên YouTube vào tháng 3/2024.

Tất cả những dấu hiệu này đều chỉ ra một sự thật hấp dẫn là GPT-5 sắp ra mắt trong thời gian gần. Tuy vậy có khá nhiều điều chỉ là suy đoán ở thời điểm hiện tại, và dưới đây là một số tính năng chúng ta hy vọng được thấy ở mô hình GPT-5.

4 tính năng được kỳ vọng ở mô hình GPT-5 của OpenAI

1. Đa phương thức hơn

Sora – công cụ AI biến văn bản thành video của OpenAI (Ảnh: Internet)
Sora – công cụ AI biến văn bản thành video của OpenAI (Ảnh: Internet)

Một trong những cải tiến thú vị nhất của thế hệ GPT tiếp theo là tính đa phương thức – đó là khả năng mô hình AI có thể xử lý nhiều loại nội dung khác nhau, không chỉ là văn bản mà cả các loại dữ liệu đầu vào khác như hình ảnh, âm thanh và video. Đa phương thức sẽ là một tiêu chuẩn quan trọng của các mô hình GPT trong tương lai.

Hiện nay GPT-4 đã xử lý tốt dữ liệu đầu vào và đầu ra dưới dạng hình ảnh, vì vậy người dùng kỳ vọng GPT-5 sẽ được nâng cấp để xử lý được âm thanh và video. Google đã đạt được điều này với mô hình AI mang tên Gemini, và chắc chắn OpenAI sẽ phải đáp trả với GPT-5 sắp tới. Trong podcast Unconfuse Me, Bill Gates đã hỏi Sam Altman về tầm nhìn phát triển GPT trong 2 năm tới, và câu trả lời đầu tiên của Sam là khả năng xử lý video.

Như vậy chúng ta hy vọng có thể sử dụng video với GPT-5 như tải video lên để yêu cầu chỉnh sửa, tạo video bằng AI, trích xuất các phân đoạn từ video và tìm các cảnh cụ thể trong một video dài. Chúng ta cũng hy vọng có thể làm được những việc tương tự với dữ liệu âm thanh. Đó là những vấn đề lớn, nhưng xét đến tốc độ phát triển AI nhanh chóng như hiện nay thì không phải là vô lý.

2. Cửa sổ ngữ cảnh lớn hơn và hiệu quả hơn

ChatGPT của OpenAI là công cụ AI phổ biến hàng đầu hiện nay (Ảnh: Internet)
ChatGPT của OpenAI là công cụ AI phổ biến hàng đầu hiện nay (Ảnh: Internet)

Mặc dù là một trong những mô hình AI mạnh nhất trên thị trường hiện nay nhưng GPT lại có cửa sổ ngữ cảnh nhỏ hơn các đối thủ khác. Ví dụ mô hình AI Claude 3 của Anthropic có cửa sổ ngữ cảnh xử lý được 200.000 token, và Gemini của Google có mức tối đa là 1 triệu token (mức sử dụng tiêu chuẩn là 128.000). Trong khi đó GPT-4 có cửa sổ ngữ cảnh chỉ là 128.000 token, nhưng chỉ khoảng 32.000 token có thể sử dụng thực tế ở các giao diện như ChatGPT.

Với tính đa phương thức như đã nêu, việc nâng cấp cửa sổ ngữ cảnh là điều gần như bắt buộc. Có thể tăng gấp 2 hoặc 4 lần so với hiện nay là đủ, nhưng nhiều người kỳ vọng GPT-5 sẽ được tăng gấp 10 lần để xử lý nhiều dữ liệu hơn.

Tuy nhiên cửa sổ ngữ cảnh lớn hơn chưa chắc là tốt hơn, vì vậy GPT-5 cũng phải tăng cường hiệu quả xử lý ngữ cảnh. Ví dụ một mô hình AI có cửa sổ ngữ cảnh 1 triệu token (dung lượng khoảng 700.000 từ) nhưng không thể thực hiện việc tóm tắt một cuốn sách 500.000 từ vì nó không thể xử lý toàn bộ lượng dữ liệu quá lớn cùng một lúc, mặc dù về lý thuyết là có khả năng làm được. Điều này giống như việc bạn có thể đọc một cuốn sách 500 nghìn từ nhưng không thể hiểu hết nội dung đã đọc.

3. Trợ lý GPT

Sử dụng ChatGPT trên điện thoại (Ảnh: Internet)
Sử dụng ChatGPT trên điện thoại (Ảnh: Internet)

Có lẽ một trong những khả năng thú vị nhất của GPT-5 là sự xuất hiện của trợ lý GPT – được cho là sẽ thay đổi hoàn toàn cách sử dụng AI của mọi người trong mọi hoạt động. Vậy trợ lý GPT là gì?

Hiện tại các mô hình AI như GPT-4 có thể giúp bạn thực hiện một công việc cụ thể như viết email, sáng tác một câu chuyện, giải một bài toán hoặc làm một bài đăng cho blog. Tuy nhiên AI chỉ có thể thực hiện nhiệm vụ cụ thể đó mà không thể làm rất nhiều việc liên quan cần thiết khác để hoàn thành công việc của bạn. Giả sử một nhà phát triển web phải làm nhiều việc như thiết kế, tạo code, khắc phục sự cố, v.v. Bạn chỉ có thể yêu cầu AI thực hiện từng nhiệm vụ này một cách riêng lẻ, ví dụ như làm code cho trang chủ, sau đó làm code cho trang liên hệ và tiếp tục cho trang giới thiệu, v.v.

Bạn phải yêu cầu AI làm nhiều lần, và có những công việc mà AI không thể hoàn thành. Quá trình lặp đi lặp lại này tốn nhiều thời gian và không hiệu quả, trong đó phải có người chịu trách nhiệm vận hành và yêu cầu AI thực hiện từng nhiệm vụ. Tuy nhiên tính năng trợ lý GPT có thể tự đưa ra yêu cầu để thực hiện các công việc một cách tự động.

Nếu GPT-5 được trang bị trợ lý GPT, bạn có thể yêu cầu nó thực hiện công việc hoàn chỉnh như tạo trang web danh mục đầu tư thay vì chỉ làm code cho từng trang. Khi đó GPT-5 sẽ tự yêu cầu các bot thành phần của nó xử lý các công việc nhỏ để tạo ra trang web, ví dụ như một bot tìm thông tin về đối tượng, một bot khác làm code cho các trang, một bot khác chuyên sáng tạo và tối ưu hóa hình ảnh – tất cả đều không cần con người yêu cầu.

4. Tránh thông tin ảo

GPT-5 sẽ thông minh hơn nhiều so với GPT-4 hiện nay (Ảnh: Internet)
GPT-5 sẽ thông minh hơn nhiều so với GPT-4 hiện nay (Ảnh: Internet)

Mặc dù OpenAI đã khắc phục vấn đề thông tin ảo do các mô hình AI tạo ra nhưng GPT-5 được kỳ vọng là sẽ giải quyết hoàn toàn điều này – vốn là nguyên nhân cản trở việc áp dụng AI trong các lĩnh vực cần sự an toàn cao như chăm sóc sức khỏe, hàng không và an ninh mạng, trong khi các lĩnh vực đó sẽ được hưởng lợi rất nhiều nếu áp dụng AI rộng rãi.

Thông tin ảo là khi mô hình AI tạo ra thông tin nghe có vẻ hợp lý và được trình bày một cách tự tin nhưng lại hoàn toàn không đúng sự thật. Nếu GPT-4 được tích hợp vào hệ thống chẩn đoán y tế để phân tích các triệu chứng của bệnh nhân, thông tin ảo có thể khiến AI đưa ra chẩn đoán sai hoặc đề xuất phương pháp điều trị nguy hiểm. Hậu quả của những sai sót như vậy trong lĩnh vực y tế có thể rất thảm khốc.

Các lĩnh vực yêu cầu an toàn cao khác cũng gặp vấn đề tương tự, ví dụ như giao thông, năng lượng hạt nhân, an ninh mạng. Có thể GPT-5 sẽ chưa giải quyết hoàn toàn thông tin ảo, nhưng hy vọng sẽ hạn chế được những sự cố như vậy đến mức tối thiểu.

Tóm lại

Trong khi chúng ta vẫn háo hức chờ đợi sự ra mắt chính thức của mô hình AI rất được mong đợi này, thì có một điều chắc chắn là GPT-5 sẽ mở rộng những khả năng có thể làm được với trí tuệ nhân tạo, mở ra một kỷ nguyên mới về sự tương tác và kết hợp giữa con người và máy móc.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm

5 sạc không dây Apple 3 trong 1 tốt nhất 2024 bạn nên mua

Nếu bạn đang cân nhắc mua một bộ sạc không dây Apple 3 trong 1 để bạn có thể sạc iPhone, Apple Watch và AirPods của mình thì hãy tham khảo 5 bộ sạc không dây tốt nhất 2024 dưới đây nhé.
Theo dõi bình luận
Thông báo về
guest
1 Bình luận
Bình chọn nhiều nhất
Mới nhất Cũ nhất
Phản hồi nội tuyến
Xem tất cả bình luận