Trang Chủ Công nghệ Trí tuệ nhân tạo Claude 3 ra mắt: Thông minh không kém...

Claude 3 chính thức ra mắt (Ảnh: Internet)

Công nghệ

Trí tuệ nhân tạo Claude 3 ra mắt: Thông minh không kém ChatGPT?

08/03/2024

Công ty Anthropic đã phát hành Claude 3 – mô hình trí tuệ nhân tạo mới được cho là có khả năng cạnh tranh với GPT-4 của OpenAI. Liệu Claude 3 có thực sự thông minh và đủ sức soán ngôi vương của ChatGPT? Hãy cùng khám phá nhé!

Nội dung chính

Claude 3 là gì?
Claude 3 có thể làm được gì?
So sánh Claude 3 vs ChatGPT

Claude vs. ChatGPT: Kỹ năng lập trình
Claude vs. ChatGPT: Lý luận thông thường
Claude vs. ChatGPT: Viết sáng tạo
Claude vs. ChatGPT: Khả năng nhận dạng hình ảnh

Tóm lại

Claude 3 là gì?

Claude 3 là một nhóm gồm 3 mô hình AI được công ty Anthropic phát triển để thay thế mô hình AI cũ là Claude 2. Có thể coi Claude 3 là câu trả lời của Anthropic để đáp lại các đối thủ như Gemini của Google và GPT-4 của OpenAI.

Claude 3 gồm 3 phiên bản theo thứ tự trí thông minh tăng dần là Haiku, Sonnet và Opus, là các mô hình AI đa phương thức đầu tiên của Anthropic và được nâng cấp đáng kể so với thế hệ Claude 2.

Nếu bạn chưa từng nghe nói đến Claude thì cũng không có gì lạ vì mô hình AI này không nổi tiếng như ChatGPT và cũng không đến từ thương hiệu lớn như Gemini của Google. Tuy nhiên Claude chắc chắn là một trong những chatbot AI tiên tiến nhất trên thế giới hiện nay, thậm chí vượt trội hơn ChatGPT ở một vài khía cạnh quan trọng.

Để thực sự hiểu được sức mạnh của Claude 3, trước tiên hãy cùng nhìn lại điểm yếu của các thế hệ trước đó:

Những phiên bản trước của Claude có nhược điểm là thận trọng quá mức cần thiết, ví dụ các tính năng an toàn của Claude 2 chặt chẽ đến mức chatbot thường né tránh nhiều chủ đề khi người dùng đặt câu hỏi, kể cả những chủ đề không có nguy cơ rõ ràng.
Claude trước đây cũng có nhược điểm về “cửa sổ ngữ cảnh” khi trò chuyện. Nếu người dùng yêu cầu giải thích thông tin hoặc tóm tắt một bài viết dài, các mô hình AI chỉ có thể đọc và xử lý một đoạn văn bản có độ dài nhất định trong mỗi lần trả lời – giới hạn lượng văn bản đó được gọi là “cửa sổ ngữ cảnh”. Các phiên bản trước của Claude được thiết kế cửa sổ ngữ cảnh là 200 nghìn token (tương đương 150.000 từ), nhưng khi hoạt động thực tế không thể xử lý tất cả lượng văn bản đó cùng một lúc mà thường quên một đoạn nào đó.
Ngoài ra Claude trước đây cũng không có tính đa phương thức. Hầu hết các mô hình AI nổi tiếng hiện nay đều được thiết kế đa phương thức, tức là có thể xử lý các dạng dữ liệu khác ngoài văn bản, ví dụ như hình ảnh, và đưa ra câu trả lời cho người dùng ở dạng dữ liệu đó.

Cả 3 vấn đề trên đều đã được giải quyết hoàn toàn hoặc ít nhất là một phần ở phiên bản Claude 3 mới ra mắt.

Claude 3 có thể làm được gì?

Giao diện chatbot của Claude AI (Ảnh: Internet)

Giống như hầu hết các mô hình AI tiên tiến hiện nay, Claude 3 có thể tạo ra câu trả lời chất lượng cao cho nhiều dạng câu hỏi với nhiều chủ đề khác nhau. Cho dù bạn cần giải nhanh một bài toán đại số, sáng tác lời bài hát, soạn thảo một bài báo chuyên sâu, tạo code cho phần mềm hay phân tích khối dữ liệu khổng lồ, Claude 3 đều đáp ứng được.

Nhưng hầu hết các mô hình AI khác cũng làm tốt những nhiệm vụ này, vậy tại sao nên chọn Claude 3? Đơn giản vì Claude 3 không chỉ thực hiện tốt yêu cầu của người dùng mà nó là mô hình AI đa phương thức miễn phí tiên tiến nhất mà bạn có thể tìm thấy trên Internet hiện nay. Gemini của Google cũng đạt điểm rất tốt trong các phép đo trí tuệ nhân tạo và được cho là đe dọa đánh bại GPT-4, nhưng Anthropic tuyên bố Claude 3 vượt trội hơn đáng kể trong một số lĩnh vực nhất định. Trải nghiệm thực tế cả hai mô hình AI này cho thấy Claude 3 có ưu thế hơn rõ ràng trong một số trường hợp cụ thể.

Tóm lại, Claude 3 có thể giúp bạn thực hiện hầu hết những việc tương tự Gemini và GPT-4 (ngoại trừ tạo hình ảnh) mà không cần trả phí đăng ký 20 USD như gói cao cấp của ChatGPT.

So sánh Claude 3 vs ChatGPT

Logo của ChatGPT và Claude AI (Ảnh: Internet)

Một cách nhanh chóng để kiểm tra hiệu suất của các mô hình AI mới là so sánh với mô hình tốt nhất hiện nay: GPT-4. Vậy Claude 3 của Anthropic có trí thông minh như thế nào so với GPT-4 của OpenAI?

Claude vs. ChatGPT: Kỹ năng lập trình

Bắt đầu với một chuỗi nhiệm vụ lập trình, Claude 3 cho kết quả tương đương với GPT-4 trong tất cả các thao tác lập trình cơ bản và thậm chí còn vượt trội hơn trong một số trường hợp. Mặc dù chỉ thử nghiệm tạo code cơ bản nhưng thế hệ trước của Claude kém hơn đáng kể khi so sánh với ChatGPT.

Ví dụ như khi yêu cầu tạo ứng dụng danh sách việc cần làm đơn giản, phiên bản trước của Claude thất bại ở mọi lần thử trong khi ChatGPT đưa ra kết quả cực tốt. Tuy nhiên Claude 3 đã tạo ra ứng dụng danh sách việc cần làm có hiệu suất tốt hơn trong cả 3 trường hợp thử nghiệm. Hình dưới đây là kết quả của GPT-4 tạo ứng dụng danh sách việc cần làm.

ChatGPT tạo ứng dụng danh sách việc cần làm (Ảnh: Internet)

Và đây là kết quả của Claude 3 khi được yêu cầu làm tương tự:

Claude 3 tạo ứng dụng danh sách việc cần làm (Ảnh: Internet)

Cả hai ứng dụng đều hoạt động khá tốt, nhưng rõ ràng Claude 3 làm tốt hơn.

Khi thử lập trình phức tạp hơn, Claude chiếm ưu thế ở một số trường hợp trong khi GPT-4 cũng vượt trội ở những lần khác. Mặc dù không thể kết luận chắc chắn rằng Claude 3 giỏi logic lập trình hơn, nhưng nếu có chênh lệch giữa hai mô hình AI này thì cũng không quá lớn.

Claude vs. ChatGPT: Lý luận thông thường

Các công cụ chatbot AI có một nghịch lý thú vị: chúng có thể xử lý các tác vụ phức tạp một cách dễ dàng nhưng thường gặp khó khăn với các vấn đề cơ bản đòi hỏi kiến thức hay logic thông thường. Vì vậy hãy so sánh 2 mô hình AI này với những câu hỏi có vẻ đơn giản nhưng phải dùng hiểu biết cơ bản để trả lời chính xác.

Với 5 câu hỏi được đưa ra, ChatGPT và Claude 3 đều trả lời một cách hợp lý. Ví dụ: “Nếu một con tàu vũ trụ từ Sao Hỏa vỡ làm đôi, trong đó một phần đâm xuống Đại Tây Dương gần Brazil và phần còn lại rơi xuống Thái Bình Dương gần Nhật Bản, bạn sẽ chôn những người sống sót ở đâu?” ChatGPT đã trả lời chính xác kể cả khi không dùng phiên bản GPT-4.

ChatGPT trả lời câu hỏi mẹo (Ảnh: Internet)

Nếu bạn thắc mắc tại sao đặt câu hỏi như vậy thì bởi vì các chatbot trước đây đã thất bại thảm hại với kiểu câu hỏi này. Tiếp theo đến lượt Claude trả lời.

Kiểm tra Claude 3 về lý luận thông thường (Ảnh: Internet)

Câu trả lời của Claude có vẻ không dứt khoát, nhưng vẫn nêu ra được ý quan trọng nhất: không thể chôn cất những người sống sót. Điều này cho thấy sự cải thiện ấn tượng vì trước đây Claude 2 không nhận ra cái bẫy trong câu hỏi tương tự.

Claude vs. ChatGPT: Viết sáng tạo

Trong thực tế, một trong những công việc phổ biến nhất cần dùng chatbot AI là tạo văn bản với nhiều hình thức khác nhau như bài viết, đơn thư, sáng tác lời bài hát. Vì vậy hãy cùng thử nghiệm xem các công cụ AI này có thể tạo ra văn bản giống người thật hay không. Mục tiêu không chỉ là nội dung “chính xác” hay sáng tạo (theo kiểu máy móc) mà còn phải mang giọng điệu như người thật.

Cả hai chatbot được yêu cầu sáng tác lời cho một bài hát rap về việc trồng dưa leo và trở thành triệu phú nhờ việc trồng dưa leo. Ngoài đời thật không ai viết rap về chủ đề này, chính vì vậy mới là thách thức cho AI.

Dưới đây là kết quả của ChatGPT:

ChatGPT viết lời cho bài rap (Ảnh: Internet)

Và đây là câu trả lời của Claude:

Claude viết lời cho bài rap (Ảnh: Internet)

Cảm nhận tùy mỗi người, nhưng Claude có vẻ tốt hơn. Khi cả hai công cụ được yêu cầu tạo 3 bài viết về các chủ đề khác nhau, Claude cho kết quả tốt hơn trong cả 3 trường hợp, văn bản giống người hơn và tránh được các lỗi thường thấy khi AI tạo văn bản như phóng đại quá mức, sử dụng các từ phức tạp và nhiều từ liên kết không cần thiết.

Claude vs. ChatGPT: Khả năng nhận dạng hình ảnh

Để đánh giá khả năng nhận dạng hình ảnh, có thể yêu cầu ChatGPT và Claude xác định một số hình ảnh về các tòa nhà cao tầng nổi tiếng trên khắp thế giới. ChatGPT đã xác định đúng tất cả 20 tòa nhà, trong khi Claude 3 không xác định được một số như tòa nhà Marina 101 nổi tiếng của Dubai, Lotte World Tower ở Seoul và tòa nhà Merdeka 118 ở Kuala Lumpur, Malaysia.

Claude gặp khó khăn trong việc xác định các tòa nhà và tỷ lệ bỏ sót cao hơn đối với các tòa nhà không ở Mỹ hoặc Trung Quốc. Tuy nhiên nó xác định tốt các hình ảnh khó nhận ra của Tháp Eiffel hay Tòa nhà Empire State.

Claude 3 nhận ra Tòa nhà Empire State (Ảnh: Internet)

Như vậy ChatGPT rõ ràng thực hiện tốt hơn ở nhiệm vụ này, nhưng Claude 3 là mô hình AI đầu tiên của Anthropic có khả năng xử lý đa phương thức nên cũng không quá tệ.

Tóm lại

Mặc dù các công cụ nổi tiếng như Palm 2 và sau đó là Gemini của Google luôn được coi là đối thủ chính của GPT-4 nhưng có thể khẳng định rằng Claude AI cũng có tiềm năng cạnh tranh ngang ngửa với ChatGPT. Được phát hành lần đầu vào tháng 3 năm 2023 và trải qua nhiều cải tiến, Claude 3 hiện tại đã mạnh hơn nhiều. Nếu bạn muốn trải nghiệm khả năng của chatbot AI thì hãy dùng thử Claude 3 để hỗ trợ làm việc hiệu quả.

Mời bạn xem thêm các bài liên quan:

Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!

Xem thêm