Ngày càng nhiều người sử dụng AI để tạo văn bản, và các mô hình ngôn ngữ như GPT ngày càng được cải tiến làm cho việc phát hiện văn bản do AI tạo ra trở nên khó khăn hơn. Trong một số trường hợp, ví dụ như các tài liệu học thuật, bắt buộc phải sử dụng văn bản do người thật viết, đó là lúc cần dùng các công cụ phát hiện văn bản AI.
Hiện tại chưa có công cụ nào phát hiện chính xác tuyệt đối văn bản do AI tạo ra, nhưng dưới đây là một số công cụ được đánh giá cao hiện nay mà bạn có thể thử.
1. GPTZero
GPTZero được tạo ra để giúp giáo viên kiểm tra xem bài làm của học sinh có phải là sản phẩm của AI hay không, nhưng trên thực tế công cụ này cũng phát hiện chính xác nội dung do ChatGPT tạo ra nên bất kỳ ai cũng có thể sử dụng nó để phát hiện văn bản AI.
GPTZero phân tích văn bản và cho biết văn bản đó được viết bởi con người hay AI, làm nổi bật các câu cụ thể mà nó cho là do AI tạo ra. Nó cũng cho điểm về độ phức tạp và độ bùng nổ, đó là các chỉ số để đánh giá tính ngẫu nhiên và độ biến thiên của tính ngẫu nhiên. Nhìn chung, những chỉ số này cao đối với văn bản do con người tạo ra và thấp đối với văn bản của AI.
Để thử nghiệm công cụ này, trước tiên hãy nhập một đoạn trích từ tác phẩm Ngôi nhà của người lính của nhà văn Ernest Hemingway. GPTZero đã xác định đúng văn bản này “hầu hết có thể là do con người viết”. Tương tự, nó có thể phát hiện chính xác văn bản do ChatGPT tạo là “được viết hoàn toàn bởi AI”.
Để tăng độ khó, hãy nhập một đoạn văn bản do AI viết có xen lẫn nội dung của con người. Kết quả thật đáng kinh ngạc, GPTZero đã phát hiện gần như chính xác tất cả những câu do AI viết. Nhưng nó cũng mắc sai sót khi đánh dấu một số đoạn do con người viết ra.
Nhìn chung, GPTZero có khả năng phát hiện văn bản AI rất tốt nhưng cũng có trường hợp xác định sai. Công cụ này có tính năng tải lên nhiều file và quét cùng lúc chỉ bằng một cú nhấp chuột. Bên cạnh gói sử dụng miễn phí, GPTZero còn có 2 gói trả phí với các tính năng bổ sung và hạn mức cao hơn.
2. Winston AI
Winston AI tuyên bố có thể phát hiện nội dung do AI tạo ra với độ chính xác 99,6%. Rất khó để kiểm chứng điều này, nhưng thực tế Winston AI đã hoạt động tốt trong các thử nghiệm.
Công cụ này đã xác định đúng đoạn văn trong Ngôi nhà của người lính của Hemingway là do con người viết 100%, và cũng phát hiện đoạn văn bản của AI là 0% do con người viết. Hơn nữa Winston AI còn tính được đoạn văn bản kết hợp là 35% do con người viết và đánh dấu gần như chính xác tất cả các câu do AI tạo ra.
Nếu sử dụng gói trả phí, Winston AI có thể cho biết chỉ số dễ đọc và mức độ đạo văn của văn bản. Bạn có thể chọn bản dùng thử miễn phí có giới hạn 2000 từ, sau đó phải nâng cấp lên tài khoản trả phí.
3. Content at Scale
Bản thân Content at Scale là một công cụ AI tạo văn bản có khả năng tạo ra nội dung dạng dài chỉ bằng vài cú nhấp chuột, đồng thời nó cũng có chức năng phát hiện văn bản do AI tạo ra với hiệu quả cao.
Content at Scale đưa ra điểm số về xác suất, kiểu mẫu và khả năng dự đoán, cuối cùng là tổng điểm, được trình bày dưới dạng tỷ lệ phần trăm. Tỷ lệ càng cao thì càng có nhiều khả năng văn bản được viết bởi con người. Công cụ này cũng đánh dấu các câu mà nó cho rằng do AI viết ra.
Với các thử nghiệm tương tự như trên, công cụ này cho điểm 100% đối với nội dung do con người viết, 16% đối với văn bản của ChatGPT và 64% đối với văn bản kết hợp cả hai. Nó cũng xác định được gần như tất cả các câu do AI viết, nhưng cũng nhầm lẫn ở vài câu giống GPTZero.
Content at Scale cho phép sử dụng miễn phí và kết quả khá giống với GPTZero.
4. Originality AI
Originality AI là công cụ phát hiện văn bản AI được sử dụng phổ biến với khả năng phát hiện chính xác văn bản do GPT 3, GPT 3.5 và ChatGPT tạo ra. Cách hoạt động cũng tương tự như trên: đưa ra tỷ lệ phần trăm khả năng văn bản được viết bởi con người hoặc AI và đánh dấu các câu có khả năng do AI tạo ra.
Thử nghiệm với mô hình Originality AI 2.0 là phiên bản nâng cấp cho kết quả: văn bản do con người viết được cho điểm là 100% được viết bởi con người. Công cụ này cũng phát hiện chính xác nội dung của ChatGPT và cho điểm 100% do AI tạo ra. Đối với văn bản kết hợp giữa con người và AI, điểm số được đưa ra là 68% AI và 32% con người.
Originality AI không có tùy chọn sử dụng miễn phí như các công cụ khác, người dùng bắt buộc phải trả phí. Ngoài ra còn có tính năng kiểm tra đạo văn nhưng phải tốn thêm credit.
5. Writefull
Writefull được tạo ra nhằm hỗ trợ viết tài liệu học thuật dễ dàng hơn, có nhiều tính năng AI bao gồm cả phát hiện nội dung do GPT tạo ra. Công cụ này đảm bảo quyền riêng tư cho người dùng bằng mã hóa dữ liệu, đặc biệt là hoàn toàn miễn phí.
Writefull có thể xác định nội dung được viết bởi GPT-3 cũng như ChatGPT. Sau khi phân tích, nó đưa ra điểm số cho biết khả năng nội dung đó được viết bởi AI.
Với các thử nghiệm như trên, Writefull đã phát hiện đúng văn bản do con người viết và cho điểm 1% khả năng văn bản đó được tạo bởi AI. Tuy nhiên văn bản của ChatGPT lại được cho điểm 39% và văn bản kết hợp AI với con người được cho điểm “2% khả năng nội dung này đến từ GPT-3 hoặc ChatGPT”.
Như vậy công cụ này có khả năng nhận dạng văn bản của con người và AI với độ chính xác tương đối nhưng lại mắc sai sót với nội dung kết hợp. Ngoài ra Writefull có thể tích hợp với Word và Overleaf.
6. Hive Moderation
Đây không chỉ là công cụ phát hiện văn bản AI mà còn có tính năng phát hiện hình ảnh do AI tạo ra. Khi thử nghiệm thực tế, Hive Moderation đã nhận biết được văn bản do con người viết là “có khả năng chứa 0% văn bản AI”, và nó cũng phát hiện được văn bản do AI tạo ra với độ chính xác cao. Nhưng giống như hầu hết những công cụ nêu trên, nó cũng mắc sai lầm khi phân tích văn bản kết hợp giữa con người và AI.
Bạn có thể sử dụng công cụ demo miễn phí trên trang web của Hive Moderation mà không cần đăng ký tài khoản, nhưng nếu muốn có toàn quyền truy cập thì phải liên hệ với đội ngũ của trang web. Bên cạnh đó còn có tính năng phát hiện hình ảnh AI giúp bạn phát hiện các hình ảnh được tạo bởi các công cụ AI như DALL-E 2 và Midjourney.
7. Crossplag
Đây là một công cụ kiểm tra sao chép được nhiều người sử dụng và cũng có tính năng phát hiện văn bản do AI tạo ra. Giao diện và cách dùng rất đơn giản, bạn chỉ cần copy và paste văn bản để kiểm tra xem nó có được tạo bởi AI hay không, ngoài ra Crossplag cũng đánh dấu những câu trong đoạn văn bản được cho là sản phẩm của AI.
Khi thử nghiệm thực tế, công cụ này đã phát hiện chính xác văn bản do ChatGPT và con người viết. Nhưng đối với đoạn văn hỗn hợp, Crossplag đã sai lầm khi cho rằng đó là 100% của con người.
Bạn có thể sử dụng tính năng phát hiện văn bản AI của Crossplag hoàn toàn miễn phí, nhưng công cụ kiểm tra đạo văn của nó yêu cầu nâng cấp lên gói trả phí.
8. Copyleaks
Copyleaks là một trong những công cụ phát hiện đạo văn được sử dụng nhiều nhất hiện nay, và cũng có khả năng phát hiện các nội dung được tạo ra bởi ChatGPT, GPT-3 và các mô hình ngôn ngữ tương tự khác. Điểm đặc biệt của Copyleaks là không chỉ phân tích văn bản tiếng Anh mà có thể xử lý được các ngôn ngữ khác như tiếng Tây Ban Nha và tiếng Pháp.
Khi thử nghiệm thực tế, công cụ này cho kết quả chính xác đoạn văn của Hemingway là 98,8% do con người viết, và phát hiện văn bản AI với xác suất 83,9%. Nội dung kết hợp giữa AI và con người được xác định 67,2% khả năng là do con người viết ra.
Bạn có thể sử dụng tính năng phát hiện nội dung AI của Copyleaks dưới dạng tiện ích mở rộng của Chrome.
Mời bạn xem thêm các bài liên quan:
- Lý do nào khiến ChatGPT không còn giữ được sức hút như ban đầu?
- 7 phần mềm tăng chất lượng video cho bạn hình ảnh đẹp sắc nét
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
Mình muốn nghe thêm ý kiến của các bạn về bài viết này, hãy để lại bình luận để chúng ta cùng tìm hiểu và cải thiện hơn nhé!