ChatGPT là công cụ AI được tạo ra với mục đích mang đến trải nghiệm AI tương tác cho người dùng. Mới đây OpenAI tiết lộ rằng ChatGPT sẽ được bổ sung giọng nói nhân tạo để trả lời các yêu cầu của người dùng, cùng với khả năng nhận diện hình ảnh để phục vụ người dùng tốt hơn.
OpenAI sẽ bổ sung giọng nói cho ChatGPT
Ngày 25/9 vừa qua, OpenAI tiết lộ rằng họ sẽ làm cho ChatGPT có giọng nói. Người dùng sẽ có thể nói chuyện trực tiếp với chatbot AI này và yêu cầu nó trả lời lại. Đây là lần đầu tiên ChatGPT có thể trò chuyện trực tiếp với người dùng bằng giọng nói một cách hiệu quả.
Trong đoạn clip ví dụ của OpenAI, một người phụ nữ yêu cầu ChatGPT tạo ra một câu chuyện kể trước khi đi ngủ và nó đã đưa ra câu trả lời bằng giọng nói nhân tạo của nữ.
Use your voice to engage in a back-and-forth conversation with ChatGPT. Speak with it on the go, request a bedtime story, or settle a dinner table debate.
Sound on 🔊 pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) September 25, 2023
Theo trang Wired, mô hình AI biến văn bản thành giọng nói được OpenAI tự phát triển, có thể tạo ra âm thanh “giống con người” dựa trên nội dung văn bản và một đoạn giọng nói mẫu ngắn chỉ vài giây (sử dụng mô hình Openai Whisper). Giọng nói nhân tạo có thể mang nhiều âm điệu và phong cách khác nhau, bạn có thể xem nhiều mẫu giọng nói trên trang web của OpenAI.
Một số công ty đã đưa tính năng mới của OpenAI vào sử dụng, ví dụ như Spotify kết hợp khả năng dịch ngôn ngữ của ChatGPT với mô hình biến văn bản thành giọng nói để dịch podcast sang nhiều ngôn ngữ khác nhau.
Tính năng giọng nói mới của ChatGPT hiện chỉ có ở phiên bản Plus và Enterprise với ứng dụng ChatGPT chính thức trên Android và iOS, dự kiến sẽ được triển khai trong vòng 2 tuần tới (bắt đầu từ ngày 25/9/2023). Trong thời gian đầu tính năng này chỉ giới hạn ở tiếng Anh, nhưng hy vọng sẽ được bổ sung thêm các ngôn ngữ khác.
ChatGPT sẽ có khả năng nhận diện và phân tích hình ảnh
Một tính năng cập nhật khác của ChatGPT là phân tích và nói về những hình ảnh được tải lên. Tùy chọn phân tích hình ảnh trực quan đã được giới thiệu trong các video cập nhật GPT-4 nhưng chưa được chú ý nhiều.
Tính năng mới này của ChatGPT tương tự như Google Lens. Bạn có thể tải một hình ảnh lên hoặc chụp ảnh bằng camera trong ứng dụng ChatGPT, nó sẽ giải thích chi tiết hình ảnh đó và thêm bối cảnh nếu cần thiết.
Nhưng tính năng này còn hơn cả Google Lens vì ChatGPT có thể trò chuyện với bạn để cung cấp thêm thông tin và bối cảnh của hình ảnh, điều này cực kỳ hữu ích trong nhiều trường hợp. Tuy nhiên OpenAI đã lưu ý rằng ChatGPT bị giới hạn về “khả năng phân tích và đưa ra các phát biểu trực tiếp về người” trong hình ảnh để bảo vệ quyền riêng tư. Cũng không loại trừ khả năng sẽ có một công cụ AI khác được tạo ra dành riêng cho mục đích nhận diện con người trong hình ảnh.
Giống như tính năng biến văn bản thành giọng nói, OpenAI sẽ triển khai tính năng nhận dạng hình ảnh của ChatGPT trong 2 tuần tới nhưng dành cho tất cả mọi nền tảng, không chỉ riêng ứng dụng ChatGPT trên di động.
Quyền riêng tư, bảo mật và các vấn đề khác
Việc ChatGPT có thêm giọng nói có ý nghĩa rất lớn. Một mặt, đây là tính năng rất thú vị đối với người dùng, nhưng đồng thời cũng làm nảy sinh mối lo ngại về vấn đề bảo mật và an ninh mạng khi AI có thể tạo ra giọng nói chỉ dựa vào một đoạn ngắn làm mẫu. Kẻ xấu có thể khai thác khả năng này để giả mạo và lừa đảo, và một khi điều đó đã xảy ra thì không có cách nào quay lại như trước nữa.
Ngay cả lời cảnh báo của OpenAI về vấn đề này dường như cũng chưa nói lên hết mức độ nghiêm trọng của nó:
“Những khả năng này cũng đưa ra những rủi ro mới, chẳng hạn như tiềm năng cho những kẻ xấu mạo danh các nhân vật của công chúng hoặc phạm tội lừa đảo. Đây là lý do tại sao chúng tôi đang sử dụng công nghệ này để tăng cường cho một trường hợp sử dụng cụ thể: trò chuyện bằng giọng nói.”
Những nguy cơ này khiến các chuyên gia phản đối tính năng giọng nói mới của ChatGPT, nhất là khi ngày càng có nhiều thông tin về việc công cụ AI này đang bị lợi dụng để thực hiện mục đích xấu như lừa đảo.
Mời bạn xem thêm các bài liên quan:
- 7 phần mềm tăng chất lượng video cho bạn hình ảnh đẹp sắc nét
- Mục tiêu trung hòa carbon vào năm 2030 của Apple liệu có khả thi?
Hãy theo dõi BlogAnChoi để cập nhật nhiều thông tin bổ ích nhé!
Nếu các bạn thấy bài viết này hữu ích, hãy chia sẻ cho bạn bè của mình để cùng biết nhé!