30/03/2024 16:06
OpenAI tiết lộ công cụ nhân bản giọng nói nhưng chưa triển khai rộng rãi vì sợ rủi ro
Hôm 29/3, OpenAI đã phát hành bản xem trước Voice Engine, công cụ trí tuệ nhân tạo (AI) tạo giọng nói số mà họ cho biết có thể tạo ra giọng nói nghe tự nhiên dựa trên mẫu âm thanh 15 giây.
Đây là sản phẩm mới nhất của OpenAI, công ty khởi nghiệp ở thành phố San Francisco (Mỹ) đứng sau chatbot nổi tiếng ChatGPT, trình tạo hình ảnh DALL-E và mô hình chuyển văn bản thành video Sora.
Dịch vụ Voice Engine đã được phát triển từ cuối năm 2022 – cùng thời điểm ChatGPT ra mắt và sử dụng kiểu nhập văn bản cũng như mẫu âm thanh 15 giây để tạo ra "lời nói có âm thanh tự nhiên gần giống với người nói ban đầu".
Thông qua một bài đăng trên blog, OpenAI cho biết đã thử nghiệm Voice Engine trong hàng loạt các ứng dụng như hỗ trợ đọc cho trẻ em, dịch ngôn ngữ và phục hồi giọng nói cho bệnh nhân ung thư.
Một số người dùng mạng xã hội đã phản ứng bằng cách nêu bật các hành vi sử dụng sai mục đích có thể xảy ra, gồm cả hành vi gian lận tiềm ẩn bằng bắt chước giọng nói trái phép (deepfake).
OpenAI cho biết đang tạm dừng việc phát hành Voice Engine rộng rãi hơn vì có khả năng bị lạm dụng, đặc biệt là trong năm bầu cử.
"Chúng tôi nhận ra rằng việc tạo ra giọng nói giống với con người mang lại những rủi ro nghiêm trọng, đặc biệt là trong một năm bầu cử. Chúng tôi đang hợp tác với các đối tác ở Mỹ và quốc tế từ các cơ quan chính phủ, truyền thông, giải trí, giáo dục, xã hội dân sự và xa hơn nữa để đảm bảo rằng đang kết hợp phản hồi của họ trong quá trình xây dựng", OpenAI viết trong bài đăng trên blog.
Nhân bản giọng nói từ lâu đã được sử dụng trong các ngành công nghiệp và hỗ trợ các nhiệm vụ như hỗ trợ và tương tác với khách hàng, cũng như góp phần tăng hiệu quả chi phí và hoạt động.
Thị trường nhân bản giọng nói toàn cầu được dự đoán sẽ đạt gần 9,3 tỷ USD vào năm 2030, từ mức ước tính 1,45 tỷ USD vào năm 2022, tăng trưởng với tốc độ gộp hàng năm hơn 26%, dữ liệu mới nhất từ Grand View Research cho thấy.
Tuy nhiên, với sự ra đời của AI sáng tạo, các rủi ro cũng xuất hiện, bao gồm thông tin sai lệch, giả mạo và thiên vị, cùng những rủi ro khác.
Đặc biệt, OpenAI thừa nhận rằng những rủi ro này sẽ tăng cao vào năm 2024, là năm bầu cử ở Mỹ, nơi dự kiến sẽ có một trận tái đấu giữa Tổng thống đương nhiệm Joe Biden và Donald Trump, những người đã tham gia vào một cuộc chiến mang tính phân cực cao, được thúc đẩy bởi mạng xã hội trong 2020.
"Chúng tôi nhận thấy rằng việc tạo ra lời nói giống giọng nói của mọi người có những rủi ro nghiêm trọng… chúng tôi đang hợp tác với các đối tác Hoa Kỳ và quốc tế từ khắp các chính phủ, truyền thông, giải trí, giáo dục, xã hội dân sự và hơn thế nữa để đảm bảo rằng chúng tôi kết hợp được phản hồi của họ khi chúng tôi xây dựng", OpenAI cho biết.
OpenAI cho biết các đối tác Voice Engine của họ đã đồng ý với các chính sách sử dụng của họ, trong đó cấm mạo danh cá nhân hoặc tổ chức khác mà không có sự đồng ý hoặc quyền hợp pháp và yêu cầu "sự đồng ý rõ ràng và có hiểu biết" từ người nói ban đầu.
"Chúng tôi không cho phép các nhà phát triển xây dựng các cách để người dùng cá nhân tạo ra tiếng nói của riêng họ. Các đối tác cũng phải tiết lộ rõ ràng với khán giả của mình rằng giọng nói họ đang nghe là do AI tạo ra", công ty cho biết.
Tin liên quan
Advertisement
Advertisement