16/02/2024 14:20
Sora, công cụ mới của OpenAI tạo video từ văn bản là gì?
OpenAI, người tạo ra nền tảng trí tuệ nhân tạo rất phổ biến ChatGPT, đã giới thiệu Sora, cho phép người dùng tạo video ngay lập tức từ văn bản.
Công ty được Microsoft hậu thuẫn cho biết Sora "có thể tạo ra những cảnh thực tế và giàu trí tưởng tượng từ các hướng dẫn bằng văn bản" dài tới một phút.
Sora, có nghĩa là "bầu trời" trong tiếng Nhật, là công cụ mới nhất trong không gian AI và có tiềm năng thay đổi hơn nữa cách mọi người tạo ra mọi thứ, ngay cả khi mối lo ngại về nội dung do AI tạo ra ngày càng tăng.
Sora có thể làm gì?
Nó đơn giản như việc gõ các từ, cụm từ hoặc câu vào một lời nhắc, sau đó Sora sẽ tự động tạo một cảnh dựa trên thông tin đó.
OpenAI cho biết Sora có thể tạo ra các cảnh phức tạp với một số nhân vật, loại chuyển động cụ thể cũng như chủ đề và bối cảnh chi tiết, hiểu được "không chỉ những gì người dùng yêu cầu trong lời nhắc mà còn cả cách những thứ đó tồn tại trong thế giới vật chất".
"Mô hình này có sự hiểu biết sâu sắc về ngôn ngữ, cho phép nó diễn giải chính xác các lời nhắc và tạo ra các nhân vật hấp dẫn thể hiện cảm xúc sống động", nó nói thêm. "Sora cũng có thể tạo nhiều cảnh quay trong một video được tạo duy nhất để duy trì chính xác các nhân vật và phong cách hình ảnh".
Sora có thể tạo video dài tối đa một phút trong khi vẫn duy trì chất lượng hình ảnh và tuân thủ lời nhắc của người dùng. Nguồn: OpenAI
Sora chính xác đến mức nào?
Dựa trên ví dụ ban đầu của OpenAI được phát hành trên X và những ví dụ được người sáng tạo trên nền tảng truyền thông xã hội đề xuất, Sora dường như có thể tạo video chính xác theo lời nhắc.
Nhưng công ty có trụ sở tại California đã thừa nhận mô hình hiện tại của Sora "có điểm yếu". OpenAI cho biết: "Nó có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một cảnh phức tạp và có thể không hiểu các trường hợp cụ thể về nguyên nhân và kết quả".
"Ví dụ: một người có thể cắn một miếng bánh quy, nhưng sau đó, chiếc bánh quy có thể không có vết cắn. Sora cũng có thể nhầm lẫn các chi tiết không gian. Nó có thể trộn lẫn trái và phải hoặc gặp khó khăn khi theo một quỹ đạo máy ảnh cụ thể. "
Sora có sẵn cho công chúng và nó có miễn phí không?
OpenAI cho biết hiện tại, Sora đã sẵn sàng cho "đội đỏ" hoặc các chuyên gia có thể đánh giá rủi ro và xác định các vấn đề tiềm ẩn như thông tin sai lệch, thành kiến và nội dung thù địch. Công ty cho biết họ sẽ thử nghiệm mô hình này một cách "ngược lại".
Sora cũng sẽ mở cửa cho một số nghệ sĩ thị giác, nhà thiết kế và nhà làm phim – "số lượng người sáng tạo có hạn", theo giám đốc điều hành OpenAI Sam Altman – để nhận phản hồi về cách cải thiện nền tảng và làm cho nó hữu ích hơn cho các chuyên gia sáng tạo.
Hiện tại, Sora miễn phí đối với những người dùng này, những người sẽ được cấp quyền truy cập sớm vào mô hình.
Tuy nhiên, vẫn chưa rõ liệu OpenAI có tính phí sau khi Sora được cung cấp cho công chúng hay không. OpenAI đã giới thiệu các mô hình ChatGPT trả phí và công cụ tạo hình ảnh của nó, Dall-E.
Sora có an toàn?
Giống như bất kỳ nền tảng AI nào khác, có những lo ngại về nội dung mà Sora có thể tạo ra. OpenAI cho biết họ đang nỗ lực giải quyết những vấn đề này.
Ngoài việc hợp tác với các đội đỏ, OpenAI cho biết họ cũng đang xây dựng các công cụ giúp phát hiện nội dung sai lệch, bao gồm cả "bộ phân loại phát hiện" có thể cho biết thời điểm video được Sora tạo ra.
Voi ma mút thời tiền sử do công cụ AI của OpenAI tạo ra từ lời nhắc bằng text. Nguồn: New York Times
Trình phân loại văn bản của OpenAI sẽ "kiểm tra và từ chối các lời nhắc nhập văn bản vi phạm chính sách sử dụng của chúng tôi", trong trường hợp người dùng yêu cầu nội dung liên quan đến bạo lực cực đoan, nội dung khiêu dâm, hình ảnh thù hận, chân dung người nổi tiếng hoặc tài sản trí tuệ của người khác, nó nói.
OpenAI cũng cho biết họ sẽ hợp tác với các nhà hoạch định chính sách, nhà giáo dục và nghệ sĩ trên khắp thế giới để "hiểu mối quan tâm của họ và xác định các trường hợp sử dụng tích cực cho công nghệ mới này".
Tin liên quan
Advertisement
Advertisement
Đọc tiếp