Advertisement

Nhận bản tin

Liên hệ quảng cáo

Email: banbientap@baocungcau.net

Hotline: 0917 267 237

icon logo

Quên mật khẩu?

Có tài khoản? Đăng nhập

Vui lòng nhập mật truy cập tài khoản mới khẩu

Thay đổi email khác
icon

Công cụ AI mới nhất của Tencent tạo hoạt ảnh tĩnh bằng lời nhắc đơn giản

Số hóa

17/03/2024 07:47

Tencent hợp tác với các nhà nghiên cứu từ các trường đại học ở Hồng Kông và Bắc Kinh trong bối cảnh ngày càng có nhiều hứng thú với thế hệ video AI.

Gã khổng lồ internet Trung Quốc Tencent Holdings đã giới thiệu mô hình trí tuệ nhân tạo (AI) chuyển đổi hình ảnh thành video với sự cộng tác của các đối tác học thuật vào thứ Sáu (15/3), một bản phát hành xuất hiện trong bối cảnh sự nhiệt tình ngày càng tăng đối với các công cụ tạo nội dung như ChatGPT và Sora của OpenAI.

Công cụ tạo ảnh động có tên Follow-Your-Click, được phát hành trên trang web mã nguồn mở GitHub của Microsoft, cho phép người dùng nhấp vào một số phần nhất định của hình ảnh bằng một lời nhắc văn bản đơn giản cho biết họ muốn nó di chuyển đến đâu rồi chuyển đổi, một hình ảnh tĩnh thành một video hoạt hình ngắn.

Dự án này là sự hợp tác giữa nhóm Hunyuan của Tencent, Đại học Khoa học và Công nghệ Hồng Kông và Đại học Thanh Hoa, một trong hai trường đại học hàng đầu của Trung Quốc đại lục ở Bắc Kinh.

Công cụ AI mới nhất của Tencent tạo hoạt ảnh tĩnh bằng lời nhắc đơn giản- Ảnh 1.

Công cụ chuyển văn bản thành video của OpenAI Sora đã khơi dậy sự phấn khích xung quanh các công cụ AI tạo video. Ảnh: AFP

Tencent cho biết họ sẽ phát hành mã đầy đủ cho mô hình này vào tháng 4, nhưng bản demo đã có sẵn trên GitHub. Các nhà nghiên cứu đã thể hiện một số khả năng của nó ở đó, với một kết quả cho thấy hình ảnh một con chim với lời nhắc "vỗ cánh" biến thành một tệp MP4 ngắn về một con chim có màu sắc cầu vồng đang co giật một trong những đôi cánh của nó.

Một hình ảnh khác về một cô gái đứng ngoài trời với lời nhắc một từ đơn giản "bão" đã biến thành hình ảnh động với tia chớp lóe lên ở hậu cảnh.

Theo một bài báo học thuật của các nhà nghiên cứu từ ba tổ chức, Follow-Your-Click nhằm mục đích giải quyết các vấn đề mà các mô hình chuyển hình ảnh thành video khác trên thị trường gặp phải có xu hướng di chuyển toàn bộ cảnh thay vì tập trung vào các đối tượng cụ thể trong một bức ảnh. Các mô hình khác yêu cầu người dùng đưa ra những mô tả chi tiết về cách thức và nơi họ muốn hình ảnh di chuyển.

Các nhà nghiên cứu cho biết trong bài báo xuất bản hôm thứ Tư trên arXiv, một kho lưu trữ bài báo khoa học trực tuyến: "Khung của chúng tôi có khả năng kiểm soát người dùng đơn giản hơn nhưng chính xác hơn và hiệu suất tạo ra tốt hơn so với các phương pháp trước đây".

Việc tạo video đã trở thành một chủ đề nóng kể từ khi OpenAI do Microsoft hậu thuẫn phát hành mô hình Sora chuyển văn bản thành video, kết quả ấn tượng của nó đã dẫn đến một làn sóng tìm kiếm linh hồn mới trong ngành AI của Trung Quốc khi người chơi tìm cách bắt kịp AI có tính sáng tạo.

Trong lĩnh vực tạo văn bản và hình ảnh thành video, Pika Labs có trụ sở tại Thung lũng Silicon, do ứng cử viên tiến sĩ người Trung Quốc Guo Wenjing tại Đại học Stanford đồng sáng lập, là một ngôi sao đang lên khác. 

Công ty khởi nghiệp này đã huy động được 55 triệu USD vốn ban đầu và các vòng cấp vốn Series A từ một số tên tuổi lớn nhất trong lĩnh vực công nghệ.

Các đối thủ Trung Quốc của Tencent cũng đã tham gia cuộc đua. Tập đoàn Alibaba Group Holding , chủ sở hữu tờ South China Morning Post, gần đây đã tung ra một công cụ tạo video chân dung có tên EMO, biến hình ảnh và lời nhắc âm thanh thành video hát và nói chuyện.

Follow-Your-Click tham gia hộp công cụ chỉnh sửa và tạo văn bản thành video nguồn mở của Tencent có tên VideoCrafter2, được gã khổng lồ công nghệ phát hành vào tháng 1. 

Đây là phiên bản cập nhật của VideoCrafter1, được phát hành vào tháng 10 năm 2023 nhưng chỉ giới hạn ở các video chỉ dài hai giây.

(Nguồn: SCMP)

GIA HÂN
iconChia sẻ icon Chia sẻ
icon Chia sẻ

Advertisement