02/06/2023 08:26
AI càn quét Trung Quốc khi các công ty tung ra 'ChatGPT nội địa'
Tiền không thành vấn đề khi các nhà đầu tư lớn nhỏ đổ xô vào công nghệ chatbot.
Vào tháng 2, ngay sau khi ChatGPT của OpenAI gây bão trong thế giới công nghệ, một loạt bài đăng của doanh nhân nổi tiếng người Trung Quốc Wang Huiwen đã lan truyền trên mạng xã hội.
"Tôi đang đầu tư 50 triệu USD. Hãy hợp tác với tôi để nắm bắt kỷ nguyên mới và tạo ra OpenAI của Trung Quốc. Tôi hiện không hiểu công nghệ AI nhưng tôi đang nỗ lực học hỏi", Wang, người đồng sáng lập nền tảng giao đồ ăn Meituan, cho biết trong một trong những bài viết.
Một số nhà phân tích đã hoài nghi, chỉ ra rằng 50 triệu USD chỉ là giọt nước trong đại dương khi nói đến số tiền cần thiết để đào tạo các chatbot như ChatGPT.
Tuy nhiên, ông Wang chỉ là một trong số nhiều nhà đầu tư Trung Quốc đổ xô tham gia vào lĩnh vực AI tổng quát và nhiều người đang tập trung vào một lĩnh vực cụ thể: các mô hình ngôn ngữ lớn.
Các mô hình ngôn ngữ lớn là công nghệ hỗ trợ các chatbot như ChatGPT và Bard của Google. Bằng cách sử dụng các thuật toán và sức mạnh điện toán tiên tiến, các mô hình này được đào tạo trên một lượng lớn bộ dữ liệu để tạo ra các phản ứng giống như con người.
Trong ba tháng qua, hơn 30 thực thể Trung Quốc đã thông báo rằng họ đang phát triển các mô hình ngôn ngữ lớn của riêng mình. Những người này bao gồm những gã khổng lồ công nghệ như Alibaba, Tencent, Baidu và Huawei Technologies - vốn đã bắt đầu trước khi ChatGPT bùng nổ, cũng như các trường đại học, tổ chức do nhà nước hậu thuẫn và các doanh nhân mới làm quen với AI, như ông Wang.
"Hàng chục công ty Trung Quốc đổ xô xây dựng các mô hình nền tảng là điển hình cho bất kỳ công nghệ mới nào có tiềm năng lớn. Sự bùng nổ của những người chơi và sản phẩm mới thường sẽ được theo sau bởi sự hợp nhất khi công nghệ trưởng thành và những người chiến thắng rõ ràng xuất hiện", ông Andy Chun, phó chủ tịch của Hiệp hội Máy tính Hồng Kông cho biết.
Ngưỡng đầu tư vào các mô hình ngôn ngữ lớn ở Trung Quốc đã tăng từ 50 triệu USD lên 100 triệu USD kể từ đầu năm, các nhà đầu tư nói với Nikkei Asia.
Một lý do cho sự quan tâm và đầu tư ồ ạt là tiềm năng thương mại to lớn. Theo công ty nghiên cứu thị trường IDC, thị trường phần mềm và ứng dụng AI của Trung Quốc được dự đoán sẽ tăng gấp 4 lần về giá trị từ năm 2021 đến năm 2026 lên hơn 21 tỷ USD.
Một lý do khác là sự hấp dẫn của chính cách tiếp cận mô hình ngôn ngữ lớn.
"Các chuyên gia trong ngành tin rằng chúng ta đã bước vào một kỷ nguyên mới của các mô hình ngôn ngữ lớn và nhiều người cảm thấy rằng đáng để xem xét lại và làm lại tất cả các sản phẩm từ đầu. Thay vì sử dụng các giao diện lập trình ứng dụng (API) hoặc tích hợp các hệ thống hiện có, chúng tôi dự định xây dựng lại hoàn toàn và cấu hình lại mọi sản phẩm", Robin Li, đồng sáng lập và CEO của Baidu, cho biết trong một bài phát biểu vào tuần trước.
Ông nói: "Các mô hình ngôn ngữ lớn đã biến đổi trí tuệ nhân tạo và chúng sẽ sớm biến đổi thế giới".
Các công ty không phải là những người duy nhất để mắt đến AI. Do tầm quan trọng của nó đối với an ninh quốc gia và khả năng cạnh tranh toàn cầu, chính phủ Trung Quốc đã đưa ra các chính sách hỗ trợ ngành công nghiệp AI và đang cố gắng đưa nước này trở thành quốc gia dẫn đầu thế giới trong lĩnh vực này. Đầu năm nay, chính quyền thành phố Bắc Kinh đã cam kết hỗ trợ các công ty xây dựng các mô hình ngôn ngữ lớn để cạnh tranh với ChatGPT.
Giới chức Trung Quốc cho biết nước này sẽ thúc đẩy nghiên cứu khoa học bằng cách tập trung vào các lĩnh vực bao gồm trí tuệ nhân tạo, thông tin lượng tử và vi mạch, mặc dù điều này cũng đã báo hiệu những hạn chế đối với sự phát triển.
Cơ quan giám sát không gian mạng hàng đầu của quốc gia đã ban hành một quy tắc đề xuất nêu rõ rằng nội dung được tạo bằng AI tổng quát phải phản ánh "các giá trị cốt lõi của chủ nghĩa xã hội" và Chủ tịch Trung Quốc Tập Cận Bình cũng đã thúc giục cải thiện "quản trị an ninh của trí tuệ nhân tạo".
Tuy nhiên, tất cả sự phấn khích này không thay đổi được thực tế rằng việc xây dựng các mô hình ngôn ngữ lớn rất tốn kém, cả về tài chính và môi trường. Lượng khí thải carbon từ việc đào tạo một mô hình đơn lẻ có thể lên tới hàng trămtấn, theo một báo cáo của Đại học Stanford.
Ở Mỹ, chỉ những người chơi công nghệ lớn mới đủ khả năng phát triển các mô hình ngôn ngữ lớn. Ví dụ, OpenAI có sự hỗ trợ tài chính đáng kể từ Microsoft, điều này đã cho phép nó phát triển ChatGPT hơn nữa.
Xiao Yanghua, giáo sư khoa học máy tính tại Đại học Phúc Đán ở Thượng Hải, cho biết trong một bài đăng trực tuyến rằng hiện tại nhiều tổ chức Trung Quốc chỉ đang tinh chỉnh các mô hình nền tảng nguồn mở và sử dụng các API tương đối rẻ như ChatGPT để tạo dữ liệu nhằm "phát triển" người mẫu của riêng họ.
"Đó là lý do tại sao khi bạn hỏi một số người mẫu ngôn ngữ lớn trong nước 'Bạn là ai?' câu trả lời là 'Tôi là ChatGPT'", Xiao nói.
Ông cũng chỉ trích tiền đổ vào AI, so sánh nó với chính sách kinh tế tai hại của ông Mao Trạch Đông. Ông nói: "Sự phát triển của các mô hình ngôn ngữ lớn hiện nay rất giống với Đại nhảy vọt vào những năm 1950, gây ra sự lãng phí lớn về nhân lực, vật lực và tài chính".
Đánh giá xem dòng đầu tư này đã mang lại bao nhiêu cho đến nay là không dễ dàng.
"Thách thức là những mẫu Trung Quốc này chưa được phát hành cho một bộ phận lớn dân số, vì vậy rất khó để đánh giá cách chúng so sánh với các mẫu hiện đại như những mẫu đằng sau ChatGPT và Bard", Triolo, một chuyên gia về Trung Quốc và công nghệ tại công ty tư vấn Albright Stonebridge cho biết.
Theo ông Triolo, các công ty Trung Quốc có xu hướng đưa các mô hình AI tổng quát của họ vào các ngành dọc hoặc thị trường mục tiêu được tập trung chặt chẽ và sử dụng bộ dữ liệu của riêng họ để phát triển các ứng dụng tạo ra doanh thu nhanh hơn.
Ông nói thêm, những hạn chế của Mỹ đối với việc xuất khẩu các đơn vị xử lý đồ họa tiên tiến hoặc GPU sẽ không phải là trở ngại lớn trong thời gian ngắn, nhưng theo thời gian, các công ty Trung Quốc có thể gặp khó khăn trong việc khắc phục những hạn chế phần cứng này.
Theo Qing Wei, giám đốc công nghệ của Microsoft Trung Quốc, một thách thức khác, cấp bách hơn đối với các công ty Trung Quốc liên quan đến bộ dữ liệu.
"Đối với các công ty công nghệ lớn ở Trung Quốc, rất khó để cung cấp dữ liệu cho đối thủ cạnh tranh hoặc kết nối với API của đối thủ, đó là lý do tại sao họ muốn xây dựng mô hình của riêng mình nếu họ sẵn sàng đón nhận kỷ nguyên AI mới", ông nói.
Mặc dù dữ liệu ngôn ngữ mà ChatGPT có thể trích xuất là mở, được chia sẻ và miễn phí, nhưng hầu hết dữ liệu tiếng Trung chất lượng cao cần thiết để tạo "phiên bản ChatGPT của Trung Quốc" đều do các công ty hoặc tổ chức nắm giữ và không thể chia sẻ được, ông Wei cho biết vào tháng 3.
Zeren Bai, hiệu trưởng cấp cao của Linear Capital có trụ sở tại Thượng Hải, tập trung đầu tư vào các ứng dụng dữ liệu và cơ sở hạ tầng dữ liệu ở Trung Quốc, cho biết hầu hết các gã khổng lồ internet Trung Quốc đang phát triển các mô hình ngôn ngữ lớn của riêng họ, vì họ có lợi thế tận dụng dữ liệu của chính họ.
Ông nói: "Đối với các công ty công nghệ lớn ở Trung Quốc, rất khó để họ cung cấp dữ liệu cho đối thủ cạnh tranh hoặc kết nối với API của đối thủ, đó là lý do họ muốn xây dựng mô hình của riêng mình nếu họ sẵn sàng đón nhận kỷ nguyên AI mới".
Bất chấp những trở ngại, ông Bai cho biết sự đồng thuận của ngành kể từ khi ChatGPT ra đời là đáng để làm lại tất cả các ứng dụng.
Ông nói: "Các ứng dụng được xây dựng trên các mô hình nền tảng sẽ là một cơ hội tương đối chắc chắn, vì vậy chúng tôi đang tập trung vào các ứng dụng AI tổng quát trong các ngành dọc, thay vì trên các nền tảng tập trung vào trò chuyện nói chung". Ví dụ về điều này có thể bao gồm việc sử dụng AI để tạo ảnh hoặc video để tiếp thị.
Và các mô hình ngôn ngữ lớn của Trung Quốc đang thực sự phát triển và cải thiện. Lấy Ernie Bot của Baidu, câu trả lời đầu tiên của Trung Quốc cho ChatGPT. Bot vẫn đang trong quá trình thử nghiệm và chưa mở cửa cho công chúng, nhưng Baidu gần đây cho biết số truy vấn của Ernie mỗi giây, thước đo lưu lượng truy cập mà nó có thể xử lý đã tăng khoảng 10 lần kể từ khi phát hành giới hạn vào tháng 3.
Trong khi đó, Alibaba Cloud hôm 1/6 đã giới thiệu trợ lý thông minh của mình, Tingwu, dựa trên mô hình ngôn ngữ lớn Tongyi Qianwen. Tingwu có thể chuyển lời nói và video thành văn bản trong thời gian thực và có sẵn để thử nghiệm beta công khai.
Nhưng Tencent và Alibaba có nguồn tài chính khổng lồ và đội quân kỹ sư tùy ý sử dụng. Điều này để lại những hy vọng ở đâu, như doanh nhân Wang?
James Chou cho biết: "Chỉ một vài gã khổng lồ công nghệ cuối cùng sẽ giành chiến thắng trong cuộc chiến mô hình ngôn ngữ lớn, giống như hàng nghìn công ty Trung Quốc đang đốt tiền để giành thị phần trong chiến trường mua theo nhóm vào đầu những năm 2010 và chỉ một số ít trong số họ sống sót". giám đốc điều hành của Microsoft cho Startups Bắc Á.
"Tôi tin rằng có thể có nhiều sự phát triển sáng tạo hơn trong các ngành dọc hẹp và chuyên biệt, vì một số công ty có thể tận dụng chuyên môn của họ trong một lĩnh vực cụ thể và dữ liệu độc quyền mà họ sở hữu để tạo ra các mô hình mới".
(Nguồn: Nikkei)
Tin liên quan
Chủ đề liên quan
Advertisement
Advertisement