09/08/2023 15:59
AI đang hủy hoại internet?
Kể từ khi ChatGPT xuất hiện vào năm ngoái, các công ty công nghệ đã chạy đua để kết hợp công nghệ AI. Trong nhiều trường hợp, các công ty đã bỏ các sản phẩm cốt lõi lâu đời của họ để làm như vậy.
Khi đăng nhập vào HBO Max vào cuối tháng 5/2023, mọi người nhận thấy một điều kỳ lạ. Thông thường, khi ai đó đăng nhập vào trang web, HBO sẽ yêu cầu họ xác minh rằng họ là con người bằng cách giải một hình ảnh xác thực, hộp kiểm nhỏ "Tôi không phải là người máy" hoặc lưới hình ảnh "chọn tất cả các ô vuông có đèn giao thông" chứng minh rằng trên thực tế, bạn là một con người".
Nhưng lần này, khi người dùng đăng nhập, họ được yêu cầu giải một loạt câu đố phức tạp. Các nhiệm vụ kỳ lạ bao gồm việc thêm các dấu chấm trên hình ảnh của xúc xắc đến nghe các đoạn âm thanh ngắn và chọn đoạn clip có chứa mẫu âm thanh lặp lại.
Những nhiệm vụ mới kỳ lạ này, bề ngoài là để chứng minh người dùng là con người, không chỉ giới hạn ở HBO. Trên các nền tảng, người dùng đã bối rối trước những câu đố ngày càng khó giải như xác định đồ vật, chẳng hạn như ngựa làm từ mây, không tồn tại.
Lý do đằng sau những vòng mới này? AI cải tiến. Vì các công ty công nghệ đã đào tạo bot của họ về các hình ảnh xác thực cũ hơn, nên các chương trình này giờ đây có khả năng vượt qua các thử thách điển hình một cách dễ dàng.
Do đó, con người chúng ta phải nỗ lực nhiều hơn để chứng minh nhân tính của mình chỉ để lên mạng. Nhưng những captcha nhức đầu chỉ là phần nổi của tảng băng khi nói đến cách AI đang viết lại cơ chế của Internet.
Kể từ khi ChatGPT xuất hiện vào năm ngoái, các công ty công nghệ đã chạy đua để kết hợp công nghệ AI. Trong nhiều trường hợp, các công ty đã bỏ các sản phẩm cốt lõi lâu đời của họ để làm như vậy. Việc dễ dàng tạo ra văn bản và hình ảnh có vẻ có thẩm quyền chỉ bằng một lần bấm nút có nguy cơ làm xói mòn các thể chế mong manh của Internet và khiến việc điều hướng trang web trở thành một mớ hỗn độn.
Khi cơn sốt AI chiếm ưu thế trên web, các nhà nghiên cứu đã khám phá ra cách nó có thể được vũ khí hóa để làm trầm trọng thêm một số mối quan tâm cấp bách nhất của Internet — như thông tin sai lệch và quyền riêng tư - đồng thời khiến trải nghiệm trực tuyến đơn giản hàng ngày, không bị xóa thư rác để đăng nhập vào các trang web, còn khó chịu hơn hiện tại.
"Không có nghĩa là việc chúng ta không thể kiềm chế AI sẽ dẫn đến sự sụp đổ của xã hội", Christian Selig, người tạo ra Apollo, một ứng dụng Reddit phổ biến nói.
Và cho đến nay, AI đang biến Internet thành cơn ác mộng.
Internet gián đoạn
Trong gần 20 năm, Reddit đã trở thành trang nhất không chính thức của internet và sự tồn tại lâu dài đó phần lớn nhờ vào các tình nguyện viên kiểm duyệt các cộng đồng khác nhau của nó. Theo một ước tính, người điều hành Reddit thực hiện công việc không được trả lương hàng năm trị giá 3,4 triệu USD.
Để làm điều này, họ dựa vào các công cụ như Apollo, một ứng dụng gần một thập kỷ cung cấp các công cụ kiểm duyệt nâng cao.
Nhưng vào tháng 6, người dùng nhận được một thông báo bất thường: Apollo ngừng hoạt động. Trong nỗ lực của công ty để tham gia vào cơn sốt vàng AI, các ứng dụng của bên thứ ba đã phải đối mặt với sự chặt chẽ.
Apollo và các giao diện tương tự khác dựa trên quyền truy cập vào giao diện lập trình ứng dụng của Reddit, hoặc API, một phần mềm giúp các ứng dụng trao đổi dữ liệu.
Trước đây, Reddit cho phép mọi người lấy dữ liệu miễn phí, Reddit càng cho phép nhiều công cụ thì càng thu hút được nhiều người dùng, giúp ứng dụng phát triển.
Nhưng giờ đây, các công ty AI đã bắt đầu sử dụng Reddit và nguồn tương tác trực tuyến với con người khổng lồ của nó để đào tạo các mô hình của họ. Trong nỗ lực kiếm tiền từ sự quan tâm bất ngờ này, Reddit đã công bố mức giá mới, đắt đỏ để truy cập vào dữ liệu của mình.
Apollo và các ứng dụng khác đã trở thành thiệt hại tài sản thế chấp, gây ra một tháng phản đối và bất ổn từ cộng đồng Reddit. Công ty từ chối nhúc nhích, mặc dù điều đó có nghĩa là xa lánh cộng đồng những người tạo nên linh hồn của nó.
Khi những con bò kiếm tiền thu thập dữ liệu làm suy yếu chất lượng của các trang web từng đáng tin cậy, một lượng lớn nội dung đáng ngờ do AI tạo ra tràn ra khắp các trang web. Martijn Pieters, một kỹ sư phần mềm làm việc tại Cambridge, gần đây đã chứng kiến sự suy giảm của Stack Overflow, trang web truy cập internet dành cho các câu hỏi và câu trả lời về kỹ thuật.
Ông đã đóng góp và kiểm duyệt nền tảng này trong hơn một thập kỷ khi nó đột ngột lao dốc vào tháng 6.
Công ty đứng sau trang web, Prosus, đã quyết định cho phép các câu trả lời do AI tạo ra và bắt đầu tính phí các công ty AI để truy cập vào dữ liệu của mình. Đáp lại, những người kiểm duyệt hàng đầu đã đình công, lập luận rằng nội dung chất lượng thấp do AI tạo ra đã đi ngược lại mục đích của trang web: "Trở thành kho lưu trữ nội dung câu hỏi và câu trả lời chất lượng cao".
NewsGuard, một công ty theo dõi thông tin sai lệch và đánh giá độ tin cậy của các trang web thông tin, đã tìm thấy gần 350 cửa hàng tin tức trực tuyến gần như hoàn toàn do AI tạo ra mà hầu như không có sự giám sát của con người.
Các trang web như Biz Breaking News và Market News Reports đưa ra các bài báo chung về nhiều chủ đề, bao gồm chính trị, công nghệ, kinh tế và du lịch.
Nhiều bài báo trong số này chứa đầy những tuyên bố chưa được xác minh, thuyết âm mưu và trò lừa bịp. Khi NewsGuard thử nghiệm mô hình AI đằng sau ChatGPT để đánh giá xu hướng lan truyền những câu chuyện sai sự thật, nó đã thất bại 100 trên 100 lần.
Gordon Crovitz, đồng giám đốc điều hành của NewsGuard nói với tôi, "chúng sẽ là nguồn cung cấp thông tin sai lệch có sức thuyết phục lớn nhất ở quy mô lớn nhất trong lịch sử Internet". Một báo cáo từ Europol, cơ quan thực thi pháp luật của Liên minh Châu Âu, kỳ vọng 90% nội dung internet sẽ được tạo ra bởi AI trong một vài năm tới.
Mặc dù các trang web tin tức do AI tạo này chưa có lượng độc giả đáng kể, nhưng sự gia tăng nhanh chóng của chúng là dấu hiệu báo trước cho việc nội dung do AI tạo sẽ dễ dàng bóp méo thông tin trên mạng xã hội như thế nào.
Trong nghiên cứu của mình, Filippo Menczer, giáo sư khoa học máy tính và giám đốc Đài quan sát về truyền thông xã hội của Đại học Indiana, đã tìm thấy các mạng bot đang đăng khối lượng lớn nội dung do ChatGPT tạo lên các trang truyền thông xã hội như X (trước đây là Twitter) và Facebook.
Và mặc dù các bot AI hiện đã có dấu hiệu nhận biết, nhưng các chuyên gia chỉ ra rằng chúng sẽ sớm bắt chước con người tốt hơn và trốn tránh các hệ thống phát hiện do Menczer và mạng xã hội phát triển.
Trong khi các trang web do người dùng điều hành như Reddit và các nền tảng truyền thông xã hội luôn chống lại những kẻ xấu, mọi người cũng đang mất đi một nơi quan trọng mà họ tìm đến để xác minh thông tin: công cụ tìm kiếm.
Microsoft và Google sẽ sớm chôn vùi các liên kết kết quả tìm kiếm truyền thống để ủng hộ các bản tóm tắt được ghép lại với nhau bởi các bot không được trang bị đầy đủ để phân biệt thực tế với hư cấu. Khi chúng tôi tìm kiếm một truy vấn trên Google, chúng tôi không chỉ tìm hiểu câu trả lời mà còn tìm hiểu xem nó phù hợp như thế nào trong bối cảnh rộng lớn hơn của nội dung trên internet.
Chúng tôi lọc những kết quả đó và sau đó chọn những nguồn mà chúng tôi tin tưởng. Một công cụ tìm kiếm do chatbot cung cấp sẽ loại bỏ những trải nghiệm này, loại bỏ ngữ cảnh như địa chỉ trang web và có thể "nhá hàng" một câu trả lời đạo văn, mà Crovitz của NewsGuard nói với tôi nghe có vẻ "có thẩm quyền, được viết tốt" nhưng "hoàn toàn sai".
Nội dung tổng hợp cũng tràn ngập các nền tảng thương mại điện tử như Amazon và Etsy. Hai tuần trước khi cuốn sách giáo khoa kỹ thuật của Christopher Cowell, một kỹ sư chương trình đến từ Portland, Oregon, được ấn hành, ông đã phát hiện ra một cuốn sách mới có cùng tên trên Amazon.
Cowell sớm nhận ra rằng nó do AI tạo ra và nhà xuất bản đằng sau nó có thể đã lấy tiêu đề từ danh sách phát hành trước của Amazon và đưa nó vào phần mềm như ChatGPT.
Tương tự như vậy, trên Etsy, một nền tảng được biết đến với danh mục thủ công, thủ công, tác phẩm nghệ thuật do AI tạo ra, cốc và sách hiện đã trở nên phổ biến.
Nói cách khác, sẽ nhanh chóng trở nên rất khó phân biệt đâu là thật đâu là giả trực tuyến. Mặc dù thông tin sai lệch từ lâu đã là một vấn đề với Internet, nhưng AI sẽ thổi bay những vấn đề cũ của chúng ta.
Lừa đảo nhiều đất sống
Trong ngắn hạn, sự trỗi dậy của AI sẽ tạo ra một loạt thách thức hữu hình về bảo mật và quyền riêng tư. Lừa đảo trực tuyến, đã phát triển kể từ tháng 11, sẽ khó bị phát hiện hơn vì AI sẽ giúp chúng dễ dàng điều chỉnh theo từng mục tiêu hơn.
Nghiên cứu được thực hiện bởi John Licato, giáo sư khoa học máy tính tại Đại học Nam Florida, đã phát hiện ra rằng có thể thiết kế chính xác các trò gian lận tùy theo sở thích và xu hướng hành vi của một cá nhân với rất ít thông tin về một người từ các trang web công cộng và hồ sơ mạng xã hội.
Một trong những dấu hiệu nhận biết chính về lừa đảo lừa đảo có rủi ro cao - một kiểu tấn công trong đó kẻ xâm nhập giả dạng một thực thể đáng tin cậy như ngân hàng của bạn để đánh cắp thông tin nhạy cảm - là văn bản thường chứa lỗi chính tả hoặc đồ họa không tinh tế và rõ ràng như họ nên được.
Nhưng những dấu hiệu này sẽ không tồn tại trong mạng lừa đảo do AI cung cấp, với việc tin tặc biến văn bản thành hình ảnh và trình tạo văn bản miễn phí như ChatGPT thành công cụ spam mạnh mẽ.
Trí tuệ nhân tạo AI có khả năng có thể được sử dụng để dán ảnh hồ sơ của bạn trong chiến dịch email được cá nhân hóa của một thương hiệu hoặc tạo một tin nhắn video từ một chính trị gia có giọng nói được làm lại một cách giả tạo, chỉ nói về các chủ đề mà bạn quan tâm.
Và điều này đã xảy ra, dữ liệu từ một công ty an ninh mạng, Darktrace đã phát hiện ra sự gia tăng 135% trong các chiến dịch mạng độc hại kể từ đầu năm 2023 và tiết lộ rằng bọn tội phạm đang ngày càng chuyển sang sử dụng bot để viết email lừa đảo nhằm gửi các tin nhắn dài hơn, không bị lỗi ít có khả năng bị bắt bởi các bộ lọc thư rác.
Và chẳng mấy chốc, tin tặc có thể không phải trải qua quá nhiều khó khăn để có được thông tin nhạy cảm của bạn. Hiện tại, tin tặc thường sử dụng vô số phương pháp gián tiếp để theo dõi bạn, bao gồm các trình theo dõi ẩn bên trong các trang web và mua bộ dữ liệu lớn chứa thông tin bị xâm phạm từ web tối.
Tuy nhiên, các nhà nghiên cứu bảo mật đã phát hiện ra rằng các bot AI trong ứng dụng và thiết bị của bạn có thể lấy cắp thông tin nhạy cảm cho tin tặc.
Do các mô hình AI từ OpenAI và Google tích cực thu thập dữ liệu trên web, nên tin tặc có thể ẩn các mã độc hại, một bộ hướng dẫn dành cho bot, bên trong các trang web và khiến các bot thực thi nó mà không cần sự can thiệp của con người.
Giả sử bạn đang sử dụng Microsoft Edge, một trình duyệt được tích hợp sẵn chatbot Bing AI. Vì chatbot liên tục đọc các trang bạn xem, nên nó có thể nhận mã độc ẩn trong trang web bạn truy cập.
Mã này có thể yêu cầu Bing AI đóng giả làm nhân viên của Microsoft, nhắc bạn về một ưu đãi mới để sử dụng Microsoft Office miễn phí và yêu cầu thông tin chi tiết về thẻ tín dụng của bạn. Đó là cách một chuyên gia bảo mật quản lý để đánh lừa Bing AI.
Florian Tramèr, trợ lý giáo sư khoa học máy tính tại ETH Zürich, nhận thấy các cuộc tấn công "prompt injection" này đáng lo ngại, đặc biệt là khi các trợ lý thông minh AI đang xâm nhập vào tất cả các loại ứng dụng như hộp thư đến email, trình duyệt, phần mềm văn phòng, v.v. do đó, có thể dễ dàng truy cập dữ liệu.
"Những thứ như trợ lý AI thông minh quản lý email, lịch, mua hàng, v.v. của bạn hiện không khả thi vì những rủi ro này", Tramèr cho biết.
'Internet chết'
Khi AI tiếp tục tàn phá các sáng kiến do cộng đồng lãnh đạo như Wikipedia và Reddit, Internet sẽ ngày càng có cảm giác như nó được thiết kế cho máy móc và bởi máy móc.
Toby Walsh, giáo sư trí tuệ nhân tạo tại Đại học New South Wales, nói với tôi rằng điều đó có thể phá vỡ trang web mà chúng ta đang sử dụng hiện nay.
Nó cũng sẽ gây khó khăn cho các nhà sản xuất AI. Khi nội dung do AI tạo ra lấn át công việc của con người, các công ty công nghệ như Microsoft và Google sẽ có ít dữ liệu gốc hơn để cải thiện mô hình của họ.
"AI ngày nay hoạt động được vì nó được rèn luyện trên mồ hôi và sự khéo léo của con người. "Nếu AI thế hệ thứ hai được đào tạo dựa trên nguồn gốc của thế hệ đầu tiên, chất lượng sẽ giảm mạnh", Walsh nói.
Đầu tháng 5 năm nay, một nghiên cứu của Đại học Oxford đã phát hiện ra rằng việc đào tạo AI trên dữ liệu do các hệ thống AI khác tạo ra sẽ khiến nó xuống cấp và cuối cùng là sụp đổ. Và như vậy, chất lượng thông tin tìm thấy trực tuyến cũng vậy.
Licato, giáo sư Đại học Nam Florida, so sánh tình trạng hiện tại của trải nghiệm web với lý thuyết "internet đã chết". Khi các trang web được truy cập nhiều nhất trên internet như Reddit trở nên tràn ngập các bài báo và bình luận do bot viết, các công ty sẽ triển khai thêm các bot truy cập để đọc và lọc nội dung tự động. Cuối cùng, theo lý thuyết, hầu hết việc tạo và tiêu thụ nội dung trên internet sẽ không còn do con người thực hiện nữa.
"Đó là một điều kỳ lạ khi tưởng tượng, nhưng dường như ngày càng có nhiều khả năng xảy ra với cách mọi thứ đang diễn ra", Licato nói.
Tác giả bài viết cho rằng ông không thể không đồng ý. Trong vài tháng qua, những nơi ông thường lui tới trực tuyến đều bị tràn ngập nội dung và khuôn mặt do AI tạo ra hoặc quá bận rộn với việc cập nhật các bản cập nhật AI của đối thủ đến mức họ đã làm tê liệt các dịch vụ cốt lõi của mình. Nếu nó tiếp tục, internet sẽ không bao giờ như cũ nữa.
(Nguồn: Business Insider)
Tin liên quan
Chủ đề liên quan
Advertisement
Advertisement