Một vụ kiện liên bang tại Mỹ cáo buộc Google “bí mật đánh cắp tất cả các nội dung được tạo và chia sẻ trên internet” để xây dựng các sản phẩm trí tuệ nhân tạo (AI) của mình.

shutterstock 1160472559
(Nguồn: Sundry Photography/Shutterstock)

Theo một vụ kiện được đệ trình lên Tòa án Quận Hoa Kỳ ở San Francisco, Google đang thu thập một lượng lớn dữ liệu, bao gồm cả thông tin cá nhân, để phát triển một dòng sản phẩm trí tuệ nhân tạo do Bard (chatbot trí tuệ nhân tạo tổng hợp đàm thoại được phát triển bởi Google) đứng đầu.

Bard là chatbot mới của công ty được ra mắt vào đầu năm nay để cạnh tranh với  ChatGPT của OpenAI.

Đơn kiện được đệ trình vào thứ Ba (ngày 11/7) nhằm kiện Google bằng hình thức kiện tập thể.

“Google đã lấy tất cả thông tin cá nhân và nghề nghiệp của chúng tôi, ý tưởng sáng tạo và tác phẩm của chúng tôi, ảnh của chúng tôi, thậm chí cả email của chúng tôi, hầu như tất cả thông tin kỹ thuật số, và sử dụng các thông tin đó để xây dựng các sản phẩm trí tuệ nhân tạo thương mại.” đơn tố tụng cho biết.

Ông Ryan Clarkson, luật sư của các nguyên đơn, cho biết trong một tuyên bố rằng gã khổng lồ công nghệ “đã bí mật thu thập dữ liệu này trong nhiều năm mà không thông báo cho bất kỳ ai, càng không cần nói đến việc có được sự đồng ý của bất kỳ ai”.

“Google không sở hữu Internet, không sở hữu công việc sáng tạo của chúng ta, không sở hữu các biểu hiện cá tính, hình ảnh gia đình và con cái của chúng ta hay bất cứ thứ gì khác, chỉ là chúng ta chia sẻ những thứ này trên internet.”

Tuy nhiên Google đã phủ nhận các cáo buộc trong vụ kiện.

Halimah DeLaine Prado, cố vấn pháp lý của Google, cho biết trong một tuyên bố: “Chúng tôi đã nói rõ trong nhiều năm rằng chúng tôi sử dụng dữ liệu từ các nguồn công khai, chẳng hạn như dữ liệu được đăng lên web mở và bộ dữ liệu công khai để đào tạo các mô hình AI đứng sau các dịch vụ như Google Dịch và tuân thủ nghiêm ngặt các nguyên tắc AI của Google.”

Và cho biết: “Luật pháp Mỹ hỗ trợ việc sử dụng thông tin công cộng để tạo ra những cách sử dụng có lợi mới, chúng tôi mong muốn bác bỏ những tuyên bố vô căn cứ này.”

Vụ kiện làm nổi bật những lo ngại ngày càng tăng về lượng dữ liệu khổng lồ, bao gồm cả thông tin cá nhân, được thu thập khi xây dựng các sản phẩm trí tuệ nhân tạo.

Tuần trước, diễn viên hài Sarah Silverman và hai nhà văn đã đệ đơn kiện Meta và OpenAI, cáo buộc hai công ty công nghệ này vi phạm bản quyền bằng cách sử dụng bộ dữ liệu chứa tác phẩm của họ.

Đây là khiếu nại mới nhất của giới sáng tác đối với các công ty công nghệ trí tuệ nhân tạo (AI) kể từ khi Open AI phát hành ChatGPT gây bão trên toàn thế giới.

Bên nguyên đơn cáo buộc Open AI sử dụng các tác phẩm của họ mà không xin phép để đào tạo các mô hình AI. Vụ việc này được cho là sẽ dẫn tới gia tăng các trường hợp gây phức tạp cho sự phát triển của xu hướng công nghệ mới lớn nhất thế giới. Ngoài ra, các nguyên đơn cũng kiện công ty mẹ của Facebook là Meta đã dùng các bản tải sách của họ cho mục đích đào tạo.

Cụ thể, trong vụ kiện này, các tác giả đề cập cuốn hồi ký “The Bedwetter” bán chạy nhất năm 2010 của Silverman, tiểu thuyết kinh dị “Ararat” của Golden và loạt tiểu thuyết siêu nhiên lừng danh “Sandman Slim” của Kadrey. Các tác giả kiện OpenAI sử dụng sách của họ làm tài liệu đào tạo ChatGPT và kiện Meta sử dụng tác phẩm của họ phục vụ xây dựng mô hình LLaMA.

Luật sư của phía nguyên đơn cho biết phần lớn tài liệu đào tạo OpenAI và Meta sử dụng đến từ “các tác phẩm có bản quyền – trong đó có sách của các nguyên đơn – được sao chép mà không có sự đồng ý của tác giả cũng như không trả tiền hay bồi thường”.

Trong cả hai vụ kiện, tòa án bang California (Mỹ) đã thụ lý hồ sơ ngày 7/7 vừa qua, các tác giả cáo buộc việc các công ty công nghệ OpenAI và Meta sử dụng tác phẩm của họ để đào tạo các mô hình AI là vi phạm bản quyền. Nếu những vụ kiện này thành công, các công ty công nghệ sẽ phải thay đổi cách thức đang thực hiện trong xây dựng các mô hình và tạo nội dung. Các khiếu nại tương tự gần đây gồm vụ các chủ sở hữu mã nguồn kiện OpenAI và GitHub của Microsoft; các nghệ sĩ thị giác và hãng Getty Images kiện Stability AI.

Trí Đạt (t/h)