Các công cụ trí tuệ nhân tạo (AI) mới hứa hẹn tạo ra các video ngắn từ các lệnh văn bản đơn giản đang làm dấy lên mối lo ngại và thắc mắc của các nghệ sĩ và chuyên gia truyền thông.

r shutterstock 2240810093
(Ảnh minh họa: Ascannio / Shutterstock)

Hôm thứ Năm (15/2) OpenAI, nhà sáng tạo ChatGPT và nhà sản xuất video DALL-E cho biết, họ đang thử nghiệm mô hình sản xuất chuyển văn bản thành video Sora, cho phép người dùng tạo các video chân thực với những lời nhắc đơn giản.

Công ty khởi nghiệp ở San Francisco này cho biết, Sora có thể chụp một hình ảnh hiện có và biến nó thành video, “làm sinh động nội dung của hình ảnh một cách chính xác và chú ý đến từng chi tiết nhỏ”. Điều đó có thể được sử dụng để làm sống động những bức ảnh tĩnh hiện có.

OpenAI cho biết nó cũng có thể “lấy một video hiện có và mở rộng nó hoặc lấp đầy các khung hình còn thiếu”. Điều đó có thể hữu ích trong việc khôi phục video khi một số phần của cảnh quay bị mất.

OpenAI cũng cho biết sẽ nỗ lực xây dựng các công cụ giúp cho việc tạo những video “có vấn đề” trở nên khó khăn hơn, bằng cách đưa vào một hệ thống các lời nhắc vi phạm chính sách, như những lời nhắc yêu cầu từ chối tạo các video “bạo lực cực đoan, nội dung khiêu dâm, hình ảnh thù hận, chân dung người nổi tiếng hoặc IP của người khác”.

OpenAI cũng lưu ý rằng mô hình hiện tại còn có “điểm yếu”. Nó có thể gặp khó khăn trong việc mô phỏng chính xác tính chất vật lý của một khung cảnh phức tạp, và có thể không hiểu được các trường hợp cụ thể về nguyên nhân và kết quả. Ví dụ, một người có thể cắn một miếng bánh quy, nhưng sau đó, chiếc bánh quy có thể không có vết cắn.

OpenAI cho biết, nó cũng có thể bị nhầm lẫn về không gian, “trộn lẫn giữa trái và phải” “có thể gặp khó khăn với những mô tả chính xác về các sự kiện diễn ra theo thời gian”.

Phản ứng ban đầu từ các ngành có khả năng bị ảnh hưởng, là các video clip do Sora sản xuất trên trang web AI mở rất khác nhau về phong cách và chủ đề, từ cảnh quay bằng máy bay không người lái trông rất chân thực trên một khu chợ đông đúc, đến hoạt hình chạy như một chú thỏ xuyên qua một khu rừng.

Ông Thomas Bellenger, người sáng lập kiêm Giám đốc nghệ thuật của Cutback Productions ở San Francisco, đã quan sát cẩn thận sự phát triển của việc sản xuất hình ảnh bằng AI.

Ông nói, có những người cảm thấy đây là một xu hướng không thể ngăn cản, đang phát triển với tốc độ đáng kinh ngạc. Có những người không muốn nhìn thấy nó. Công ty của ông tạo ra hiệu ứng hình ảnh quy mô lớn cho các nhạc sĩ lưu diễn như Stromae và Justice.

Ông cho biết, sự phát triển của AI đã tạo ra rất nhiều tranh luận nội bộ công ty. Sora vẫn chưa được công khai nên khả năng của nó vẫn chưa được công chúng kiểm chứng. Dù tương lai có ra sao đi chăng nữa, họ cũng sẽ tìm cách để tạo ra sự khác biệt.

Phát minh mới này cũng có thể ảnh hưởng đến các công ty trò chơi điện tử. Một số sẵn sàng đón nhận công cụ mới này, trong khi những người khác lo lắng rằng họ có thể bị thay thế.

Công ty game Ubisoft của Pháp gọi thông báo của OpenAI là một “bước nhảy vọt lượng tử”, có thể cho phép người dùng và nhóm phát triển thể hiện trí tưởng tượng của họ.

Người phát ngôn của công ty nói với AFP rằng họ đã khám phá tiềm năng này trong một thời gian dài.

Ông Alain Puget, Giám đốc Alkemi Studio ở thành phố Nantes, Pháp, nói rằng AI chỉ có thể tái tạo những gì con người làm, và sẽ không thay thế bất kỳ nghệ sĩ nào AI. Nhưng ông cho biết, công cụ ấn tượng về mặt hình ảnh này có thể được các studio nhỏ hơn sử dụng, để tạo ra những hình ảnh có bố cục chuyên nghiệp hơn.

Ông nói rằng mặc dù các “đoạn cắt cảnh” video thỉnh thoảng được phát để nâng cao cốt truyện của trò chơi không giống với các hành động do người chơi điều khiển, nhưng các công cụ như Sora cuối cùng có thể sẽ thay thế cách chúng ta làm mọi việc.

Ông Basile Simon, cựu nhà báo kiêm nhà nghiên cứu hiện tại của Đại học Stanford, tin rằng việc sản xuất bằng AI đã có bước nhảy vọt đáng chú ý vào năm ngoái, và có thể nhanh chóng tạo ra những cảnh giả như thật.

Ông lo lắng rằng những công cụ như vậy có thể bị lạm dụng trong các cuộc bầu cử và công chúng không còn biết nên tin vào điều gì.

Ông Julien Pain đến từ chương trình định hướng thực tế “True or False” trên kênh truyền hình France Info của Pháp cho biết, ông cũng lo ngại về việc lạm dụng AI.

Ông nói, trước đây, rất dễ phát hiện các hình ảnh giả mạo, như nhìn thấy các khuôn mặt trùng lặp ở phía sau. Phần mềm mới này thực sự có vẻ ở một đẳng cấp khác.

Ông nói rằng trong khi trí tuệ nhân tạo mở và những gã khổng lồ công nghệ của Mỹ có thể giới thiệu các công cụ bảo mật, như hình mờ công nghiệp để phơi bày những hình ảnh do AI tạo ra, điều gì sẽ xảy ra với các đối thủ Trung Quốc và Nga trong tương lai?

Fred & Farid, một công ty hợp tác với Longchamp và Budweiser, mở một studio chuyên dụng về AI vào đầu tháng 1, và kỳ vọng 80% nội dung thương hiệu sẽ được tạo ra bởi AI.

Stephanie Laporte, Giám đốc điều hành kiêm người sáng lập công ty quảng cáo và người có ảnh hưởng OTTA, tin rằng công nghệ này sẽ buộc ngành công nghiệp phải tiến lên.

Cô cũng kỳ vọng các công ty quảng cáo có kinh phí hạn chế sẽ dựa vào các công cụ AI để tiết kiệm nhân công. Cô tin rằng một ngoại lệ có thể xảy ra là ngành hàng xa xỉ. Bởi vì các thương hiệu xa xỉ rất nhạy cảm với tính xác thực và có thể không sử dụng nhiều AI.

Bình Minh (t/h)