//custa.cantho.gov.vn/files/images/NAM%202022/NAM%202023/NAM%202024/NAM%202024/sora.jpg

Sora - Ứng dụng tạo video từ văn bản gây chú ý của OpenAI

Ngày 16/2/2024, OpenAI ra mắt trí tuệ nhân tạo (AI) tạo video từ văn bản, có tên gọi là Sora ở cấp độ thử nghiệm. Điều đáng nói là những thước phim do Sora tạo ra có độ chân thực đến mức đáng kinh ngạc.

Sora là gì?

Trong tiếng Nhật, “Sora” có nghĩa là bầu trời. Nhóm nghiên cứu công nghệ này chọn Sora bởi nó gợi lên ý tưởng về tiềm năng sáng tạo không giới hạn.

Description: D:\cha tai 2021\cổng KHCN\tháng 3\h-minh họa.jpg

Hình ảnh voi ma mút trong đoạn video mà Sora tạo ra (Ảnh chụp màn hình)

Sora là mô hình trí tuệ nhân tạo (AI) mới giúp người dùng tạo ra các video dưới một phút từ văn bản. Sora được phát triển bởi công ty AI đứng sau chatbot ChatGPT từng gây sốt giới công nghệ thế giới là OpenAI.

Với công nghệ này, người dùng chỉ cần cung cấp đoạn văn mô tả nội dung video, từ đó Sora sẽ tạo ra video clip chất lượng cao dựa trên hướng dẫn đó. Ngoài ra, Sora còn có thể biến hình ảnh tĩnh thành video hoặc mở rộng độ dài của video.

Ngay từ khi ra mắt, Sora đã thu hút và trở thành đề tài nóng trên mạng xã hội (MXH) đặc biệt là trên Twiter. CEO của OpenAI – ông Sam Altman đã theo dõi và chia sẻ lại những video được tạo ra từ Sora.

Hành động của ông không chỉ thể hiện sự tích cực với cộng đồng, mà còn làm rõ sức mạnh đáng kinh ngạc của sản phẩm này.

Công nghệ vượt trội đứng sau Sora

Để sản xuất ra những video trông như thật, Sora phải có khả năng hiểu được ngôn từ, các yêu cầu, mệnh lệnh của người dùng.

Description: D:\cha tai 2021\cổng KHCN\tháng 3\h1 minh hoa.jpg

Trí tuệ nhân tạo (AI) được dự báo sẽ ngày càng thâm nhập vào cuộc sống của chúng ta

Nhưng không chỉ dừng ở đó, Sora còn phải hiểu được quy tắc vật lý, mọi vật chuyển động như thế nào, ánh sáng, bóng tối sẽ thay đổi ra sao khi nhân vật đi lại, chuyển động.

Điều đáng nói là những thước phim của Sora tạo ra có độ chân thật đến mức kinh ngạc. Sora có thể tạo ra các video dài tới một phút trong khi vẫn duy trì chất lượng hình ảnh và tuân thủ theo yêu cầu của người dùng.

Trong chiến dịch ra mắt của mình, OpenAI nhận định: Sora có khả năng tạo ra các cảnh phức tạp với nhiều nhân vật. Các loại chuyển động của chủ thể và khung nền có thể chính xác đến từng chi tiết. Mô hình không chỉ hiểu những gì người dùng đã yêu cầu trong đề bài, mà còn hiểu cách những thứ đó tồn tại trong thế giới vật lý.”

Theo giới chuyên môn, đây là một bước tiến rất lớn trong công nghệ tạo ra hình ảnh, video từ văn bản. Công nghệ này có khả năng làm tăng tốc độ làm việc của các nhà làm phim, đồng thời thay thế hoàn toàn những “nghệ sĩ kỹ thuật số” ít kinh nghiệm.

Theo trang AI news, công nghệ phía sau Sora có một phần là GPT-4. GPT-4 là một mô hình đa phương thức lớn có thể xử lý đầu vào văn bản và hình ảnh cũng như đầu ra văn bản giống con người.

GPT-4 cập nhật mô hình ngôn ngữ lớn của OpenAI, được đào tạo trên lượng lớn dữ liệu trực tuyến để tạo ra phản hồi phức tạp cho các truy vấn của người dùng.

GPT-4 có 5 tính năng vượt trội mà ChatGPT không thể thực hiện, đó là các tính năng: Phân tích cả hình ảnh; viết mã dễ dàng hơn; vượt qua các bài kiểm tra một cách xuất sắc; cung cấp phản hồi chính xác hơn và hợp lý hóa công việc trong các ngành công nghiệp khác nhau.

Trong đó, với tính năng phân tích cả hình ảnh, GPT-4 về cốt lõi, thay đổi lớn nhất ở GPT -4 là khả năng hoạt động với các hình ảnh mà người dùng tải lên. Một trong những trường hợp sử dụng đáng kinh ngạc nhất đến nay là từ bản trình diễn video của OpenAI cho thấy một bản vẽ có thể được chuyển thành trang Web hoạt động trong vòng có vài phút. Người trình diễn đã tải hình ảnh lên GPT -4, sau đó dán mã kết quả vào bản xem trước cho thấy đây có thể là một trang Web đang hoạt động như thế nào.

Phần còn lại của Sora là mô hình khuếch tán, biến nhiễu tĩnh thành một video mạch lạc bằng cách giảm dần độ nhiễu đó qua nhiều bước.

Sora cũng sử dụng công nghệ tương tự như Dalle -3: Biến văn bản thành hình ảnh, ở đây là những video giống như thật đến khó tin.

Công nghệ này có thể hiểu đơn giản là chỉ cần viết ra những gì bạn muốn xem và AI sẽ tạo ra nó cho bạn- với chi tiết sống động, chất lượng tuyệt vời và một số trường hợp là khả năng sáng tạo thật sự.

Lo ngại về sự phát triển vượt tầm kiểm soát của AI

Theo Tiến sĩ Trần Văn Cảnh – nhà khoa học dữ liệu thuộc Khoa Công nghệ thông tin, Trường Đại học Heidelberg (Đức) thì dù mô hình Sora còn nhiều thiếu sót như nhầm lẫn bên trái và bên phải hoặc không duy trì được hình ảnh liên tục suốt thời lượng của video. Tuy nhiên, nguy cơ Sora tạo ra thông tin sai lệch là hoàn toàn có thể, khiến việc xác định đâu là sự thật trên Internet càng trở nên khó khăn hơn.

Tiến sĩ Cảnh nhận định, với ứng dụng Sora, việc phân biệt tin thật giả là rất khó khăn vì các video do Sora tạo ra có tính chân thật rất cao. Bản thân OpenAI đang tìm kiếm các giải pháp khắc phục hạn chế, tuy nhiên, chúng ta phải chấp nhận rằng, không có giải pháp nào triệt để cả.

Sắp tới, ứng dụng sẽ cho phép người sử dụng cung cấp hình ảnh, văn bản để từ đó tạo ra video mới, như vậy các phát biểu của nhân vật có ảnh hưởng trên thế giới có thể bị làm giả, gây ra hệ lụy lớn cho công chúng.

Bởi trước Sora, OpenAI đã phát hành 2 sản phẩm, bao gồm ChatGPT có thể tạo văn bản giống như con người và công nghệ DALL –E tạo nên “Deepfake” – kỹ thuật sử dụng AI để tạo âm thanh, hình ảnh và video giả mạo.

Sức mạnh Sora không chỉ gây sửng sốt trong cộng đồng mà còn mang theo những lo ngại nghiêm trọng, đặc biệt là trong bối cảnh hiện nay khi Deepfake trở nên phổ biến trên Internet. Việc tạo ra video giả mạo chính trị gia, nghệ sỹ nổi tiếng có thể tạo ra những tác động tiêu cực đến xã hội.

Điều này cho thấy sự phát triển của AI mang lại cả tính tích cực lẫn tiêu cực trong dòng chảy không ngừng của Internet. Và với sự xuất hiện của Sora, cuộc đua công nghệ sẽ trở nên nóng bỏng hơn bao giờ hết.

Với khả năng tạo video chân thật chỉ từ những đoạn văn bản. Sora không chỉ mở ra một chương mới trong lĩnh vực AI mà còn đặt ra những thách thức và cơ hội mới cho ngành công nghiệp nghệ thuật và giải trí.

Sự sáng tạo của OpenAI đã thể hiện sức mạnh của AI và tiềm năng không ngừng trong việc định hình tương lai của chúng ta.

                                                                                            (Hòa Minh –Tổng hợp)

 

Tài liệu tham khảo

Nguy cơ AI vượt tầm kiểm soát – Chuyên mục Chuyển đổi số (Tạp chí Doanh nghiệp Việt Nam) ngày 24/2/2024.