OpenAI представила нейромережу Sora для генерації відео за текстовим запитом

Компанія OpenAI, яка створила ChatGPT і Dall-e, представила нову нейромережу Sora, яка може за текстовим запитом створювати “реалістичні” і “креативні” ролики. Це може змінити підхід до створення візуального контенту.

Sora дає змогу створювати відеозаписи тривалістю до 60 секунд, водночас підтримуючи високу якість зображення і точно дотримуючись вказівок користувача. Основне завдання проєкту полягає в навчанні штучного інтелекту розумінню та імітації фізичного світу в русі.

Текстовий запит у Sora для створення ролика вище: “Стильна жінка йде вулицею Токіо, сповненою теплим світлом неонових і анімованих вивісок. Вона одягнена в чорну шкіряну куртку, довгу червону сукню, чорні черевики. На ній сонцезахисні окуляри та червона помада. Вона йде впевнено і невимушено. Вулиця волога і відбиває світло. Багато пішоходів навколо”.

Інші приклади запитів, за якими Sora вже здатна генерувати відео, включають як реалістичні сцени з людьми і тваринами, так і очевидно фантастичні, наприклад, з мамонтами, що бродять сніговим полем, або з китами, що пливуть повітрям серед будівель.

Наразі доступ до моделі надано експертам з інформаційної безпеки для оцінки потенційних загроз і ризиків, а також художникам і дизайнерам для отримання зворотного зв’язку та подальшого вдосконалення моделі.

OpenAI акцентує увагу на питаннях безпеки й етики використання Sora і розробляє інструменти для виявлення фейкового контенту, зокрема класифікатор для визначення відео, створених за допомогою ШІ. У разі інтеграції моделі в продукти OpenAI, планується використання метаданих C2PA для поліпшення прозорості походження контенту.

З технічного погляду модель Sora є поєднанням GPT і дифузійної моделі, що генерує відео. Остання починає з випадкового шуму і поступово прибирає його в ході безлічі кроків. Такий підхід дає змогу моделі зберігати послідовність зображення об’єктів, навіть якщо вони тимчасово виходять із поля зору “камери”.

OpenAI, у рамках проєкту Sora, прагне продемонструвати потенціал розвитку штучного інтелекту та можливості, які з’являться на горизонті в найближчому майбутньому. Технічна доповідь щодо Sora буде опублікована пізніше.

This site is registered on wpml.org as a development site. Switch to a production site key to remove this banner.