Shengshu Technology представила свою последнюю модель ИИ, Vidu 1.5. Компания стремится выйти на рынок генерации текста в видео и изображений в видео, выводя на рынок нового конкурента, который сможет конкурировать с такими компаниями, как OpenAI Sora, о которой было объявлено ранее в этом году. Для тех, кто не знаком с Shengshu Technology, это новая компания ИИ, которая была основана в марте 2023 года в прошлом году.
Новая модель ИИ компании во многом похожа на Sora от OpenAI, хотя и с некоторыми изменениями. Vidu 1.5 может генерировать видео длиной до восьми секунд из изображений, а также текстовых подсказок. Модель ИИ использует свою внутреннюю функцию согласованности множественных сущностей для бесшовного склеивания людей, объектов и сред при генерации видео из пользовательских подсказок.
Есть также то, что Vidu назвал согласованностью нескольких ракурсов, которая позволяет пользователям либо генерировать видео с использованием любых введенных изображений, либо загружая три фотографии одного объекта. Компания AI далее заявляет, что модель AI использует расширенные функции управления для добавления лучшего движения и детального фона в сгенерированный вывод. По словам создателя модели, вы можете генерировать восьмисекундное видео менее чем за 30 секунд.
Vidu также предоставил несколько демонстраций, созданных моделью Vidu 1.5. Результаты впечатляют: от роскошного автомобиля, едущего по огненным дорогам, до анимированной сцены с милым маленьким драконом, смотрящим на яблоко, созданные видео демонстрируют, как Vidu 1.5 оживляет текстовые подсказки. Но загвоздка в том, что вы можете создавать только максимум восьмисекундные видео, в то время как ее прямой конкурент, модель Sora, позволяет создавать видео длиной до минуты.
Что касается разрешения видео, Vidu 1.5 может похвастаться возможностью создавать видео с максимальным разрешением 1080p. Vidu 1.5 имеет свои недостатки. Например, некоторые видео, созданные с помощью ИИ, не содержат мелких деталей, а также показывают некоторые нереалистичные движения, например, в сцене с автомобилем, где пламя проносится по центру автомобиля. Хотя это не серьезные недостатки и даже не заметны, пока вы не посмотрите их внимательно,.
Мультимодальный ИИ Vidu 1.5 работает по модели freemium. Бесплатная версия позволяет вам создавать 4-секундные клипы с разрешением скорости, а премиум-версия, которая стоит $9.99/месяц, позволяет вам создавать 8-секундные видео с разрешением до 1080p. Vidu 1.5 теперь доступен для всех на официальном сайте.