A empresa de inteligência artificial Midjourney revelou recentemente seu próximo grande passo à frente. Após anos oferecendo e focando em imagens estáticas, Midjourney agora está procurando expandir para o mundo da geração de vídeo, especificamente a geração em tempo real.
Isso agora está disponível como parte do Version 1 do Video Model, que é descrito como "algo divertido, fácil, bonito e acessível para que todos possam explorar". No momento, o sistema deve transformar imagens em vídeo usando uma mecânica de prompt de movimento animado. Essencialmente, ele traz vida e movimento a uma imagem estática, que pode ser ajustada dependendo do nível de movimento que deve ser esperado da imagem de origem em questão.
Comparado ao software de vídeo de IA rival, pode parecer que Midjourney está um pouco atrasado, mas observa que este é apenas um trampolim para um objetivo muito maior. A intenção de longo prazo é poder oferecer simulações de mundo aberto em tempo real, e chegar lá significa também poder percorrer modelos 3D de vídeo gerado e, em seguida, gerar tudo muito rápido. Esses últimos pontos são os próximos passos para tornar o objetivo de Midjourney uma realidade. Nas próprias palavras de Midjourney:
"O que você talvez não saiba é que acreditamos que o destino inevitável dessa tecnologia são modelos capazes de simulações de mundo aberto em tempo real.
"O que é isso? Basicamente; imagine um sistema de IA que gera imagens em tempo real. Você pode comandá-lo para se mover no espaço 3D, os ambientes e personagens também se movem, e você pode interagir com tudo.
"Para fazer isso, precisamos de blocos de construção. Precisamos de recursos visuais (nossos primeiros modelos de imagem). Precisamos fazer essas imagens se moverem (modelos de vídeo). Precisamos ser capazes de nos mover pelo espaço (modelos 3D) e precisamos ser capazes de fazer tudo isso rápido (modelos em tempo real).
"O próximo ano envolve construir essas peças individualmente, liberá-las e, lentamente, juntar tudo em um único sistema unificado. Pode ser caro no começo, mas mais cedo do que você imagina, é algo que todos poderão usar.
O problema com este software de vídeo é que é muito mais caro de usar. Midjourney está cobrando 8x o que cobra por um trabalho de imagem, que descreve ainda ser "mais de 25 vezes mais barato do que o que o mercado enviou antes".