Google lanza su propio texto para

Google responde a la IA de texto a video de Meta, él Maque-A-Video, con el suyo, el video Imagen. Los investigadores de Google Braun, el laboratorio de IA de la compañía, introdujeron Imagen Video, una IA que puede crear videoclips a partir de indicaciones de texto. La segunda IA de texto a video se produce seis meses después de Dalle-2, un generador de texto a imagen de Ópera, y simplemente una semana después de que Meta anunció su video de maquillaje.

El video Imagen de Google puede producir videos de resolución de 1,280x768 píxeles a 24 cuadros por segundo de no más de 5.3 segundos. El modelo toma una descripción y genera un video de 16 cuadros y 3-FPS que tiene una resolución de 24 x 48 píxeles. Luego, el sistema supera y predice marcos adicionales, produciendo un video de 720p a 24 cuadros por segundo.

Google dice que el video de Imagen tiene un alto grado de controlabilidad y conocimiento mundial.

Encontramos el video de Imagen no solo capaz de generar videos de alta fidelidad, sino también con un alto grado de controlabilidad y conocimiento mundial, incluida la capacidad de generar diversos videos y animaciones de texto en varios estilos artísticos y con comprensión de objetos 3D, dijo Google Investigadores.

Google El video de Imagen fue entrenado con un conjunto de datos interno de 14 millones de videos y 60 millones de imágenes fijas, y los datos de capacitación contenían otros 400 millones de imágenes del conjunto de datos abierto Latón-400 m.

El equipo de Imagen Video planea unirse a los investigadores de Pena, otra IA de texto a video de Google que puede convertir el texto detallado en videos de más de dos minutos, aunque con una calidad menor.

Las demostraciones compartidas incluyen un video de Toffee vertiendo en una taza, figuras de madera surf en una tabla de surf en el espacio, globo lleno de agua que explota en cámara lenta extrema y más.

Comentarios

Entradas populares