Este jueves, OpenAI, una de las principales empresas en inteligencia artificial generativa, dio a conocer su último modelo, llamado 'Sora', el cual ha causado sensación en las redes sociales.
'Sora' es capaz de convertir instrucciones en texto en escenas de video realistas, con múltiples personajes y movimientos específicos.
La firma, conocida por desarrollar modelos como ChatGPT y DALL-E, asegura que 'Sora' puede crear "escenas complejas con detalles del componente principal y el trasfondo".
Además, destaca su capacidad para "entender cómo existen los objetos en el mundo físico" y su habilidad para "interpretar acertadamente las instrucciones y generar caracteres convincentes que expresan emociones vibrantes".
Publicidad
"OpenAI acaba de anunciar Sora, su modelo de IA de texto a vídeo. Este vídeo no es real, está basado en un mensaje de 'un gato que despierta a su dueño dormido exigiéndole el desayuno...'", publicó uno de los usuarios de 'X'.
this could be the "holy shit" moment of AI. OpenAI has just announced Sora, its text-to-video AI model. This video isn't real, it's based on a prompt of "a cat waking up its sleeping owner demanding breakfast..." 🤯 https://t.co/xKy3iQBKwT pic.twitter.com/HPm2p1jbgo
— Tom Warren (@tomwarren) February 15, 2024
A pesar de este impresionante avance, OpenAI aún no ha puesto 'Sora' a disposición del público. Según informó The New York Times, la compañía está llevando a cabo análisis adicionales para comprender los posibles riesgos asociados con el sistema.
Publicidad
Mientras tanto, OpenAI ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos, con el objetivo de detectar posibles usos maliciosos de 'Sora'. La empresa está tomando medidas proactivas para garantizar que la tecnología se utilice de manera ética y segura.
Steven Levy de la revista Wired tuvo la oportunidad de presenciar la capacidad de 'Sora' cuando se le permitió ver, aunque no operar, el modelo.
Al darle la instrucción en texto de crear una escena de la ciudad de Tokio captada por una cámara en movimiento durante un día nevado, Levy describió el resultado como una vista convincente y realista de Tokio en ese momento.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
'Sora' permite la creación de mundos diversos, tanto realistas como fantásticos, con escenas tridimensionales y movimientos fluidos. Incluso en escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctamente.
Publicidad
Con 'Sora', OpenAI amplía su presencia en el sector de servicios de inteligencia artificial generativa, abarcando desde la generación de texto hasta la creación de imágenes estáticas y vídeos, consolidándose como líder en la innovación tecnológica.