OpenAI anuncia un nuevo modelo de vídeo

Tiempo de lectura: 3 minutos

Hola, Proactivos!

Somos Adam y Alejo quienes te escribimos.

Nos rendimos. El ritmo de lanzamientos de productos innovadores en IA es más que ridículo, y simplemente me he quedado sin adjetivos para describir lo que está pasando en este momento. Pero lo intentaré de todos modos.

MENÚ DE HOY

OpenAI anuncia Sora: el vídeo generado por IA ya es una realidad
Google lanza Gemini Pro 1.5 y desbloquea nuevas y potentes funciones
Cómo usar Pika para crear vídeos a partir de texto
Viernes de risas: OpenAI le roba el protagonismo a Gemini
5 nuevas herramientas de IA para aumentar tu productividad
Imágenes generadas por IA: Perros con sombrero con Wes Anderson

NOTICIAS

Hoy en IA & Tecnología

Meta y Chill: Meta lanza V-JEPA, un método para enseñar a las máquinas a comprender y modelar el mundo físico mediante la visualización de vídeos, desbloqueando potencialmente la capacidad de realizar tareas en el mundo real a través de esa comprensión.
Mano amiga: Se dice que Apple está desarrollando una herramienta de IA que ayudaría a los desarrolladores a escribir código para aplicaciones, en competencia directa con Github Copilot de Microsoft.
Nope™: OpenAI no puede registrar la marca "GPT" según una nueva resolución de la Oficina de Patentes y Marcas de Estados Unidos.
Coding Pal: Magic, un compañero de trabajo virtual impulsado por IA que puede escribir código, recauda 117 millones de dólares en financiación del ex CEO de GitHub Nat Friedman y otros.

PRÓXIMO EN IA

OpenAI anuncia Sora: el vídeo generado por inteligencia artificial ya es una realidad

Fuente : OpenAI

Si buscas en el diccionario la definición de "robarle el protagonismo a alguien", lo más probable es que encuentres una foto de Sam Altman y OpenAI. Eso es porque la empresa que está detrás de ChatGPT, DALL-E y GPT-4 tiene la costumbre de superar a sus competidores... especialmente a Google.

Ayer, Google lanzó su último modelo Gemini 1.5 Pro (hablaremos de ello más adelante). Unas horas más tarde, OpenAI dijo "Guárdame la cerveza" y anunció Sora, su nuevo y vanguardista modelo de texto a vídeo.

Llamado así por la palabra japonesa que significa "cielo", Sora es la primera incursión de OpenAI en el vídeo generado por IA. En un anuncio oficial, la empresa afirma que Sora puede "crear escenas realistas e imaginativas a partir de instrucciones de texto". Cada vídeo puede durar aproximadamente un minuto y la calidad es lo que algunos han llamado digna de Hollywood. Eso podría deberse a la capacidad de Sora para crear escenas complejas con múltiples personajes... e incluso comprender emociones.

OpenAI afirma que Sora no se dará a conocer al público en general hasta que un equipo rojo haya tenido la oportunidad de analizar y escudriñar cada una de sus vulnerabilidades. Aunque no lo han dicho oficialmente, es probable que Sora se publique como parte de ChatGPT, donde podrás generar vídeos con sencillas instrucciones de texto.

Para poner en perspectiva la enormidad de este logro, el año pasado por estas fechas apenas podíamos generar imágenes realistas con IA. Si avanzamos hasta hoy, estamos a punto de tener a nuestro alcance imágenes generadas por IA de calidad Hollywood. Las cosas están a punto de ponerse muy interesantes.

Pero no tienes que fiarte de nuestra palabra. Echa un vistazo a algunos de los primeros vídeos que compartimos en nuestras redes sociales

— # (#)

FAMILIA GEMINI

Google desbloquea nuevas y potentes funciones con la actualización a Gemini 1.5

Longitudes de contexto de los principales modelos de fundación - Fuente: Google

Tienes que sentirlo por Google. Apenas habían pasado un par de horas desde que anunciaron Gemini Pro 1.5 y OpenAI apareció de la nada para robarles el protagonismo con Sora. Pero eso no hace que el último modelo de Google sea menos interesante o importante.

Lo más impresionante de Gemini Pro 1.5 es que tiene una longitud de contexto de 1 millón de tokens, lo que significa que puede procesar simultáneamente hasta 1 millón de unidades de información como palabras.

Lo que eso significa en la práctica es que Gemini 1.5 puede procesar hasta 1 hora de vídeo, 11 horas de audio y bases de código con más de 30.000 líneas de código de una sola vez: un logro técnico asombroso que está muy por encima de lo que cualquier otro modelo de IA es capaz de hacer actualmente.

Las implicaciones de este avance en la vida real son que Géminis 1.5 Pro puede hacer cosas como:

Ver una película muda y seguir captando puntos de la trama
Comprender, razonar e identificar determinados detalles en transcripciones de audio o documentos extensos como contratos
Analizar bibliotecas enteras de código de un producto y explicar cómo está construido

Google hizo especial hincapié en las capacidades de razonamiento mejoradas de Gemini Pro 1.5, afirmando que puede aprender nuevas habilidades como traducir idiomas poco comunes o mejorar una base de código con 100.000 líneas de código.

Google dice que actualmente está dando a los desarrolladores y a los clientes empresariales un acceso limitado a Gemini 1.5, y que "pronto" se lanzará una versión completa para el público en general.

IA EN EL TRABAJO

Cómo generar vídeos a partir de texto con Pika

Fuente : Pika

Sora de OpenAI aún no está listo para que lo utilices. Hasta entonces, hay muchos otros modelos de texto a vídeo que puedes probar, como Pika:

Entra en Pika.art
Ve al Panel de control de Pika 1.0 y haz clic en "Explore".
Escribe tu idea para el vídeo en la sección de sugerencias del centro de la pantalla. Sé lo más descriptivo posible, añadiendo adjetivos y detalles concretos
Incluye imágenes o vídeos anteriores, si los tienes
Elige la relación de aspecto y los fotogramas por segundo que prefieras
Juega con el control de movimiento para entender cómo se mueve la cámara en tu vídeo
Pulsa Intro para generar tu vídeo
Encuentra tu vídeo finalizado en la sección "Mi biblioteca
Si no estás satisfecho con el resultado final, puedes pulsar "reintentar", "reprompt" o "editar"

RISAS DEL DOMINGO

OpenAI roba el protagonismo a Gemini

Fuente : @ai_for_success en X

5 Herramientas de IA para Mejorar tu Productividad

Jasper AI: Ayuda a las empresas a ampliar el contenido de marketing, como artículos de blog, publicaciones en redes sociales, correos electrónicos de ventas, textos de sitios web, etc.

Writingmate: Copiloto de IA para Google Docs, Slides y Sheets. Responde a tus preguntas y redacta tus correos electrónicos, compatible con todos los sitios web.

Innovate with AI: The No-Code AI Toolkit - Una guía gratuita para transformar los flujos de trabajo de tu oficina con IA. Informes, calendario, propuestas y mucho más. Haz clic para recibirla en tu bandeja de entrada: acceso gratuito e instantáneo.

Lindo AI: Construye un sitio web describiendo tu negocio y obtén todo lo que necesitas, desde páginas de aterrizaje hasta generación orgánica automatizada de clientes potenciales.

Recast: Convierte tu lista de lectura en resúmenes de audio del tamaño de un bocado con IA.

IMÁGENES GENERADAS POR AI

Si los personajes de Wes Anderson fueran perros

Fuente : @boubi1000 en Midjourney

Prompt: retrato de 3/4 de lado de un perro vestido con chaqueta y sombrero, estilo Wes Anderson, colores suaves, fotografía kodachrome --v 6.0 --ar 3:4

Adquiere nuevos clientes y aumenta tus ingresos asociándote con nosotros

IA Proactiv es la newsletter más grande sobre IA en el mundo español e hispano con +30 000 lectores, algunos de ellos trabajando en startups y empresas líderes mundiales. Reserva tu anuncio hoy.

🧞 Tu deseo es mi orden

¿Qué te pareció el correo electrónico de hoy?

Tu opinión me ayuda a crear mejores correos electrónicos para ti!

Reseñas del día

Gracias por leernos.

¡Hasta la próxima!

Adam & Alejo