- Alejo & Adam
- Posts
- El modelo de voz de OpenAI pide la comida
El modelo de voz de OpenAI pide la comida
TAMBIÉN: Cómo generar subtítulos de vídeo con IA

Tiempo de lectura: 3,5 minutos
Imagina una web sin navegadores o un smartphone sin aplicaciones. Mustafa Suleyman, de Microsoft, cree que pronto llegaremos a depender de la IA de una forma muy parecida. Y: OpenAI presenta nuevas herramientas para desarrolladores, incluida una forma de perfeccionar sus potentes funciones de voz a voz.
MENÚ DE HOY
Renovación de Copilot con la IA como prioridad
Frontera: OpenAI desbloquea la API de voz a voz para desarrolladores
Tutorial: Cómo añadir subtítulos a cualquier vídeo
Todo lo que debes saber hoy
5 nuevas herramientas de IA para aumentar tu productividad
Imágenes generadas por IA: Fantasía Oscura
PRÓXIMO EN IA
La renovación de la IA de Copilot podría cambiar nuestra forma de interactuar con los ordenadores

La interacción con un ordenador suele ser unidireccional. Pero en un evento previo celebrado el martes, Mustafa Suleyman, de Microsoft, dijo que cree que la IA hará que nuestros dispositivos sean más maleables, como la arcilla a la que se puede dar forma y moldear. Con esto en mente, Microsoft acaba de desvelar una serie de nuevas funciones de Copilot. Esto es todo lo que vimos en la presentación del martes.
Copilot Voz: Una respuesta al modo Voz Avanzada de OpenAI con un enfoque especial en la inteligencia emocional. Sus cuatro voces pueden adaptarse a tu estado de ánimo, hacer bromas autocríticas y tranquilizarte si tienes un día difícil.
Copilot Visión: Esta función puede ver todo lo que aparece en tu pantalla y reaccionar en consecuencia. En una demostración, un usuario preguntó por películas en Rotten Tomatoes. Copiloto le dijo cuáles estaban disponibles para ver en streaming, le ofreció resúmenes de críticas y le dio recomendaciones personalizadas.
Recall: Un historial de navegación superpotente que puede ayudarte a encontrar páginas web y documentos perdidos hace tiempo (por ejemplo, «Encuentra el gráfico con la flecha morada de la semana pasada»). Ahora incluye funciones biométricas de seguridad y encriptación.
¿Y qué más?
Think Deeper, impulsado por una versión perfeccionada de o1, te ayudará a tomar decisiones complejas, como planificar unas vacaciones familiares.
Copilot Daily es un podcast diario generado por IA con noticias adaptadas a ti.
Paint convertirá automáticamente tus garabatos en detalladas obras de arte
AI Search te ayuda a encontrar intuitivamente configuraciones, archivos, imágenes y mucho más
A continuación, Suleyman quiere dotar a Copilot de un mayor «cociente de acción», es decir, de la capacidad de ponerse en contacto contigo de forma proactiva y realizar llamadas o compras en tu nombre.
LA ACADEMIA DE IA
Cómo añadir subtítulos a cualquier vídeo utilizando RunwayML

Ve al sitio web de runwayML e inicia sesión para obtener créditos.
Ahora haz clic en Subtítulos en la lista de herramientas.
Sube tu vídeo, elige el idioma que prefieras y haz clic en el botón Generar.
Espera unos segundos y te llevará al editor donde podrás editar los subtítulos generados por la IA si es necesario.
Una vez hecho todo, haz clic en el botón Exportar para descargar tu vídeo con subtítulos.
DESDE LA FRONTERA
OpenAI muestra nuevas herramientas para desarrolladores, incluidos bots de voz personalizados

Fuente: DevDay
Un desarrollador acaba de utilizar una versión modificada del modo Voz Avanzada de OpenAI para pedir comida para un evento. Le dio un presupuesto y una dirección, y se puso en marcha para hacer el pedido en su nombre.
Esto es sólo el primer vistazo a lo que es posible con el acceso ampliado a la API de OpenAI, que permitirá a 3 millones de desarrolladores crear aplicaciones personalizadas de terceros con la tecnología de voz a voz de la startup, líder en el sector.
He aquí todo lo demás anunciado en el DevDay de OpenAI:
Con el almacenamiento en caché de prompts, los ingenieros que reutilizan los mismos activos una y otra vez pueden reducir sus costes a la mitad.
Los desarrolladores ya pueden adaptar las capacidades de visión de GPT-4o para utilizarlas en todo tipo de aplicaciones, desde vehículos autónomos a imágenes médicas.
Los programadores podrán utilizar los modelos más grandes de OpenAI para ajustar los más pequeños, un proceso conocido como destilación de modelos.
PROMPT DEL DÍA
Marketing de afiliación
Prompt: Diseña una página de aterrizaje optimizada para nuestro tráfico de afiliados.
El objetivo principal es convertir a los visitantes procedentes de [socio o plataforma de afiliación específica] para nuestro [producto o servicio específico]. Incluye sugerencias para el titular, la llamada a la acción y los elementos visuales.
IA Y TECH
Todo lo que necesitas saber hoy

Robaescenas: La plataforma de texto a vídeo Pika lanzó Pika 1.5, con movimientos más realistas, tomas cinemáticas, sincronización labial y efectos especiales personalizados.
Cambiador de juegos: Series Entertainment, que está creando un motor de videojuegos basado en IA, recaudó 28 millones de dólares en una ronda de financiación de serie A, con el respaldo de Netflix, Dell y Andreessen Horowitz.
Nuevos comienzos: Durk Kingma, uno de los cofundadores de OpenAI, anunció que se une a Anthropic AI y espera contribuir a «la misión de Anthropic de desarrollar potentes sistemas de IA de forma responsable».
Ctl+Alt+AI: Alphabet ha anunciado que los nuevos Chromebooks de Samsung y Lenovo incorporarán un nuevo botón con el que se podrá acceder rápidamente a Gemini y otras herramientas de IA.
5 Herramientas de IA para Mejorar tu Productividad
✅ Uizard: Convierte ideas de productos en conceptos, visualiza, comunica e itera sobre wireframes y prototipos en minutos.
✅ Otio*: Resúmenes automáticos, chatea con tus documentos, automatización de flujo de trabajo con IA, resúmenes de YouTube, comparación de documentos, redacción de informes, editor de texto con IA
(¡Impulsado por GPT-4o, Claude 3.5 y Mistral!)
✅ Slite: Convierte cualquier documento en el texto más fácil de leer utilizando IA.
✅ Flipner: Asistente de escritura de bolsillo que captura tus ideas y elabora textos con el toque de la IA.
✅ Playform: Genera arte creativo de IA sin aprender nueva terminología técnica ni codificación.
*indica una herramienta promocionada, si la hay.
IMÁGENES GENERADAS POR IA
Fantasía Oscura

Fuente : Redditor u/Oldbones177 via Midjourney
Mantén el prompt en inglés para obtener la mejor respuesta posible.
Midjourney Prompt: 1970s dark fantasy book illustration art Frazetta- style drawing of subject
⭐⭐ Adquiere nuevos clientes y aumenta tus ingresos asociándote con nosotros
IA Proactiv es la newsletter más grande sobre IA en el mundo español e hispano con +54 000 lectores, algunos de ellos trabajando en startups y empresas líderes mundiales. Reserva tu anuncio hoy.
🧞 Tus deseos son nuestras órdenes
¿Qué te pareció el correo electrónico de hoy?Tu opinión me ayuda a crear mejores correos electrónicos para ti! |
Iniciar Sesión o Suscríbete para participar en las encuestas. |


Gracias por leernos.
¡Hasta la próxima!
