Cómo resumir vídeos de YouTube con inteligencia artificial
Un vídeo de 2 horas convertido en 12 minutos de lectura. Así funciona un resumidor de vídeos con IA, qué puede hacer y dónde se queda corto.
Tienes 47 vídeos en "Ver más tarde". No vas a verlos.
Seamos honestos. Esa lista de "Ver más tarde" de YouTube es un cementerio de buenas intenciones. Conferencias de 90 minutos, entrevistas larguísimas, cursos que algún día ibas a seguir. Están ahí desde 2024 y van a seguir ahí.
El problema no es la falta de ganas. Es aritmética. Si tienes 40 vídeos de media hora, necesitas 20 horas para verlos todos. Nadie tiene 20 horas libres.
La primera solución que se le ocurre a todo el mundo: copiar la transcripción, pegarla en ChatGPT y pedir un resumen. Lo hemos probado. El resultado es un listado de puntos genéricos que podrían aplicarse a cualquier vídeo sobre el mismo tema. Sin estructura, sin las citas que hacían especial esa charla, sin contexto.
Hay otra forma de hacerlo.
Un prompt no es un pipeline
Cuando pegas una transcripción en ChatGPT y le dices "resúmeme esto", toda la magia depende de un solo prompt procesando todo el texto de golpe. Es como pedirle a alguien que lea un libro de 300 páginas y te haga un informe — en un solo vistazo, sin tomar notas.
Un resumidor especializado funciona de forma diferente. El de Leader Summaries usa tres fases separadas, y la distinción importa:
Primera fase — clasificación. La IA lee el contenido y decide qué tipo de material es. Una conferencia TED no se resume igual que una entrevista a un CEO, ni que un tutorial técnico. El tipo de contenido determina qué se extrae y cómo se estructura.
Segunda fase — extracción. Se identifican las ideas centrales con sus ejemplos, datos y citas concretas. No un resumen superficial: los fragmentos específicos que aportan valor real.
Tercera fase — síntesis. Con las ideas extraídas, se genera el resumen final con estructura editorial. Aquí es donde eliges el formato: narrativo (como un artículo), esquema (puntos clave organizados) o práctico (enfocado en aplicación). Y puedes añadir un enfoque personalizado — algo como "céntrate en las estrategias de pricing" — para que el resumen vaya donde tú necesitas.
Tres fases en vez de una. Esa es toda la diferencia. Pero el resultado se nota.
Cómo se hace, paso a paso
Copias la URL del vídeo. La pegas. Eliges el estilo. Le das a crear. Esperas 2-3 minutos.
Ya está. No hay paso 6.
La IA extrae los subtítulos del vídeo automáticamente (funcionan con el 95% de vídeos de YouTube, porque Google genera subtítulos automáticos para casi todo). Procesa el contenido en las tres fases y te entrega el resumen.
Funciona con vídeos en cualquier idioma. Si el vídeo está en inglés, puedes generar el resumen en español. O dejarlo en el idioma original. Tú decides.
Pega una URL de YouTube y compruébalo tú mismo
El primer resumen es la mejor forma de entender la diferencia con un resumen genérico.
Probar el resumidorDonde se queda corto (y no te lo vamos a esconder)
Ninguna IA resume todo bien. Estas son las limitaciones reales:
Vídeos sin subtítulos: Si el vídeo no tiene subtítulos (ni automáticos ni manuales), no hay nada que procesar. Es raro — Google genera subtítulos automáticos para casi todo — pero pasa con vídeos en idiomas minoritarios o con audio de mala calidad.
Contenido muy visual: Si un vídeo depende de gráficos, diagramas o demostraciones en pantalla, la IA solo tiene acceso al audio. Un tutorial de Excel donde el presentador dice "como veis aquí" sin describir lo que muestra va a perder información.
No es un humano: La IA no tiene criterio editorial humano. A veces prioriza una idea secundaria sobre una principal, o pierde un matiz irónico. Es buena, pero no es perfecta. Los resúmenes editoriales escritos por nuestro equipo (los de la biblioteca) siguen siendo de otro nivel.
Dicho claramente: la IA no sustituye la lectura profunda. Lo que hace es convertir contenido que ibas a ignorar en conocimiento que ahora sí puedes usar.
Y luego qué: el resumen no se queda en un cajón
La diferencia real con copiar y pegar en ChatGPT no está en el resumen. Está en lo que puedes hacer después.
Cada resumen se guarda en tu biblioteca personal. Desde ahí puedes convertirlo en audio con voz natural — 15 minutos de podcast que escuchas de camino al trabajo, con la pantalla del móvil bloqueada. La voz es sintética (no es un locutor humano), pero suena bien y cumple su función.
También puedes meterlo en una carpeta inteligente con otros resúmenes del mismo tema y después hacerle preguntas a la carpeta entera. "¿En qué coinciden estos 8 vídeos sobre negociación?" La IA cruza todas las fuentes y te da una síntesis comparativa.
¿Para qué tipo de vídeos funciona mejor?
Después de ver muchos resúmenes generados, estos son los formatos donde mejor resultado da:
Conferencias y charlas (TED, keynotes): Funcionan muy bien. El ponente habla de forma estructurada, las ideas están claras, y el resumen las captura bien.
Entrevistas largas (podcasts en vídeo): Funcionan bien si la entrevista tiene contenido denso. Las entrevistas más conversacionales o de "lifestyle" dan resúmenes más flojos porque hay menos ideas concretas que extraer.
Cursos y tutoriales: Buenos para la parte teórica. Para la parte práctica (ejercicios, demostraciones), el resumen captura la explicación pero pierde el "hazlo tú".
Vídeos cortos (menos de 5 minutos): Funcionan, pero casi no merece la pena. Si el vídeo dura 5 minutos, es más rápido verlo.
El coste real
Cada resumen consume 100 créditos. El plan Líder (35 €/mes) incluye 4.000 créditos al mes — unos 40 resúmenes. Para la mayoría de personas es más que suficiente. Si necesitas más, el Ejecutivo (111 €/mes) da 15.000 créditos.
Generar audio del resumen cuesta 500 créditos adicionales. El chat con tu biblioteca y los quizzes son gratuitos.
¿Merece la pena? Depende de cuántos vídeos consumes. Si ves 2-3 vídeos largos a la semana y no tienes tiempo de procesarlos, sí. Si ves un vídeo al mes, probablemente no.
Preguntas frecuentes
¿Puedo resumir vídeos privados?
Solo si tienen subtítulos accesibles. Los públicos y no listados funcionan sin problema.
¿El resumen es siempre en español?
Por defecto sí, pero puedes elegir mantener el idioma original del vídeo.
¿Qué diferencia hay con las extensiones de Chrome que resumen YouTube?
La mayoría de extensiones usan un solo prompt genérico. El pipeline de 3 fases produce resúmenes más estructurados y permite elegir estilo y enfoque. Además, el resumen se guarda en una biblioteca donde puedes organizarlo, generar audio, crear quizzes y chatear con él.
40 resúmenes al mes por 35 €
Incluye resumidor IA, chat con tu biblioteca, carpetas inteligentes y generación de audio.
Ver planes¿Quieres ver qué más puede hacer Leader Summaries?
550+ resúmenes editoriales, herramientas de IA y mucho más.