一个Youtube视频总结工具和一些思考

我发现最近几年视频正在取代文字成为主要的获取信息的渠道随着视频制作的门槛越来越低估计未来绝大部分内容都会来自视频但是高效地获取视频内容是一件比较困难的事情因为时间轴的限制无法像文字那样被快速浏览反复回看总结

而且比起文章来视频更能分散注意力使得我们不断地在视频标题之间横跳我们其实是在信息的海洋里漂流瓶被动地接受很多信息如果有一个工具在我们和视频本身之间做一个缓冲可以让我们拿会对信息的主动权

所以一直想做这么一个可以总结Youtube视频的工具最近终于借助AI for coding的力量在Cursor的帮助下实现了产品还是demo的状态安装和使用需要一些终端的知识依照文末的Github链接中的说明就可以运行

这个工具针对的是内容性强的视频比如故事类和知识类的视频这类视频具有很高的可压缩性往往可以关掉视频只听音频内容转化为文字后也基本不会丢失信息这类视频非常适合转成文章形式我们可以像阅读文章一样观看视频当然也有很多无法压缩的视频比如电影综艺节目纪录片尤其是编程演示这些内容很难用自然语言描述

功能

其实市面上有很多类似的工具但是它们几乎都是一个模式LLM+视频本身自带的字幕这些产品有两个特点第一是不支持中文因为这些工具本质上就是抓取YouTube视频的文字的字幕用大语言模型进行总结而Youtube不会对中文视频创建字幕第二是它们都是一次性地总结没有对视频总结管理和复用这两点让我在用的过程中还是感受到了不方便

比如很多时候我在YouTube搜资料时会被标题吸引点进去看并且常常觉得所花的时间和所获得的信息不成正比这与阅读文章不同读文章时我可以用很短的时间判断这篇文章是否值得投入时间这种快速决策在看视频时很难实现尤其是在这种信息非常丰富的时代当你面对大量知识性视频时很难以最高效率找到与你最相关的视频

所以我做了这样一个工具它针对的一个应用场景是这样的当你在浏览视频时看到一个标题特别吸引你的视频你很想点进去观看但又不确定这个视频的内容是否真如标题所说在这种情况下你可以使用这个工具让它帮助你分析并总结这个视频的内容

这个工具有以下几个功能

  1. 可以处理总结所有中文视频
  2. 本地运行带有一个数据库用来保存值得反复回味的视频文稿和总结
  3. [待实现]可以自动总结你放在WatchLater里的视频
  4. [待实现]可以定时给你发送Newsletter形式的报告给你指定的所有频道的更新

这个工具的唯一目的就是让你更高效地获取到内容性强的视频内容最根本的初衷打造一个属于个人的curated的youtube newsletter通过这个newsletter对自己的订阅有一个整体的把控然后再决定看哪一个视频把自己从视频信息洪流中抽离出来目前还只能手动添加URL两个正在做的功能是Newsletter和WatchLater

Newsletter 功能能够自动监测你指定的频道中的所有视频更新它会自动抓取内容分析视频提供总结甚至给出视频的原文它会定时邮件发送一份 Newsletter告知你相关视频和频道的更新情况及其总结这样你可以对自己关注的博主有一个每日概览在决定观看视频之前你就可以大致了解其内容如果没有时间看也不会有错过的感觉

Watch Later功能会监控你的 “Watch Later” 播放列表的更新并自动在后台为你总结视频的内容等到你回头查看 “Watch Later” 列表中视频之前你可以先看这个视频的总结有些视频可能并不值得你花时间去看

运行逻辑

如果某个视频有自带的字幕文件工具会优先使用这些文件如果没有它会将视频下载到本地运行一个Whisper模型将视频音频转录为文字然后进行总结这样做的一个好处是由于YouTube上的大部分中文视频并没有自带字幕这个工具几乎可以适用于所有YouTube视频包括中文视频Whisper的大小是small在这个大小下中文转录效果和转录速度比较平衡在mac下内存占用是1.5GB左右只有在转录时才会加载Whisper

目前这个工具是本地运行自带一个简单的Web UI本地运行是因为没有web开发经验的我发现Web开发流程非常复杂可能要用80%的时间实现剩余20%的非核心功能另外本地运行有一个好处就是允许你的数据偏好和所有文档都保存在本地无需经历繁琐的注册步骤你可以任意处理本地文件这个工具会在本地建立一个数据库并且通过一个简单的Web UI和数据库交互对视频进行管理通过这个网页界面你能随时查看视频的完整文稿跳转到任意位置

文稿转换和总结默认用的是DeepSeek因为试用了许多大型模型后发现 DeepSeek 在这方面尤其是在处理中文时比其他模型表现得要好一点不过你可以在UI中很方便地修改配置文件选择任何一个大型语言模型