就在网站侧边栏的底部,新增了一个由 Sphinx 驱动的子站点。(就是中间海胆 形状的按钮)。

题外话:炼金世界观的海胆(bbs.nga.cn)

这个子站点仅用于存放一些演讲的中文转录稿,我以后收藏的视频就不用每次都花一小时以上去陪听了。其实背后的动机就是我的收藏夹已经积压太多了(2019 年的资料还没清完),所以尝试借助 LLM/AI 红利来解决演讲看不完的痛点,而且也能避开看一半发现是标题党的问题。

工具链很简单,软件只用到 whisper 和 deepseek,有 GUI 套壳方案的话就是拖一把鼠标的事情。单个稿件完整生成大概需要十分钟,唯一瓶颈是 deepssek 的吐字效率。

由于(现在的 jekyll)博客有点用腻了,所以尝试了 Linux 内核文档同款的 Sphinx——实际难用!这个就不多说了,毕竟 Sphinx 也没说自己是写博客用的,没有原生 markdown 都是合理的。优点是 HTML 构建确实飞快,文档格式相当丰富。以及部署是零成本的,一般会推荐 readthedocs;我试了 Vercel 手动部署也挺简单的。

uni 目前装修成这样,顺便看下转录效果

上面示例是一份 perfbook 作者的视频转录,whisper 不仅幽默,还会法语!用雷军对比法的话就是比翻译从业者更懂技术,比技术从业者什么都懂。我都不敢想象再过五年的 AI 会是怎么样。

总之,后面会把生成的演讲稿都丢到里面去,我自己也不一定会立刻看,就是以后突然想看的话肯定比打开视频要方便得多,反正熟肉点个鼠标就有。一些来自韩国的演讲分享也可以处理了,再也不用受苦于油管的劣质字幕。目前唯一的不便就是还要手动搭配幻灯片来看,有心思的话应该也能自动处理。

最后,仓库是开源的:https://github.com/Caturra000/Transcripts。需要 epub、PDF 等离线版本可以 make epub 或者 make pdf 构建获取。(离线版本的目录有点问题,应该也没人在意的吧。)