Abogen 发布 v1.3.1:新增 Web UI、EPUB 3 流水线与 Supertonic TTS 引擎

Abogen v1.3.1 带来基于 Flask 的 Web UI、EPUB 3 媒体叠加打包流水线、Supertonic TTS 引擎、多音色角色分配以及 Calibre/Audiobookshelf 集成。

Abogen v1.3.1:从一个桌面工具,长成桌面 + Web 双形态

Abogen 发布 v1.3.1。这一版的分量不轻:它不只是加功能,而是借一次架构重构,把 Abogen 从单纯的 PyQt6 桌面应用,扩展成桌面与 Web 共享同一核心的双形态工具,并补上了 EPUB 3、Supertonic TTS 与多音色等关键能力。

速览

方向 更新
形态 新增基于 Flask 的 Web UI(abogen-web)
架构 重构代码库,PyQt6 GUI 与 Web UI 共享同一核心
输出 EPUB 3 媒体叠加(media-overlay)打包流水线
语音 新增 Supertonic TTS 引擎(GPU 加速)
表现 多音色角色分配 + 实体分析/发音覆盖
生态 Calibre OPDS、Audiobookshelf 集成

架构重构:一套核心,两种入口

abogen-web 适合 Docker 与无头服务器部署,而它和桌面 GUI 现在共用同一核心逻辑。这意味着无论从桌面点开,还是在服务器上批量跑,行为都一致——这也是 Abogen 走向服务端批量生成有声书的前提。

内容质量:EPUB 3 与会「演」的有声书

EPUB 3 流水线可以基于生成的音频与分块元数据,构建带媒体叠加的电子书,分块时间元数据被持久化到任务产物中并配有自动化测试。配合多音色角色分配,可以为讲述者与不同角色分配不同声音,做出「戏剧化」的有声书;新增的实体分析与发音覆盖系统,则专门照顾专有名词的读法。Supertonic TTS 引擎进一步带来 GPU 加速的合成选项。

升级与落地

  1. 通过 uv tool update abogen 升级到 v1.3.1。
  2. 服务器场景评估 abogen-web,并接上 Calibre/Audiobookshelf 形成管线。
  3. Web 部署要关注访问控制与资源占用;完整变更项以官方发布说明为准。
版权声明:本文内容来自 Abogen GitHub Releases 。本平台对该内容进行了编译和整理,仅用于信息传播和学习交流之用。如有侵权,请联系我们进行处理。

用户评价

  • 加载评价中...