Abogen 发布 v1.3.1：新增 Web UI、EPUB 3 流水线与 Supertonic TTS 引擎

2026-06-09

AI新闻主编

Abogen v1.3.1 带来基于 Flask 的 Web UI、EPUB 3 媒体叠加打包流水线、Supertonic TTS 引擎、多音色角色分配以及 Calibre/Audiobookshelf 集成。

Abogen v1.3.1：从一个桌面工具，长成桌面 + Web 双形态

Abogen 发布 v1.3.1。这一版的分量不轻：它不只是加功能，而是借一次架构重构，把 Abogen 从单纯的 PyQt6 桌面应用，扩展成桌面与 Web 共享同一核心的双形态工具，并补上了 EPUB 3、Supertonic TTS 与多音色等关键能力。

速览

方向	更新
形态	新增基于 Flask 的 Web UI（abogen-web）
架构	重构代码库，PyQt6 GUI 与 Web UI 共享同一核心
输出	EPUB 3 媒体叠加（media-overlay）打包流水线
语音	新增 Supertonic TTS 引擎（GPU 加速）
表现	多音色角色分配 + 实体分析/发音覆盖
生态	Calibre OPDS、Audiobookshelf 集成

架构重构：一套核心，两种入口

abogen-web 适合 Docker 与无头服务器部署，而它和桌面 GUI 现在共用同一核心逻辑。这意味着无论从桌面点开，还是在服务器上批量跑，行为都一致——这也是 Abogen 走向服务端批量生成有声书的前提。

内容质量：EPUB 3 与会「演」的有声书

EPUB 3 流水线可以基于生成的音频与分块元数据，构建带媒体叠加的电子书，分块时间元数据被持久化到任务产物中并配有自动化测试。配合多音色角色分配，可以为讲述者与不同角色分配不同声音，做出「戏剧化」的有声书；新增的实体分析与发音覆盖系统，则专门照顾专有名词的读法。Supertonic TTS 引擎进一步带来 GPU 加速的合成选项。

升级与落地

通过 uv tool update abogen 升级到 v1.3.1。
服务器场景评估 abogen-web，并接上 Calibre/Audiobookshelf 形成管线。
Web 部署要关注访问控制与资源占用；完整变更项以官方发布说明为准。

用户评价

加载评价中...