Liberty:本地优先的桌面会议音视频处理工作台,转写、分离、AI 总结一站搞定

原创 发布日期:
33

你是否曾为整理冗长的会议录音而熬夜?是否担心将敏感的会议数据上传到云端?Liberty 应运而生——它是一款开源、本地优先的桌面工具,让你轻松完成语音转写、说话人分离与 AI 总结,全程无需离开自己的电脑。

一、Liberty 是什么?

Liberty 是一款面向桌面端的会议音视频处理工作台,专注于帮助用户从会议录音或视频中快速提取文字、区分讲话人、生成智能摘要并整理导出。它的核心理念是“本地优先”——所有语音转写与说话人分离任务都在用户自己的电脑上完成,不依赖任何云端服务。这意味着敏感会议数据可以完全处于你的控制之下,特别适合法律、金融、研发等隐私要求严格的场景。

在技术层面,Liberty 采用了现代混合架构:前端使用 React 19 + TypeScript + Vite 构建,桌面壳基于 Tauri 2,原生能力(文件操作、系统凭据、数据库等)由 Rust 提供。转写链路则通过内置的 Python 3.9 运行时FunASR Runner 驱动,同时捆绑了 ffmpeg 用于音视频处理。所有数据存储在本地 SQLite 数据库中(通过 rusqlite 绑定),无需外部数据库服务。整个项目代码以 MIT 许可证在 GitHub 上开源,任何人都可以自由使用、修改和分发。

除了完整的本地工作流,Liberty 也保留了远端模式:当配置了 backendUrl 后,前端可以访问远端会议 API,适用于需要集中处理或团队后端的场景。AI 总结功能兼容 OpenAI Chat Completions 接口,支持任意兼容的模型(包括私有部署的 LLM),并且 API Key 通过操作系统的安全凭据存储(macOS Keychain / Windows Credential Manager)保管,避免了明文泄露风险。

值得一提的还有 Liberty 内置的桌面宠物系统。它作为会议处理流程之外的本地陪伴功能,用户通过完成语音转写等任务可以让宠物成长、赚取 LP 点数,并在宠物商店购买虚拟物品。每日还可开启 10 次免费盲盒。该纯属娱乐,不涉及任何真实货币交易或充值。

Liberty:本地优先的桌面会议音视频处理工作台,转写、分离、AI 总结一站搞定

二、软件功能一览

Liberty 的功能覆盖了从“拿到录音文件”到“产出会议纪要”的完整链条。以下表格概括了核心模块:

功能模块 详细说明
任务创建与管理 通过系统文件选择器导入音视频文件,支持设置标题、识别语言、说话人分离参数和热词;任务状态实时更新,支持重试和删除。
本地语音转写(ASR) 基于 FunASR Runner 实现高精度转写;首次启动自动下载并配置 Python 3.9、模型和 ffmpeg;转写完全在本地执行。
说话人分离(Diarization) 自动识别录音中的不同说话人并为逐字稿标注;后期可在界面上合并、重命名讲话人。
AI 智能总结 支持 OpenAI 兼容模型,可自由管理模型配置和总结模板;用户手动触发生成总结,并保存多条记录以供切换查看。
逐字稿与纪要窗口 交互式逐字稿查看,按说话人筛选;会议纪要窗口支持实时编辑;结果工作台集成所有产出。
多种导出格式 逐字稿 TXT、会议纪要 Markdown、完整包 Markdown、正式会议纪要 DOCX(基于内置模板)。
人员管理 管理与会人员姓名、部门、排序和会议记录人;支持 Excel 格式批量导入和导出,方便与组织架构对接。
系统设置 多语言(简体中文 / English)、自动/亮色/暗色主题、透明/着色玻璃效果、主题色切换、本地运行时路径、ASR 参数、远端后端配置。
系统诊断 诊断面板展示平台架构、SQLite 版本、运行时组件状态、安全基线。
桌面宠物系统 255 级成长体系,LP 钱包,宠物商店,个人仓库,每日 10 次免费盲盒;宠物通过原生渲染(macOS AppKit / Windows GDI)显示在桌面上。

这些功能通过前端页面(任务列表、结果工作台、模型管理、模板管理、宠物中心等)组合成一个统一的使用体验。

三、软件特色

Liberty 不同于常见的云端转录服务,它的核心特色可以概括为以下几点:

1. 本地优先,数据隐私完全可控

转写和说话人分离完全在本地运算,录音文件不必上传至任何第三方服务器。即使使用 AI 总结,你也可选择自行部署的本地 LLM 或可信的私有端点,最大程度规避数据泄露风险。

2. 开箱即用的运行环境

许多本地转写项目需要用户手动配置 Python、Conda 和模型,门槛较高。Liberty 通过内置的运行时管理组件,在第一次启动时自动下载和安装所需的 Python 3.9、ffmpeg 以及 FunASR 模型。整个过程无需用户干预,即使非技术人员也能快速上手。

3. 强扩展性的 AI 总结

模型管理支持任意 OpenAI 兼容接口,你可以在界面里配置不同模型(GPT、Claude、本地 llama.cpp 等),并为不同会议类型定制总结模板(如“周会摘要”、“客户访谈纪要”)。总结历史可回溯,方便对比。

4. 桌面宠物——为工作注入乐趣

Liberty 独创地将会议处理与桌面养成结合起来。完成转写任务能提升宠物等级(最高 255 级),赚取 LP 点数购买虚拟道具。每日盲盒提供免费随机奖励,不消耗任何点数或真实货币。宠物通过操作系统原生 API 渲染,支持拖拽、互动,是提高工作愉悦感的小彩蛋。

5. 跨平台现代桌面体验

基于 Tauri 2 和 Rust,Liberty 在 macOS(Intel & Apple Silicon)与 Windows(x64 / x86)上都具备原生应用般的小体积和高启动速度,同时使用 Web 技术构建界面,便于定制主题和国际化。

6. 完全开源,社区驱动

项目托管在 GitHub(whalesky-labs/Liberty),采用 MIT 许可。用户可以审查每一行代码、提交 Issue、参与功能开发,也可以基于源码定制自己的版本。

特色对比:Liberty vs 传统云端转写

对比维度 Liberty 云端转写服务
数据处理位置 完全本地 上传服务器
隐私安全性 数据不出电脑 依赖服务商安全承诺
网络依赖 无需联网(转写) 全程在线
后续费用 免费开源 按分钟/时长收费
AI 总结控制权 模型、提示词全部自主 固定模板或受限
个性化扩展 可修改代码,自定义功能 仅能用提供 API

Liberty:本地优先的桌面会议音视频处理工作台,转写、分离、AI 总结一站搞定

四、使用方法

Liberty 的日常操作非常直观,只需几个步骤就能完成一次会议处理:

1. 获取应用

  • 预编译安装包:从 GitHub Releases 下载对应平台(macOS .dmg 或 Windows .msi)安装。

  • 自行构建:克隆仓库后,先执行 pnpm install 安装前端依赖,再运行 pnpm desktop:tauri dev 启动开发模式;生产构建使用 pnpm desktop:tauri build

2. 首次初始化

启动 Liberty,系统会自动检测运行时状态。如果缺少 Python、ffmpeg 或模型,会弹出安装/修复提示(需要网络)。稍等片刻即可进入主界面。

3. 创建并运行转写任务

  • 点击“新建任务”,在文件框中选择单个音频或视频文件。

  • 设置任务标题、识别语言(如中文)、开启说话人分离、输入热词(如专有名词)。

  • 提交任务后,可在任务列表查看实时日志和进度。

  • 处理完成后任务状态变为“成功”,点击进入结果工作台。

4. 使用 AI 总结

  • 在工作台中打开“AI 总结”窗口。

  • 选择已配置的模型(需先在设置中添加模型)和总结模板,调整讲话人、时间戳参数。

  • 点击生成,等待返回结果;可多次生成并保存不同版总结,并切换查看。

5. 导出结果

根据使用场景选择导出格式:纯文本 Txt 适合存档,Markdown 便于嵌入博客或文档,DOCX 正式会议纪要可直接打印或发送。

⚠️ 注意:当前版本本地任务一次只能处理一个文件。如果选择了多个文件,本地模式会保留最后选择的文件。多文件并发支持将在后续迭代中增强。

五、收费价格

Liberty 完全免费,没有隐藏费用。

  • 软件本身采用 MIT 开源许可,可以自由用于个人或商业用途。

  • 宠物系统中的 LP 点数仅通过本地任务获得,每日盲盒免费提供,没有内购、订阅或付费道具

  • 如果需要 AI 总结能力,你可能需要自行申请 OpenAI API 密钥或部署私有模型,这部分费用由用户自己控制,Liberty 不会额外收费。

Liberty:本地优先的桌面会议音视频处理工作台,转写、分离、AI 总结一站搞定

六、常见问题解答(FAQ)

1. 使用 Liberty 一定需要联网吗?

语音转写、说话人分离和数据显示完全离线运行。只有以下场景需要网络:首次自动下载运行时组件、AI 总结请求(如果你配置的是在线模型)、以及使用远端模式。你可以根据需要选择离线与在线功能的组合。

2. 支持哪些操作系统?

目前主要支持 macOS(Apple Silicon 和 Intel)以及 Windows(x64 和 x86)。具体信息可查看 GitHub 的支持平台矩阵。

3. 转写支持哪些语言?

FunASR 主要针对中文(普通话)优化,也支持部分中文方言和英文。你可以在新建任务时选择语言参数,未来可通过模型扩展增加更多语种。

4. 本地转写会不会很慢?

速度取决于音频长度和电脑 CPU 性能。FunASR 经过优化,在主流配置上可实现接近或超过实时速率的转写。GPU 加速目前未正式启用,但 FunASR 社区已在进行相关支持。

5. 说话人分离能识别多少个发言人?

FunASR 的说话人分离默认支持识别多人,参数可调整。实际效果受录音质量、重叠对话等因素影响,建议在安静会议环境中使用,后期也可手动调整标注。

6. 如何保护我的 API Key?

Liberty 不将 API Key 保存在明文配置文件或代码中,而是利用操作系统提供的安全存储(macOS Keychain 或 Windows Credential Manager)。只有当 AI 总结发起请求时才会调用。

7. 宠物系统会影响主性能吗?

极少。宠物渲染采用原生 API,资源占用很低。如果不需要,也可在设置中完全关闭宠物功能。

8. 如何更新本地运行时(Python、模型等)?

应用启动时会校验运行时完整性,如有更新会提示修复。你也可以在系统设置的“本地运行时”中手动触发检查更新。

七、总结

Liberty 重新定义了桌面会议处理工作台:它把语音转写、说话人分离、AI 总结、结果整理四个环节无缝串联,同时坚守本地优先开源透明两大原则。无论你是需要快速整理会议纪要的职场人,还是重视数据安全的企业团队,Liberty 都提供了一个强大且可控的解决方案。再加上桌宠养成的小惊喜,让日常工作多了一分陪伴的乐趣。现在就下载体验吧!

Liberty下载地址

Liberty
版本 1.1.23
大小 45.4 MB
语言 多国语言
系统 Windows,macOS
打赏
THE END
作者头像
李想想
只是突然觉得好像隔了很多座山,突然就不想翻山越岭了。