不想打字？我用这三个工具搞定了所有语音输入

现在写代码最累的不是写代码，是跟 AI 沟通 — 一个需求要打一大段话描述清楚，打字打得手酸。

后来我就想，干嘛不直接说呢？说比打快三倍，而且边想边说比边想边打字顺畅多了。

折腾了一圈，现在手机和电脑上各有一套方案，基本不怎么打字了：

• 手机上日常打字 → 豆包输入法（免费，装上就用） • 电脑上大段口述 → 闪电说 + 豆包 API（识别最准，20 小时免费额度） • 电脑上说完要整理 → Typeless（AI 帮你把口水话变成结构化文字）

𝟭. 豆包输入法 — 手机上装了就完事

如果你只是想在手机上把打字换成语音，装个豆包输入法就够了。

App Store / 应用商店搜"豆包输入法"，装上，在系统设置里切换成默认输入法，完事。

它的语音识别就是豆包的引擎，中文准确率很高，标点也能自动加。完全免费，不用配任何东西。

聊天、短消息、随手记个东西，用它就行。

缺点也明显：没有电脑版！

𝟮. 闪电说 + 豆包 API — 电脑上大段语音转文字

这是我用得最多的方案。

闪电说是一个专门做语音转文字的 Mac APP，官网下载即可 https://shandianshuo.cn/

它本身自带语音识别，但接上豆包的语音识别 API 之后，效果拉到另一个级别。新用户有 20 小时免费额度，正常用够很久。用完之后按量计费，很便宜。

写代码、文章、长笔记、口述想法，我都用它。

需要配一下，总共四步： ① 注册火山引擎 — 3 分钟 ② 创建一个应用 — 1 分钟 ③ 拿到密钥 — 30 秒 ④ 填进闪电说 — 1 分钟

先看一眼闪电说里长什么样 — 打开闪电说，点左侧「模型」，在「语音识别服务商」里找到「火山引擎」，点进去：

看到 App ID 和 Access Token 两个空要填了吧？下面就去拿。

第一步：先去火山引擎注册

火山引擎是字节跳动的云服务平台，豆包的语音识别 API 就在上面。

打开 https://volcengine.com ，右上角用手机号注册登录。

进去之后会让你实名认证 — 别慌，点"微信/抖音扫脸认证"，刷一下脸就过了。字节的所有 API 都要过这一步，认证一次以后就不用管了。

第二步：创建语音识别应用

认证完之后，打开豆包语音的控制台： https://console.volcengine.com/speech/app

点"创建应用"，三个东西要填： ❶ 应用名称：doubaoyuyin（只能英文，随便填） ❷ 应用简介：豆包语音（随意即可） ❸ 接入能力：选「豆包流式语音识别模型2.0 小时版」

"小时版"就是按使用时长计费的意思，个人用选这个就对了。

点确定，搞定。

第三步：拿到你的 App ID 和 Access Token

创建完之后，在左侧菜单找到「API 服务中心」，点第一个「豆包流式语音识别模型 2.0」。

页面拉到底部，你会看到两个东西：

❶ App ID — 直接复制 ❷ Access Token — 点旁边的小眼睛，显示出来再复制

Access Token 就是你的密码，别发给别人。

第四步：填进闪电说

回到刚才闪电说的火山引擎配置页面，把 App ID 和 Access Token 分别填进去。

填完之后点下面的「运行速度测试」，如果出了结果，说明通了。偶尔网络不稳可以多试两次。

然后点「设为默认模型」。

检查一下：回到闪电说的模型页面，看两个地方：

❶ 默认语音识别模型显示「豆包流式语音识别模型2.0」 ❷ 火山引擎旁边有个绿色小点

都对了就配好了。

配置过程中卡住了，也可以看闪电说官方的保姆级教程：https://shandianshuo.featurebase.app/help/articles/2168891-shan-dian-shuo-v06-zui-jia-shi-jianhan-bao-mu

𝟯. Typeless — 说完帮你整理

前面两个工具都是"你说什么就转什么"，逐字转录。

但有时候你不需要逐字稿 — 你需要的是把脑子里乱七八糟的想法，说出来之后变成一段整理好的文字。

Typeless 干的就是这个事。Mac 和 iOS 都能下载使用。

你对着它说一堆，它不光转成文字，还会用 AI 帮你整理：去掉口水话，理清逻辑，变成结构化的段落。

我写代码的时候经常用它：口述一个需求，说完它直接给我一段整理好的描述，比自己打字写快多了。

官网 https://www.typeless.com/ 下载。新用户免费用一个月，之后每周有 4000 字的免费额度，日常够用。

编码口述需求、把零散想法整理成段落、写邮件草稿，都很合适。

避坑：用 AirPods 的注意

因为我的 macmini 没有麦克风，所以我就使用我的 AirPods pro 做了麦克风，但是我发现一个问题：开始录音后前几秒说的话识别不上，得等一会儿才正常。

我查询了西安这不是 APP 的 bug，是蓝牙协议的问题。蓝牙耳机有两种模式：听音乐走一个协议（音质好，没有麦克风），通话走另一个协议（音质差，能用麦克风）。你点开录音的那一瞬间，耳机要从"听"切到"说"，这个切换需要几秒钟，前几句话就丢了

三个解决办法：

• 有实力者，直接买个麦克风，花钱解君愁 • 点了录音之后，等两三秒再开口说 • 用有线耳机，没有切换延迟

我在闪电说和 Typeless 都遇到了这个问题。

就这样，手机装个豆包输入法，电脑装个闪电说配上豆包 API，想整理就用 Typeless。

全场景完结。

来源：飞书 · AI Spark 知识库｜原文（最新版）：https://lcnniolukk80.feishu.cn/wiki/AEnfwRvyfiGRrmkeJJBccb4un3d ｜归档：2026-06-04

普通人如何开始用 AI

新手避坑清单

新手学习路径

自媒体人 AI 入门路径：从选题到复盘的完整工作流

AI 基础概念

工具避坑与选型

工具测评

AI 工具教程

智能体入门

智能体应用案例

AI 编程案例

AI 编程工具

Claude Code 深度全解

底层原理精讲

可视化图解

零到精通：七步上手路径

企业级安全与治理

生态与工具链全景

实战工作流手册

自媒体教程专区

AI 图像与视觉创作

办公效率

个人工具箱与环境配置

知识管理

AI 编程趋势

不想打字？我用这三个工具搞定了所有语音输入

自媒体人 AI 入门路径：从选题到复盘的完整工作流

Claude Code 深度全解

底层原理精讲

可视化图解

零到精通：七步上手路径

企业级安全与治理

生态与工具链全景

实战工作流手册

不想打字？我用这三个工具搞定了所有语音输入 ​

不想打字？我用这三个工具搞定了所有语音输入