Macaronic icon

Macaronic

跟 AI 说话,比打字快十倍。
前提是——它得听懂你。

Dictation built for talking to AI. Any language mix.

为什么做这个

现在我们打的字,越来越多是直接说给 AI 听的。口述比打字高效得多:想到哪说到哪,说错词、绕弯子都无所谓——那些你觉得"啰嗦"的细节,恰恰是 AI 需要的上下文。在电脑上,很多人已经习惯点一下那个语音按钮(AI 自带的,或者某个小插件)对着说。但这些语音功能对口音、对说话习惯,对有些人友好,对有些人不够聪明——至少对我不够。

到了手机上,选择就更别扭。系统自带的听写不够聪明;专门的听写 app 又像杀鸡用牛刀——它们是给开会、上课的人做的,转录几小时录音、生成会议纪要,还要按月付一份不便宜的订阅。可我不是那种重度用户,我只是想把刚才那句话变成字。

最别扭的是:它们大多要你先选一种语言。可现在的大模型早就听得懂几种语言混着说了。既然如此,为什么不干脆直接接入大模型的 API,用多少花多少,想怎么说就怎么说?

Macaronic 的做法

🔌 接入你最顺手的大模型,自己听写

不是某个手机厂或某家"自带"的语音服务——是你自己挑的那个大模型,直接调它的 API。它足够聪明,任意语言混着说、夹着专业术语都能听懂,而且混说时术语写得更准(该英文是英文,该中文是中文)。没有语言开关,因为根本不需要。

💸 用多少 token,就花多少 token

接你自己的 API key,按 token 计费、费用直接付给模型厂商——说一句扣一句,不说就不花。没有订阅、没有中转、我们一分钱不收。不像那些按月收费的听写套件,用不用都先扣你一个月。

🎙 随说随录,说完即出

点一下开始说,再点一下停——这时干净的文字才出来,自动进剪贴板。不是边说边在屏幕上滚字(那只会让你一直盯着读、分心)。想到哪说到哪,一段一段录,每段可以接进下面的汇总稿,最后一次复制带走。把脑子里的东西倒出来,直接成笔记。

🔒 隐私是结构性的

音频从你的手机直接发给你选的模型厂商,这条路径上根本没有我们——不是"我们承诺不看",是结构上就没有我们这一站。你的 API key 只存在你手机的 Keychain 里。

当前版本支持

平台iPhone(iOS)
大模型OpenAI API(我自己现在用得最顺手的)
之后更多平台、更多模型厂商的 key

算笔账

别家是"按月订阅,用不用都扣":

Wispr Flow$15 / 月(或 $144 / 年)
Superwhisper$8.49 / mo
Aqua 等$8–17 / 月

Macaronic 是"按字算,说多少花多少",用你自己的 key:

说满一千字大约 $0.03(三美分)
说满一万字大约 $0.3(三毛美元)

按正常语速(一分钟约 200 字)和 OpenAI 实时语音当前费率估算,仅供找感觉——你写过的笔记有多长,心里大概就有数了。换句话说:你得对着它一整天不停地说,才花得到别家一个月订阅的钱。

不是空口说——作者连着两周密集折腾这个 app(还包含大量开发测试),OpenAI 账单一共也就两三美元。轻度使用,几个月不到十块。

上手三步

以当前版本(iPhone + OpenAI key)为例:

step 1

1 · 贴上你的 key

首次打开粘贴一次,测试保存即可

step 2

2 · 点一下,开始说

想到哪说到哪,混着说也行;说的时候还不出字

step 3

3 · 再点一下,停

文字这才出来、自动复制;点「加入汇总」接到笔记末尾

少打字,多说话

正在收尾上架流程。

Coming soon to the App Store · iOS