BB WaveNet
截图:
简介:
Chrome 版 WaveNet 的扩展版本,可将选定的文本出色地转换为高质量的自然声音音频。
旨在帮助患有阅读障碍、多动症等阅读困难的人通过利用 Google 出色的文本转语音引擎更有效地获取知识。为了实现这一目标,Michael Poirier-Ginter 创建的 WaveNet for Chrome 做得非常出色。
我接受了他的代码和设计,希望他不介意,并实现了我自己的功能,我发现这些功能对我有益。我认为一些用户可能会发现这个定制工具很有用。我还更新了扩展以符合新的清单 v3 要求(因此版本 5.1 与 Ginter 的 5.0)。当用户需要获取自己的 apiKey 时,限制仍然与 5.0 相同,包括说明(虽然有点过时;我可能会在不久的将来更新说明)——虽然过时,但如果你有耐心并继续尝试,你可能会找到了,我也费了九牛二虎之力才找到,但终于找到了。
我的扩展与原始扩展不同,如下所述:
1) 所有捕获的文本和合成的音频都发送到 1 个单独的窗口(TTS 面板)。由于清单 v3 不再允许扩展在后台播放音频。 TTS面板在视觉控制上有一些优势:
--要激活文本转语音:(a) 在浏览器中选择文本,右键单击 ->“队列”,(b) 从 chrome://extensions/shortcuts 设置所需的快捷方式,或 (c) pss '键盘上的 F2'(我不记得在我的生活中使用过)——抱歉,这是硬编码的——与 Chrome 浏览器的方案相比,将来如果受欢迎的话,可能会实现更灵活的快捷方式选项。
--在 TTS 面板上,
--使用“箭头键”导航“说话”句子,然后“输入”或左键单击进行选择,再次单击播放/“说话”。
--“K”或“F2”暂停/播放,
--'alt' + 左键单击可切换捕获的文本和“语音”文本(从手动语音词典生成)。如果没有它,“MR angiography”将被读作“Mister angiography”;语音版本将是“MR angiography”; “血压为 108/60 mm Hg”将读作“血压为 100 8 60 mm Hg”;在发送到 Google 的 API 获取音频文件之前,语音版本将是“血压为 108 超过 60”(没有毫米汞柱)。如果你遇到一个听起来很奇怪的单词/案例,这可能是我的错,或者是谷歌的错。 “语音”文本会让你知道该责怪谁。语音词典是硬编码的,但您可以将其关闭。如果您使用的是 Windows 并且想要查看字典,请转至文件资源管理器中的“%userprofile%\AppData\Local\Google\Chrome\User Data\Default\Extensions”以查找扩展名并根据需要修改 javascript 文件认为合适,并作为您自己的“开发人员”扩展运行。您必须学习正则表达式才能有效且广泛地捕获您的用例。
--“[”(左括号)键可减慢速度,“]”(右括号)键可即时加速 0.25 倍。安装时,我将个人偏好设置为 1.75x。 1.0x 太慢了,无法维持我的注意力。
--左键单击任何句子即可重播,而无需向 Google 的 WaveNet TTS API 发出新请求。因此,您可以节省一些请求成本,因为 apiKey 是从试用分配或付费 Google 平台获得的。再次单击可暂停。音频将自动前进到下一个句子。
--如果您太忙而无法获得自己的 apiKey,或者为了使用此扩展而设置和维护您的付费 Google 平台,我很乐意为您设置并为您提供 apiKey + 市场维护费率(与苹果收费--30%)。 90 天试用期后,Google 每月每 100 万个字符收费 16 美元。这对我来说优先级较低,因为您可以自己获取并每 3 个月注册一个新帐户,但如果有需求,我会重新确定优先级。
2) 不久的将来的功能将包括将 TTS 面板的页面保存到单个 HTML 文件,并且您可以再次离线收听,即使在没有安装 BB WaveNet 的浏览器上也是如此。目前,无论您的速度设置如何,您都可以将每个句子的所有音频媒体文件下载为 Opus 编码的 OGG 文件,速度为 1.0x。目的是保留以不同速度离线播放的灵活性。 OGG 文件是 Chrome 和 Android 原生的,它们可以在 VLC 的播放列表中以您想要的速度很好地播放。
3) 不久的将来的功能还将包括对计算机剪贴板中的文本进行排队。这将允许您收听来自允许您复制文本的离线应用程序的文本。
4) 请随意请求任何功能,但我可能会将这些请求直接发送给原作者 Michael Poirier-Ginter。 ; D. 新功能请求将根据我认为对大众有益的内容进行优先级排序,但请随意捐赠 1 或 2 杯 Joe,让我喝点咖啡,我会更快地满足您的请求(在添加捐赠按钮后) ,同样是低优先级)。