博文

使用现成服务实现文本转语音,获得更自然的 AI 语音

图片
Samantha 和 晓晓 “黑寡妇”斯嘉丽 约翰逊凭借其在电影 Her 中给人工智能伴侣 Samantha 的配音,获得了第八届罗马电影节最佳女主角, 而约翰逊在电影中未曾露过一面。电影 her 讲述主人公离婚后找了个人工智能做女朋友,每天和 AI 谈情说爱的故事。有个小插曲是他发现自己的女朋友同时还和成百上千人谈恋爱,瞬间心碎。其他我没什么印象,毕竟多年前的电影了。之前在笔友软件 slowly 上和台湾笔友聊过这部电影。突然想起貌似看过一个小说叫做《不存在的女朋友》……好歹人家这个女友 Samantha 还会说话。 电影上映十年后的现在,与 “ 人工智能 ”聊天成为现实。当然也有专门的 AI 女朋友,网站流量还很高。不少人在短视频平台分享自己与 ChatGPT 聊天的视频,比如和 GPT 对话以练习外语口语,让 GPT 学小猫小狗叫等等。我自己也想摆脱哑巴英语, 和 PI 聊过几句 。 人工智能不仅可以理解人的提示词返回文本或者声音,就连声音也越来越自然。微软最近更新的 AI 语音“晓晓 多语言”,对比去年年底说普通话的“晓晓”,甚至还加上了说话气息,呵呵、哈哈等笑声也更自然。 人工智能语音在工作中的应用 那么自媒体从业者如何使用 AI 来给自己的视频等创作配音,让声音听起来更真实,从而在众多的作品中脱颖而出呢?除了在微软 Azure 上部署文本转语音服务之外,我们还可以借助现成的服务来轻松地获得 AI 语音。比如 speechify, naturalreaders, ttsreader, Clipchamp, etc. speechify 提供歌手 Snoop Dogg 的声音,以及 Gwyneth Paltrow ——我也不知道是谁, 这两人的声音是独家的。对了还有总统的声音,貌似是奥巴马。普通话的话,speechify 提供六种声音,包含一种台湾腔的女声。Speechify 甚至支持图片转语音:OCR 识别并“读取”图片中的文本。支持声音克隆。 naturalreaders 每天可用20分钟。超过后免费用户只能使用免费的声音了,听起来效果一般。貌似还不能商用。支持克隆自己的声音。 使用 win 系统自带的 Clipchamp 软件,实现文本转语音。 比较了下,微软提供的 AI 语音,优势还是挺大的,支持的语言多,人声选项也多,还支持不少方言。除了使用现

Talk With Your Personal AI Pi

图片
ChatGPT 需要国外 IP 地址,还要掏钱。Bing AI 需要国外 IP 地址…… 有没有好用又方便的人工智能呢,还真有!Pi.ai 就提供了一个国内可用的人工智能,虽然不能生成图片,但是可以给出针对性的详细的回答,不像某些 AI 会把搜索结果直接粘过来。回复速度也很快,还有八种人声可供选择,声音听起来很自然,有男声有女声。能够回复中文问题,比如写中文诗,但是配音不支持中文,念出来的超级奇怪…… Pi 由 Inflection AI 研发。Inflection-2.5 号称全球最好的个人 AI, 可以和领先的 ChatGPT, Gemini 一战:https://inflection.ai/inflection-2-5   亮点 :国内可用;回复速度够快;提供语音;可以拿来练口语;目前不要钱。 缺点 :不支持生成图片;用手机号注册账号的话,不支持大陆手机号。更多缺点等待发现。 可以先用 Google 等账号登录。在登录状态下,Pi 可以保存聊天记录。   Q: can you create images A: Alas, I can't generate or receive images right now! I'm just a text-based AI, though who knows what the future holds? 🤔  Is there a specific image you're looking to create?   回复问题时候会同时用选定的人声念出答案。下边是她的自我介绍:  Q: let me know the difference between pi and other Ais   A: Sure thing! While I may share some similarities with other AIs, I'm designed to stand out in the following ways:       Personality: I have a distinct and friendly personality, which helps create a more conversatio

一个充满虚假的世界

早些年,几个邻居聊天说什么是假的,这个是假的那个是假的等等。其中一个邻居说只有妈是真的,另一个做医生的说多莉羊这种克隆出来的羊,它妈就是假的。大家哈哈大笑。 后来有个餐饮行业的同学在微信群里发了个请大家投票还是什么的链接。对他们这种世界五百强的企业来说竟然还作假,感觉很不可思议,就说了句怎么你们也刷单,电商刷单,投票拉票……另一个同学说都刷单,还有个同学说一个虚假的世界。 直播的视频各种滤镜美颜和特效,画面空间扭曲。国内电商平台卖得茯苓大量造假。国外专门给品牌留评论的网站 Trustpilot 批量造假…… 据说有些人拍婚纱照的时候选择不修图或者简单修图。接受不了对方容貌的一点点瑕疵还有什么必要结婚呢? 2023年进入到了 AI 的时代,图片文章甚至视频,AI 都能批量制造,我们会进入到一个分不清真假的时代吗? 写于一月十二号晚上,看小红书上有卖家卖三方联名的假鞋想到的。 三月十七号补充:早上出去买早饭。两家挨着的早餐店,右边只剩下酱肉包子了,左边的水煎包也只剩下牛肉末粉条馅儿的。看来大家刚看了三一五晚会,这几天不买肉馅儿。不少网友评论说,过几天就忘了……

使用微软 Clipchamp 给视频添加更自然的配音

图片
虽然不用抖音,但是看小红书的视频笔记时候时不时还是会听到视频里用工具添加的配音,有烂大街的孙猴子声音,还有很扭捏听起来好像有点畏怯的女人声音。反正就是难听!刷到了都要立马划走那种。像 YouTube 等视频平台可以选择是否要开启字幕,将来有没有可能让用户直接选择用哪个声音来读取旁白,视频制作者只需要提供旁白的文字就好了? 微软的操作系统有一个“讲述人”的功能,可以读屏幕上的文字,包括邮件、网页等等,本来是给视障人士设计提供的。 我想有没有可能用这个听起来很自然的声音来给视频配音呢?搜了下还真可以,需要使用微软的视频剪辑软件 Clipchamp 来操作。微软自己的说法:You can turn words into a natural voice over audio in a variety of accents in Clipchamp thanks to our voiceover feature. There are 400 unique voices to choose from, with different accents and sounds. We offer 170 languages. 如下图:   操作步骤:假定只使用文字转语音这个功能,不剪辑视频。 打开软件,登陆账号。好像需要选择使用场景, 文字转语音只对个人账户可用 。 点击左侧“录像和创建”,点击“创建”下方的“文字转语音”。 右侧选择语言和声音。语言如果选择外语的话,是念不了中文的。中文还支持好几种方言。 填入要转语音的文字。点击预览可以试听。没问题的话点保存。 貌似只能导出 MP4 文件。然后可以用你喜欢的视频剪辑软件添加旁白声音。 如果是剪辑视频的时候添加文本再做转换到音频的操作,点击保存后会自动添加音轨。  2024年4月13号更新 :微软最近更新了普通话的 AI 语音,“多语言 晓晓”听起来更自然。 Clipchamp 和其他几个 tts 软件的比较,可看 这篇文章 。 参考链接: How to add a voice over to videos Complete guide to Narrator  How to use text to speech in Clipchamp

How to enable Crawler Hints – IndexNow for my website

图片
每天都有大量的网站被生产出来。因此,想要在最新内容刚一发布上线,就将这些内容索引下来的搜索引擎有必要更新下他们获取索引的方式。 Cloudflare 很高兴地宣布他们已和微软必应以及 Yandex 合作来支持 IndexNow. Cloudflare 的支持从他们在第一个 Impact Week 宣布的 Crawler Hints initiative 而开始。 Crawler Hints 这项服务旨在提高网络爬虫的运行效率,这些爬虫的流量大约占了互联网流量的45%. Cloudflare 通过确保爬虫能够知道他们之前爬取到了什么,以及再次爬取某个网站的内容是否有意义,而达到了前面所述的效率改进。 Cloudflare 最近宣布了针对 Crawler Hints 的两个令人兴奋的更新: Crawler Hints 现已支持 IndexNow, IndexNow 这项协议可以让网站在每次产生了新内容,有更新或者内容被删的时候通知搜索引擎。通过和微软、Yandex 合作,Cloudflare 可以大幅改善他们搜索引擎的基础设施、客户的源服务器和互联网的效率。 现在,所有的 Cloudflare 用户都可免费使用 Crawler Hints. 用户点一下鼠标,就可获得这些更有效率的爬虫带来的好处。如果你想要开启 Crawler Hints, 可以在控制面板里的 Cache Tab 来实现。 Crawler Hints 解决了什么问题: 爬虫帮互联网运作起来。为了提供更好的依赖于全网内容建立索引的搜索体验,搜索引擎操控爬虫网络去爬取互联网,找出和用户的查询最相关的内容。但因为网上内容一直在变,并且没有“中央结算中心”来通知这些变化发生的时间,搜索引擎爬虫的工作成了西西弗斯的任务 ( Sisyphean task). 他们必须在网上不停得徘徊,找出究竟多久应该检查下某个给定网站,看看有没更新。 运营搜索引擎的公司很努力的想要让这个过程尽量的高效,“推动”最先进的爬取节奏和基础设施效率。但仍旧有明显的浪费:多余的爬取。 Cloudflare 的流量来自于各大主流搜索的爬虫,过去两年也在研究这些爬虫在网页没有更新之后多久会再次爬取。每次爬取都是浪费。不幸的是我们的观察表明,53%的爬虫流量都被浪费了。Crawler Hints 旨在提高相关爬取的比例,限制那些找不到新内容

使用开源笔记软件 Joplin, 并配置 WebDAV 跨平台同步笔记

图片
Joplin 介绍 Joplin 是一个开源的笔记软件,支持多个平台多种语言,支持 Markdown, 基础笔记功能免费。主打"卖点"是代替 Evernote, 端到端加密等等。 官网的介绍是这样说得:Joplin is an open source note-taking app. Capture your thoughts and securely access them from any device.   跨平台同步功能可以选 Joplin cloud, 是一个付费功能。当然也可以使用 Dropbox, OneDrive 等网盘, 或者支持webdav的网盘。Joplin的笔记是在电脑本地存储的,如果你用不着跨平台看笔记的话,都不需要同步功能了。貌似 notion 的笔记都在云端存储,不能离线看? Joplin 下载 桌面版下载地址是:https://joplinapp.org/. 安卓端可在 F-droid 下载。 InfiniCLOUD 注册 国内支持 webdav 的网盘不多,坚果云算一个。但是看不少人说坚果云有限制。日本有一个网盘服务 InfiniCLOUD, 注册后即有 20G 空间,使用邀请码 G578B 之后再得5个G. 也支持 webdav, 国内访问没有问题。用来同步 Joplin 的笔记刚好。infinicloud的网址是:https://infini-cloud.net. 注册之后点击 My page, 开启 Turn on Apps Connection. 记下 apps passwords. 如下图所示:   设置 WebDAV 过程: 建议先在 InfiniCLOUD 网盘根目录新建一个文件夹,比如文件夹名字 Joplin,专门用来同步Joplin 笔记。不然根目录会生成大量 .md 文件, 看起来非常乱。 如果你使用 Dropbox 或者OneNote进行同步的话,Joplin 会自动新建文件夹。 安装好 Joplin 之后点击上边 menu 栏中的工具,选择选项,选择左侧导航栏的同步。 同步目标选择 webdav, 填写 InfiniCLOUD 同步的 URL, ID和密钥,分别对应 InfiniCLOUD 中的connection URL, connection ID, apps password. 如下

发布文章到 blogger 博客的几种方法

发布文章到 blogger 博客,除了在后台直接写文章发布之外,还有不少别的办法。比如早些年在flicker上就可以直接发图片到 blogger 博客,还可以添加标题和文字说明。我一般用得是邮件发布。 不愿在后台直接发布文章的一个原因是后台可供选择的中文字体太少,后台添加字体的地方大部分都是英文字体,中文字体的话看了下简体中文只有一个 Noto Sans SC, 查了下说是 adobe 和Google 联合开发的,在 adobe 体系里称之为思源字体,详见这个 网页 。其实在后台也可以通过编辑代码的方法修改字体,感觉太麻烦,主要是我还不会。而使用邮件发布,则可以在邮箱中很方便得设置中文字体,之前一般选微软雅黑。这个字体不能商业使用,但是这个博客连广告都没有挂,一时半会儿应该也不会挂广告。算不上商业使用。 更新 :使用 blogger 提供的新主题模板,在主题背景下点自定义修改主题,选择高级,然后选单拉到最下边选择添加 CSS, 就可以添加CSS 来修改文章的字体了。很方便。 还有一个 stackedit.io 也可以发布到 blogger, 主要亮点是支持 markdown. 一直没有学过markdown, 也就没有用过。最近下载得 Joplin 笔记,功能亮点也是支持 markdown, 感觉好像用不着。除了发布文章到 blogger 博客,StackEdit 还可以发布到 wordpress.com 托管得博客, 同步文件到 Dropbox, Google Drive 等网盘,至于同步文件到 Zendesk 我就不知道怎么用了,这不是一个主要帮商家提供客服服务的平台吗? 需要注意的是,用 stackedit 发文章的话,需要授权stackedit管理 blogger 上的文章和评论。