不只语音转文本,还能帮你画重点、让同事朋友间交互讨论的 vocol.ai 跨语系协作平台

newsman 发表了文章 • 2023-07-24 22:56 • 来自相关话题

现在有越来越多的人在使用数字科技辅助学习、工作,我也常常在 PTT 上看到许多网友在问有没有好用的笔记软件、工具可以处理语音转文本的工作,因为他们可能录下了课堂老师讲的内容、工作会议讨论的事项,但事后需要转成文本档整理到自己的笔记或是工作报告中。最近我就发现了一款好用的语音转文本工具 vocol.ai,辨识正确率很高,产生逐字稿的同时还可以分辨不同的讲者,甚至未来的 AI 趋势在 vocol.ai 里面也直接集成进去了,大家最常叫 ChatGPT 做的「帮我整理这内容的重点跟翻译」直接就在逐字稿产生以后一并生成。另外,如果你是需要团队合作的案子,vocol.ai 也有团队协作功能,从头到尾一站式就搞定。下面我会详细的介绍 vocol.ai 要怎么用,并且实际示范语音转文本效果以及好用的几个功能。语音转文本神器:vocol.ai 的 7 大重点这里先跟大家快速重点一下我觉得 vocol.ai 好用的 7 大功能,先让大家有个概念,原来这 vocol.ai 可以做这些,然后我们再体验它的效果。免费试用约 200 分钟先跟大家说,目前 vocol.ai 有提供每个帐号大约 200 V-points 的免费试用额度,通常一分钟的逐字稿转换会花掉 1 到 1.5 V-points(这只是大约计算,通常不会差太多),所以 200 V-points 大概就是 200 分钟左右。▲你可以在个人页面中看到剩余可用的 V-points所以你不用担心说看完介绍想要用结果要付费才能用!可以先试用 200 分钟,觉得好用、有帮助的话再继续购买更多的 V-points。▲ vocol.ai 还有包含企业方案在内的其他方案,后面会提到语音转逐字稿直接把录音档、影片档上传到 vocol.ai 的个人平台上,vocol.ai 就会开始帮你分析影片、音乐的内容,然后产生逐字稿,整个流程大概两、三个步骤就能搞定。▲上传 mp3、mp4、m4a 多种格式都可以支持通常内容只要不是太复杂的情况下,逐字稿大约可以在 3 ~ 5 分钟之内就产生出来,然后就可以在项目的画面右半部「逐字稿」这一区块看到完整的逐字稿内容。▲上传完毕后再等一下逐字稿就会出现,等待时间取决影片长度与复杂度完整呈现声音的内容就连那种我们很不经意脱口而出的赘词「对」、「就是」、「那个」,或是你卡词的状况都会很完整的节录出来。▲ vocol.ai 完整地把语音内容转成逐字稿既然是逐字稿,所以当然就是说了什么就呈现什么,本来就不会去帮你修饰语句,我觉得这样是非常正常而且尽责的逐字稿。录音的品质会决定逐字稿生成后的结果,有时候我们可能会因为声音素材品质不佳、讲话彼此互相搭到、太过小声….等原因,导致辨识出错误的内容或是用字,但也没关系,点两下逐字稿中想要修改的段落,就可以在跳出的菜单中选择「编辑」进行修改。▲ 觉得有需要调整的地方也可以自行修改辨识不同讲者vocol.ai 在辨识逐字稿的过程中也会分辨哪一句话是谁讲的,然后把不同的句子对应到讲话的人,所以会在逐字稿中看到「讲话者 1」、「讲话者 2」等字样,让我们可以更容易了解谁说了些什么。▲ 分辨讲者更容易看出是谁在说话就我目前的测试,至少到第七位讲话者都还可以辨识得出来,而且每一位讲者都会用不同颜色的线条表示,在内容很多的情况下比较好一眼就找到、辨别不同的说话者。▲ 目前测试至少可以支持 7 名讲者如果还想要更容易辨识的话,直接把「讲话者」改为真实的对象名称就好了,这样如果有刚参与项目的同事或是朋友之间就在讨论事情,就不用担心不知道是谁在说话了。▲ 讲者的名称也可以自行调整多种语言辨识vocol.ai 可以针对影片、录音档内不同的语音进行辨识,基本的国语、英语和日语就不说了,这几种语言对于 vocol.ai 在处理逐字稿上几乎是没有什么太大的问题。▲ vocol.ai 辨识英语甚至对话包含中、英文夹杂的状况也都可以顺利辨识,就像下面这样,在逐字稿里面就会同时显示中文以及英文两种不同的内容。▲ vocol.ai 辨识中英语夹杂另外,因为许多台湾人习惯说台语,今天如果录音的场合是大家都习惯说台语的会议、讨论上,其他的语音转文本系统可能很难处理,vocol.ai 就没有问题。我也简短的测试了一下,是真的可以辨识出来,不过要注意的是,台语的说法跟国语还是会有落差,像是下面这个「补给够」是台语「补嘎搞」的直翻,国语可能就会讲「补足」,会有这类的差别需要注意。▲ vocol.ai 台语也能辨识然后来试试看广东话,这是我在网络上找到的一段香港 YouTuber 的街访影片开头,丢到 vocol.ai 去转文本,没想到竟然也可以正确辨识。▲ vocol.ai 广东话也能辨识AI 生成重点在上面的几张截屏中你应该也有看到,vocol.ai 在生成完逐字稿以后,还会透过 AI 语言模型,把逐字稿的内容整理出重点显示在左半边的部分,而且如果内容完整清晰的话,可以分段,并且指出每一段的时间从什么时候开始、什么时候结束。虽然在上传文件时可以先勾选产生 AI 分析摘要,但我有时我在上传的时候会刻意先不开启 AI 自动产生摘要的功能,就是下面这个开关先不打开。我会先产出逐字稿,确认好内容再点击「运行智能分析」产出 AI 分析摘要。这也是我觉得很棒的一点,因为我通常习惯先确认好逐字稿内容,确认没有要修改再做 AI 重点摘要,因为如果我有针对逐字稿进行修改的话,这样做可以确保我的摘要会跟逐字稿内容是同步的,省去我对照内容的时间。另外,录音的内容如果一次说了好多不同的主题,vocol.ai 也会帮你把不同的主题分门别类的抓出来,你可以从「主题」标签页中看到 vocol.ai 帮你整理的主题项目,点一下任何一个项目,右边的逐字稿就会反黄,方便我们可以快速找到。团队协作平台团队协作功能是我觉得 vocol.ai 很棒的一项特色,不仅仅是你可以自己在上面完成工作,你还可以邀请同事一起参与,直接在 vocol.ai 的平台上,针对生成的内容进行讨论,评论。无论是自己还是被邀请的对象,除了可以浏览逐字稿内容、摘要内容以外,还可以针对有疑虑的地方,直接留下评论,然后在评论区中进行讨论或是交流。然后我看 vocol.ai 官网的方案内容说明,在未来还会加入新的 Starter 和 Pro 方案,可以使用像是重点标示、权限设置、团队管理、使用分析….等更多项目团队用户专属且工作上必须使用到的功能。vocol.ai 可以用在哪里?下面这边我想要实际带大家来体验看看各种不同使用 vocol.ai 的情境,透过情境的方式,我想大家应该更可以体会 vocol.ai 语音转文本有哪些可以发挥的地方。课堂纪录整理现在很多人都会在课堂上把老师教的内容记录下来,甚至有些笔记 App 也有提供录音功能,但就是纯录音,也没办法转成文本,后续要做笔记的时候还是要从头开始听,甚至你有想要听的内容,但是你根本不知道这个内容出现在几分几秒,要像是瞎子摸象那样一直在播放器中寻找。但是利用 vocol.ai,你只需要把影片、录音档上传。如果内容很多也没关系,上传完以后你可以先做自己的事情,等到逐字稿生成完毕会发送通知给你,蛮贴心的功能,不用在那痴痴的等。但要特别注意的是,上传单个音档最高限制是 180 分钟!如果你刚好没有带到录音笔、手机空间不够、快没电的情况下,你也可以直接透过 volco.ai 提供的录音功能录下要转逐字稿的内容。但因为这是透过内置浏览器来进行录音,所以还是要注意一下浏览器的设置,避免因为没有跟网页有交互时进入休眠状态让录音被迫停止,以我的经验来说,我常用 Google Chrome,所以会习惯去「设置」→「性能」→把信任的网站加入菜单中。此外,我也会同时关闭内存节省模式。无论是透过 vocol.ai 直接录音或是上传音档,当逐字稿产生完毕后,你就可以从逐字稿中透过搜索的方式,快速找到你想要找的重点,之后再把所有的内容好好整理一下,会比从头重新听过再来整理还要有效率。想听哪一段的内容直接点击文本就可以直接切换过去,不用在一整段语音中盲目寻找要听的目标内容。这里也要特别提一下,其实 vocol.ai 也有针对逐字稿、评论讨论的关键字搜索工具,不过我觉得那比较适用有好多段对话的情况,搜索工具会引导你去有包含这个关键字的对话、章节或是讨论串。但是像我上面那样,课堂上只有老师一个人批哩啪啦在讲的情况,vocol.ai 的关键字搜索反而没那么好用,因为他不会引导你去这个字实际出现的地方,而是把有提到这个字的对话整段抓出来,等于是老师整段讲的话都被标出来了,那就没有意义了,所以像这种情况还是改用浏览器内置的搜索工具比较好。还是要说一下,逐字稿真的很好用,大家一定要会善用,毕竟在信息的世界,文本是很重要的传播媒介啊。会议纪录整理vocol.ai 也很适合拿来做会议记录,做会后的数据整理,搭配 vocol.ai 可以分辨不同讲者的特色,可以在逐字稿中很容易了解到谁说了哪些内容。而且包含这样一来一回的对话,甚至有时候有抢话的状况,vocol.ai 都还是分辨得很清楚,没有混在一起、搭在一起。另外像这个情境,就可以使用上面提过的关键字搜索工具,找出哪些对话里面有我们想要了解的关键字内容。如果可以使用 vocol.ai 的工具还是比较好,毕竟这个可以直接让画面只显示我们搜索的关键字对话,更容易聚焦在结果上。另外还有一种会议记录,可能就是大家开会的时候随手录下来的,这种当然也可以使用 vocol.ai 来做会后的逐字稿整理。可是你会发现这里面明明就很多人都有发言,但是在逐字稿中却都只辨识成一个讲者,不像上面那样可以辨识成两个人,还能一来一往很流畅,句子也不会搭在一起。主要还是因为声音品质的关系。像这个会议记录的影片文件,因为大家声音都不是非常清晰,有些讲得也很模糊,所以 vocol.ai 在判断上就会有很大难度去准确的辨识,而这个影片的情况还算好,逐字稿中有 8 成的内容都有抓到,只是没有分辨讲者罢了。毕竟 AI 也不是万能,素材的品质越好,能够提供的内容就越完整,这点大家一定要记得。用翻译快速看懂国外采访纪录刚好在这段时间,我们有机会受德国在台协会邀请做一个小访问,主题是关于 9 月要在德国柏林举办的 IFA 展览,而我们也录下了采访的内容,然后透过 vocol.ai 来帮我们做事后的整理。一样可以透过 AI 生成的重点先了解一下整段访问的内容,然后再针对逐字稿的内容去做整理或是进一步的利用。这边就要提到 vocol.ai 七月刚上线的翻译功能!简单来说,这功能是能够让你在生成逐字稿之后进行翻译。完成逐字稿翻译后,点击该语系就能对照原始语系,而且就算你点击特定区段的翻译版本逐字稿,语音也会同步,也能留下评论。这对想要学习语言的人来说,就像是学习平台一样方便。除了在平台上跨语系协作,也能下载各种翻译版本逐字稿。支持的格式有 txt 和 srt 这两种。逐字稿翻译功能甚至支持 20 种以上的语系,但需要注意的是翻译版本无法被编辑喔!我认为这对于需要开跨国会议的人非常有帮助,例如有时候跟日本客户开会时,他们偏好使用日文,但对于不懂日文的我们,如果需要知道内容细节,就需要口译帮忙,但有时候口译也会省略一些内容,这就会造成信息落差,如果能掌握到所有细节,其实就能避免这种状况。vocol.ai 也是好用的多人协作平台上面的案例中,你可以发现我主要是以个人使用的情境在体验 vocol.ai 的功能,谈到 vocol.ai 如何帮助我们更好的处理语音的事情。但其实 vocol.ai 不仅仅是对自己有帮助,对于团队协作都是有帮助的,这都是借助 vocol.ai 的协作平台功能。换个立场,今天你不是会议的参与者,但你是团队的一员你不一定要亲自参与每一场的会议,但是你可以在会议结束以后,让与会的同事透过 vocol.ai 平台的「分享文件」功能把你邀请进 vocol.ai 的协作平台。收到邀请后会有 Email 的通知,而且可以在媒体库中清楚的辨识哪些是受他人邀请参与的项目,哪些是自己的项目。直接在平台中留下针对内容的建议身为受邀者虽然目前还不能编辑逐字稿的内容,但是可以针对逐字稿或是语音的段落给予意见,然后再由项目的拥有者根据大家的回馈进行修改。可以选择任何一段的逐字稿或是语音段落,然后留下「评论」,这样在同一个项目底下的其他参与者,就可以看到彼此的评论内容。其他人只要点击讨论区中你所留下的评论,就会被引导到你选起来的对话或是章节,你也不用再跟大家说「请看 XX 分 XX 秒的地方」,把时间跟精力专注在真正要聚焦的内容上吧。所以无论你是主要参与会议的人、只需要知道会议上讨论了些什么的人,或者你是一个项目管理的角色,你都可以利用 vocol.ai 协作平台的共享逐字稿(包括原始逐字稿跟多语系翻译版本)与 AI 重点整理的功能,查看整场会议的全貌或重点、甚至给予评论。而且上面说到的这些评论都会即时显示,大家可以花个 10 分钟 20 分钟一起在在线透过 vocol.ai 来完成会议后续的确认工作。也能直接用 vocol.ai 录制在线会议此外,vocol.ai 还可以化身为一个机器人加入 Google Meet 或 Microsoft Team 的视频会议中,把会议的内容自动记录下来,再自动丢回 vocol.ai 的平台中分析、产出逐字稿。不过要注意的是,目前使用机器人自动录音有六十分钟限制。接着你只要从个人后台首页中的「邀请 Google/Team 会议录音机器人」选项的「加入会议」功能操作。然后粘贴会议的链接,让 vocol.ai 可以向会议送出加入的邀请。在会议端就会收到有 vocol.ai 机器人要加入会议的通知,允许加入以后,vocol.ai 就会开始对会议的内容进行录音。当会议结束后,vocol.ai 机器人就会自动把录制的内容丢回系统,你可以在后台中看到 meeting 的文件,这就是刚刚录制的会议内容。接着后面产生 AI 摘要、逐字稿的功能就跟前面介绍过的一样。透过这个方式,在团队开会、远程视频会议时,就不用另外录像、取得录像档然后再上传,这些有的没的工作就直接让 vocol.ai 来处理,处理完还能直接生成会议重点摘要与逐字稿,多方便。vocol.ai 平台:语音转多语系逐字稿,让工作变得更有效率回归到最原始的需求,我们之所以需要一款好用的语音转文本工具,就是因为现在很多东西都讲求数字化,而数字与我们之间最重要的沟通方式就是文本了。透过 vocol.ai 的语音转文本功能,我们可以很方便又快速的把落落长的课堂录音、会议记录、采访内容在几分钟内就转成多语系文本,让我们后续可以做更多应用。vocol.ai 提供了 AI 摘要功能以及分享逐字稿功能,可以加快工作的流程以及协作的顺畅度,利用 AI 摘要先快速了解内容后,在针对逐字稿的细项内容去修正、讨论与调整。 查看全部

现在有越来越多的人在使用数字科技辅助学习、工作,我也常常在 PTT 上看到许多网友在问有没有好用的笔记软件、工具可以处理语音转文本的工作,因为他们可能录下了课堂老师讲的内容、工作会议讨论的事项,但事后需要转成文本档整理到自己的笔记或是工作报告中。

最近我就发现了一款好用的语音转文本工具 vocol.ai,辨识正确率很高,产生逐字稿的同时还可以分辨不同的讲者,甚至未来的 AI 趋势在 vocol.ai 里面也直接集成进去了,大家最常叫 ChatGPT 做的「帮我整理这内容的重点跟翻译」直接就在逐字稿产生以后一并生成。

另外,如果你是需要团队合作的案子,vocol.ai 也有团队协作功能,从头到尾一站式就搞定。下面我会详细的介绍 vocol.ai 要怎么用,并且实际示范语音转文本效果以及好用的几个功能。

语音转文本神器:vocol.ai 的 7 大重点

这里先跟大家快速重点一下我觉得 vocol.ai 好用的 7 大功能,先让大家有个概念,原来这 vocol.ai 可以做这些,然后我们再体验它的效果。

免费试用约 200 分钟

先跟大家说,目前 vocol.ai 有提供每个帐号大约 200 V-points 的免费试用额度,通常一分钟的逐字稿转换会花掉 1 到 1.5 V-points(这只是大约计算,通常不会差太多),所以 200 V-points 大概就是 200 分钟左右。

▲你可以在个人页面中看到剩余可用的 V-points

所以你不用担心说看完介绍想要用结果要付费才能用!可以先试用 200 分钟,觉得好用、有帮助的话再继续购买更多的 V-points。

▲ vocol.ai 还有包含企业方案在内的其他方案,后面会提到

语音转逐字稿

直接把录音档、影片档上传到 vocol.ai 的个人平台上,vocol.ai 就会开始帮你分析影片、音乐的内容,然后产生逐字稿,整个流程大概两、三个步骤就能搞定。

▲上传 mp3、mp4、m4a 多种格式都可以支持

通常内容只要不是太复杂的情况下,逐字稿大约可以在 3 ~ 5 分钟之内就产生出来,然后就可以在项目的画面右半部「逐字稿」这一区块看到完整的逐字稿内容。

▲上传完毕后再等一下逐字稿就会出现,等待时间取决影片长度与复杂度

完整呈现声音的内容

就连那种我们很不经意脱口而出的赘词「对」、「就是」、「那个」,或是你卡词的状况都会很完整的节录出来。

▲ vocol.ai 完整地把语音内容转成逐字稿

既然是逐字稿,所以当然就是说了什么就呈现什么,本来就不会去帮你修饰语句,我觉得这样是非常正常而且尽责的逐字稿。

录音的品质会决定逐字稿生成后的结果,有时候我们可能会因为声音素材品质不佳、讲话彼此互相搭到、太过小声….等原因,导致辨识出错误的内容或是用字,但也没关系,点两下逐字稿中想要修改的段落,就可以在跳出的菜单中选择「编辑」进行修改。

vocol.ai 语音转文本

▲ 觉得有需要调整的地方也可以自行修改

辨识不同讲者

vocol.ai 在辨识逐字稿的过程中也会分辨哪一句话是谁讲的,然后把不同的句子对应到讲话的人,所以会在逐字稿中看到「讲话者 1」、「讲话者 2」等字样,让我们可以更容易了解谁说了些什么。

▲ 分辨讲者更容易看出是谁在说话

就我目前的测试,至少到第七位讲话者都还可以辨识得出来,而且每一位讲者都会用不同颜色的线条表示,在内容很多的情况下比较好一眼就找到、辨别不同的说话者。

▲ 目前测试至少可以支持 7 名讲者

如果还想要更容易辨识的话,直接把「讲话者」改为真实的对象名称就好了,这样如果有刚参与项目的同事或是朋友之间就在讨论事情,就不用担心不知道是谁在说话了。

▲ 讲者的名称也可以自行调整

多种语言辨识

vocol.ai 可以针对影片、录音档内不同的语音进行辨识,基本的国语、英语和日语就不说了,这几种语言对于 vocol.ai 在处理逐字稿上几乎是没有什么太大的问题。

▲ vocol.ai 辨识英语

甚至对话包含中、英文夹杂的状况也都可以顺利辨识,就像下面这样,在逐字稿里面就会同时显示中文以及英文两种不同的内容。

▲ vocol.ai 辨识中英语夹杂

另外,因为许多台湾人习惯说台语,今天如果录音的场合是大家都习惯说台语的会议、讨论上,其他的语音转文本系统可能很难处理,vocol.ai 就没有问题。

我也简短的测试了一下,是真的可以辨识出来,不过要注意的是,台语的说法跟国语还是会有落差,像是下面这个「补给够」是台语「补嘎搞」的直翻,国语可能就会讲「补足」,会有这类的差别需要注意。

▲ vocol.ai 台语也能辨识

然后来试试看广东话,这是我在网络上找到的一段香港 YouTuber 的街访影片开头,丢到 vocol.ai 去转文本,没想到竟然也可以正确辨识。

▲ vocol.ai 广东话也能辨识

AI 生成重点

在上面的几张截屏中你应该也有看到,vocol.ai 在生成完逐字稿以后,还会透过 AI 语言模型,把逐字稿的内容整理出重点显示在左半边的部分,而且如果内容完整清晰的话,可以分段,并且指出每一段的时间从什么时候开始、什么时候结束。

虽然在上传文件时可以先勾选产生 AI 分析摘要,但我有时我在上传的时候会刻意先不开启 AI 自动产生摘要的功能,就是下面这个开关先不打开。

我会先产出逐字稿,确认好内容再点击「运行智能分析」产出 AI 分析摘要。

这也是我觉得很棒的一点,因为我通常习惯先确认好逐字稿内容,确认没有要修改再做 AI 重点摘要,因为如果我有针对逐字稿进行修改的话,这样做可以确保我的摘要会跟逐字稿内容是同步的,省去我对照内容的时间。

另外,录音的内容如果一次说了好多不同的主题,vocol.ai 也会帮你把不同的主题分门别类的抓出来,你可以从「主题」标签页中看到 vocol.ai 帮你整理的主题项目,点一下任何一个项目,右边的逐字稿就会反黄,方便我们可以快速找到。

团队协作平台

团队协作功能是我觉得 vocol.ai 很棒的一项特色,不仅仅是你可以自己在上面完成工作,你还可以邀请同事一起参与,直接在 vocol.ai 的平台上,针对生成的内容进行讨论,评论。

无论是自己还是被邀请的对象,除了可以浏览逐字稿内容、摘要内容以外,还可以针对有疑虑的地方,直接留下评论,然后在评论区中进行讨论或是交流。

然后我看 vocol.ai 官网的方案内容说明,在未来还会加入新的 Starter 和 Pro 方案,可以使用像是重点标示、权限设置、团队管理、使用分析….等更多项目团队用户专属且工作上必须使用到的功能。

vocol.ai 可以用在哪里?

下面这边我想要实际带大家来体验看看各种不同使用 vocol.ai 的情境,透过情境的方式,我想大家应该更可以体会 vocol.ai 语音转文本有哪些可以发挥的地方。

课堂纪录整理

现在很多人都会在课堂上把老师教的内容记录下来,甚至有些笔记 App 也有提供录音功能,但就是纯录音,也没办法转成文本,后续要做笔记的时候还是要从头开始听,甚至你有想要听的内容,但是你根本不知道这个内容出现在几分几秒,要像是瞎子摸象那样一直在播放器中寻找。

但是利用 vocol.ai,你只需要把影片、录音档上传。

如果内容很多也没关系,上传完以后你可以先做自己的事情,等到逐字稿生成完毕会发送通知给你,蛮贴心的功能,不用在那痴痴的等。

但要特别注意的是,上传单个音档最高限制是 180 分钟!

如果你刚好没有带到录音笔、手机空间不够、快没电的情况下,你也可以直接透过 volco.ai 提供的录音功能录下要转逐字稿的内容。

但因为这是透过内置浏览器来进行录音,所以还是要注意一下浏览器的设置,避免因为没有跟网页有交互时进入休眠状态让录音被迫停止,以我的经验来说,我常用 Google Chrome,所以会习惯去「设置」→「性能」→把信任的网站加入菜单中。此外,我也会同时关闭内存节省模式。

无论是透过 vocol.ai 直接录音或是上传音档,当逐字稿产生完毕后,你就可以从逐字稿中透过搜索的方式,快速找到你想要找的重点,之后再把所有的内容好好整理一下,会比从头重新听过再来整理还要有效率。

想听哪一段的内容直接点击文本就可以直接切换过去,不用在一整段语音中盲目寻找要听的目标内容。

这里也要特别提一下,其实 vocol.ai 也有针对逐字稿、评论讨论的关键字搜索工具,不过我觉得那比较适用有好多段对话的情况,搜索工具会引导你去有包含这个关键字的对话、章节或是讨论串。

但是像我上面那样,课堂上只有老师一个人批哩啪啦在讲的情况,vocol.ai 的关键字搜索反而没那么好用,因为他不会引导你去这个字实际出现的地方,而是把有提到这个字的对话整段抓出来,等于是老师整段讲的话都被标出来了,那就没有意义了,所以像这种情况还是改用浏览器内置的搜索工具比较好。

还是要说一下,逐字稿真的很好用,大家一定要会善用,毕竟在信息的世界,文本是很重要的传播媒介啊。

会议纪录整理

vocol.ai 也很适合拿来做会议记录,做会后的数据整理,搭配 vocol.ai 可以分辨不同讲者的特色,可以在逐字稿中很容易了解到谁说了哪些内容。

而且包含这样一来一回的对话,甚至有时候有抢话的状况,vocol.ai 都还是分辨得很清楚,没有混在一起、搭在一起。

另外像这个情境,就可以使用上面提过的关键字搜索工具,找出哪些对话里面有我们想要了解的关键字内容。

如果可以使用 vocol.ai 的工具还是比较好,毕竟这个可以直接让画面只显示我们搜索的关键字对话,更容易聚焦在结果上。

另外还有一种会议记录,可能就是大家开会的时候随手录下来的,这种当然也可以使用 vocol.ai 来做会后的逐字稿整理。

可是你会发现这里面明明就很多人都有发言,但是在逐字稿中却都只辨识成一个讲者,不像上面那样可以辨识成两个人,还能一来一往很流畅,句子也不会搭在一起。

主要还是因为声音品质的关系。

像这个会议记录的影片文件,因为大家声音都不是非常清晰,有些讲得也很模糊,所以 vocol.ai 在判断上就会有很大难度去准确的辨识,而这个影片的情况还算好,逐字稿中有 8 成的内容都有抓到,只是没有分辨讲者罢了。

毕竟 AI 也不是万能,素材的品质越好,能够提供的内容就越完整,这点大家一定要记得。

用翻译快速看懂国外采访纪录

刚好在这段时间,我们有机会受德国在台协会邀请做一个小访问,主题是关于 9 月要在德国柏林举办的 IFA 展览,而我们也录下了采访的内容,然后透过 vocol.ai 来帮我们做事后的整理。

一样可以透过 AI 生成的重点先了解一下整段访问的内容,然后再针对逐字稿的内容去做整理或是进一步的利用。

这边就要提到 vocol.ai 七月刚上线的翻译功能!

简单来说,这功能是能够让你在生成逐字稿之后进行翻译。完成逐字稿翻译后,点击该语系就能对照原始语系,而且就算你点击特定区段的翻译版本逐字稿,语音也会同步,也能留下评论。

这对想要学习语言的人来说,就像是学习平台一样方便。

除了在平台上跨语系协作,也能下载各种翻译版本逐字稿。支持的格式有 txt 和 srt 这两种。

逐字稿翻译功能甚至支持 20 种以上的语系,但需要注意的是翻译版本无法被编辑喔!

我认为这对于需要开跨国会议的人非常有帮助,例如有时候跟日本客户开会时,他们偏好使用日文,但对于不懂日文的我们,如果需要知道内容细节,就需要口译帮忙,但有时候口译也会省略一些内容,这就会造成信息落差,如果能掌握到所有细节,其实就能避免这种状况。

vocol.ai 也是好用的多人协作平台

上面的案例中,你可以发现我主要是以个人使用的情境在体验 vocol.ai 的功能,谈到 vocol.ai 如何帮助我们更好的处理语音的事情。

但其实 vocol.ai 不仅仅是对自己有帮助,对于团队协作都是有帮助的,这都是借助 vocol.ai 的协作平台功能。

换个立场,今天你不是会议的参与者,但你是团队的一员

你不一定要亲自参与每一场的会议,但是你可以在会议结束以后,让与会的同事透过 vocol.ai 平台的「分享文件」功能把你邀请进 vocol.ai 的协作平台。

收到邀请后会有 Email 的通知,而且可以在媒体库中清楚的辨识哪些是受他人邀请参与的项目,哪些是自己的项目。

直接在平台中留下针对内容的建议

身为受邀者虽然目前还不能编辑逐字稿的内容,但是可以针对逐字稿或是语音的段落给予意见,然后再由项目的拥有者根据大家的回馈进行修改。

可以选择任何一段的逐字稿或是语音段落,然后留下「评论」,这样在同一个项目底下的其他参与者,就可以看到彼此的评论内容。

其他人只要点击讨论区中你所留下的评论,就会被引导到你选起来的对话或是章节,你也不用再跟大家说「请看 XX 分 XX 秒的地方」,把时间跟精力专注在真正要聚焦的内容上吧。

所以无论你是主要参与会议的人、只需要知道会议上讨论了些什么的人,或者你是一个项目管理的角色,你都可以利用 vocol.ai 协作平台的共享逐字稿(包括原始逐字稿跟多语系翻译版本)与 AI 重点整理的功能,查看整场会议的全貌或重点、甚至给予评论。

而且上面说到的这些评论都会即时显示,大家可以花个 10 分钟 20 分钟一起在在线透过 vocol.ai 来完成会议后续的确认工作。

也能直接用 vocol.ai 录制在线会议

此外,vocol.ai 还可以化身为一个机器人加入 Google Meet 或 Microsoft Team 的视频会议中,把会议的内容自动记录下来,再自动丢回 vocol.ai 的平台中分析、产出逐字稿。不过要注意的是,目前使用机器人自动录音有六十分钟限制。

接着你只要从个人后台首页中的「邀请 Google/Team 会议录音机器人」选项的「加入会议」功能操作。

然后粘贴会议的链接,让 vocol.ai 可以向会议送出加入的邀请。

在会议端就会收到有 vocol.ai 机器人要加入会议的通知,允许加入以后,vocol.ai 就会开始对会议的内容进行录音。

当会议结束后,vocol.ai 机器人就会自动把录制的内容丢回系统,你可以在后台中看到 meeting 的文件,这就是刚刚录制的会议内容。

接着后面产生 AI 摘要、逐字稿的功能就跟前面介绍过的一样。

透过这个方式,在团队开会、远程视频会议时,就不用另外录像、取得录像档然后再上传,这些有的没的工作就直接让 vocol.ai 来处理,处理完还能直接生成会议重点摘要与逐字稿,多方便。

vocol.ai 平台:语音转多语系逐字稿,让工作变得更有效率

回归到最原始的需求,我们之所以需要一款好用的语音转文本工具,就是因为现在很多东西都讲求数字化,而数字与我们之间最重要的沟通方式就是文本了。

透过 vocol.ai 的语音转文本功能,我们可以很方便又快速的把落落长的课堂录音、会议记录、采访内容在几分钟内就转成多语系文本,让我们后续可以做更多应用。

vocol.ai 提供了 AI 摘要功能以及分享逐字稿功能,可以加快工作的流程以及协作的顺畅度,利用 AI 摘要先快速了解内容后,在针对逐字稿的细项内容去修正、讨论与调整。

买量投放与变现之间的关系

newsman 发表了文章 • 2023-07-24 22:43 • 来自相关话题

如果遇到了变现方面的瓶颈,如何都提高不了LTV和ROI,可以考虑下如何从投放侧进行突破,如何精准匹配用户,从而提升ROI。以下是我的理解,具体参考投放增长的同学可能更有说服力。首先,同样的模式下出价是一个因素,出价越低相对来说,用户质量相对来说更差。所以有时候觉得为什么近期LTV降低,可以考虑下是否是这个因素引起。其次,具体采取什么样的模式投放,也是需要考量的。以Google Ads为例,其他平台也是类似。首先,同样的模式下出价是一个因素,出价越低相对来说,用户质量相对来说更差。所以有时候觉得为什么近期LTV降低,可以考虑下是否是这个因素引起。1.0 粗犷式投放简单来说,只买安装,我个人觉得这种方法在IAA产品前期还是可以考虑的。适合测试产品整体数据,了解产品在各区域的数据表现,同时短期内适合在有限的预算。简单来说,只买安装,我个人觉得这种方法在IAA产品前期还是可以考虑的。适合测试产品整体数据,了解产品在各区域的数据表现,同时短期内适合在有限的预算。2.0-2.5 优化事件投放2.0-2.5 这个角度的方案有多种,主要分以下几类:1、留存事件 认为完成某一重要产品操作,即为留存用户。由于变现产品一般情况下都为高留存。由于从而定义该事件为买量事件2、广告事件认为完成某一个核心广告事件,即为广告事件用户。由于用户完成广告漏斗中的某一个核心环节,认为该用户为具有较高广告价值的用户,从而定义该事件为广告事件3、Tachi这个算是今年才推出的新方案,原理就是搜集用户每一次广告展示的价值,从而找到较高广告价值的用户,进行买量。由于广告受市场波动影响、新增影响较大,所以Tachi相对来说,过程比较繁琐,需要人工干预,调整这个较高广告价值的具体数值。具体可以找相关的Google Ads这边的同学了解一下。3.0 投放3.0 tRoas3.0相对来说,就比较简单了,原理上来说,按照广告回收或者整体回收来买量。3.0 ARO太极的升级版,原理类似于太极,以机器自动化取代人工干预,不需要周期性修改数值。以上方案均有开发者使用,不同类型的产品在不同的国家可能适用于不同的买量方式。具体可以根据实际数据结果选择最优选自己的方案。 查看全部

如果遇到了变现方面的瓶颈,如何都提高不了LTV和ROI,可以考虑下如何从投放侧进行突破,如何精准匹配用户,从而提升ROI。以下是我的理解,具体参考投放增长的同学可能更有说服力。

首先,同样的模式下出价是一个因素,出价越低相对来说,用户质量相对来说更差。所以有时候觉得为什么近期LTV降低,可以考虑下是否是这个因素引起。其次,具体采取什么样的模式投放,也是需要考量的。以Google Ads为例,其他平台也是类似。

首先,同样的模式下出价是一个因素,出价越低相对来说,用户质量相对来说更差。所以有时候觉得为什么近期LTV降低,可以考虑下是否是这个因素引起。

1.0 粗犷式投放

简单来说,只买安装,我个人觉得这种方法在IAA产品前期还是可以考虑的。适合测试产品整体数据,了解产品在各区域的数据表现,同时短期内适合在有限的预算。

简单来说,只买安装,我个人觉得这种方法在IAA产品前期还是可以考虑的。适合测试产品整体数据,了解产品在各区域的数据表现,同时短期内适合在有限的预算。

2.0-2.5 优化事件投放

2.0-2.5 这个角度的方案有多种,主要分以下几类:

1、留存事件 认为完成某一重要产品操作,即为留存用户。由于变现产品一般情况下都为高留存。由于从而定义该事件为买量事件

2、广告事件认为完成某一个核心广告事件,即为广告事件用户。由于用户完成广告漏斗中的某一个核心环节,认为该用户为具有较高广告价值的用户,从而定义该事件为广告事件

3、Tachi这个算是今年才推出的新方案,原理就是搜集用户每一次广告展示的价值,从而找到较高广告价值的用户,进行买量。由于广告受市场波动影响、新增影响较大,所以Tachi相对来说,过程比较繁琐,需要人工干预,调整这个较高广告价值的具体数值。具体可以找相关的Google Ads这边的同学了解一下。

3.0 投放

3.0 tRoas

3.0相对来说,就比较简单了,原理上来说,按照广告回收或者整体回收来买量。

3.0 ARO

太极的升级版,原理类似于太极,以机器自动化取代人工干预,不需要周期性修改数值。

以上方案均有开发者使用,不同类型的产品在不同的国家可能适用于不同的买量方式。具体可以根据实际数据结果选择最优选自己的方案。

推荐一款免费好用的AI绘图神器

newsman 发表了文章 • 2023-07-24 17:53 • 来自相关话题

大家好,欢迎来到”AI工具推荐“专栏第二弹,前段时间AI作图火上天,国外更是有Mdjourney以假乱真的照片级效果:但无奈Mdjourney只有25次免费作画的机会,使用完之后就要付费了。况且我们很多时候使用普通AI作图即可满足大部分要求,今天就推荐一款免费好用的AI绘图工具,它就是前段时间百度推出的文心一言的”姐妹版“ 文心一格——AI艺术与创意辅助平台,访问网址是:https://yige.baidu.com/creation我们看到,默认预置了不少绘图风格,如艺术创想、唯美二次元、怀旧漫画风、中国风、概念插画、明亮插画、梵高、超现实主义、动漫风、插画、像素艺术、炫彩插画等。那我们就来试试效果吧:关键词1:一个晴朗的早上,在一个公园的草地上,一个男孩手上拿着风筝,另一个女孩在吹泡泡,非常详细,数字艺术,hdr,4k,插画生成图片的速度还挺快的,效果还不错,但没有惊艳的感觉,我们可以考虑关键词优化,点击“联想”,可以看到其他用户生成的关键词及作品,可以参考联想:于是我把关键词调整了下:一个帅气文艺的男孩手上拿着风筝,一个漂亮的女孩在吹泡泡,非常详细,4k,插画于是得到的效果好了不少:我们再来试个关键词,关键词2:一个漂亮的豪宅与花的花园和喷泉,绘画,油画,4k,详细,散景风格先选择“中国风”:再换成了“艺术创想”风格,嗯,更惊艳了:关键词3:可爱的兔子导游,穿着汉服,中国风,灯笼,油画,hdr,4k风格选择:智能推荐:效果挺不错,所以我分享出去了,还获得了2个电量。我们也可以点击“联想”看看其他用户的作品:二、我们再来试试自定义功能,自定义可以上传参考图,得到的AI生成图片能够基于参考图的基本布局来构图,比如我试了下关键词:民国时期,几个男人围坐在起吃饭,宫崎骏动画,hdr, 4k。上传了一张民国时期的参考照片,得到了如下四张照片,确实挺像宫崎骏的风格:我们也可以看到其他人的一些作品关键词,其实创作出一幅好看的作品,关键词也并不复杂:三、文心一格还有些新鲜的实验室功能,我们有机会再尝试哈:四、最后说下如何能够通过赚取电量生成画作?注册之后,默认有50的电量,所谓电量就是一种内部币种,类似QQ的Q币,用于兑换飞桨文心一格平台上图片生成服务、指定公开画作下载服务、以及其他增值服务等。新人注册默认有50电量,一张画通常都是2电量,可以用来创作25幅画。要是不想花钱购买电量,我们只要不是很频繁使用AI绘图,完全可以通过每日的签到,画作分享、公开优秀画作来免费赚取电量,满足日常使用。好了,今天的绘图工具就介绍完了,大家是不是已经跃跃欲试了呢,那就赶快注册来试玩下吧。 查看全部

大家好,欢迎来到”AI工具推荐“专栏第二弹,前段时间AI作图火上天,国外更是有Mdjourney以假乱真的照片级效果:

但无奈Mdjourney只有25次免费作画的机会,使用完之后就要付费了。况且我们很多时候使用普通AI作图即可满足大部分要求,今天就推荐一款免费好用的AI绘图工具,它就是前段时间百度推出的文心一言的”姐妹版“ 文心一格——AI艺术与创意辅助平台,访问网址是:https://yige.baidu.com/creation

我们看到,默认预置了不少绘图风格,如艺术创想、唯美二次元、怀旧漫画风、中国风、概念插画、明亮插画、梵高、超现实主义、动漫风、插画、像素艺术、炫彩插画等。

那我们就来试试效果吧:
关键词1:一个晴朗的早上,在一个公园的草地上,一个男孩手上拿着风筝,另一个女孩在吹泡泡,非常详细,数字艺术,hdr,4k,插画

生成图片的速度还挺快的,效果还不错,但没有惊艳的感觉,我们可以考虑关键词优化,点击“联想”,可以看到其他用户生成的关键词及作品,可以参考联想:

于是我把关键词调整了下:一个帅气文艺的男孩手上拿着风筝,一个漂亮的女孩在吹泡泡,非常详细,4k,插画
于是得到的效果好了不少:

我们再来试个关键词,
关键词2:一个漂亮的豪宅与花的花园和喷泉,绘画,油画,4k,详细,散景
风格先选择“中国风”:

再换成了“艺术创想”风格,嗯,更惊艳了:

关键词3:可爱的兔子导游,穿着汉服,中国风,灯笼,油画,hdr,4k
风格选择:智能推荐:

效果挺不错,所以我分享出去了,还获得了2个电量。我们也可以点击“联想”看看其他用户的作品:

二、我们再来试试自定义功能,自定义可以上传参考图,得到的AI生成图片能够基于参考图的基本布局来构图,比如我试了下关键词:民国时期,几个男人围坐在起吃饭,宫崎骏动画,hdr, 4k。上传了一张民国时期的参考照片,得到了如下四张照片,确实挺像宫崎骏的风格:

我们也可以看到其他人的一些作品关键词,其实创作出一幅好看的作品,关键词也并不复杂:

三、文心一格还有些新鲜的实验室功能,我们有机会再尝试哈:

四、最后说下如何能够通过赚取电量生成画作?

注册之后,默认有50的电量,所谓电量就是一种内部币种,类似QQ的Q币,用于兑换飞桨文心一格平台上图片生成服务、指定公开画作下载服务、以及其他增值服务等。新人注册默认有50电量,一张画通常都是2电量,可以用来创作25幅画。
要是不想花钱购买电量,我们只要不是很频繁使用AI绘图,完全可以通过每日的签到,画作分享、公开优秀画作来免费赚取电量,满足日常使用。

好了,今天的绘图工具就介绍完了,大家是不是已经跃跃欲试了呢,那就赶快注册来试玩下吧。

国内AI绘图工具大PK:商汤秒画、阿里通义万相和百度文心一格,谁的绘图效果更惊艳?

newsman 发表了文章 • 2023-07-24 17:42 • 来自相关话题

最近我也在试用国内AI大模型方面做得比较好的另外两家的AI文生图产品,他们就是商汤秒画和阿里通义万相,他们都是可以免费注册后使用的,使用起来没太多限制,很方便。再结合我之前推荐的百度文心一格也是免费的,今天咱们就来对比PK一下国内目前这三家的AI绘图能力,看谁画出来的图更好呢。商汤秒画的访问地址是:https://miaohua.sensetime.com/zh-CN通义万相的访问地址是:https://wanxiang.aliyun.com/文心一格的访问地址是:https://yige.baidu.com/好了,大家可以试下注册,注册好之后我们就来开始试用吧。绘画技能PK我们用一样的描述词,来看下三款工具的绘图效果。1、先试下简短的词语:森林里的精灵首先是商汤秒画的效果:接下来是通义万相出场:最后是文心一格出场:这一轮,大家都把自己心目中的精灵画出来了,难分伯仲。2、好,那第二轮换一个词:黑夜,北极星发出一束光照射到大海上,杰作,细节丰富,8K,HDR商汤秒画:通义万相:文心一格:也还是仁者见仁智者见智,各有优势。3、再来一轮PK,描述词:万马奔腾商汤秒画:通义万相:文心一格:个人评价,这轮秒画后面许多马有些失真,万相的扬沙效果做得更好,而文心虽然马的细节做得挺好,但是没有画出万马的感觉。3、再来一个需要一定的知识储备的吧,描述词:武松打虎。商汤秒画:通义万相:文心一格:这轮很明显,只有秒画get到了意思,万相有点闹着玩啊,文心至少画出了老虎,这轮秒画胜出。4、之前看过网友用Midjourney生成各个朝代士兵自拍的图片,挺逼真的,这是效果图,今天我们也拿这三个国产AI绘图工具也来试试看,看跟目前最棒的AI工具的差距还有多少。描述词:公元前1000年,一个秦朝的士兵对着镜头在自拍,穿着盔甲,开心地笑,旁边围着一群士兵,面对镜头也在笑,背景是城墙,上面飘着秦朝的大旗,杰作,细节丰富,HDR,8K画质商汤秒画:通义万相:文心一格:这轮看来,文心偏得有些多呀,秒画和万相虽然感觉不太像秦朝的士兵服装(我们通过秦始皇兵马俑的着装可以找到原版),但整体摄影感觉还是比较真实的。5、最后,我们来试试他们的家居设计能力。描述词:现代简约家居设计,一个客厅,桌子,电视,茶几,阳台,沙发商汤秒画:通义万相:文心一格:整体来讲,都get到了描述词的点,但是个人观点,万相输出的设计更符合主流设计风格,电视机的摆放更合理些。下面我来分别介绍下这三款AI绘图的使用方法:商汤秒画1、我们登录进来后,选择Artist v0.3.0 Beta模型进行绘画,这个是官方团队出品的。至于其他模型,是用户自己再通过一些特定数据集进行训练后的,有些擅长画水墨画、有些擅长出游戏人物,有的擅长画小人书,这个看个人需求。从通用性角度来看,还是官方模型效果最好。2、我们可以选择一次生成的图片数量、分辨率比例、步数一般设置到最大100,画质效果最好。也可以上传参考图,将会按参考图的样子去生成图片。在描述词上输入内容,点击生成即可出图。3、目前来看生成图片数量没有限制,而且可以免费使用。4、我们还可以试下它的图片参考功能,我上传了一个图片,然后输入描述词之后,比如这个天空像一个睡毯,那么得到的效果还是很惊艳的:通义万相1、阿里通义万相需要先申请体验,一般要等几天审核通过,通过后会收到短信通知,即可使用了。2、文本生成图像功能可以输入描述词,目前支持默认、水彩、油画、中国画、扁平插画、二次元、素描、3D卡通八种风格。再选择完一个图片比例后,即可出图了,一次可以生成四张图片。3、还有相似图像生成功能,如果你有一张图片,担心侵权,但有很想用,那么可以上传图片,然后生成一张类似的图片出来,不过这种方式下不可以再输入描述词。比如刚才它生成“龙凤呈祥”效果不是很拉胯嘛,那么把商汤秒画的图作为原图,看下生成的相似图片,终于像两条龙了:4、万相还支持“图像风格迁移”,我们可以上传一个原图,再上传一个风格图,就可以生成以风格图的绘图风格修改的原图了。这种一般可以在模仿画家风格中可以用到。比如我这么尝试了下:5、平台目前还在测试阶段,每天最多可以免费生成50次图,一次4张。至于你喜欢哪一款AI绘图工具,可以自己再尝试下,选择挺多,咱们不一定要用付费的Midjourney,也可以得到不错的效果呢。 查看全部

最近我也在试用国内AI大模型方面做得比较好的另外两家的AI文生图产品,他们就是商汤秒画和阿里通义万相,他们都是可以免费注册后使用的,使用起来没太多限制,很方便。再结合我之前推荐的百度文心一格也是免费的,今天咱们就来对比PK一下国内目前这三家的AI绘图能力,看谁画出来的图更好呢。

商汤秒画的访问地址是:https://miaohua.sensetime.com/zh-CN
通义万相的访问地址是:https://wanxiang.aliyun.com/
文心一格的访问地址是:https://yige.baidu.com/
好了,大家可以试下注册,注册好之后我们就来开始试用吧。

绘画技能PK

我们用一样的描述词,来看下三款工具的绘图效果。

1、先试下简短的词语:森林里的精灵

首先是商汤秒画的效果:

接下来是通义万相出场:

最后是文心一格出场:

这一轮,大家都把自己心目中的精灵画出来了,难分伯仲。

2、好,那第二轮换一个词:黑夜,北极星发出一束光照射到大海上,杰作,细节丰富,8K,HDR

商汤秒画:

通义万相:

文心一格:

也还是仁者见仁智者见智,各有优势。

3、再来一轮PK,描述词:万马奔腾

商汤秒画:

通义万相:

文心一格:

个人评价,这轮秒画后面许多马有些失真,万相的扬沙效果做得更好,而文心虽然马的细节做得挺好,但是没有画出万马的感觉。

3、再来一个需要一定的知识储备的吧,描述词:武松打虎。

商汤秒画:

通义万相:

文心一格:

这轮很明显,只有秒画get到了意思,万相有点闹着玩啊,文心至少画出了老虎,这轮秒画胜出。

4、之前看过网友用Midjourney生成各个朝代士兵自拍的图片,挺逼真的,这是效果图,今天我们也拿这三个国产AI绘图工具也来试试看,看跟目前最棒的AI工具的差距还有多少。

描述词:公元前1000年,一个秦朝的士兵对着镜头在自拍,穿着盔甲,开心地笑,旁边围着一群士兵,面对镜头也在笑,背景是城墙,上面飘着秦朝的大旗,杰作,细节丰富,HDR,8K画质

商汤秒画:

通义万相:

文心一格:

这轮看来,文心偏得有些多呀,秒画和万相虽然感觉不太像秦朝的士兵服装(我们通过秦始皇兵马俑的着装可以找到原版),但整体摄影感觉还是比较真实的。

5、最后,我们来试试他们的家居设计能力。描述词:现代简约家居设计,一个客厅,桌子,电视,茶几,阳台,沙发

商汤秒画:

通义万相:

文心一格:

整体来讲,都get到了描述词的点,但是个人观点,万相输出的设计更符合主流设计风格,电视机的摆放更合理些。

下面我来分别介绍下这三款AI绘图的使用方法:

商汤秒画

1、我们登录进来后,选择Artist v0.3.0 Beta模型进行绘画,这个是官方团队出品的。至于其他模型,是用户自己再通过一些特定数据集进行训练后的,有些擅长画水墨画、有些擅长出游戏人物,有的擅长画小人书,这个看个人需求。从通用性角度来看,还是官方模型效果最好。

2、我们可以选择一次生成的图片数量、分辨率比例、步数一般设置到最大100,画质效果最好。也可以上传参考图,将会按参考图的样子去生成图片。在描述词上输入内容,点击生成即可出图。

3、目前来看生成图片数量没有限制,而且可以免费使用。

4、我们还可以试下它的图片参考功能,我上传了一个图片,然后输入描述词之后,比如这个天空像一个睡毯,那么得到的效果还是很惊艳的:

通义万相

1、阿里通义万相需要先申请体验,一般要等几天审核通过,通过后会收到短信通知,即可使用了。
2、文本生成图像功能可以输入描述词,目前支持默认、水彩、油画、中国画、扁平插画、二次元、素描、3D卡通八种风格。再选择完一个图片比例后,即可出图了,一次可以生成四张图片。
3、还有相似图像生成功能,如果你有一张图片,担心侵权,但有很想用,那么可以上传图片,然后生成一张类似的图片出来,不过这种方式下不可以再输入描述词。比如刚才它生成“龙凤呈祥”效果不是很拉胯嘛,那么把商汤秒画的图作为原图,看下生成的相似图片,终于像两条龙了:

4、万相还支持“图像风格迁移”,我们可以上传一个原图,再上传一个风格图,就可以生成以风格图的绘图风格修改的原图了。这种一般可以在模仿画家风格中可以用到。比如我这么尝试了下:

5、平台目前还在测试阶段,每天最多可以免费生成50次图,一次4张。

至于你喜欢哪一款AI绘图工具,可以自己再尝试下,选择挺多,咱们不一定要用付费的Midjourney,也可以得到不错的效果呢。

苹果手机和苹果电脑上利用「大神水印」下载和管理视频教程

Applealmond 发表了文章 • 2023-06-14 10:23 • 来自相关话题

大家知道iPhone上的Safari及微信内置浏览器均不支持下载视频文件,其实,小编目前还没看到iOS上的哪款浏览器是支持下载视频文件的,哭晕。但是小编发现「大神水印」APP里的「提取视频|图片」功能可以,笑Cry。

下面我们就来介绍如何利用大神水印下载视频或图片。「大神水印」APP苹果下载地址
 
举个例子,如果我们想在苹果手机上下载微博里的视频。我们需要

​1. 打开大神水印APP, 点击首页的「提取视频|图片」 功能
2. 进入提取资源页面后,将复制的链接粘贴到输入框,然后点击提取资源按钮
3. 成功提取后,选择要保存的视频清晰度,然后点击「保存到相册」按钮即可。(如果是图集也支持一键批量保存到相册)
 

  
是不是觉得很完美,是的,苹果手机上用「大神水印」来下载视频图片,是小编目前用过的最省心的方法。如果想了解其他视频下载方法,推荐阅读小编的其他文章哦。
 
PS: 此方法也适用于iPad、iPod和搭载M1芯片的MacBook。 查看全部


大家知道iPhone上的Safari及微信内置浏览器均不支持下载视频文件,其实,小编目前还没看到iOS上的哪款浏览器是支持下载视频文件的,哭晕。但是小编发现「大神水印」APP里的「提取视频|图片」功能可以,笑Cry。


下面我们就来介绍如何利用大神水印下载视频或图片。「大神水印」APP苹果下载地址
 
举个例子,如果我们想在苹果手机上下载微博里的视频。我们需要

​1. 打开大神水印APP, 点击首页的「提取视频|图片」 功能
2. 进入提取资源页面后,将复制的链接粘贴到输入框,然后点击提取资源按钮
3. 成功提取后,选择要保存的视频清晰度,然后点击「保存到相册」按钮即可。(如果是图集也支持一键批量保存到相册)
 

  
是不是觉得很完美,是的,苹果手机上用「大神水印」来下载视频图片,是小编目前用过的最省心的方法。如果想了解其他视频下载方法,推荐阅读小编的其他文章哦。
 
PS: 此方法也适用于iPad、iPod和搭载M1芯片的MacBook。

iOS 17 加入敏感照片侦测功能,裸露、血腥或暴力影像不让你一下就看到

newsman 发表了文章 • 2023-06-12 21:51 • 来自相关话题

苹果在 WWDC 2023 发表了 iOS 17,其中在发表会上也提到一项功能,可以让用户在接收到内容较为敏感的影像时,先以模糊处理的方式隐藏影像里面的内容,不会让你一下子就看到。iOS 17 让裸露、血腥或暴力影像不会一下就被看见苹果在 WWDC 2023 的发表会上有提到,iOS 17 在用户接收到敏感照片的时候,不会直接显示出来,会先以模糊的方式隐藏敏感照片的内容,直到用户按下确定要显示内容的按钮以后才会显示影像。这个「敏感性内容警告」的效果不仅仅对静态的图片有效,包含动态的影像如果有存在敏感性的内容,也会先以模糊处理的方式显示。这个功能目前适用的范围包含 AirDrop、iMessage、FaceTime 甚至是最新的联系人海报都有效果,在 AirDrop 上如果收到包含裸露、血腥、暴力…等消息,就会出现如下图的消息通知,让你方便判断是否要拒收。「敏感性内容警告」所有侦测仅在本机运行没有隐私问题苹果也强调,大家不用担心自己发送的内容会被苹果看到、监控或是外流,因为所有的「敏感性内容警告」侦测、判断行为都是在 iPhone 本机完成,任何的照片、影片都不会上传到云端或是 Apple 的服务器,所以大家可以不用担心传出去的内容会被苹果检查。因为不会上传网络,而且 Apple 的传输也都有端到端加密功能,所以也不会有第三方外流、窃取的疑虑。可自行选择是要开启或关闭此外,「敏感性内容警告」功能不会区分是不是仅限未成年的帐号才可以使用,对于成年者的帐号、iPhone 也一样有效,只是这个功能缺省是没有开启的,必须要从设置中开启才能够开始自动检测敏感性照片。而我自己也已经下载 iOS 17 Beta,但相关的细节不能透露太多,因为实际上当我们下载 Beta 版内容的同时,在隐私条约上有注明开发者预览版的使用体验、功能截屏是不能公开的,所以我只能跟大家说这个功能确实有效。等到公开测试版推出后内容就可以公开了,到时候我会再另外写一篇详细的介绍给大家看。 查看全部

苹果在 WWDC 2023 发表了 iOS 17,其中在发表会上也提到一项功能,可以让用户在接收到内容较为敏感的影像时,先以模糊处理的方式隐藏影像里面的内容,不会让你一下子就看到。

iOS 17 让裸露、血腥或暴力影像不会一下就被看见

苹果在 WWDC 2023 的发表会上有提到,iOS 17 在用户接收到敏感照片的时候,不会直接显示出来,会先以模糊的方式隐藏敏感照片的内容,直到用户按下确定要显示内容的按钮以后才会显示影像。

这个「敏感性内容警告」的效果不仅仅对静态的图片有效,包含动态的影像如果有存在敏感性的内容,也会先以模糊处理的方式显示。

这个功能目前适用的范围包含 AirDrop、iMessage、FaceTime 甚至是最新的联系人海报都有效果,在 AirDrop 上如果收到包含裸露、血腥、暴力…等消息,就会出现如下图的消息通知,让你方便判断是否要拒收。

「敏感性内容警告」所有侦测仅在本机运行没有隐私问题

苹果也强调,大家不用担心自己发送的内容会被苹果看到、监控或是外流,因为所有的「敏感性内容警告」侦测、判断行为都是在 iPhone 本机完成,任何的照片、影片都不会上传到云端或是 Apple 的服务器,所以大家可以不用担心传出去的内容会被苹果检查。

因为不会上传网络,而且 Apple 的传输也都有端到端加密功能,所以也不会有第三方外流、窃取的疑虑。

可自行选择是要开启或关闭

此外,「敏感性内容警告」功能不会区分是不是仅限未成年的帐号才可以使用,对于成年者的帐号、iPhone 也一样有效,只是这个功能缺省是没有开启的,必须要从设置中开启才能够开始自动检测敏感性照片。

而我自己也已经下载 iOS 17 Beta,但相关的细节不能透露太多,因为实际上当我们下载 Beta 版内容的同时,在隐私条约上有注明开发者预览版的使用体验、功能截屏是不能公开的,所以我只能跟大家说这个功能确实有效。

等到公开测试版推出后内容就可以公开了,到时候我会再另外写一篇详细的介绍给大家看。

iOS 17 的 Spotlight Siri 建议加入更多实用的内容选项

newsman 发表了文章 • 2023-06-12 21:48 • 来自相关话题

苹果最新的 iOS 17 已经在 WWDC 2023 结束后正式向所有的开发者发布,只要注册开发者帐号即可免费下载 iOS 17 Beta 版本,我们之前也有分享 iOS 17 更新、升级与安装方式给大家。另外我们也分享过国外的 YouTube 频道测试关于 iOS 17 Beta 电池续航力的测试内容,结果是 iOS 17 Beta 并没有特别耗电,对于 iOS 17 第一版的 Beta 开发者预览版来说算是一个相当不错的表现。苹果也针对 iOS 17 的 Siri 做了改良,虽然台湾还不能用,但是如果使用英文语系的 Siri 甚至可以不用加「Hey」就可以调用 Siri,这样子的调用方式更直觉也更口语。但除了 Siri 的调用方式变了以外,在 Spotlight 里面的 Siri 建议也变得更聪明了。网友分享 iOS 17 的 Siri 建议加入更多选项不知道大家有没有常常在使用 Spotlight 里面的 Siri 建议功能,这个功能会让 Siri 根据你过去的使用习惯,动作,显示相关的内容给你。例如你习惯在 iPhone 连上 AirPods 的时候听音乐,那么当你的 AirPods 连上 iPhone 以后,你下滑叫出 Spotlight 后,Siri 建议这里就会出现与音乐相关的 App。或是你通常晚上都会开 Facebook、跟朋友传消息,那么 Siri 建议就会在晚上的时候推送给你许多社区相关 App。而近日在国外的 Reddit 论坛上就有网友分享,他发现 iOS 17 的 Siri 变得更聪明了。因为他每天都会去特定的某间商店,在更新到 iOS 17 以后,Siri 建议甚至还会显示这间商店的建议项目,这是他过去从来没有看过的。▲ 画面来源:Reddit 网友分享你还可以直接在 Spotlight 的 Siri 建议中看到 Siri 建议的「动作」,像是下面网友分享的截屏,就显示了 Siri 不再只是建议你开启「时钟」App,而是直接建议你「创建计时器」功能。▲ 画面来源:MacRumors因为在过去 Siri 建议比较不会显示到 App 里面的功能,所以这样在操作上会变得比较方便,但我在想初期可能仅有 iOS 内置的 Apple 相关 App 会支持,其他第三方 App 可能会需要等到开发者更新代码以后才有支持吧。虽然目前 iOS 17 还是第一个开发者预览 Developer Beta 版,但其实整体来说表现还算不错,虽然不像 iOS 16 那样有着非常显著的大改版,可是像这些小地方的改变我觉得都蛮实用的,而我们也会在 iOS 17 公开测试版推出后,带大家进一步了解更多关于 iOS 17 的详细内容。 查看全部

苹果最新的 iOS 17 已经在 WWDC 2023 结束后正式向所有的开发者发布,只要注册开发者帐号即可免费下载 iOS 17 Beta 版本,我们之前也有分享 iOS 17 更新、升级与安装方式给大家。

另外我们也分享过国外的 YouTube 频道测试关于 iOS 17 Beta 电池续航力的测试内容,结果是 iOS 17 Beta 并没有特别耗电,对于 iOS 17 第一版的 Beta 开发者预览版来说算是一个相当不错的表现。

苹果也针对 iOS 17 的 Siri 做了改良,虽然台湾还不能用,但是如果使用英文语系的 Siri 甚至可以不用加「Hey」就可以调用 Siri,这样子的调用方式更直觉也更口语。

但除了 Siri 的调用方式变了以外,在 Spotlight 里面的 Siri 建议也变得更聪明了。

网友分享 iOS 17 的 Siri 建议加入更多选项

不知道大家有没有常常在使用 Spotlight 里面的 Siri 建议功能,这个功能会让 Siri 根据你过去的使用习惯,动作,显示相关的内容给你。

例如你习惯在 iPhone 连上 AirPods 的时候听音乐,那么当你的 AirPods 连上 iPhone 以后,你下滑叫出 Spotlight 后,Siri 建议这里就会出现与音乐相关的 App。

或是你通常晚上都会开 Facebook、跟朋友传消息,那么 Siri 建议就会在晚上的时候推送给你许多社区相关 App。

而近日在国外的 Reddit 论坛上就有网友分享,他发现 iOS 17 的 Siri 变得更聪明了。

因为他每天都会去特定的某间商店,在更新到 iOS 17 以后,Siri 建议甚至还会显示这间商店的建议项目,这是他过去从来没有看过的。

▲ 画面来源:Reddit 网友分享

你还可以直接在 Spotlight 的 Siri 建议中看到 Siri 建议的「动作」,像是下面网友分享的截屏,就显示了 Siri 不再只是建议你开启「时钟」App,而是直接建议你「创建计时器」功能。

▲ 画面来源:MacRumors

因为在过去 Siri 建议比较不会显示到 App 里面的功能,所以这样在操作上会变得比较方便,但我在想初期可能仅有 iOS 内置的 Apple 相关 App 会支持,其他第三方 App 可能会需要等到开发者更新代码以后才有支持吧。

虽然目前 iOS 17 还是第一个开发者预览 Developer Beta 版,但其实整体来说表现还算不错,虽然不像 iOS 16 那样有着非常显著的大改版,可是像这些小地方的改变我觉得都蛮实用的,而我们也会在 iOS 17 公开测试版推出后,带大家进一步了解更多关于 iOS 17 的详细内容。

小红书卖养生茶项目,低成本可复制!

newsman 发表了文章 • 2023-06-12 21:41 • 来自相关话题

各位今年一定要好好重视小红书这个平台,主要原因有两点:1、粉丝用户价值高2 、平台变现能力强前几天也在这上面发现了一个赚钱的项目——卖养生茶。这个项目以前在视频号上看到很多,搬到小红书其实一样可以做。养生茶背后解决的是健康问题,目前市场上卖养生茶的基本是解决用户的两大需求:1、养生茶怎么搭配;2、养生茶搭配的作用今天具体给大家拆解下在小红书上引流私域卖养生茶。一、项目原理这项目的基本原理就是从小红书上面发笔记,引流精准客户到微信上面,然后在私域里头做养生茶。养生茶这个品类的毛利润大概是50%-70%,而且重点是复购率很高。需求量也大,据不完全统计,小红书上,“养生茶”相关的笔记70万+篇,关联的商品5万+件;其他泛话题,比如"助眠”、"熬夜"、“养颜”、“暖宫”等养生需求养生笔记在小红书上浩如烟海。其中熬夜”相关的笔记493万+,“熬夜养生”相关的笔记48万+二、项目难度其实对于普通创业者来说,做这个项目目前主要需要解决的有两个问题1、货源问题2、流量这种养生茶,配方不同,功效也不一样。前期选择3 到5款适合女生亚健康的产品茶就可以了。关于货源的话也是跟做小红书无货源一样,可以从1688上进行选品对比。这里就不多说, 接下来我们重点说下流量,具体怎么做笔记内容和引流方法。怎么做内容?查看了很多关于养生茶的笔记,发现很多在小红书关注「养生」的用户多为 18~34岁的年轻女性。其中脱发、内心焦虑、失眠、作息不规律大多数用户会遇到的问题,面对这些问题,想要通过食料来调理解决。那么针对这些问题,文案内容很简单,根据上面说的这些问题,用关键词搜索同行的作品内容,提炼出高赞模板,然后润色改动,添加对应的话题来增加笔记曝光率。引流的三种方法1、广告分发,铺量用别人的账号来发广告,一般情况下,给他对应的报酬或者产品,让他给我们发一次广告,如茶元子店铺就是这个模式。2、小红书粉丝群引导用主号创建一个粉丝群聊,引导用户加入群聊,然后用一个小号定期在群里发消息,引导用户添加威信的路径,这个方法目前来说相对比较安全。3、评论区小号引导小号引流,可以注册一个小号,头像设置为一模一样的,名字可以设置为XXX助理、XXX小号,然后在用小号去评论作品。客户来了后,后端怎么成交?先提前打造好朋友圈,在朋友圈塑造养生花茶价值。话术和文案可以从同行那边模仿和收集。、要知道,养生产品是高复购的一类产品,效果好不好一时也不好说,但只要客户信任你,吃完了之后,还会找你来买。 查看全部

各位今年一定要好好重视小红书这个平台,主要原因有两点:

1、粉丝用户价值高

2 、平台变现能力强

前几天也在这上面发现了一个赚钱的项目——卖养生茶。

这个项目以前在视频号上看到很多,搬到小红书其实一样可以做。

养生茶背后解决的是健康问题,目前市场上卖养生茶的基本是解决用户的两大需求:

1、养生茶怎么搭配;2、养生茶搭配的作用

今天具体给大家拆解下在小红书上引流私域卖养生茶。

一、项目原理

这项目的基本原理就是从小红书上面发笔记,引流精准客户到微信上面,然后在私域里头做养生茶。

养生茶这个品类的毛利润大概是50%-70%,而且重点是复购率很高。

需求量也大,据不完全统计,小红书上,“养生茶”相关的笔记70万+篇,关联的商品5万+件;

其他泛话题,比如"助眠”、"熬夜"、“养颜”、“暖宫”等养生需求养生笔记在小红书上浩如烟海。其中熬夜”相关的笔记493万+,“熬夜养生”相关的笔记48万+

二、项目难度

其实对于普通创业者来说,做这个项目目前主要需要解决的有两个问题

1、货源问题

2、流量

这种养生茶,配方不同,功效也不一样。前期选择3 到5款适合女生亚健康的产品茶就可以了。

关于货源的话也是跟做小红书无货源一样,可以从1688上进行选品对比。

这里就不多说, 接下来我们重点说下流量,具体怎么做笔记内容和引流方法。

怎么做内容?

查看了很多关于养生茶的笔记,发现很多在小红书关注「养生」的用户多为 18~34岁的年轻女性。

其中脱发、内心焦虑、失眠、作息不规律大多数用户会遇到的问题,面对这些问题,想要通过食料来调理解决。

那么针对这些问题,文案内容很简单,根据上面说的这些问题,用关键词搜索同行的作品内容,提炼出高赞模板,然后润色改动,添加对应的话题来增加笔记曝光率。

引流的三种方法

1、广告分发,铺量

用别人的账号来发广告,一般情况下,给他对应的报酬或者产品,让他给我们发一次广告,如茶元子店铺就是这个模式。

2、小红书粉丝群引导

用主号创建一个粉丝群聊,引导用户加入群聊,然后用一个小号定期在群里发消息,引导用户添加威信的路径,这个方法目前来说相对比较安全。

3、评论区小号引导

小号引流,可以注册一个小号,头像设置为一模一样的,名字可以设置为XXX助理、XXX小号,然后在用小号去评论作品。

客户来了后,后端怎么成交?

先提前打造好朋友圈,在朋友圈塑造养生花茶价值。话术和文案可以从同行那边模仿和收集。、

要知道,养生产品是高复购的一类产品,效果好不好一时也不好说,但只要客户信任你,吃完了之后,还会找你来买。

如何将ChatGPT用作语言翻译工具

Applealmond 发表了文章 • 2023-05-30 22:22 • 来自相关话题

您可以使用ChatGPT进行许多事情,准确和上下文相关的语言翻译就是其中之一。
 
尽管ChatGPT并非专门用于翻译,但这款AI聊天机器人正在迅速成为一个可靠的翻译工具。它在许多语言的大型文本语料库上进行了训练,并部署在对话界面上,ChatGPT在翻译方面提供了无与伦比的灵活性,远远超过传统的翻译工具。

然而,为了充分发挥ChatGPT作为翻译工具的优势,您需要在提示方面有所创意。我们已经完成了艰苦的部分——以下是如何从ChatGPT中获得最佳翻译结果。
 
为什么要使用ChatGPT进行翻译?

谷歌翻译、微软翻译和DeepL是互联网上最受欢迎的翻译服务之一。此外,还有数十种翻译服务,所有这些服务都提供了令人印象深刻的准确性、免费使用和覆盖数十种语言。那么为什么要选择ChatGPT呢?ChatGPT是一款好的翻译工具的特点是什么呢?

与几乎所有流行的翻译工具不同,ChatGPT的交互性质使其成为一款杰出的翻译工具。使用其他翻译工具时,您提供一段文本,您会得到一份翻译,这就是全部。无论它是否是您能得到的最佳翻译都无关紧要——您只能使用它。

而ChatGPT则允许您根据您的具体需求自定义翻译,并提供反馈意见以便进行调整。例如,您可以调整语气和风格,并考虑单词的一些文化内涵和区域差异,而这是专门设计的翻译工具如谷歌翻译所无法做到的。

如果您想知道ChatGPT与谷歌翻译相比作为翻译工具的优缺点,可以参考ChatGPT与谷歌翻译的比较。
 
如何使用ChatGPT进行翻译

使用ChatGPT进行翻译非常简单。您只需要提供要翻译的文本,指定要翻译的语言,然后ChatGPT将处理剩下的工作。

1. 提供上下文

ChatGPT相比于像谷歌翻译这样的流行翻译工具的一个关键优势是,在生成翻译时能够准确考虑文本的上下文。考虑上下文可以使翻译成为仅仅翻译句子中的单个单词和生成真正反映作者或发言者意图的翻译之间的区别。

例如,西班牙语句子“Gracias por preguntar, pero estoy bastante seguro aquí” 。谷歌翻译将其翻译为“Thanks for asking, but I'm pretty sure here” 。虽然这并没有完全错误,但是根据上下文,这句话可能意味着“感谢您的询问,但我在这里很安全”。

当然,无论您尝试多少次翻译,谷歌翻译都会提供相同的翻译,因为它没有识别上下文细微差别的方法。如上所述,ChatGPT将尝试根据提供的上下文提供最准确的翻译。提供上下文可以显著提高翻译的质量。如果您不确定如何提供上下文,以下是一些启示:
 
“将[要翻译的菲律宾文本]从一个菲律宾本地人的角度翻译为英语”,应尽可能保持翻译中的许多文化内涵。“将[要翻译的文本]从讨论COVID-19大流行病的角度翻译为英语”,应使用适当的医学术语而不是通用词汇。“将[要翻译的文本]翻译为英语。该文本讨论二战中的一场战斗”,应使用适当的军事和历史术语。
 

 
2. 声明文本类型

另一个可以提高翻译准确性的重要因素是明确声明您要翻译的文本类型。例如,它是成语、歌曲、财务文件还是普通文本?只需让ChatGPT知道您要翻译什么,就可以让聊天机器人在提供更准确的翻译方面有所优势。

您可以使用以下替代方案,而不是简单地使用“将[要翻译的文本]翻译为[目标语言]”这样的提示:
 
将引号中的[财务报告|诗歌|歌曲|圣经段落|谚语]翻译为[目标语言]将[要翻译的文本]翻译为[目标语言]。要翻译的文本是[军事报告|医疗文件|药物处方]。
 
上述或类似的提示帮助ChatGPT在生成翻译时使用相关的或行业特定的上下文。虽然ChatGPT有时会识别出正确的行业词汇用于翻译,但有时您必须明确提示它使用类型声明来这样做。
 
3. 使用风格转移

有时,在翻译文本时,翻译可能过于技术性或简单不适合目标受众。在ChatGPT中使用风格转移可以帮助调整翻译的语调和风格,以适应目标受众或行业。因此,如果您正在翻译一份法律文件,翻译可以保留作者的原意,同时使用更通俗的措辞。在下面的例子中,我将一篇足球评论从西班牙语翻译成英语,首先不使用风格转移,然后使用风格转移。
 
要在翻译时使用风格转移,请使用以下提示:
 
将[要翻译的文本]用通俗易懂的语言翻译为[目标语言]。将[要翻译的文本]翻译为[目标语言]以适应[5年级]的受众。将[要翻译的文本]翻译为[目标语言]。使用风格转移使翻译后的文本适合于[目标受众]。
 
4. 考虑地区差异

某些单词可能因说话者所在的地区或国家而具有不同的含义或内涵。例如,英语句子“I'm going to play football”可以翻译为“我要去踢足球(Wǒ yào qù tī zúqiú)”在中文中。虽然这似乎是完美的翻译,但如果说话者是美国人,翻译可能是错误的。通过说“football”,美国人可能指的是橄榄球式的运动,而不是其他国家通称的足球。

常规翻译工具无法考虑到这种潜在的误解。另一方面,ChatGPT可以根据说话者的来源提供不同的翻译。

我们提示ChatGPT将“I'm going to play football”翻译成中文。正如预期的那样,它产生了“我要去踢足球(Wǒ yào qù tī zúqiú)”。在中文中,“zúqiú”意味着“足球”,这指的是足球而不是橄榄球式的运动。


 
我们重复翻译提示,但添加了关于说话者来源和可能意图的提示。这次,ChatGPT将翻译更改为“我要去踢橄榄球(Wǒ yào qù tī gǎnlǎnqiú)”,这次使用“gǎnlǎnqiú”,这是中文中的美式足球术语,更好地反映了说话者的潜在意图。
 
5. 使用摘要翻译

有时,您不想阅读整篇文本,只想理解作者或演讲者试图传达的信息。在这种情况下,ChatGPT是您可以信赖的少数翻译工具之一。要获得摘要翻译,请要求ChatGPT提供目标文本的“摘要”或“简化”翻译。一些提示示例包括:
 
提供[要翻译的文本]的西班牙语描述性但简化的翻译。提供[要翻译的文本]的法语摘要翻译。提供[要翻译的文本]的英语摘要翻译。将这篇文章翻译成荷兰语,但只包括关键点。
 
6. 使用Fine-Tuned版的ChatGPT

使用Fine-Tuned版的ChatGPT是利用AI聊天机器人进行翻译的最佳方法之一。它为使用ChatGPT进行翻译打开了几乎无限的可能性。但是,如何为翻译Fine-Tuned版的ChatGPT进行Fine-Tune呢?

您可以通过多种方式来完成。Fine-Tuned ChatGPT进行翻译的关键组成部分之一是在提供任何文本进行翻译时设定ChatGPT必须遵循的规则。例如,您可以通过提供单词-翻译对或文本-翻译对来对ChatGPT进行Fine-Tune。以下是一个例子:

在试图将一段Pidgin文本翻译成英语时,我们遇到了一些错误翻译的单词。提供以下单词-翻译对使ChatGPT在随后的翻译中更新了这些单词的翻译。



您还可以通过提供几个大型文本及其经过验证的翻译来使ChatGPT翻译更加准确。然后,您可以提示ChatGPT从提供的样本中推断出单词和短语的正确翻译,并在涉及类似语言对的文本翻译时应用它。虽然您可以使用更长的文本来Fine-Tune ChatGPT的翻译,但以下是一个简短的示例说明其工作原理。
 


每次提示时,我们都获得了更准确的翻译,而无需采取进一步的步骤。

不要完全依赖机器翻译

虽然ChatGPT是一个令人印象深刻的翻译工具,但请记住它仍然是一个机器,并不总是能产生最佳的翻译。因此,尤其是对于重要或敏感的文档,不要完全依赖它。相反,尝试结合使用多种工具,并尽可能考虑使用专业翻译人员进行校对以确保准确性。
  查看全部
您可以使用ChatGPT进行许多事情,准确和上下文相关的语言翻译就是其中之一。
 
尽管ChatGPT并非专门用于翻译,但这款AI聊天机器人正在迅速成为一个可靠的翻译工具。它在许多语言的大型文本语料库上进行了训练,并部署在对话界面上,ChatGPT在翻译方面提供了无与伦比的灵活性,远远超过传统的翻译工具。

然而,为了充分发挥ChatGPT作为翻译工具的优势,您需要在提示方面有所创意。我们已经完成了艰苦的部分——以下是如何从ChatGPT中获得最佳翻译结果。
 
为什么要使用ChatGPT进行翻译?

谷歌翻译、微软翻译和DeepL是互联网上最受欢迎的翻译服务之一。此外,还有数十种翻译服务,所有这些服务都提供了令人印象深刻的准确性、免费使用和覆盖数十种语言。那么为什么要选择ChatGPT呢?ChatGPT是一款好的翻译工具的特点是什么呢?

与几乎所有流行的翻译工具不同,ChatGPT的交互性质使其成为一款杰出的翻译工具。使用其他翻译工具时,您提供一段文本,您会得到一份翻译,这就是全部。无论它是否是您能得到的最佳翻译都无关紧要——您只能使用它。

而ChatGPT则允许您根据您的具体需求自定义翻译,并提供反馈意见以便进行调整。例如,您可以调整语气和风格,并考虑单词的一些文化内涵和区域差异,而这是专门设计的翻译工具如谷歌翻译所无法做到的。

如果您想知道ChatGPT与谷歌翻译相比作为翻译工具的优缺点,可以参考ChatGPT与谷歌翻译的比较。
 
如何使用ChatGPT进行翻译

使用ChatGPT进行翻译非常简单。您只需要提供要翻译的文本,指定要翻译的语言,然后ChatGPT将处理剩下的工作。

1. 提供上下文

ChatGPT相比于像谷歌翻译这样的流行翻译工具的一个关键优势是,在生成翻译时能够准确考虑文本的上下文。考虑上下文可以使翻译成为仅仅翻译句子中的单个单词和生成真正反映作者或发言者意图的翻译之间的区别。

例如,西班牙语句子“Gracias por preguntar, pero estoy bastante seguro aquí” 。谷歌翻译将其翻译为“Thanks for asking, but I'm pretty sure here” 。虽然这并没有完全错误,但是根据上下文,这句话可能意味着“感谢您的询问,但我在这里很安全”。

当然,无论您尝试多少次翻译,谷歌翻译都会提供相同的翻译,因为它没有识别上下文细微差别的方法。如上所述,ChatGPT将尝试根据提供的上下文提供最准确的翻译。提供上下文可以显著提高翻译的质量。如果您不确定如何提供上下文,以下是一些启示:
 
  • “将[要翻译的菲律宾文本]从一个菲律宾本地人的角度翻译为英语”,应尽可能保持翻译中的许多文化内涵。
  • “将[要翻译的文本]从讨论COVID-19大流行病的角度翻译为英语”,应使用适当的医学术语而不是通用词汇。
  • “将[要翻译的文本]翻译为英语。该文本讨论二战中的一场战斗”,应使用适当的军事和历史术语。

 

 
2. 声明文本类型

另一个可以提高翻译准确性的重要因素是明确声明您要翻译的文本类型。例如,它是成语、歌曲、财务文件还是普通文本?只需让ChatGPT知道您要翻译什么,就可以让聊天机器人在提供更准确的翻译方面有所优势。

您可以使用以下替代方案,而不是简单地使用“将[要翻译的文本]翻译为[目标语言]”这样的提示:
 
  • 将引号中的[财务报告|诗歌|歌曲|圣经段落|谚语]翻译为[目标语言]
  • 将[要翻译的文本]翻译为[目标语言]。要翻译的文本是[军事报告|医疗文件|药物处方]。

 
上述或类似的提示帮助ChatGPT在生成翻译时使用相关的或行业特定的上下文。虽然ChatGPT有时会识别出正确的行业词汇用于翻译,但有时您必须明确提示它使用类型声明来这样做。
 
3. 使用风格转移

有时,在翻译文本时,翻译可能过于技术性或简单不适合目标受众。在ChatGPT中使用风格转移可以帮助调整翻译的语调和风格,以适应目标受众或行业。因此,如果您正在翻译一份法律文件,翻译可以保留作者的原意,同时使用更通俗的措辞。在下面的例子中,我将一篇足球评论从西班牙语翻译成英语,首先不使用风格转移,然后使用风格转移。
 
要在翻译时使用风格转移,请使用以下提示:
 
  • 将[要翻译的文本]用通俗易懂的语言翻译为[目标语言]。
  • 将[要翻译的文本]翻译为[目标语言]以适应[5年级]的受众。
  • 将[要翻译的文本]翻译为[目标语言]。使用风格转移使翻译后的文本适合于[目标受众]。

 
4. 考虑地区差异

某些单词可能因说话者所在的地区或国家而具有不同的含义或内涵。例如,英语句子“I'm going to play football”可以翻译为“我要去踢足球(Wǒ yào qù tī zúqiú)”在中文中。虽然这似乎是完美的翻译,但如果说话者是美国人,翻译可能是错误的。通过说“football”,美国人可能指的是橄榄球式的运动,而不是其他国家通称的足球。

常规翻译工具无法考虑到这种潜在的误解。另一方面,ChatGPT可以根据说话者的来源提供不同的翻译。

我们提示ChatGPT将“I'm going to play football”翻译成中文。正如预期的那样,它产生了“我要去踢足球(Wǒ yào qù tī zúqiú)”。在中文中,“zúqiú”意味着“足球”,这指的是足球而不是橄榄球式的运动。


 
我们重复翻译提示,但添加了关于说话者来源和可能意图的提示。这次,ChatGPT将翻译更改为“我要去踢橄榄球(Wǒ yào qù tī gǎnlǎnqiú)”,这次使用“gǎnlǎnqiú”,这是中文中的美式足球术语,更好地反映了说话者的潜在意图。
 
5. 使用摘要翻译

有时,您不想阅读整篇文本,只想理解作者或演讲者试图传达的信息。在这种情况下,ChatGPT是您可以信赖的少数翻译工具之一。要获得摘要翻译,请要求ChatGPT提供目标文本的“摘要”或“简化”翻译。一些提示示例包括:
 
  • 提供[要翻译的文本]的西班牙语描述性但简化的翻译。
  • 提供[要翻译的文本]的法语摘要翻译。
  • 提供[要翻译的文本]的英语摘要翻译。
  • 将这篇文章翻译成荷兰语,但只包括关键点。

 
6. 使用Fine-Tuned版的ChatGPT

使用Fine-Tuned版的ChatGPT是利用AI聊天机器人进行翻译的最佳方法之一。它为使用ChatGPT进行翻译打开了几乎无限的可能性。但是,如何为翻译Fine-Tuned版的ChatGPT进行Fine-Tune呢?

您可以通过多种方式来完成。Fine-Tuned ChatGPT进行翻译的关键组成部分之一是在提供任何文本进行翻译时设定ChatGPT必须遵循的规则。例如,您可以通过提供单词-翻译对或文本-翻译对来对ChatGPT进行Fine-Tune。以下是一个例子:

在试图将一段Pidgin文本翻译成英语时,我们遇到了一些错误翻译的单词。提供以下单词-翻译对使ChatGPT在随后的翻译中更新了这些单词的翻译。



您还可以通过提供几个大型文本及其经过验证的翻译来使ChatGPT翻译更加准确。然后,您可以提示ChatGPT从提供的样本中推断出单词和短语的正确翻译,并在涉及类似语言对的文本翻译时应用它。虽然您可以使用更长的文本来Fine-Tune ChatGPT的翻译,但以下是一个简短的示例说明其工作原理。
 


每次提示时,我们都获得了更准确的翻译,而无需采取进一步的步骤。

不要完全依赖机器翻译

虽然ChatGPT是一个令人印象深刻的翻译工具,但请记住它仍然是一个机器,并不总是能产生最佳的翻译。因此,尤其是对于重要或敏感的文档,不要完全依赖它。相反,尝试结合使用多种工具,并尽可能考虑使用专业翻译人员进行校对以确保准确性。
 

聊天标记语言(ChatML)的介绍

newsman 发表了文章 • 2023-05-21 18:17 • 来自相关话题

OpenAI的公告集中在几个主要点上:
 
托管API的价格显著下降,自2022年12月以来,ChatGPT的成本降低了90%。
 
通过Azure托管的API很可能具有非常细粒度的管理,并提供区域和地理可用区。这为API提供了显著的增值潜力。
 
ASR供应商面临着越来越大的压力,需要通过卓越而个性化的支持、细粒度的微调、支持利基少数语言等方面建立差异化。
 
Whisper和ChatGPT的API使得实施和实验变得更加容易。Whisper的易用性使得ChatGPT可以包括语音数据,而不仅限于文本数据。
 
允许您访问特定的模型版本,并在需要时进行升级,从而暴露了模型的变化和更新。这为生产实施引入了稳定性。
 
这些变化表明了LLM环境日益成熟的趋势。
 
回到聊天标记语言(ChatML)的话题,我认为引入ChatML具有极其重要的意义,原因如下:
 
LLMs存在的主要安全漏洞和滥用方式是指令注入攻击。ChatML将允许对这些攻击进行保护。
 
为了抵御指令注入攻击,对话被分隔为不同的层级或角色:

- 系统(System)
- 助手(assistant)
- 用户,等等。
 
这只是ChatML的第一个版本,未来还有重要的发展计划。
 
ChatML目前仅支持文本类型的有效载荷,但OpenAI预计将引入其他数据类型。这与大型基础模型很快将开始结合文本、图像、声音等的理念保持一致。

用户仍然可以使用不安全的原始字符串格式,但这种格式天生容易受到注入攻击。
 
OpenAI处于理想的位置,以负责任的方式引导和管理LLM领域的发展。为创建应用程序奠定基础标准。

ChatML明确告诉模型每个文本片段的来源,特别显示了人类文本和AI文本之间的界限。

这为减轻和最终解决注入问题提供了机会,因为模型可以识别出开发者、用户或自身输入的指令。 ~ OpenAI
 
以下是一个具有系统(system)、用户(user)和助手(assistant)角色定义的ChatML示例JSON文件:
 [{"role": "system",
"content" : "You are ChatGPT, a large language model trained by OpenAI. Answer as concisely as possible.\nKnowledge cutoff: 2021-09-01\nCurrent date: 2023-03-02"},
{"role": "user",
"content" : "How are you?"},
{"role": "assistant",
"content" : "I am doing well"},
{"role": "user",
"content" : "What is the mission of the company OpenAI?"}]

以下是一个使用Python的代码片段来处理ChatML示例文件:pip install openai

import os
import openai
openai.api_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

completion = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages = [{"role": "system", "content" : "You are ChatGPT, a large language model trained by OpenAI. Answer as concisely as possible.\nKnowledge cutoff: 2021-09-01\nCurrent date: 2023-03-02"},
{"role": "user", "content" : "How are you?"},
{"role": "assistant", "content" : "I am doing well"},
{"role": "user", "content" : "What is the mission of the company OpenAI?"}]
)
#print(completion)
print(completion)


根据下面的输出,请注意所定义的角色,模型细节为gpt-3.5-turbo-0301以及其他详细信息。{
"choices": [
{
"finish_reason": "stop",
"index": 0,
"message": {
"content": "The mission of OpenAI is to ensure that artificial intelligence (AI) benefits humanity as a whole, by developing and promoting friendly AI for everyone, researching and mitigating risks associated with AI, and helping shape the policy and discourse around AI.",
"role": "assistant"
}
}
],
"created": 1677751157,
"id": "chatcmpl-6pa0TlU1OFiTKpSrTRBbiGYFIl0x3",
"model": "gpt-3.5-turbo-0301",
"object": "chat.completion",
"usage": {
"completion_tokens": 50,
"prompt_tokens": 84,
"total_tokens": 134
}
}
构建基于LLMs的对话界面的一个挑战之一是将提示节点按顺序组成链条的概念。

节点之间的边缘由于输入的非结构化特性而难以管理。而且输入通常是自然语言或对话,这本质上是非结构化的。

ChatML将极大地帮助创建一个标准目标,用于将数据转换为链条的形式进行提交。
  查看全部
OpenAI的公告集中在几个主要点上:
 
托管API的价格显著下降,自2022年12月以来,ChatGPT的成本降低了90%。
 
通过Azure托管的API很可能具有非常细粒度的管理,并提供区域和地理可用区。这为API提供了显著的增值潜力。
 
ASR供应商面临着越来越大的压力,需要通过卓越而个性化的支持、细粒度的微调、支持利基少数语言等方面建立差异化。
 
Whisper和ChatGPT的API使得实施和实验变得更加容易。Whisper的易用性使得ChatGPT可以包括语音数据,而不仅限于文本数据。
 
允许您访问特定的模型版本,并在需要时进行升级,从而暴露了模型的变化和更新。这为生产实施引入了稳定性。
 
这些变化表明了LLM环境日益成熟的趋势。
 
回到聊天标记语言(ChatML)的话题,我认为引入ChatML具有极其重要的意义,原因如下:
 
LLMs存在的主要安全漏洞和滥用方式是指令注入攻击。ChatML将允许对这些攻击进行保护。
 
为了抵御指令注入攻击,对话被分隔为不同的层级或角色:

- 系统(System)
- 助手(assistant)
- 用户,等等。
 
这只是ChatML的第一个版本,未来还有重要的发展计划。
 
ChatML目前仅支持文本类型的有效载荷,但OpenAI预计将引入其他数据类型。这与大型基础模型很快将开始结合文本、图像、声音等的理念保持一致。

用户仍然可以使用不安全的原始字符串格式,但这种格式天生容易受到注入攻击。
 
OpenAI处于理想的位置,以负责任的方式引导和管理LLM领域的发展。为创建应用程序奠定基础标准。

ChatML明确告诉模型每个文本片段的来源,特别显示了人类文本和AI文本之间的界限。

这为减轻和最终解决注入问题提供了机会,因为模型可以识别出开发者、用户或自身输入的指令。 ~ OpenAI
 
以下是一个具有系统(system)、用户(user)和助手(assistant)角色定义的ChatML示例JSON文件:
 
[{"role": "system", 
"content" : "You are ChatGPT, a large language model trained by OpenAI. Answer as concisely as possible.\nKnowledge cutoff: 2021-09-01\nCurrent date: 2023-03-02"},
{"role": "user",
"content" : "How are you?"},
{"role": "assistant",
"content" : "I am doing well"},
{"role": "user",
"content" : "What is the mission of the company OpenAI?"}]


以下是一个使用Python的代码片段来处理ChatML示例文件:
pip install openai

import os
import openai
openai.api_key = "xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

completion = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages = [{"role": "system", "content" : "You are ChatGPT, a large language model trained by OpenAI. Answer as concisely as possible.\nKnowledge cutoff: 2021-09-01\nCurrent date: 2023-03-02"},
{"role": "user", "content" : "How are you?"},
{"role": "assistant", "content" : "I am doing well"},
{"role": "user", "content" : "What is the mission of the company OpenAI?"}]
)
#print(completion)
print(completion)


根据下面的输出,请注意所定义的角色,模型细节为gpt-3.5-turbo-0301以及其他详细信息。
{
"choices": [
{
"finish_reason": "stop",
"index": 0,
"message": {
"content": "The mission of OpenAI is to ensure that artificial intelligence (AI) benefits humanity as a whole, by developing and promoting friendly AI for everyone, researching and mitigating risks associated with AI, and helping shape the policy and discourse around AI.",
"role": "assistant"
}
}
],
"created": 1677751157,
"id": "chatcmpl-6pa0TlU1OFiTKpSrTRBbiGYFIl0x3",
"model": "gpt-3.5-turbo-0301",
"object": "chat.completion",
"usage": {
"completion_tokens": 50,
"prompt_tokens": 84,
"total_tokens": 134
}
}

构建基于LLMs的对话界面的一个挑战之一是将提示节点按顺序组成链条的概念。

节点之间的边缘由于输入的非结构化特性而难以管理。而且输入通常是自然语言或对话,这本质上是非结构化的。

ChatML将极大地帮助创建一个标准目标,用于将数据转换为链条的形式进行提交。