Otter
otter.ai
Otter 是一款智能笔记应用程序,可帮助您记住、搜索和分享您的语音对话。 Otter 创建的智能语音笔记结合了音频、转录、说话人识别、内联照片和关键短语。它可以帮助商务人士、记者和学生在会议、采访、讲座以及任何重要对话中更加专注、协作和高效。
Google Cloud Platform
google.com
Google提供的Google Cloud Platform(GCP)是一套云计算服务的套件,该服务在与Google内部用于其最终用户产品的基础架构上运行,例如Google Search,Gmail,Files Storage和YouTube。除了一组管理工具外,它还提供了一系列模块化云服务,包括计算,数据存储,数据分析和机器学习。注册需要信用卡或银行帐户详细信息。GoogleCloud Platform提供基础架构作为服务,平台作为服务以及无服务器的计算环境。 2008年4月,Google宣布了App Engine,该平台用于在Google管理的数据中心开发和托管Web应用程序,这是该公司的首个云计算服务。该服务通常于2011年11月获得。自App Engine发布以来,Google向平台添加了多个云服务。 Google Cloud Platform是Google Cloud的一部分,其中包括Google Cloud Platform公共云基础架构以及G Suite,Android和Chrome OS的企业版本以及用于机器学习和企业映射服务的应用程序编程接口(API)。
Jasper
jasper.ai
Jasper:商业品牌人工智能始终以您的品牌声音在您在线的任何地方创建内容。 Jasper 是您的创意人工智能助手,可以以您独特的品牌语气学习和写作。无论你是大胆地、厚脸皮地、正式地说话,还是只在网上说话(u do u)。此外,Jasper Everywhere 浏览器扩展使 Jasper 始终陪伴在您身边,从 CMS 到电子邮件、社交媒体,再到使用 Jasper API 的您自己的公司平台。 最重要的是,Jasper 具有随着安全协议的发展而保持最新的内置安全功能,可确保您的数据安全和私密。 利用人工智能创建内容的速度提高 5 倍。 Jasper 是最高质量的 AI 文案工具,拥有超过 3,000 条 5 星级评论。最适合撰写博客文章、社交媒体内容和营销文案。
SpeechTexter
speechtexter.com
语音到文本转换器。用你的声音听写。用于使用语音打字的免费网络应用程序。支持 70 多种不同语言!
Speechnotes
speechnotes.co
语音转文本 - 语音输入和转录。 免费用语音做笔记,或当场自动转录音频和视频录音。安全、准确且超快。
Notta
notta.ai
Notta 是一款领先的 AI 转录工具和会议记录工具,可帮助将任何语音对话快速转录和总结为可操作的文本,支持 58 种语言。 * 重要消息:Airgram 已加入 Notta!除了转录视频/音频文件、现场演讲之外,Notta 还与 Zoom、Microsoft Teams 和 Google Meet 等领先的视频会议平台集成,以生成自动会议记录。它还允许用户查看、搜索、编辑、导出记录并与团队成员共享记录,以实现无缝协作。 Notta 使您能够最大限度地发挥每次对话的价值。
Krisp
krisp.ai
Krisp 是一款智能应用程序,旨在提高在线会议和通话的效率和清晰度。主要是利用人工智能进行降噪,有效消除在线交互过程中的背景噪音、语音和回声。 此功能可确保在各种环境下(从个人对话到团队会议和呼叫中心)进行清晰、高质量的通信。除了噪音消除之外,Krisp 还提供实时会议转录,这提高了可访问性并有助于维护记录。 此外,它还具备生成简洁会议笔记和摘要的能力,有效充当AI会议助手。另一个值得注意的功能是 Krisp 的会议录制功能,它可以自动录制所有通信应用程序中的虚拟会议。 Krisp 专门针对呼叫中心环境提供了 AI 口音本地化功能,可以实时转换座席的口音以匹配客户的母语口音,从而实现更清晰的沟通。 它还可以安全地实时转录代理和客户的对话。使用为开发人员提供的 SDK,可以将应用程序的服务集成到各种产品中。 作为一款多功能人工智能工具,Krisp 满足了广泛的用户需求,包括个人、自由职业者、混合工作团队、销售团队、专业服务和呼叫中心。
DeepAI
deepai.org
为天生富有创造力的人类提供人工智能工具
Jammable
jammable.com
通过 Jammable 在几秒钟内使用 AI 创建 AI 封面,数百个社区上传的 AI 语音模型可供创意使用!
Resemble.ai
resemble.ai
Resemble AI 使用专有的深度学习模型创建自定义 AI 语音,该模型使用文本转语音和语音转语音合成来生成高质量的 AI 生成的音频内容。 Resemble Localize 是我们的多语言本地化工具,可以翻译文本并将您的 AI 语音转换为多达 100 种语言。 Resemble Fill 是我们的生成填充(音频修复)功能,使您能够使用克隆的 AI 语音修改现有语音。 Fill 可用于修改程序化音频广告、动态流媒体广告插入 (SAI)、语音助手等。 最近,我们凭借语音 AI 对 Netflix 获得艾美奖提名的《安迪·沃霍尔日记》的贡献,荣获 2023 年威比奖“最佳语音技术应用奖”。 除了 Netflix 之外,我们还与 Byju's、世界银行集团、Boingo、环球影业、派拉蒙影业等合作。
ServiceNow
servicenow.com
ServiceNow(纽约证券交易所代码:NOW)让世界为每个人提供更好的服务。我们基于云的平台和解决方案可帮助组织数字化和统一,以便他们能够找到更智能、更快、更好的方法来实现工作流程。因此,员工和客户可以更加紧密地联系、更加创新、更加敏捷。我们都可以创造我们想象的未来。世界与 ServiceNow 合作。
Speech to Note
speechtonote.com
Speech To Note 是一款人工智能驱动的语音识别工具,可立即将语音转换为文本。我们的工具使用先进的语音转文本技术将您的文字转录成您可以编辑或共享的简洁摘要。 体验我们人工智能驱动工具的强大功能,它可以立即将您的口语转化为简洁且信息丰富的摘要。
PromptSmart
promptsmart.com
PromptSmart 是一款提词器应用程序,可跟随您的声音,帮助您制作视频或演示文稿。 PromptSmart 是首款具有语音识别功能的提词器应用程序 - 最先进的公共演讲工具! 2014 年 8 月推出! PromptSmart 的诞生源于对公开演讲的热情。 PromptSmart 的创始人对 MBA 学生进行公开演讲艺术的指导和指导。我们意识到直观的扬声器控制提词器可以更好地支持许多演讲者,因此我们还认识到当今的移动设备可以满足这一需求。考虑到这一点,PromptSmart 应运而生。 PromptSmart 还满足了喜欢使用笔记而不是完整书面演讲的演讲者的需求。我们设计了数字记录卡功能,让演讲者通过跟踪要涵盖的关键信息来保持重点。 最终结果是 PromptSmart 成为适合任何演讲者风格的最先进的公开演讲工具!
Clarifai
clarifai.com
Clarifai 是一家独立的人工智能公司,专注于计算机视觉、自然语言处理和音频识别。 Clarifai 成立于 2013 年,是最早成立的深度学习平台之一,为非结构化图像、视频、文本和音频数据提供人工智能平台。其平台支持整个人工智能生命周期,包括图像、视频、文本和音频数据的数据探索、数据标记、模型训练、评估和推理。 Clarifai 总部位于华盛顿特区,利用机器学习和深度神经网络自动识别和分析图像、视频、文本和音频。 Clarifai 使用户能够通过 API、移动 SDK 和/或本地解决方案将人工智能技术应用到他们的产品中。
Gladia
gladia.io
Gladia 是一个人工智能知识基础设施平台,提供即插即用的 API,使用户能够充分利用他们的数据。 Speech-to-Text API Alpha 是他们的最新产品,它提供实时处理和低至 1% 的单词错误率。 它基于 Open AI 的 Whisper 模型构建,能够在 10 秒内转录一小时的音频。该 API 免费提供,支持 99 种语言。 Gladia 由创始人兼首席执行官 Jean-Louis Queguiner 和联合创始人兼首席技术官 Jonathan Soto 领导。 Queguiner 拥有符号人工智能硕士学位,并独自构建了一个聊天机器人,用于在一个商店中管理、分类和统一所有人工智能应用程序。 索托拥有麻省理工学院硕士学位,是多篇学术论文的作者。 Gladia 为用户提供教程和文档,并与其团队进行一对一的入职电话会议。 他们致力于在不牺牲质量的情况下,使他们的 API 比市场上任何其他产品更易于访问且更实惠。
Hour One
hourone.ai
一小时通过将所有工作流程集中在一个人工智能驱动的平台上,彻底改变了企业的内容创建。我们拥有市场上最逼真的头像,具有自然的动作,生动地动画您的商业信息。我们的模板可针对任何品牌进行定制,使团队能够大规模制作个性化内容 - 无需设计或编辑技能。此外,凭借快速渲染和顶级安全性,Hour One 成为专为企业需求而设计的首要内容操作系统。过去需要几个月的时间,现在只需几分钟,并产生更高的参与度……通过“一小时”更聪明地工作,而不是更努力,并制作可产生影响力的个性化商业视频。 * HourOne 是一款视频创建工具,允许用户使用各种模板、声音和角色创建营销视频和演示文稿。 * 用户喜欢易用性、可供选择的声音和角色范围、快速的处理和下载时间以及客户成功团队的支持。 * 审阅者遇到了诸如机器人文本对话功能、有限的头像选项、临时用户的学习曲线、有限的品牌功能、加载时间缓慢以及某些功能缺乏明确说明等问题。
AI Voice Detector
aivoicedetector.com
AI语音检测器是一款语音验证工具,可帮助检测真伪并过滤AI生成的语音。它让用户安心并防止音频操纵、错误信息、语音诈骗和口头评估中的抄袭。 * AI Voice Detector 是一款旨在区分计算机生成的声音和真实人类声音的工具,专门针对业务用例,确保客户服务交互中内容的真实性和可靠的报告。 * 审阅者对该软件针对音频操纵和语音诈骗的保护实施、其易用性、快速处理以及无缝处理各种音频文件格式而没有任何问题的能力表示赞赏。 * 用户提到了一些限制,例如系统要求音频文件长度至少为 8 秒且没有背景音乐、偶尔会将真声误识别为假声,反之亦然,以及软件集成能力有限。
SAP
sap.com
SAP 是领先的企业应用和商业人工智能公司。他们站在业务和技术的交叉点,他们的创新旨在直接解决真正的业务挑战并产生现实世界的影响。 他们的解决方案是世界上最复杂和要求最高的流程的支柱。 SAP 的集成产品组合将现代组织的要素(从劳动力和财务到客户和供应链)整合到一个推动进步的统一生态系统中。
Prolific
prolific.com
Prolific 是一个平台,使研究人员能够从大量经过审查的研究参与者和任务执行者中大规模收集高质量的人力数据。使用 Prolific 平台,研究人员可以定位、联系和管理 Prolific 多样化、经过审查和公平对待的研究参与者,以提供改变世界的研究和下一代人工智能。
Dictanote
dictanote.co
我们通过使用语音输入帮助用户提高工作效率! Dictanote 是一款现代笔记应用程序,具有内置语音到文本集成功能,让您可以轻松以 50 多种语言语音输入笔记。 Voice In 是语音转文本 Chrome 扩展程序,可让您使用语音在任何网站上的任何文本框中键入内容。
Speechlogger
speechlogger.com
Speech Logger 是一款基于网络的语音识别和语音翻译软件,包括自动标点符号、自动保存、时间戳、文本内编辑功能、音频文件转录、导出选项等。 * Speechlogger 是一款专为演讲、会议或活动的自动实时字幕和翻译而设计的工具,具有自动标点符号、发言者识别和情绪分析等附加功能。 * 审阅者赞赏 Speechlogger 即使在嘈杂的背景下也能准确转录语音的能力、其用户友好的设计以及自动标点符号、说话人识别和情绪分析等独特功能,他们认为这些功能优于某些付费转录工具。 * 用户遇到的问题包括影响免费版本性能的广告、偶尔出现的翻译错误、转录不常见口音时的准确性较低、缺乏语音控制以及情绪分析和主题建模工具中的误解。
V7
v7labs.com
V7 是一款专为计算机视觉和生成式人工智能应用而设计的人工智能数据引擎。该平台为企业培训数据提供基础设施,包括标签、工作流程、数据集,并具有人机交互培训功能。 它提供多种注释属性来提高人工智能模型的数据质量。凭借自动注释、医学成像 DICOM 注释、数据集管理和模型管理等功能,V7 可以自动化并简化各种任务。 其图像和视频标注工具旨在提高数据标注的精度。此外,它还支持自定义数据管道的构建和自动化,并具有用于自动化光学字符识别 (OCR) 和智能文档处理 (IDP) 工作流程的工具。V7 允许用户外包注释任务。 它可用于农业、汽车、建筑、能源、食品饮料、医疗保健等各个行业。它提供实时团队注释的协作功能,并提供贴标机和模型性能分析。此外,V7 还通过直观的用户界面促进注释和模型训练工作流程变得更加高效。 凭借其增强的自动注释功能,它加快了注释的速度和准确性。该平台与 AWS、Databricks 和 Voxel51 等集成,支持视频、图像和文本数据等一系列数据类型。
Softcatalà Traductor
softcatala.org
TranslatorTranslator 加泰罗尼亚语 <> {西班牙语、英语、葡萄牙语、法语}基于 Apertium 技术。
Riku.AI
riku.ai
尝试人工智能 一个游乐场,多个提供商。 Riku 是你的人工智能的宝库。创作以及保存、分发和试验最新技术的地方。 Riku 是利用 NLP 技术构建自定义模型的一站式解决方案。 Riku.AI 将最好的大型语言模型聚合在一个地方,使人工智能技术的学习、构建和共享变得尽可能简单。
SoundHound
soundhound.com
作为对话智能的领先创新者,我们提供独立的语音人工智能平台,使各行业的企业能够为其客户提供一流的对话体验。 SoundHound 的先进语音 AI 平台以专有的 Speech-to-Meaning® 和 Deep Meaning Understanding® 技术为基础,提供卓越的速度和准确性,使人类能够通过自然说话的方式与产品和服务进行交互,就像彼此交互一样。 SoundHound 受到全球各地公司的信赖,包括现代、梅赛德斯-奔驰、Pandora、高通、Netflix、Snap、Square、LG、VIZIO、起亚和 Stellantis。
AssemblyAI
assemblyai.com
AssemblyAI 是一家语音人工智能公司,专注于构建能够转录和理解人类语音的最先进的新型人工智能模型。我们的客户(例如 CallRail、Fireflies 和 Spotify)选择 AssemblyAI 来基于语音数据构建令人难以置信的全新人工智能体验和产品。 AssemblyAI 模型和框架包括: - 人工智能语音转文字 - 音频智能,包括摘要、情绪分析、主题检测、内容审核、PII 编辑等 - LeMUR,一个将强大的法学硕士应用于转录语音的框架,您可以在其中提出复杂的问题,从转录中提取行动项目和回顾等等
ai|coustics
ai-coustics.com
ai|coustics 是一款人工智能工具,可使用先进算法增强语音音频质量。他们的生成语音人工智能技术使用户能够在任何情况下获得专业级的音频质量,无论是录制播客、视频会议还是传输音频。 该工具不仅可以抑制背景噪音,还可以消除房间共振、补偿低质量耳机并修复数字伪影以提高口语的清晰度和质量。 它甚至可以恢复音频信号丢失的成分和频率。该人工智能工具非常适合任何以音频为中心的应用程序,包括电信、播客平台、音频录制或传输硬件以及语音转文本系统。 利用其 HD-SPEECH API 和 SDK,将 ai|coustics 集成到音频应用程序中非常简单,并且可用于 Windows、Mac、Linux、Web、Android 和 iOS 平台,在嵌入式、桌面和云环境中运行。 用户可以通过访问其 PLAYGROUND 页面来亲身体验该工具的强大功能,在那里他们可以看到和听到人工智能语音增强的变革效果。 ai|coustics 还提供联系信息,包括电子邮件、电话和地址,以及指向其网站通知和隐私政策的链接。希望提高语音应用程序音频质量的用户可以受益于 ai|coustics 的先进 AI 算法,该算法可将音频质量提升至专业级标准。
Kili Technology
kili-technology.com
快速构建高质量数据集。 企业相信我们能够简化他们的数据标记操作,并为其自定义模型、生成式人工智能和法学硕士构建最佳数据集 ___ 为什么选择奇力科技? 你可能不知道这一点,但是: MNIST 的数据集错误率为 3.4%,仍然被超过 38,000 篇论文引用。 ImageNet 数据集及其众包标签的错误率为 6%。该数据集可以说是谷歌和 Facebook 开发的最流行的图像识别系统的基础。这些数据集中的系统错误会产生现实后果。在包含错误的数据上训练的模型被迫学习这些错误,从而导致错误的预测或需要对不断增加的数据进行重新训练以“消除”错误。 每个行业都已经开始了解人工智能的变革潜力并进行投资。但机器学习转换器的革命和对机器学习模型优化的不懈关注正在达到收益递减的地步。还有什么?
IBM
ibm.com
IBM Cognos Analytics充当您可信赖的业务副驾驶,目的是使您对数据驱动的决策更加聪明,更快,更有信心。 IBM Cognos Analytics为每个用户(无论是数据科学家,业务分析师还是非IT专家)都以与组织目标相关的方式执行相关分析的功能。它缩短了每个用户的旅程从简单的分析到复杂的分析,使他们可以利用数据探索未知的数据,确定新的关系,对结果有更深入的了解并挑战现状。通过IBM Cognos分析可视化,分析和分享有关您的数据的可行见解。
SpeechAce
speechace.com
在 SpeechAce,我们致力于通过多功能语音识别技术帮助语言学习者提高口语能力。我们开发了世界上第一个语音识别 API,不仅可以帮助语言学习者评估他们的口语技能,还可以确定他们需要改进的确切领域。虽然我们的语音识别 API 的第一个版本仅提供发音分数,但我们现在增强了我们的产品,包括完整的语音转录以及对词汇、语法、流畅性、连贯性和相关性等更高水平技能的评估。 SpeechAce 拥有多元化的全球客户群,其中包括一些最小(但最热门)的初创公司以及世界上一些最大的语言学习提供商。