Web 应用的应用商店
找到合适的软件和服务。
使用 WebCatalog Desktop 将网站转化为桌面应用,并访问大量 Mac、Windows 专属的应用。使用空间组织应用,在多个帐户之间轻松切换,通过前所未有的方式提高工作效率。
深度学习软件是指旨在促进深度学习模型的创建、训练和部署的一类软件工具和框架。深度学习是机器学习的一个子集,涉及训练多层人工神经网络(因此称为“深度”)来学习数据的表示。深度学习软件通常提供以下功能: * 神经网络架构设计:用于设计和定制深度神经网络架构的工具,包括指定层数、层类型(例如卷积、循环)以及层之间的连接。 * 数据预处理和增强:用于准备和预处理输入数据以训练深度学习模型的实用程序,包括标准化、数据增强和特征提取等任务。 * 模型训练和优化:在大数据集上训练深度学习模型的算法和技术,包括随机梯度下降等优化算法,以及正则化、dropout等处理过拟合的方法。 * 模型评估和验证:用于评估经过训练的模型在验证和测试数据集上的性能的工具,包括准确性、精确度、召回率和 F1 分数等指标。 * 部署和推理:通常通过与软件开发框架和平台集成,将经过训练的深度学习模型部署到生产环境中以推理新数据的设施。 流行的深度学习软件框架包括 TensorFlow、PyTorch、Keras 和 Caffe。这些框架提供了高级抽象和 API,使开发人员和研究人员能够更轻松地构建和试验深度学习模型,而无需从头开始实现一切。
提交新应用
Claude
claude.ai
Claude by Anthropic 是 Anthropic 打造的下一代人工智能助手,经过培训,安全、准确、可靠,可帮助您完成最佳工作。
Otter
otter.ai
Otter 是一款智能笔记应用程序,可帮助您记住、搜索和分享您的语音对话。 Otter 创建的智能语音笔记结合了音频、转录、说话人识别、内联照片和关键短语。它可以帮助商务人士、记者和学生在会议、采访、讲座以及任何重要对话中更加专注、协作和高效。
AWS Console
amazon.com
Amazon Web Services (AWS) 是 Amazon 的子公司,以按量付费的方式向个人、公司和政府提供按需云计算平台和 API。这些云计算Web服务提供了各种基本的抽象技术基础设施以及分布式计算构建块和工具。其中一项服务是 Amazon Elastic Compute Cloud (EC2),它允许用户通过互联网随时使用虚拟计算机集群。 AWS版本的虚拟计算机模拟了真实计算机的大部分属性,包括用于处理的硬件中央处理单元(CPU)和图形处理单元(GPU);本地/RAM内存;硬盘/SSD存储;操作系统的选择;联网;以及预装的应用软件,例如网络服务器、数据库和客户关系管理 (CRM)...
Google Cloud Platform
google.com
Google 云平台 (GCP) 由 Google 提供,是一套云计算服务,运行在 Google 内部用于其最终用户产品(例如 Google 搜索、Gmail、文件存储和 YouTube)的同一基础设施上。除了一套管理工具外,它还提供一系列模块化云服务,包括计算、数据存储、数据分析和机器学习。注册需要信用卡或银行帐户详细信息。Google Cloud Platform 提供基础设施即服务、平台即服务和无服务器计算环境。 2008 年 4 月,Google 发布了 App Engine,这是一个用于在 Google 管理的数据中心中开发和托管 Web 应用程序的平台,这是该公司的第一个云计算服...
Jasper
jasper.ai
Jasper:商业品牌人工智能始终以您的品牌声音在您在线的任何地方创建内容。 Jasper 是您的创意人工智能助手,可以以您独特的品牌语气学习和写作。无论你是大胆地、厚脸皮地、正式地说话,还是只在网上说话(u do u)。此外,Jasper Everywhere 浏览器扩展使 Jasper 始终陪伴在您身边,从 CMS 到电子邮件、社交媒体,再到使用 Jasper API 的您自己的公司平台。 最重要的是,Jasper 具有随着安全协议的发展而保持最新的内置安全功能,可确保您的数据安全和私密。 利用人工智能创建内容的速度提高 5 倍。 Jasper 是最高质量的 AI 文案工具,拥有超过...
OpenAI Platform
openai.com
OpenAI 是一家人工智能研究和部署公司,致力于确保通用人工智能造福全人类。人工智能是一种极其强大的工具,其创建必须以安全和人类需求为核心。 OpenAI 致力于将利益一致性放在首位——置于利润之上。 为了实现我们的使命,我们必须包容并重视构成全人类的许多不同观点、声音和经验。我们对多元化、公平性和包容性的投资是持续不断的,通过广泛的举措执行,并得到领导层的倡导和支持。 在 OpenAI,我们相信人工智能有潜力帮助人们解决巨大的全球挑战,我们希望人工智能的优势得到广泛分享。
Krisp
krisp.ai
Krisp 是一款智能应用程序,旨在提高在线会议和通话的效率和清晰度。主要是利用人工智能进行降噪,有效消除在线交互过程中的背景噪音、语音和回声。 此功能可确保在各种环境下(从个人对话到团队会议和呼叫中心)进行清晰、高质量的通信。除了噪音消除之外,Krisp 还提供实时会议转录,这提高了可访问性并有助于维护记录。 此外,它还具备生成简洁会议笔记和摘要的能力,有效充当AI会议助手。另一个值得注意的功能是 Krisp 的会议录制功能,它可以自动录制所有通信应用程序中的虚拟会议。 Krisp 专门针对呼叫中心环境提供了 AI 口音本地化功能,可以实时转换座席的口音以匹配客户的母语口音,从而实现更...
Deep Dream Generator
deepdreamgenerator.com
深梦发生器。了解卷积神经网络通过过度处理图像和增强特征可以生成什么。
FaceCheck.ID
facecheck.id
使用 FaceCheck.ID 人脸识别搜索引擎在线查找任何人。通过照片搜索人员并验证您正在与他们声称的人交谈。
SpeechTexter
speechtexter.com
语音到文本转换器。用你的声音听写。用于使用语音打字的免费网络应用程序。支持 70 多种不同语言!
Notta
notta.ai
Notta 是一款领先的 AI 转录工具和会议记录工具,可帮助将任何语音对话快速转录和总结为可操作的文本,支持 58 种语言。 * 重要消息:Airgram 已加入 Notta!除了转录视频/音频文件、现场演讲之外,Notta 还与 Zoom、Microsoft Teams 和 Google Meet 等领先的视频会议平台集成,以生成自动会议记录。它还允许用户查看、搜索、编辑、导出记录并与团队成员共享记录,以实现无缝协作。 Notta 使您能够最大限度地发挥每次对话的价值。
Resemble.ai
resemble.ai
Resemble AI 使用专有的深度学习模型创建自定义 AI 语音,该模型使用文本转语音和语音转语音合成来生成高质量的 AI 生成的音频内容。 Resemble Localize 是我们的多语言本地化工具,可以翻译文本并将您的 AI 语音转换为多达 100 种语言。 Resemble Fill 是我们的生成填充(音频修复)功能,使您能够使用克隆的 AI 语音修改现有语音。 Fill 可用于修改程序化音频广告、动态流媒体广告插入 (SAI)、语音助手等。 最近,我们凭借语音 AI 对 Netflix 获得艾美奖提名的《安迪·沃霍尔日记》的贡献,荣获 2023 年威比奖“最佳语音技术应用奖...
Speechnotes
speechnotes.co
语音转文本 - 语音输入和转录。 免费用语音做笔记,或当场自动转录音频和视频录音。安全、准确且超快。
DeepAI
deepai.org
为天生富有创造力的人类提供人工智能工具
FaceMRI
facemri.com
FaceMRI 是一家位于美国的人脸识别软件研究小组。 FaceMRI 是适用于 Mac 和 PC 的最先进的人脸识别搜索引擎。 FaceMRI 拥有一套面部识别软件,可以将面部分类为性别(男性、女性、非二元)、年龄段、年龄和种族。创建出勤图表和分析。可以通过+导入图像+导入视频+网络搜索(FB、LinkedIn、Instagram)+导入文件夹+网络摄像头和IP摄像头+物联网和安全摄像头来提取人脸。 + USB 密钥和外部设备 FaceMRI 利用人脸识别的力量来解锁图像和视频的分析。用户可以将该应用程序下载到 Mac 或 PC 上并导入图像和视频。它将从视频和图像中提取面孔和人物,用户可...
Alibaba Cloud
alibabacloud.com
阿里云是全球最大的云计算公司之一,在全球范围内提供可扩展、安全、可靠的云计算服务,通过全面的云产品和解决方案加速数字化进程。
Jammable
jammable.com
通过 Jammable 在几秒钟内使用 AI 创建 AI 封面,数百个社区上传的 AI 语音模型可供创意使用!
PromptSmart
promptsmart.com
PromptSmart 是一款提词器应用程序,可跟随您的声音,帮助您制作视频或演示文稿。 PromptSmart 是首款具有语音识别功能的提词器应用程序 - 最先进的公共演讲工具! 2014 年 8 月推出! PromptSmart 的诞生源于对公开演讲的热情。 PromptSmart 的创始人对 MBA 学生进行公开演讲艺术的指导和指导。我们意识到直观的扬声器控制提词器可以更好地支持许多演讲者,因此我们还认识到当今的移动设备可以满足这一需求。考虑到这一点,PromptSmart 应运而生。 PromptSmart 还满足了喜欢使用笔记而不是完整书面演讲的演讲者的需求。我们设计了数字记录...
Landing AI
landing.ai
计算机视觉变得超级简单。 在几分钟内创建并部署您的计算机视觉系统。无需复杂的编程或人工智能经验。
Jupitrr
jupitrr.com
Jupitrr AI Video Maker 是一款人工智能驱动的工具,允许创作者将他们的录音和播客转换为个性化视频。借助此工具,用户可以在短短几分钟内轻松创建令人惊叹的视频内容。 Jupitrr AI Video Maker 背后的 AI 技术可以自动为创作者的视频生成素材视频,包括素材、图表、字幕等。该工具拥有类似于编辑 Word 文档的用户友好界面,无需复杂的时间线,使视频编辑变得轻而易举。 它提供了一键访问庞大视频库的便利性,为用户省去了搜索合适素材的麻烦。 Jupitrr AI Video Maker 支持多种语言,包括西班牙语、印地语、法语、普通话等,可供世界各地的广大创作者使...
Roboflow
roboflow.com
只需几十张示例图像,您就可以在 24 小时内训练出一个可用的、最先进的计算机视觉模型。 Roboflow 创建软件即服务产品,使计算机视觉构建变得简单。 超过 250,000 名开发人员使用 Roboflow 来管理图像数据、注释和标记数据集、应用预处理和增强、转换注释文件格式、一键训练计算机视觉模型以及通过 API 或边缘部署模型。
Speechlogger
speechlogger.com
Speech Logger 是一款基于网络的语音识别和语音翻译软件,包括自动标点符号、自动保存、时间戳、文本内编辑功能、音频文件转录、导出选项等。 * Speechlogger 是一款专为演讲、会议或活动的自动实时字幕和翻译而设计的工具,具有自动标点符号、发言者识别和情绪分析等附加功能。 * 审阅者赞赏 Speechlogger 即使在嘈杂的背景下也能准确转录语音的能力、其用户友好的设计以及自动标点符号、说话人识别和情绪分析等独特功能,他们认为这些功能优于某些付费转录工具。 * 用户遇到的问题包括影响免费版本性能的广告、偶尔出现的翻译错误、转录不常见口音时的准确性较低、缺乏语音控制以及情绪分...
Clarifai
clarifai.com
Clarifai 是一家独立的人工智能公司,专注于计算机视觉、自然语言处理和音频识别。 Clarifai 成立于 2013 年,是最早成立的深度学习平台之一,为非结构化图像、视频、文本和音频数据提供人工智能平台。其平台支持整个人工智能生命周期,包括图像、视频、文本和音频数据的数据探索、数据标记、模型训练、评估和推理。 Clarifai 总部位于华盛顿特区,利用机器学习和深度神经网络自动识别和分析图像、视频、文本和音频。 Clarifai 使用户能够通过 API、移动 SDK 和/或本地解决方案将人工智能技术应用到他们的产品中。
Hour One
hourone.ai
一小时通过将所有工作流程集中在一个人工智能驱动的平台上,彻底改变了企业的内容创建。我们拥有市场上最逼真的头像,具有自然的动作,生动地动画您的商业信息。我们的模板可针对任何品牌进行定制,使团队能够大规模制作个性化内容 - 无需设计或编辑技能。此外,凭借快速渲染和顶级安全性,Hour One 成为专为企业需求而设计的首要内容操作系统。过去需要几个月的时间,现在只需几分钟,并产生更高的参与度……通过“一小时”更聪明地工作,而不是更努力,并制作可产生影响力的个性化商业视频。 * HourOne 是一款视频创建工具,允许用户使用各种模板、声音和角色创建营销视频和演示文稿。 * 用户喜欢易用性、可供选择...
Speech to Note
speechtonote.com
Speech To Note 是一款人工智能驱动的语音识别工具,可立即将语音转换为文本。我们的工具使用先进的语音转文本技术将您的文字转录成您可以编辑或共享的简洁摘要。 体验我们人工智能驱动工具的强大功能,它可以立即将您的口语转化为简洁且信息丰富的摘要。
npm
npmjs.com
npm 是由 npm, Inc. 维护的 JavaScript 编程语言的包管理器。npm 是 JavaScript 运行时环境 Node.js 的默认包管理器。它由一个命令行客户端(也称为 npm)和一个公共和付费私有包的在线数据库(称为 npm 注册表)组成。
AssemblyAI
assemblyai.com
AssemblyAI 是一家语音人工智能公司,专注于构建能够转录和理解人类语音的最先进的新型人工智能模型。我们的客户(例如 CallRail、Fireflies 和 Spotify)选择 AssemblyAI 来基于语音数据构建令人难以置信的全新人工智能体验和产品。 AssemblyAI 模型和框架包括: - 人工智能语音转文字 - 音频智能,包括摘要、情绪分析、主题检测、内容审核、PII 编辑等 - LeMUR,一个将强大的法学硕士应用于转录语音的框架,您可以在其中提出复杂的问题,从转录中提取行动项目和回顾等等
MobileEngine
services.tineye.com
TinEye 是一家图像搜索和识别公司。我们是计算机视觉、模式识别、神经网络和机器学习方面的专家。我们的使命是让您的图像可搜索。
Crescendo
crescendo.com
Crescendo Systems Corporation 是医疗、法律、执法和保险领域文档、数字听写、语音处理、转录和工作流程管理系统的领先开发商。
Muse.ai
muse.ai
muse.ai 是一家视频搜索公司,正在构建先进的人工智能来组织全球视频。
Face Age
getfaceage.com
Face Age利用尖端技术分析面部皮肤属性,捕捉皱纹、毛孔、痤疮、眼袋等细节,了解每位顾客的皮肤。 Face Age 旨在轻松集成到现有的电子商务平台中。 Face Age 提供各种集成选项,使设置过程顺利高效。无论您经营的是小型精品店还是大型市场,Face Age 都能无缝适应您的技术要求。
Symbl.ai
symbl.ai
Symbl.ai 是一个对话智能平台,使用先进的深度学习模型为开发人员提供非结构化对话数据的实时转录和见解。 该工具为各个行业提供解决方案,例如收入情报、活动和网络研讨会、远程协作、联络中心和招聘情报。 Symbl.ai 的功能支持自定义跟踪器、摘要、主题建模、转录、对话分析以及用于语音、音频和文本数据的预构建 UI 和组件。 凭借其 API 技术,Symbl.ai 可以对非结构化人类对话进行实时异步语音识别,使该工具能够通过单个 API 调用来添加智能。 此外,该平台还通过批处理/异步请求在不到 400 毫秒的时间内提供实时关键字、短语和意图检测。 Symbl.ai 包含语音到文本...
Syte
syte.ai
Syte 是专门为电子商务应用程序设计的产品发现平台。它利用视觉人工智能来增强各种电子商务活动,包括视觉搜索、个性化和自动产品标签。 Syte 旨在通过提供视觉搜索体验将购物者与产品联系起来,从而提高效率、支持可持续发展并消除死胡同。 它展示视觉上相似且互补的产品推荐,旨在激发和转化不同类型的购物者。它还具有自动产品标签系统,可以节省时间、优化销售流程并提高产品数据的准确性。 这些解决方案可以适应不同的市场现实,并可以扩展以满足时尚、家居装饰和珠宝等各个行业领域的特定需求。 它适合不同的企业规模,从成长型企业到大型企业。
PixLab
pixlab.io
PixLab 是领先的独立软件即服务平台,适用于机器视觉和媒体处理 API。我们帮助开发人员使用我们的网络和离线 SDK 实施智能应用程序。我们的 API 功能集包括但不限于护照和身份证扫描、内容审核、面部识别、光学字符识别以及许多其他 API 端点。
Gladia
gladia.io
Gladia 是一个人工智能知识基础设施平台,提供即插即用的 API,使用户能够充分利用他们的数据。 Speech-to-Text API Alpha 是他们的最新产品,它提供实时处理和低至 1% 的单词错误率。 它基于 Open AI 的 Whisper 模型构建,能够在 10 秒内转录一小时的音频。该 API 免费提供,支持 99 种语言。 Gladia 由创始人兼首席执行官 Jean-Louis Queguiner 和联合创始人兼首席技术官 Jonathan Soto 领导。 Queguiner 拥有符号人工智能硕士学位,并独自构建了一个聊天机器人,用于在一个商店中管理、分类和统一所...
NVIDIA Developer
developer.nvidia.com
使用生成式人工智能构建应用程序。 使用可在任何地方运行的生产就绪 API 体验、原型化和部署 AI。
Talkatoo
talkatoo.com
Talkatoo 正在为医疗专业人员重塑听写功能。无论您是在兽医行业还是人类医疗行业,Talkatoo 都是适合您的语音转文本软件解决方案。 Talkatoo 在 Windows 和 Mac 上兼容,适用于您可以键入的任何领域(包括 PIM 和 EHR),并且非常易于使用。 * Talkatoo 是一款专为临床使用而设计的桌面听写解决方案,重点是将语音转换为文本,包括专业词汇和医学术语。 * 审阅者赞赏 Talkatoo 能够准确地将语音转换为文本(包括复杂的医学术语),并且其用户友好的界面有助于提高创建医疗记录的效率和生产力。 * 审阅者指出,Talkatoo 在处理大量指令时可能会很慢,...
Voxpow
voxpow.com
由机器学习提供支持的语音到文本转换。直接在您的网站上免费。 Voxpow 支持您的全球用户群,可识别 100 多种语言及其变体。
V7
v7labs.com
V7 是一款专为计算机视觉和生成式人工智能应用而设计的人工智能数据引擎。该平台为企业培训数据提供基础设施,包括标签、工作流程、数据集,并具有人机交互培训功能。 它提供多种注释属性来提高人工智能模型的数据质量。凭借自动注释、医学成像 DICOM 注释、数据集管理和模型管理等功能,V7 可以自动化并简化各种任务。 其图像和视频标注工具旨在提高数据标注的精度。此外,它还支持自定义数据管道的构建和自动化,并具有用于自动化光学字符识别 (OCR) 和智能文档处理 (IDP) 工作流程的工具。V7 允许用户外包注释任务。 它可用于农业、汽车、建筑、能源、食品饮料、医疗保健等各个行业。它提供实时团队注...
Speechmatics
speechmatics.com
Speechmatics 是全球领先的语音智能专家,结合人工智能和机器学习的最新突破,释放人类语音的商业价值。全球范围内的企业都在使用 Speechmatics 来准确理解人类级别的语音并将其转录为文本,无论人口统计、年龄、性别、口音、方言或位置如何,都可以实时在录制媒体上进行。 将这些文字记录与最新的人工智能驱动的语音功能相结合,企业可以构建利用摘要、主题、情绪、章节、翻译等的产品。 Speechmatics 每月以 50 种语言处理全球 300 多年的转录。其神经网络在语音识别领域开创了机器学习的先河,考虑了声学、语言、方言、多个说话者、标点符号、大写、上下文和隐含含义。 Speech...
Lambda
lambdalabs.com
Lambda 提供计算来加速人类进步。我们是一支深度学习工程师团队,致力于构建世界上最好的 GPU 云、集群、服务器和工作站。我们的产品为工程师和研究人员提供了处于人类知识前沿的动力。客户包括英特尔、微软、谷歌、亚马逊研究院、腾讯、凯撒医疗机构、麻省理工学院、斯坦福大学、哈佛大学、加州理工学院、洛斯阿拉莫斯国家实验室、迪士尼和国防部。
Tune AI
tunehq.ai
Tune AI 正在推动 GenAI 在企业中的采用。 我们得到了 Accel、Flipkart Ventures、Together Fund、Speciale Invest、Techstars 和其他知名投资者的支持 TuneChat:我们的聊天应用程序由开源模型提供支持 TuneStudio:我们为开发人员微调和部署法学硕士的游乐场 ChainFury:我们的开源提示引擎可在 GitHub 上找到
Faceplusplus
faceplusplus.com
Face++ 是一个提供计算机视觉技术的平台,使您的应用程序能够更好地阅读和理解世界。
CrystalSound
crystalsound.ai
CrystalSound 是一款使用人工智能技术的桌面应用程序,有助于消除通话、录音和在线会议期间所有不必要的噪音和干扰。凭借其先进的算法和最先进的功能,CrystalSound 可以消除背景噪音、回声、啸叫效果和其他声音,确保您能够清晰有效地进行沟通。 CrystalSound能够工作在Mac、Windows、Linux操作系统上,满足用户的下载和使用需求。有了 CrystalSound,您不必再担心通信应用程序的兼容性问题。我们的解决方案旨在与 Teams、Zoom、Google Meet、Loom、Discord 等流行应用程序无缝协作。
SpeechWrite
speechwrite.com
SpeechWrite 是一家专注于工作流程解决方案、数字听写、语音识别和 PDF 解决方案的完整解决方案提供商。 SpeechWrite 的实用技术复杂而简单,可让您改善工作环境并更智能地工作。 SpeechWrite 与 OEM 和技术合作伙伴密切合作,对最新技术发展和市场趋势拥有广泛的了解。 SpeechWrite 成立于 2001 年,在听写行业拥有 100 多年的经验,并以其上市速度和售后支持而自豪。
Thirdlane
thirdlane.com
Thirdlane Connect 是一款多功能的客户沟通和团队协作应用程序,为您的团队提供一系列功能,包括聊天、语音和视频通话、会议、屏幕共享、文件共享以及与 CRM 和各种其他业务应用程序的无缝集成。 Thirdlane Connect 旨在促进多渠道客户沟通和团队协作,专为本地和远程工作人员而设计,支持网络浏览器、iPhone、Android 设备以及 Windows、Linux 和 Mac 桌面。这一功能强大的应用程序与 Thirdlane 商务电话系统或 Thirdlane 多租户 PBX 平台完全集成并由其提供支持。这些平台可以安全地部署在各种环境中,无论是在本地还是在私有云或公共...
AI Voice Detector
aivoicedetector.com
AI语音检测器是一款语音验证工具,可帮助检测真伪并过滤AI生成的语音。它让用户安心并防止音频操纵、错误信息、语音诈骗和口头评估中的抄袭。 * AI Voice Detector 是一款旨在区分计算机生成的声音和真实人类声音的工具,专门针对业务用例,确保客户服务交互中内容的真实性和可靠的报告。 * 审阅者对该软件针对音频操纵和语音诈骗的保护实施、其易用性、快速处理以及无缝处理各种音频文件格式而没有任何问题的能力表示赞赏。 * 用户提到了一些限制,例如系统要求音频文件长度至少为 8 秒且没有背景音乐、偶尔会将真声误识别为假声,反之亦然,以及软件集成能力有限。
Dictanote
dictanote.co
我们通过使用语音输入帮助用户提高工作效率! Dictanote 是一款现代笔记应用程序,具有内置语音到文本集成功能,让您可以轻松以 50 多种语言语音输入笔记。 Voice In 是语音转文本 Chrome 扩展程序,可让您使用语音在任何网站上的任何文本框中键入内容。
Kili Technology
kili-technology.com
快速构建高质量数据集。 企业相信我们能够简化他们的数据标记操作,并为其自定义模型、生成式人工智能和法学硕士构建最佳数据集 ___ 为什么选择奇力科技? 你可能不知道这一点,但是: MNIST 的数据集错误率为 3.4%,仍然被超过 38,000 篇论文引用。 ImageNet 数据集及其众包标签的错误率为 6%。该数据集可以说是谷歌和 Facebook 开发的最流行的图像识别系统的基础。这些数据集中的系统错误会产生现实后果。在包含错误的数据上训练的模型被迫学习这些错误,从而导致错误的预测或需要对不断增加的数据进行重新训练以“消除”错误。 每个行业都已经开始了解人工智能的变革潜力并进...
SoundHound
soundhound.com
作为对话智能的领先创新者,我们提供独立的语音人工智能平台,使各行业的企业能够为其客户提供一流的对话体验。 SoundHound 的先进语音 AI 平台以专有的 Speech-to-Meaning® 和 Deep Meaning Understanding® 技术为基础,提供卓越的速度和准确性,使人类能够通过自然说话的方式与产品和服务进行交互,就像彼此交互一样。 SoundHound 受到全球各地公司的信赖,包括现代、梅赛德斯-奔驰、Pandora、高通、Netflix、Snap、Square、LG、VIZIO、起亚和 Stellantis。
Altered
altered.ai
Altered 是一款下一代音频编辑器,它将多种语音 AI 技术集成到用户友好的应用程序中,为各个行业(包括播客、视频游戏工作室和电子学习)制作高质量的语音内容。
Dictalogic
dictalogic.com
Dictalogic 提供专门的模块,包括音频到文本、语音到文本、对话到文本和任务委派,所有这些都通过一个仪表板进行。 * 纯音频:传统的音频听写,其中音频被录制并发送给转录员,转录员可以在任何地方(包括在家工作)。 * 音频到文本:数字转换可实现语音到文本的动态转换。在这种方法中,音频被记录并发送以进行转录,并且音频在到达转录者之前被转换为文本。我们提供多种作业选项供您探索。 * 语音转文本:我们还提供实时语音转文本的功能。工作流程与其他听写相同,可以发送给任何转录员。 * 对话到文本:Dictalogic Conversation 模块是一种语音到文本解决方案,结合了语音识别、说话...
VXG
videoexpertsgroup.com
VXG 是一家全球云视频监控公司,致力于简化视频管理并使系统以经济高效的方式进行扩展。帮助连接超过 150,000 个摄像头的系统集成商、安全、访问控制、人工智能、视频监控、电信和 SaaS 公司构建定制的世界级视频监控解决方案。真正的开放云平台旨在与其他解决方案集成或构建与 IP 摄像机配合使用的新服务。 VXG 是面向 SaaS 公司的面向未来的创新技术平台和云 VMS 引擎,完全灵活、可扩展、经济高效、白标和可定制。提供最快、最简单的真正云视频监控路径,并提供具有完整源代码和所有必要组件的完整 VMS。 完全开放(与产品无关)平台的关键价值在于,客户可以在自己的云/数据中心部署解决方...
Luxand.cloud
luxand.cloud
高级面部搜索和识别 API。 Luxand.Cloud 站在面部识别技术的最前沿,打造安全与创新无缝交织的未来。我们的尖端解决方案凭借精确性和复杂性重新定义了身份验证的格局。通过无缝访问控制提升您的数字安全性,解锁个性化且强化的体验。相信 Luxand.Cloud 能够以无与伦比的可靠性引领您保护数字前沿。与我们一起踏上重新定义数字时代安全边界的旅程。 Luxand.cloud 支持: - 人脸检测 - 人脸识别 - 人脸验证 - 情绪识别 - 人脸特征点检测 - 活体检测 - 人脸裁剪
Vue.ai
vue.ai
Vue.ai 是世界上第一个通用人工智能平台之一,使世界各地的大型企业能够跨工作流程和功能构建各种支持人工智能的应用程序。与任何其他点解决方案不同,Vue.ai 提供的价值是将整个企业的图像、视频和文本数据汇集在一起,使用其 AI 堆栈对其进行解码,从而使智能能够在整个企业中提供数据驱动的决策。通过结合即用型 API、无代码和低代码工具,Vue.ai 使营销、产品、业务和技术团队能够对收入增长、效率和成本降低产生数量级的影响。 Vue.ai 目前已部署在多个行业,包括零售、金融、保险、物流和医疗保健。 Vue.ai 是由 Ashwini Asokan 和 Anand Chandrasek...
hasty.ai
hasty.ai
Hasty 现在是 CloudFactory 的一部分,CloudFactory 是加速人工智能生命周期的人机交互人工智能解决方案的全球领导者。 不再为了效率而牺牲质量。 了解有关 Accelerated Annotation 的更多信息,这是一款新的 Vision AI 产品,它将 CloudFactory 一流的员工队伍与行业领先的 AI 辅助标记技术相结合,生成高质量标记数据的速度比手动标记快 5 倍。 Hasty 平台提供从原始图像和视频到生产就绪模型所需的一切。
NoahFace
noahface.com
NoahFace 提供高度可配置的软件解决方案,将 iPad 和智能手机转变为地球上最灵活、可扩展且可靠的时钟平台。 NoahFace 快速、可靠且准确,提供面部识别、温度和酒精筛查等现代功能。
GoSpotCheck
gospotcheck.com
FORM 的 GoSpotCheck 释放了现场团队的力量,通过唯一的移动解决方案推动市场执行,该解决方案结合了动态任务管理、行业领先的图像识别、照片报告、现场团队通信和高级报告 - 所有这些都在一个易于使用的平台中。指导团队、提高执行力并推动销售,同时创建该领域的共享视图,帮助领导者更快地做出更好的决策。使用 FORM 的 GoSpotCheck 提高销量,这是一款可实时指导、跟踪和提高绩效的现场执行应用程序。
CloudSight
cloudsight.ai
CloudSight 是图像字幕和理解领域的全球领导者。我们的目标是为世界各地的人们和公司提供最卓越、最先进的解决方案。 CloudSight 拥有两个突破性的消费者应用程序 - CamFind,世界上第一个成功的移动视觉搜索引擎,它允许您“搜索物理世界”并通过从移动设备拍照来查找任何信息; TapTapSee是一款针对盲人和视障人士的应用程序,它利用移动设备的摄像头和VoiceOver来拍摄物体并为用户大声识别它们。 此外,通过 CloudSight API 开发人员可以利用财富 500 强公司和主要零售商可用的相同技术。 CloudSight Inc. 成立于 2012 年,总部位于...