Web 應用程式的專屬商店

找到合適的軟體和服務。

使用 WebCatalog Desktop 將網站轉化為傳統型應用程式，並存取大量 Mac、Windows 專屬的應用程式。使用空間來組織應用程式，並在多個帳戶間輕鬆切換，以前所未有的方式來提升工作效率。

深度學習軟體 - 最受歡迎的應用程式 - 坦尚尼亞

深度學習軟體是指旨在促進深度學習模型的創建、訓練和部署的一類軟體工具和框架。深度學習是機器學習的一個子集，涉及訓練多層人工神經網路（因此稱為“深度”）來學習資料的表示。深度學習軟體通常提供以下功能： * 神經網路架構設計：用於設計和自訂深度神經網路架構的工具，包括指定層數、層類型（例如捲積、循環）以及層之間的連接。 * 資料預處理和增強：用於準備和預處理輸入資料以訓練深度學習模型的實用程序，包括標準化、資料增強和特徵提取等任務。 * 模型訓練與最佳化：在大數據集上訓練深度學習模型的演算法與技術，包括隨機梯度下降等最佳化演算法，以及正則化、dropout等處理過擬合的方法。 * 模型評估和驗證：用於評估經過訓練的模型在驗證和測試資料集上的表現的工具，包括準確性、精確度、召回率和 F1 分數等指標。 * 部署和推理：通常透過與軟體開發框架和平台集成，將經過訓練的深度學習模型部署到生產環境中以推理新資料的設施。流行的深度學習軟體框架包括 TensorFlow、PyTorch、Keras 和 Caffe。這些框架提供了高級抽象和 API，使開發人員和研究人員能夠更輕鬆地建立和試驗深度學習模型，而無需從頭開始實現一切。

提議新的應用程式

Google Cloud Platform

google.com

Google 雲端平台 (GCP) 由 Google 提供，是一套雲端運算服務，運行在 Google 內部用於其最終用戶產品（例如 Google 搜尋、Gmail、文件儲存和 YouTube）的相同基礎架構上。除了一套管理工具外，它還提供一系列模組化雲端服務，包括運算、資料儲存、資料分析和機器學習。註冊需要信用卡或銀行帳戶詳細資訊。 2008 年 4 月，Google 發布了 App Engine，這是一個用於在 Google 管理的資料中心中開發和託管 Web 應用程式的平台，這是該公司的第一個雲端運算服務。該服務於 2011 年 11 月全面推出。 Google Cloud Platf...

Otter

otter.ai

Otter 是一款智慧筆記應用程序，可協助您記住、搜尋和分享您的語音對話。 Otter 創建的智慧語音筆記結合了音訊、轉錄、說話者識別、內聯照片和關鍵字詞。它可以幫助商務人士、記者和學生在會議、採訪、講座以及任何重要對話中更加專注、協作和高效。

Claude

claude.ai

Claude by Anthropic 是 Anthropic 打造的下一代人工智慧助手，經過安全、準確且可靠的培訓，可協助您出色地完成工作。

Jasper

jasper.ai

Jasper：商業品牌人工智慧始終以您的品牌聲音在您在線上的任何地方創建內容。 Jasper 是您的創意人工智慧助手，可以以您獨特的品牌語氣學習和寫作。無論你是大膽地、厚臉皮地、正式地說話，還是只在網路上說話（u do u）。此外，Jasper Everywhere 瀏覽器擴充功能使 Jasper 始終陪伴在您身邊，從 CMS 到電子郵件、社交媒體，再到使用 Jasper API 的您自己的公司平台。最重要的是，Jasper 具有隨著安全協議的發展而保持最新的內建安全功能，可確保您的資料安全和私密。利用人工智慧創建內容的速度提高 5 倍。 Jasper 是最高品質的 AI 文案工具，...

SpeechTexter

speechtexter.com

語音到文字轉換器。用你的聲音聽寫。用於使用語音打字的免費網路應用程式。支援 70 多種不同語言！

Notta

notta.ai

Notta 是一款領先的 AI 轉錄工具和會議記錄工具，可協助將任何語音對話快速轉錄和總結為可操作的文本，支援 58 種語言。 * 重要消息：Airgram 已加入 Notta！除了轉錄視訊/音訊檔案、現場演講之外，Notta 還與 Zoom、Microsoft Teams 和 Google Meet 等領先的視訊會議平台集成，以產生自動會議記錄。它還允許用戶查看、搜尋、編輯、匯出記錄並與團隊成員共享記錄，以實現無縫協作。 Notta 讓您能夠最大限度地發揮每次對話的價值。

Alibaba Cloud

alibabacloud.com

阿里雲是全球最大的雲端運算公司之一，在全球提供可擴展、安全、可靠的雲端運算服務，透過全面的雲端產品和解決方案加速數位化進程。

AWS Console

amazon.com

Amazon Web Services (AWS) 是 Amazon 的子公司，以按量付費的方式向個人、公司和政府提供按需雲端運算平台和 API。這些雲端運算Web服務提供了各種基本的抽象技術基礎設施以及分散式運算建構塊和工具。其中一項服務是 Amazon Elastic Compute Cloud (EC2)，它允許使用者透過互聯網隨時使用虛擬電腦叢集。 AWS版本的虛擬電腦模擬了真實電腦的大部分屬性，包括用於處理的硬體中央處理單元（CPU）和圖形處理單元（GPU）；本地/RAM記憶體；硬碟/SSD儲存；作業系統的選擇；聯網;以及預先安裝的應用軟體，例如網頁伺服器、資料庫和客戶關係管理 (C...

FaceCheck.ID

facecheck.id

使用 FaceCheck.ID 人臉辨識搜尋引擎在線查找任何人。透過照片搜尋人員並驗證您正在與他們聲稱的人交談。

Speechnotes

speechnotes.co

語音轉文字 - 語音輸入和轉錄。免費用語音做筆記，或當場自動轉錄音訊和視訊錄音。安全、準確且超快。

OpenAI Platform

openai.com

OpenAI 是一家人工智慧研究和部署公司，致力於確保通用人工智慧造福全人類。人工智慧是一種極其強大的工具，其創建必須以安全和人類需求為核心。 OpenAI 致力於將利益一致性放在首位——置於利潤之上。為了實現我們的使命，我們必須包容並重視構成全人類的許多不同觀點、聲音和經驗。我們對多元化、公平性和包容性的投資是持續不斷的，透過廣泛的舉措執行，並得到領導層的倡導和支持。在 OpenAI，我們相信人工智慧有潛力幫助人們解決巨大的全球挑戰，我們希望人工智慧的優勢能廣泛分享。

FaceMRI

facemri.com

FaceMRI 是一家位於美國的人臉辨識軟體研究小組。 FaceMRI 是 Mac 和 PC 的最先進的人臉辨識搜尋引擎。 FaceMRI 擁有一套臉部辨識軟體，可將臉部分類為性別（男性、女性、非二元）、年齡層、年齡和種族。建立出勤圖表和分析。可透過+匯入影像+匯入影片+網路搜尋（FB、LinkedIn、Instagram）+匯入資料夾+網路攝影機和IP攝影機+物聯網和安全攝影機來提取人臉。 + USB 金鑰和外部設備 FaceMRI 利用人臉辨識的力量來解鎖影像和影片的分析。用戶可以將該應用程式下載到 Mac 或 PC 上並匯入圖像和影片。它將從影片和圖像中提取面孔和人物，用戶可以向客戶添...

Deep Dream Generator

deepdreamgenerator.com

深夢發生器。了解卷積神經網路透過過度處理影像和增強特徵可以產生什麼。

Krisp

krisp.ai

Krisp 是一款智慧型應用程序，旨在提高線上會議和通話的效率和清晰度。主要是利用人工智慧進行降噪，有效消除線上互動過程中的背景噪音、語音和迴聲。此功能可確保在各種環境下（從個人對話到團隊會議和呼叫中心）進行清晰、高品質的溝通。除了噪音消除之外，Krisp 還提供即時會議轉錄，這提高了可訪問性並有助於維護記錄。此外，它還具備產生簡潔會議筆記和摘要的能力，有效充當AI會議助理。另一個值得注意的功能是 Krisp 的會議錄製功能，它可以自動錄製所有通訊應用程式中的虛擬會議。 Krisp專門針對呼叫中心環境提供了AI口音本地化功能，可以即時轉換座席的口音以匹配客戶的母語口音，從而實現更清晰...

Resemble.ai

resemble.ai

Resemble AI 使用專有的深度學習模型創建自訂 AI 語音，該模型使用文字轉語音和語音轉語音合成來產生高品質的 AI 生成的音訊內容。 Resemble Localize 是我們的多語言在地化工具，可以翻譯文字並將您的 AI 語音轉換為多達 100 種語言。 Resemble Fill 是我們的生成填充（音訊修復）功能，可讓您使用複製的 AI 語音修改現有語音。 Fill 可用於修改程式化音訊廣告、動態串流廣告插入 (SAI)、語音助理等。最近，我們憑藉語音 AI 對 Netflix 獲得艾美獎提名的《安迪沃荷日記》的貢獻，榮獲 2023 年威比獎「最佳語音技術應用獎」。除...

Jammable

jammable.com

透過 Jammable 在幾秒鐘內使用 AI 創建 AI 封面，數百個社群上傳的 AI 語音模型可供創意使用！

Roboflow

roboflow.com

只需幾十張範例圖像，您就可以在 24 小時內訓練出一個可用的、最先進的電腦視覺模型。 Roboflow 創建軟體即服務產品，讓電腦視覺建構變得簡單。超過 25 萬名開發人員使用 Roboflow 來管理圖像資料、註釋和標記資料集、應用預處理和增強、轉換註釋檔案格式、一鍵訓練電腦視覺模型以及透過 API 或邊緣部署模型。

DeepAI

deepai.org

為天生富有創造力的人類提供人工智慧工具

Clarifai

clarifai.com

Clarifai 是一家獨立的人工智慧公司，專注於電腦視覺、自然語言處理和音訊辨識。 Clarifai 成立於 2013 年，是最早成立的深度學習平台之一，為非結構化圖像、視訊、文字和音訊資料提供人工智慧平台。其平台支援整個人工智慧生命週期，包括圖像、視訊、文字和音訊資料的資料探索、資料標記、模型訓練、評估和推理。 Clarifai 總部位於華盛頓特區，利用機器學習和深度神經網路自動識別和分析圖像、視訊、文字和音訊。 Clarifai 使用戶能夠透過 API、行動 SDK 和/或本地解決方案將人工智慧技術應用到他們的產品中。

Speech to Note

speechtonote.com

Speech To Note 是一款由人工智慧驅動的語音辨識工具，可立即將語音轉換為文字。我們的工具使用先進的語音轉文字技術將您的文字轉錄成您可以編輯或分享的簡潔摘要。體驗我們人工智慧驅動工具的強大功能，它可以立即將您的口語轉化為簡潔且資訊豐富的摘要。

PromptSmart

promptsmart.com

PromptSmart 是一款提詞器應用程序，可跟隨您的聲音，幫助您製作影片或簡報。 PromptSmart 是首款具有語音辨識功能的提詞器應用程式 - 最先進的公共演講工具！ 2014 年 8 月推出！ PromptSmart 的誕生源自於對公開演講的熱情。 PromptSmart 的創辦人對 MBA 學生進行公開演講藝術的指導和指導。我們意識到直覺的揚聲器控制提詞器可以更好地支援許多演講者，因此我們也認識到當今的行動裝置可以滿足這一需求。考慮到這一點，PromptSmart 應運而生。 PromptSmart 也滿足了喜歡使用筆記而不是完整書面演講的演講者的需求。我們設計了數位記錄卡...

npm

npmjs.com

npm 是由 npm, Inc. 維護的 JavaScript 程式語言的套件管理器。它由一個命令列客戶端（也稱為 npm）和一個公共和付費私有包的線上資料庫（稱為 npm 註冊表）組成。

PixLab

pixlab.io

PixLab 是領先的獨立軟體即服務平台，適用於機器視覺和媒體處理 API。我們幫助開發人員使用我們的網路和離線 SDK 實施智慧應用程式。我們的 API 功能集包括但不限於護照和身分證掃描、內容審核、臉部辨識、光學字元辨識以及許多其他 API 端點。

Gladia

gladia.io

Gladia 是一個人工智慧知識基礎設施平台，提供即插即用的 API，使用戶能夠充分利用他們的資料。 Speech-to-Text API Alpha 是他們的最新產品，它提供即時處理和低至 1% 的單字錯誤率。它基於 Open AI 的 Whisper 模型構建，能夠在短短 10 秒內轉錄一小時的音訊。該 API 免費提供，支援 99 種語言。 Gladia 由創辦人兼執行長 Jean-Louis Queguiner 和聯合創始人兼首席技術長 Jonathan Soto 領導。 Queguiner 擁有符號人工智慧碩士學位，並獨自建立了一個聊天機器人，用於在一個商店中管理、分類和統一所...

Hour One

hourone.ai

一小時透過將所有工作流程集中在一個人工智慧驅動的平台上，徹底改變了企業的內容創建。我們擁有市場上最逼真的頭像，具有自然的動作，生動地動畫您的商業訊息。我們的模板可針對任何品牌進行定制，使團隊能夠大規模製作個性化內容 - 無需設計或編輯技能。此外，憑藉快速渲染和頂級安全性，Hour One 成為專為企業需求設計的首要內容作業系統。過去需要幾個月的時間，現在只需幾分鐘，並產生更高的參與度……透過「一小時」更聰明地工作，而不是更努力，並製作可產生影響力的個人化商業影片。 * HourOne 是一款影片創建工具，允許用戶使用各種模板、聲音和角色創建行銷影片和簡報。 * 使用者喜歡易用性、可供選擇的聲...

Landing AI

landing.ai

電腦視覺變得超級簡單。在幾分鐘內創建並部署您的電腦視覺系統。無需複雜的程式設計或人工智慧經驗。

AI Voice Detector

aivoicedetector.com

AI語音偵測器是一款語音驗證工具，可協助偵測真偽並過濾AI產生的語音。它讓用戶安心並防止音訊操縱、錯誤訊息、語音詐騙和口頭評估中的抄襲。 * AI Voice Detector 是一款旨在區分電腦生成的聲音和真實人類聲音的工具，專門針對業務用例，確保客戶服務互動中內容的真實性和可靠的報告。 * 審閱者對該軟體針對音訊操縱和語音詐騙的保護實施、其易用性、快速處理以及無縫處理各種音訊檔案格式而沒有任何問題的能力表示讚賞。 * 使用者提到了一些限制，例如係統要求音訊檔案長度至少為 8 秒且沒有背景音樂、偶爾會將真聲誤識別為假聲，反之亦然，以及軟體整合能力有限。

Dictanote

dictanote.co

我們透過使用語音輸入幫助用戶提高工作效率！ Dictanote 是一款現代筆記應用程序，具有內建語音到文字整合功能，讓您可以輕鬆以 50 多種語言語音輸入筆記。 Voice In 是語音轉文字 Chrome 擴充程序，可讓您使用語音在任何網站上的任何文字方塊中鍵入內容。

Speechlogger

speechlogger.com

Speech Logger 是一款基於網路的語音辨識和語音翻譯軟體，包括自動標點符號、自動儲存、時間戳記、文字內編輯功能、音訊檔案轉錄、匯出選項等。 * Speechlogger 是一款專為演講、會議或活動的自動即時字幕和翻譯而設計的工具，具有自動標點符號、發言者識別和情緒分析等附加功能。 * 審查者讚賞Speechlogger 即使在嘈雜的背景下也能準確轉錄語音的能力、其用戶友好的設計以及自動標點符號、說話人識別和情緒分析等獨特功能，他們認為這些功能優於某些付費轉錄工具。 * 用戶遇到的問題包括影響免費版本表現的廣告、偶爾出現的翻譯錯誤、轉錄不常見口音時的準確性較低、缺乏語音控制以及情緒分...

Picture to Text

picturetotext.info

他們的圖像到文字轉換器使將圖像轉換為可編輯文字變得簡單而有效率。無論您有掃描文件、手寫筆記或任何其他視覺內容，他們的工具都可以輕鬆處理。透過從各種圖像類型中可靠地提取文本，享受高精度。其用戶友好的介面確保每個人都可以輕鬆使用它。此外，它們支援多種語言，因此您可以無縫處理各種語言的文字。其中一項突出的功能是能夠提交大量影像，在處理大量資料時節省您的時間。它們還支援多種圖像格式，使其適用於任何項目。最重要的是，他們的工具完全免費使用。使用照片到文字轉換器，您可以： * 輕鬆將圖像轉換為文本，節省時間 * 透過快速、準確的成果提高生產力 * 使用易於使用的工具簡化您的工作流程使用我們...

AssemblyAI

assemblyai.com

AssemblyAI 是一家語音人工智慧公司，專注於建立能夠轉錄和理解人類語音的最先進的新型人工智慧模型。我們的客戶（例如 CallRail、Fireflies 和 Spotify）選擇 AssemblyAI 來基於語音資料建立令人難以置信的全新人工智慧體驗和產品。 AssemblyAI 模型和框架包括： - 人工智慧語音轉文字 - 音訊智能，包括摘要、情緒分析、主題偵測、內容審核、PII 編輯等 - LeMUR，一個將強大的法學碩士應用於轉錄語音的框架，您可以在其中提出複雜的問題，從轉錄中提取行動項目和回顧等等

v7labs.com

V7 是一款專為電腦視覺和生成式人工智慧應用而設計的人工智慧資料引擎。該平台為企業培訓資料提供基礎設施，包括標籤、工作流程、資料集，並具有人機互動培訓功能。它提供多種註釋屬性來提高人工智慧模型的資料品質。憑藉自動註釋、醫學成像 DICOM 註釋、資料集管理和模型管理等功能，V7 可以自動化並簡化各種任務。其影像和視訊標註工具旨在提高資料標註的精度。此外，它還支援自訂資料管道的建置和自動化，並具有用於自動化光學字元辨識 (OCR) 和智慧型文件處理 (IDP) 工作流程的工具。它可用於農業、汽車、建築、能源、食品飲料、醫療保健等各個行業。它提供即時團隊註釋的協作功能，並提供貼標機和模...

Muse.ai

muse.ai

muse.ai 是一家影片搜尋公司，正在建立先進的人工智慧來組織全球影片。

Kili Technology

kili-technology.com

快速建立高品質資料集。企業相信我們能夠簡化他們的資料標記操作，並為其自訂模型、生成式人工智慧和法學碩士建立最佳資料集 ___ 為什麼選擇奇力科技？你可能不知道這一點，但： MNIST 的資料集錯誤率為 3.4%，仍被超過 38,000 篇論文引用。 ImageNet 資料集及其眾包標籤的錯誤率為 6%。該資料集可以說是 Google 和 Facebook 開發的最受歡迎的圖像識別系統的基礎。這些資料集中的系統錯誤會產生現實後果。在包含錯誤的資料上訓練的模型被迫學習這些錯誤，從而導致錯誤的預測或需要對不斷增加的資料進行重新訓練以「消除」錯誤。每個產業都開始了解人工智慧的變革潛力...

Face Age

getfaceage.com

Face Age利用尖端技術分析臉部肌膚屬性，捕捉皺紋、毛孔、青春痘、眼袋等細節，了解每位顧客的肌膚。 Face Age 旨在輕鬆整合到現有的電子商務平台中。 Face Age 提供各種整合選項，讓設定流程順利有效率。無論您經營的是小型精品店還是大型市場，Face Age 都能無縫適應您的技術要求。

SoundHound

soundhound.com

作為對話智慧的領先創新者，我們提供獨立的語音人工智慧平台，使各行業的企業能夠為其客戶提供一流的對話體驗。 SoundHound 的先進語音AI 平台以專有的Speech-to-Meaning® 和Deep Meaning Understanding® 技術為基礎，提供卓越的速度和準確性，使人類能夠透過自然說話的方式與產品和服務進行交互，就像彼此互動一樣。 SoundHound 受到全球各地公司的信賴，包括現代、梅賽德斯-奔馳、Pandora、高通、Netflix、Snap、Square、LG、VIZIO、Kia和 Stellantis。

NVIDIA Developer

developer.nvidia.com

使用生成式人工智慧建立應用程式。使用可在任何地方運行的生產就緒 API 體驗、原型化和部署 AI。

ai|coustics

ai-coustics.com

ai|coustics 是一款人工智慧工具，可使用先進演算法增強語音音訊品質。他們的生成語音人工智慧技術使用戶能夠在任何情況下獲得專業級的音訊質量，無論是錄製播客、視訊會議還是傳輸音訊。該工具不僅可以抑制背景噪音，還可以消除房間共振、補償低品質耳機並修復數位偽影以提高口語的清晰度和品質。它甚至可以恢復音訊訊號丟失的成分和頻率。該人工智慧工具非常適合任何以音訊為中心的應用程序，包括電信、播客平台、音訊錄製或傳輸硬體以及語音轉文字系統。利用其 HD-SPEECH API 和 SDK，將 ai|coustics 整合到音訊應用程式中非常簡單，並且可用於 Windows、Mac、Linux...

SpeechAce

speechace.com

在 SpeechAce，我們致力於透過多功能語音辨識技術幫助語言學習者提升口語能力。我們開發了世界上第一個語音辨識 API，不僅可以幫助語言學習者評估他們的口語技能，還可以確定他們需要改進的確切領域。雖然我們的語音識別API 的第一個版本僅提供發音分數，但我們現在增強了我們的產品，包括完整的語音轉錄以及對詞彙、語法、流暢性、連貫性和相關性等更高水平技能的評估。 SpeechAce 擁有多元化的全球客戶群，其中包括一些最小（但最熱門）的新創公司以及世界上一些最大的語言學習提供者。

Jupitrr

jupitrr.com

Jupitrr AI Video Maker 是一款人工智慧驅動的工具，允許創作者將他們的錄音和播客轉換為個人化影片。透過此工具，用戶可以在短短幾分鐘內輕鬆創建令人驚嘆的影片內容。 Jupitrr AI Video Maker 背後的 AI 技術可以自動為創作者的視頻生成素材視頻，包括素材、圖表、字幕等。該工具具有類似於編輯 Word 文件的用戶友好介面，無需複雜的時間線，使影片編輯變得輕而易舉。它提供了一鍵存取龐大影片庫的便利性，為用戶省去了搜尋合適素材的麻煩。 Jupitrr AI Video Maker 支援多種語言，包括西班牙語、印地語、法語、普通話等，可供世界各地的廣大創作者使...

MobileEngine

services.tineye.com

TinEye 是一家圖像搜尋和識別公司。我們是電腦視覺、模式辨識、神經網路和機器學習的專家。我們的使命是讓您的圖像可搜尋。

Deepgram

deepgram.com

Deepgram 是一家基礎人工智慧公司，其使命是理解人類語言。我們讓任何開發人員只需呼叫 API 即可獲得最先進的語音 AI 轉錄和理解功能。我們的模型提供最快、最準確的轉錄以及摘要、情緒分析和主題檢測等情境功能。除此之外，開發人員還可以： * 處理直播或預先錄製的音頻 * 轉錄為數十種語言 * 為獨特的用例訓練自訂模型 * 透過統一的 API 存取深度 NLU * 使用我們的 SDK 以任何程式語言構建 * 部署在本地或 DG 的託管雲端上 * 取得可擴展的 GPU 基礎設施以進行訓練和推理 Deepgram 是令人自豪的 NVIDIA 合作夥伴和 Y Combinator 公司...

PodcastAI

podcastai.com

PodcastAI 是一個使用先進的人工智慧工具來簡化播客製作的平台，提供快速轉錄、說話者識別、元數據生成和支援人工智慧主持人互動等功能。

Speechmatics

speechmatics.com

Speechmatics 是全球領先的語音智慧專家，結合人工智慧和機器學習的最新突破，釋放人類語音的商業價值。全球範圍內的企業都在使用 Speechmatics 來準確理解人類級別的語音並將其轉錄為文本，無論人口統計、年齡、性別、口音、方言或位置如何，都可以實時在錄製媒體上進行。將這些文字記錄與最新的人工智慧驅動的語音功能相結合，企業可以建立利用摘要、主題、情感、章節、翻譯等的產品。 Speechmatics 每個月都會處理全球 300 多年來 50 種語言的轉錄。其神經網路在語音辨識領域開創了機器學習的先河，考慮了聲學、語言、方言、多個說話者、標點符號、大寫、上下文和隱含含義。 Spe...

SuperAnnotate

superannotate.com

SuperAnnotate 是領先的平台，可利用最高品質的訓練資料更快地建立、微調、迭代和管理您的 AI 模型。借助先進的註釋和 QA 工具、資料管理、自動化功能、本機整合和資料治理，我們使企業能夠建立資料集和成功的 ML 管道。與 SuperAnnotate 的專家和專業管理的註釋團隊合作，可以幫助您快速提供高品質的數據，以建立最佳效能的模型。

Altered

altered.ai

Altered 是一款新一代音訊編輯器，它將多種語音 AI 技術整合到用戶友好的應用程式中，為各個行業（包括播客、視訊遊戲工作室和電子學習）製作高品質的語音內容。

Tune AI

tunehq.ai

Tune AI 正在推動 GenAI 在企業中的採用。我們得到了 Accel、Flipkart Ventures、Together Fund、Speciale Invest、Techstars 和其他知名投資者的支持 TuneChat：我們的聊天應用程式由開源模型提供支援 TuneStudio：我們為開發人員微調和部署法學碩士的遊樂場 ChainFury：我們的開源提示引擎可在 GitHub 上找到

Dictalogic

dictalogic.com

Dictalogic 提供專門的模組，包括音訊到文字、語音到文字、對話到文字和任務委派，所有這些都透過一個儀表板進行。 * 純音訊：傳統的音訊聽寫，其中音訊被錄製並發送給轉錄員，轉錄員可以在任何地方（包括在家工作）。 * 音訊轉文字：數位轉換可實現語音到文字的動態轉換。在這種方法中，音訊被記錄並發送以進行轉錄，並且音訊在到達轉錄者之前被轉換為文字。我們提供多種作業選項供您探索。 * 語音轉文字：我們也提供即時語音轉文字的功能。工作流程與其他聽寫相同，可以發送給任何轉錄員。 * 對話到文字：Dictalogic Conversation 模組是一種語音到文字解決方案，結合了語音識別、說話...

ArtPro

artpro.com

ArtPro 是一款藝術品庫存管理軟體，旨在協助線上編目、存檔、追蹤、分享和儲存藝術品。

Lambda

lambdalabs.com

Lambda 提供運算來加速人類進步。我們是一支深度學習工程師團隊，致力於建立世界上最好的 GPU 雲端、叢集、伺服器和工作站。我們的產品為工程師和研究人員提供了處於人類知識前沿的動力。客戶包括英特爾、微軟、谷歌、亞馬遜研究院、騰訊、凱撒醫療機構、麻省理工學院、史丹佛大學、哈佛大學、加州理工學院、洛斯阿拉莫斯國家實驗室、迪士尼和國防部。

SpeechFlow

speechflow.io

SpeechFlow 是一款尖端的語音轉文字工具，可為企業和個人提供無與倫比的準確性和效率。我們先進的人工智慧技術可確保將音訊和視訊內容精確轉錄為書面文本，支援多達 14 種語言，而不僅僅是英語。主要特點： * 多語言轉錄：支援 14 種語言，克服語言障礙。在不同的語言環境中獲得準確可靠的轉錄。 * 一體化轉錄解決方案：API與線上平台：針對企業和個人，SpeechFlow提供語音辨識API介面和線上轉錄功能，簡單易用。 * 準確的轉錄：受益於業界領先的準確性、了解行業特定術語以及全面可靠轉錄的背景。 * 行業特定模型：我們訓練有素的語音識別模型專為滿足各個行業的獨特需求而定制，可提高醫療...

Faceplusplus

faceplusplus.com

Face++ 是一個提供電腦視覺技術的平台，讓您的應用程式能夠更好地閱讀和理解世界。

Phonexia

phonexia.com

Phonexia 是一家創新捷克軟體公司，成立於 2006 年，其願景是透過語音生物辨識和語音辨識技術釋放語音潛力。透過與布爾諾理工大學著名語音研究小組的密切合作，Phonexia 正在將最新的科學突破轉化為由深度神經網路驅動的高精度、最先進技術的日常現實。 Phonexia 為政府、法醫和商業部門提供一系列先進軟體，支援全球 60 多個國家的創新專案。

Capsolver

capsolver.com

Capsolver 的自動驗證碼求解器提供最實惠、最快速的驗證碼求解解決方案。您可以使用其簡單的整合選項快速將其與您的程式結合起來，從而在幾秒鐘內獲得最佳結果。 Capsolver 每分鐘可回答超過 1000 萬個驗證碼，成功率為 99.15%。這意味著您的自動化或抓取將具有 99.99% 的正常運作時間。如果您有大量預算，您可以購買驗證碼包。以市場上最低的價格，您可以獲得多種解決方案，包括 reCAPTCHA V2、reCAPTCHA V3、hCaptcha、hCaptcha Click、reCaptcha click、Funcaptcha Click、FunCaptcha、aws ca...

Vatis Tech

vatis.tech

以卓越的準確性和經濟性徹底改變語音辨識。 Vatis Tech 的 API 提供先進的語音到文字技術，使用專有的深度學習語音辨識演算法，自動將音訊或視訊檔案轉換為文本，準確率超過 95%。 Vatis Tech 為敏捷新創公司、大型企業、播客、記者和開發人員等提供語音轉文字 API 引擎和 Web 平台。這使得解決方案和服務提供者能夠將技術整合到他們的應用程式中，無論行業或用例如何。 * 部署在本地或雲端 * 使用我們的 API 以任何程式語言構建 * 取得可擴展的 GPU 基礎設施以進行訓練和推理 * 情境功能，例如說話者分類、實體偵測、標點符號以及大寫或數字轉換。 * Web 應用程...

Talkatoo

talkatoo.com

Talkatoo 正在為醫療專業人員重塑聽寫功能。無論您是在獸醫行業還是人類醫療行業，Talkatoo 都是適合您的語音轉文字軟體解決方案。 Talkatoo 在 Windows 和 Mac 上相容，適用於您可以鍵入的任何領域（包括 PIM 和 EHR），並且非常易於使用。 * Talkatoo 是一款專為臨床使用而設計的桌面聽寫解決方案，重點是將語音轉換為文本，包括專業詞彙和醫學術語。 * 審查者讚賞 Talkatoo 能夠準確地將語音轉換為文字（包括複雜的醫學術語），並且其用戶友好的介面有助於提高創建醫療記錄的效率和生產力。 * 審閱者指出，Talkatoo 在處理大量指令時可能會很慢，...

Shownotes

shownotes.io

Shownotes 是一款由人工智慧驅動的工具，可自動總結播客劇集並建立包含完整文字記錄和字幕檔案的登陸頁面。它使用 chatGPT 轉換 YouTube 自動字幕並產生令人難忘的引言，還可以根據腳本建立部落格文章。 Shownotes 提供三種方案：免費、Creator 和 Pro。免費方案每月提供一份表演筆記、一份摘要記錄、一個登陸頁面，並且所有表演都是公開的。 Creator 計劃每月提供兩個表演筆記、一份摘要記錄、一個登陸頁面、將節目設為私有的功能、登陸頁面編輯器、完整記錄以及 ums & ahs。 Pro 計劃提供無限的表演筆記、摘要記錄、登陸頁面、將節目設為私有的功能、登陸頁...

Symbl.ai

symbl.ai

Symbl.ai 是一個對話智慧平台，使用先進的深度學習模型為開發人員提供非結構化對話資料的即時轉錄和見解。該工具為各行業提供解決方案，例如收入情報、活動和網路研討會、遠端協作、聯絡中心和招募情報。 Symbl.ai 的功能支援自訂追蹤器、摘要、主題建模、轉錄、對話分析以及用於語音、音訊和文字資料的預先建構 UI 和元件。憑藉其 API 技術，Symbl.ai 可以對非結構化人類對話進行即時非同步語音識別，使該工具能夠透過單一 API 呼叫來添加智慧。此外，該平台還透過批次/非同步請求在不到 400 毫秒的時間內提供即時關鍵字、短語和意圖檢測。 Symbl.ai 包含語音到文字...

VXG

videoexpertsgroup.com

VXG 是一家全球雲端視訊監控公司，致力於簡化視訊管理並使系統以經濟高效的方式擴展。幫助連接超過 150,000 個攝影機的系統整合商、安全、存取控制、人工智慧、視訊監控、電信和 SaaS 公司建立客製化的世界級視訊監控解決方案。真正的開放雲平台旨在與其他解決方案整合或建構與 IP 攝影機配合使用的新服務。 VXG 是針對 SaaS 公司的面向未來的創新技術平台和雲端 VMS 引擎，完全靈活、可擴展、經濟高效、白標和可自訂。提供最快、最簡單的真正雲端視訊監控路徑，並提供具有完整原始程式碼和所有必要組件的完整 VMS。完全開放（與產品無關）平台的關鍵價值在於，客戶可以在自己的雲端/資料中心...