第 2 頁 - 替代項 - Krisp

SoundHound

soundhound.com

作為對話智慧的領先創新者，我們提供獨立的語音人工智慧平台，使各行業的企業能夠為其客戶提供一流的對話體驗。 SoundHound 的先進語音AI 平台以專有的Speech-to-Meaning® 和Deep Meaning Understanding® 技術為基礎，提供卓越的速度和準確性，使人類能夠透過自然說話的方式與產品和服務進行交互，就像彼此互動一樣。 SoundHound 受到全球各地公司的信賴，包括現代、梅賽德斯-奔馳、Pandora、高通、Netflix、Snap、Square、LG、VIZIO、Kia和 Stellantis。

Vowel

vowel.com

Vowel 是一款由人工智慧驅動的視訊會議和會議工具。借助人工智慧驅動的會議摘要，Vowel 使每次會議更具包容性和價值，並提供簡單、安全和可靠的體驗。主持、錄製、轉錄、剪輯、搜尋和分享會議 - 無需任何附加組件！主要功能： - 人工智慧驅動的會議摘要，掛機後立即可用 - 人工智慧驅動的行動項目（即時建議） - MeetingGPT，人工智慧驅動的會議問答 - Catch Me Up 會議回顧 - 在以下位置舉辦愉快的視訊會議您的瀏覽器- 一鍵記錄和轉錄，即使是免費計劃- 實時協作處理議程和會議記錄（包括行動項目） - 在所有會議內容中搜索所說的每一句話- Zapier 集成- 剪輯會議時刻並分享即時背景- 透過通話時間追蹤、表情符號、舉手等讓會議更具包容性，立即免費試用Vowel！

Demodesk

demodesk.com

Demodesk 是領先的虛擬銷售平台。自動安排會議、召開專業視訊會議，並利用人工智慧即時指導銷售團隊。 100% GDPR 合規、企業級安全和支援。該平台可自動執行重複性任務並簡化整個銷售流程，使銷售代表能夠專注於建立關係和完成交易。自動調度、即時筆記和 CRM 整合等功能可優化效率和生產力。透過 Demodesk，銷售專業人員可以提供精彩的產品演示，而不僅僅是幻燈片。該平台提供革命性的螢幕共享和互動功能，為潛在客戶創造身臨其境的個人化體驗，從而提高參與度和轉換率。追蹤或整合劇本和戰鬥卡等功能可在虛擬通話期間實現即時指導。該平台提供全面的分析和報告功能，可提供有關銷售業績的可行見解。有了這些有價值的數據，銷售領導者就可以做出數據驅動的決策、優化銷售流程並確定需要改進的領域。各種規模的企業都依賴我們來實現銷售數位化、提高生產力並增加收入。我們客戶的主要成果：手動任務節省了25% 的時間(Pipedrive) ↑ 轉換率提高了2 倍(Clark) 每個賣家的收入提高了30% (Treatwell) ↑ 座席工作效率提高了3 倍(Eigensonne)欲了解更多信息，請訪問demodesk.com 。

ai|coustics

ai-coustics.com

ai|coustics 是一款人工智慧工具，可使用先進演算法增強語音音訊品質。他們的生成語音人工智慧技術使用戶能夠在任何情況下獲得專業級的音訊質量，無論是錄製播客、視訊會議還是傳輸音訊。該工具不僅可以抑制背景噪音，還可以消除房間共振、補償低品質耳機並修復數位偽影以提高口語的清晰度和品質。它甚至可以恢復音訊訊號丟失的成分和頻率。該人工智慧工具非常適合任何以音訊為中心的應用程序，包括電信、播客平台、音訊錄製或傳輸硬體以及語音轉文字系統。利用其 HD-SPEECH API 和 SDK，將 ai|coustics 整合到音訊應用程式中非常簡單，並且可用於 Windows、Mac、Linux、Web、Android 和 iOS 平台，在嵌入式、桌面和雲端環境中運行。使用者可以透過造訪其 PLAYGROUND 頁面來親身體驗該工具的強大功能，在那裡他們可以看到和聽到人工智慧語音增強的變革效果。 ai|coustics 也提供聯絡資訊，包括電子郵件、電話和地址，以及指向其網站通知和隱私權政策的連結。希望提高語音應用程式音訊品質的用戶可以受益於 ai|coustics 的先進 AI 演算法，該演算法可將音訊品質提升至專業級標準。

Deepgram

deepgram.com

Deepgram 是一家基礎人工智慧公司，其使命是理解人類語言。我們讓任何開發人員只需呼叫 API 即可獲得最先進的語音 AI 轉錄和理解功能。我們的模型提供最快、最準確的轉錄以及摘要、情緒分析和主題檢測等情境功能。除此之外，開發人員還可以： * 處理直播或預先錄製的音頻 * 轉錄為數十種語言 * 為獨特的用例訓練自訂模型 * 透過統一的 API 存取深度 NLU * 使用我們的 SDK 以任何程式語言構建 * 部署在本地或 DG 的託管雲端上 * 取得可擴展的 GPU 基礎設施以進行訓練和推理 Deepgram 是令人自豪的 NVIDIA 合作夥伴和 Y Combinator 公司，我們最近完成了 7,200 萬美元的 B 輪融資，以定義 AI 語音理解的未來，使我們成為現階段資金最多的語音 AI 公司。 NVIDIA 合作夥伴和 Y Combinator 公司。

SpeechAce

speechace.com

在 SpeechAce，我們致力於透過多功能語音辨識技術幫助語言學習者提升口語能力。我們開發了世界上第一個語音辨識 API，不僅可以幫助語言學習者評估他們的口語技能，還可以確定他們需要改進的確切領域。雖然我們的語音識別API 的第一個版本僅提供發音分數，但我們現在增強了我們的產品，包括完整的語音轉錄以及對詞彙、語法、流暢性、連貫性和相關性等更高水平技能的評估。 SpeechAce 擁有多元化的全球客戶群，其中包括一些最小（但最熱門）的新創公司以及世界上一些最大的語言學習提供者。

Jupitrr

jupitrr.com

Jupitrr AI Video Maker 是一款人工智慧驅動的工具，允許創作者將他們的錄音和播客轉換為個人化影片。透過此工具，用戶可以在短短幾分鐘內輕鬆創建令人驚嘆的影片內容。 Jupitrr AI Video Maker 背後的 AI 技術可以自動為創作者的視頻生成素材視頻，包括素材、圖表、字幕等。該工具具有類似於編輯 Word 文件的用戶友好介面，無需複雜的時間線，使影片編輯變得輕而易舉。它提供了一鍵存取龐大影片庫的便利性，為用戶省去了搜尋合適素材的麻煩。 Jupitrr AI Video Maker 支援多種語言，包括西班牙語、印地語、法語、普通話等，可供世界各地的廣大創作者使用。除了庫存影片之外，該工具還提供了添加各種大小和样式的字幕和說明文字的選項。它甚至包括人工智慧生成的迷人圖表，旨在簡化將視覺數據融入影片的過程。 Jupitrr AI Video Maker旨在為創作者賦能，讓他們專注於自己的創意願景，而不是在影片編輯上花費過多的精力。憑藉其簡單性和多功能性，Jupitrr AI Video Maker 對於希望增強影片製作流程的內容創作者來說是一個有價值的工具。

PodcastAI

podcastai.com

PodcastAI 是一個使用先進的人工智慧工具來簡化播客製作的平台，提供快速轉錄、說話者識別、元數據生成和支援人工智慧主持人互動等功能。

Altered

altered.ai

Altered 是一款新一代音訊編輯器，它將多種語音 AI 技術整合到用戶友好的應用程式中，為各個行業（包括播客、視訊遊戲工作室和電子學習）製作高品質的語音內容。

Speechmatics

speechmatics.com

Speechmatics 是全球領先的語音智慧專家，結合人工智慧和機器學習的最新突破，釋放人類語音的商業價值。全球範圍內的企業都在使用 Speechmatics 來準確理解人類級別的語音並將其轉錄為文本，無論人口統計、年齡、性別、口音、方言或位置如何，都可以實時在錄製媒體上進行。將這些文字記錄與最新的人工智慧驅動的語音功能相結合，企業可以建立利用摘要、主題、情感、章節、翻譯等的產品。 Speechmatics 每個月都會處理全球 300 多年來 50 種語言的轉錄。其神經網路在語音辨識領域開創了機器學習的先河，考慮了聲學、語言、方言、多個說話者、標點符號、大寫、上下文和隱含含義。 Speechmatics 總部位於英國劍橋，在紐約也有辦公室。 Speechmatics 是註冊商標。

Dictalogic

dictalogic.com

Dictalogic 提供專門的模組，包括音訊到文字、語音到文字、對話到文字和任務委派，所有這些都透過一個儀表板進行。 * 純音訊：傳統的音訊聽寫，其中音訊被錄製並發送給轉錄員，轉錄員可以在任何地方（包括在家工作）。 * 音訊轉文字：數位轉換可實現語音到文字的動態轉換。在這種方法中，音訊被記錄並發送以進行轉錄，並且音訊在到達轉錄者之前被轉換為文字。我們提供多種作業選項供您探索。 * 語音轉文字：我們也提供即時語音轉文字的功能。工作流程與其他聽寫相同，可以發送給任何轉錄員。 * 對話到文字：Dictalogic Conversation 模組是一種語音到文字解決方案，結合了語音識別、說話者識別和每個說話者的句子歸屬（也稱為分類），以提供任何對話的即時和/或非同步轉錄 -所有內容都封裝在一個可隨時存取的安全入口網站中，24/7。

Talkatoo

talkatoo.com

Talkatoo 正在為醫療專業人員重塑聽寫功能。無論您是在獸醫行業還是人類醫療行業，Talkatoo 都是適合您的語音轉文字軟體解決方案。 Talkatoo 在 Windows 和 Mac 上相容，適用於您可以鍵入的任何領域（包括 PIM 和 EHR），並且非常易於使用。 * Talkatoo 是一款專為臨床使用而設計的桌面聽寫解決方案，重點是將語音轉換為文本，包括專業詞彙和醫學術語。 * 審查者讚賞 Talkatoo 能夠準確地將語音轉換為文字（包括複雜的醫學術語），並且其用戶友好的介面有助於提高創建醫療記錄的效率和生產力。 * 審閱者指出，Talkatoo 在處理大量指令時可能會很慢，有時難以識別特定的、不太常見的術語，而且其客戶支援回應可能會延遲。

SpeechFlow

speechflow.io

SpeechFlow 是一款尖端的語音轉文字工具，可為企業和個人提供無與倫比的準確性和效率。我們先進的人工智慧技術可確保將音訊和視訊內容精確轉錄為書面文本，支援多達 14 種語言，而不僅僅是英語。主要特點： * 多語言轉錄：支援 14 種語言，克服語言障礙。在不同的語言環境中獲得準確可靠的轉錄。 * 一體化轉錄解決方案：API與線上平台：針對企業和個人，SpeechFlow提供語音辨識API介面和線上轉錄功能，簡單易用。 * 準確的轉錄：受益於業界領先的準確性、了解行業特定術語以及全面可靠轉錄的背景。 * 行業特定模型：我們訓練有素的語音識別模型專為滿足各個行業的獨特需求而定制，可提高醫療保健、金融、法律、客戶服務和教育領域的運營效率。 * 閃電般的快速處理：體驗快速轉錄，在 3 分鐘內轉錄 1 小時的音頻，節省您的寶貴時間。 * 每月免費延長試用：每位使用者每月 5 小時免費語音轉文字轉錄 * 經濟高效的定價：價格低至每秒 0.0002 美元，透過我們靈活的即用即付定價，只需為您使用的內容付費主要適用範圍： * 聯絡中心：從客戶對話中提取有價值的見解，提高座席工作效率並降低成本。 * 視訊字幕：透過準確的視訊轉錄增強可訪問性並覆蓋更廣泛的受眾。 * 虛擬會議：輕鬆轉錄會議並從每次討論中獲取見解，無論背景噪音如何。 * 媒體監控：透過高精準度偵測仇恨言論和髒話等敏感內容，建構更安全的平台。 * 內容創作者：輕鬆轉錄訪談和講座以進行重點分析。 * 筆譯員和口譯員：增強工作流程並提供精確的翻譯。使用要求： SpeechFlow 一流的準確性、快速處理、多語言支援和經濟高效的定價使 SpeechFlow 成為滿足您所有語音轉文字需求的最終選擇。立即點擊以簡化您的轉錄流程，並透過 SpeechFlow 將您的業務提升到新的水平！

ArtPro

artpro.com

ArtPro 是一款藝術品庫存管理軟體，旨在協助線上編目、存檔、追蹤、分享和儲存藝術品。

Vatis Tech

vatis.tech

以卓越的準確性和經濟性徹底改變語音辨識。 Vatis Tech 的 API 提供先進的語音到文字技術，使用專有的深度學習語音辨識演算法，自動將音訊或視訊檔案轉換為文本，準確率超過 95%。 Vatis Tech 為敏捷新創公司、大型企業、播客、記者和開發人員等提供語音轉文字 API 引擎和 Web 平台。這使得解決方案和服務提供者能夠將技術整合到他們的應用程式中，無論行業或用例如何。 * 部署在本地或雲端 * 使用我們的 API 以任何程式語言構建 * 取得可擴展的 GPU 基礎設施以進行訓練和推理 * 情境功能，例如說話者分類、實體偵測、標點符號以及大寫或數字轉換。 * Web 應用程式內的文字編輯功能 * 轉錄為即時或預先錄製的文件

Phonexia

phonexia.com

Phonexia 是一家創新捷克軟體公司，成立於 2006 年，其願景是透過語音生物辨識和語音辨識技術釋放語音潛力。透過與布爾諾理工大學著名語音研究小組的密切合作，Phonexia 正在將最新的科學突破轉化為由深度神經網路驅動的高精度、最先進技術的日常現實。 Phonexia 為政府、法醫和商業部門提供一系列先進軟體，支援全球 60 多個國家的創新專案。

Voxpow

voxpow.com

由機器學習提供支援的語音到文字轉換。直接在您的網站上免費。 Voxpow 支援您的全球用戶群，可識別超過 100 種語言及其變體。

Laxis

laxis.com

Laaxis 旨在優化客戶對話，是一款人工智慧會議助手，旨在幫助收入團隊從互動中獲取關鍵洞察，並在各種商業能力中表現更好。該工具使用人工智慧系統來記錄、轉錄並提供客戶會議期間討論的要點的精確提煉，確保不遺漏任何關鍵細節。該工具對各種專業人士都有好處，包括銷售、行銷、業務開發、專案經理以及產品和使用者體驗設計師，因為它在市場研究、追蹤投資組合筆記、捕捉客戶需求和活動等不同領域提供幫助。它可以自動產生會議摘要和後續電子郵件，並使使用者能夠一鍵將客戶需求、行動項目和會議摘要保存在 CRM 中。使用者還可以從單一或一組會議中提取相關見解。透過包含語言首選項，Laxis 支援多語言交互，確保會議的準確即時轉錄和多語言交互的詳細記錄保存。它還允許用戶只需單擊即可重新調整音訊內容的用途，例如播客、網路研討會和會議。

Shownotes

shownotes.io

Shownotes 是一款由人工智慧驅動的工具，可自動總結播客劇集並建立包含完整文字記錄和字幕檔案的登陸頁面。它使用 chatGPT 轉換 YouTube 自動字幕並產生令人難忘的引言，還可以根據腳本建立部落格文章。 Shownotes 提供三種方案：免費、Creator 和 Pro。免費方案每月提供一份表演筆記、一份摘要記錄、一個登陸頁面，並且所有表演都是公開的。 Creator 計劃每月提供兩個表演筆記、一份摘要記錄、一個登陸頁面、將節目設為私有的功能、登陸頁面編輯器、完整記錄以及 ums & ahs。 Pro 計劃提供無限的表演筆記、摘要記錄、登陸頁面、將節目設為私有的功能、登陸頁面編輯器、完整記錄、ums & ahs 以及字幕檔案。

Symbl.ai

symbl.ai

Symbl.ai 是一個對話智慧平台，使用先進的深度學習模型為開發人員提供非結構化對話資料的即時轉錄和見解。該工具為各行業提供解決方案，例如收入情報、活動和網路研討會、遠端協作、聯絡中心和招募情報。 Symbl.ai 的功能支援自訂追蹤器、摘要、主題建模、轉錄、對話分析以及用於語音、音訊和文字資料的預先建構 UI 和元件。憑藉其 API 技術，Symbl.ai 可以對非結構化人類對話進行即時非同步語音識別，使該工具能夠透過單一 API 呼叫來添加智慧。此外，該平台還透過批次/非同步請求在不到 400 毫秒的時間內提供即時關鍵字、短語和意圖檢測。 Symbl.ai 包含語音到文字集成，允許為人類對話建立最準確的非同步語音識別 API。此工具的對話分析會產生各種指標來增強使用者或座席對話分析，例如說聽比、每分鐘字數、通話時間和基於主題的情緒。 Symbl.ai 還支援跨各種對話管道（例如視訊或音訊檔案、電話和串流媒體）處理對話並提取見解。此外，Symbl.ai 優先考慮客戶支持，提供無需使用承諾的靈活計劃和可擴展的成長選項。

Voiceitt

vocitec.com

Voiceitt 是一家屢獲殊榮的語音辨識新創公司和社會企業，開發了專有的自動語音辨識(ASR) 技術，可將非標準語音模式即時轉換為清晰的語音，使患有嚴重言語障礙和殘疾的兒童和成人能夠存取主流語音啟動技術和設備。一款支援非標準語音人士進行語音交流的應用程式。您可以使用 Voiceitt 與他人以及使用 Alexa 等語音啟動設備進行語音通訊！

Kukarella

kukarella.com

畫外音具有完美的音訊清晰度、節奏、語調和發音。在 Kukarella 上，您可以嘗試最好的 AI 神經語音。包括所有商業權利。 Kukarella 提供 130 種語言和口音的 800 多種人工智慧語音，適合我們任何付費方案的商業用途。除了配音之外，您還可以使用 Dialogues AI 工具創建對話，或使用 Simdubbing 工具將文字翻譯和配音成數百種語言。這還不是全部 - 您可以轉錄各種視頻、音頻和 YouTube 視頻，從網頁中抓取文本，以及識別圖像上的文本。此外，Kukarella 與一些科技領域的知名企業合作，例如 Google、Amazon、Microsoft 和 IBM，因此您知道自己正在獲得最好的產品。來自加拿大政府、Salesforce、DHL、麥當勞、倫敦大學和戴姆勒梅賽德斯等組織的許多創意人士都使用 Kukarella 進行配音和轉錄，因此您將成為良好的伙伴。

Avoma

avoma.com

Avama 是面向客戶團隊的端到端人工智慧會議助理。其人工智慧技術可協助面向客戶的團隊在重要會議之前、期間和之後捕捉重要的客戶資訊。 Avama 分析對話見解和情報，幫助銷售代表縮短銷售週期並取悅更多客戶。透過 Avama，您可以自動記錄所有會議、取得完整的文字記錄和摘要筆記，以及直接同步到 CRM 的可操作見解。透過直接在記錄中搜尋並使用已確定的主題來準確找到您要查找的內容，可以更快地查看通話和會議。 Avama 與您最喜歡的工具無縫整合。

Dubber

dubber.net

Dubber 是全球統一的雲端通話錄音和語音 AI 解決方案，可提高合規性以及銷售和服務績效。 Dubber 完全相容的通話錄音解決方案只需單擊即可打開，並且可以在雲端中無限擴展 - 無需任何硬體。每個通話或對話都會自動捕獲，安全地儲存在 Dubber 語音智慧雲中，並透過人工智慧進行豐富，並可立即作為重播或富有洞察力的轉錄，並具有即時搜尋、情緒分析、警報和通知。

CrystalSound

crystalsound.ai

CrystalSound 是一款使用人工智慧技術的桌面應用程序，有助於消除通話、錄音和線上會議期間所有不必要的噪音和乾擾。憑藉其先進的演算法和最先進的功能，CrystalSound 可以消除背景噪音、迴聲、嘯叫效果和其他聲音，確保您能夠清晰有效地進行溝通。 CrystalSound能夠運作在Mac、Windows、Linux作業系統上，滿足使用者下載和使用的需求。有了 CrystalSound，您不必再擔心通訊應用程式的相容性問題。我們的解決方案旨在與 Teams、Zoom、Google Meet、Loom、Discord 等流行應用程式無縫協作。

Crescendo

crescendo.com

Crescendo Systems Corporation 是醫療、法律、執法和保險領域文件、數位聽寫、語音處理、轉錄和工作流程管理系統的領先開發商。

SpeechWrite

speechwrite.com

SpeechWrite 是一家專注於工作流程解決方案、數位聽寫、語音辨識和 PDF 解決方案的完整解決方案提供者。 SpeechWrite 的實用技術複雜而簡單，可讓您改善工作環境並更聰明地工作。 SpeechWrite 與 OEM 和技術合作夥伴密切合作，對最新技術發展和市場趨勢有廣泛的了解。 SpeechWrite 成立於 2001 年，在聽寫行業擁有 100 多年的經驗，並以其上市速度和售後支援而自豪。

Picovoice

picovoice.ai

Picovoice 是一個端對端平台，可根據您的需求為任何內容添加語音。透過創新加速語音人工智慧的採用。 Picovoice 透過在裝置、行動裝置、網路瀏覽器、本地端和雲端上運行的準確、私密且快速的語音 AI 技術，將控制權帶回給企業。

Philips SpeechLive

speechlive.com

Philips SpeechLive 是一種基於雲端的聽寫、轉錄和語音辨識工作流程解決方案。它可以幫助作者比以往更快地從語音到文字。 SpeechLive 使用 Microsoft Azure 雲端服務透過多重驗證進行完整的端對端加密。我們的附加語音辨識服務具有多語言功能、即時和延遲選項以及語音命令功能，可在您口述時格式化您的文件。

Thirdlane

thirdlane.com

Thirdlane Connect 是一款多功能客戶溝通和團隊協作應用程序，為您的團隊提供一系列功能，包括聊天、語音和視訊通話、會議、螢幕共享、文件共享以及與CRM 和各種其他業務應用程式的無縫整合。 Thirdlane Connect 旨在促進多通路客戶溝通和團隊協作，專為本地和遠端工作人員而設計，支援網頁瀏覽器、iPhone、Android 裝置以及 Windows、Linux 和 Mac 桌面。這項強大的應用程式與 Thirdlane 商務電話系統或 Thirdlane 多租戶 PBX 平台完全整合並由其提供支援。這些平台可以安全地部署在各種環境中，無論是在本地還是在私有雲或公有雲中，從而確保您的通訊基礎架構的靈活性和安全性。