第 2 頁 - 替代項 - Krisp

Speechlogger

Speechlogger

speechlogger.com

Speech Logger 是一款基於網路的語音辨識和語音翻譯軟體,包括自動標點符號、自動儲存、時間戳記、文字內編輯功能、音訊檔案轉錄、匯出選項等。 * Speechlogger 是一款專為演講、會議或活動的自動即時字幕和翻譯而設計的工具,具有自動標點符號、發言者識別和情緒分析等附加功能。 * 審查者讚賞Speechlogger 即使在嘈雜的背景下也能準確轉錄語音的能力、其用戶友好的設計以及自動標點符號、說話人識別和情緒分析等獨特功能,他們認為這些功能優於某些付費轉錄工具。 * 用戶遇到的問題包括影響免費版本表現的廣告、偶爾出現的翻譯錯誤、轉錄不常見口音時的準確性較低、缺乏語音控制以及情緒分...

Jupitrr

Jupitrr

jupitrr.com

Jupitrr AI Video Maker 是一款人工智慧驅動的工具,允許創作者將他們的錄音和播客轉換為個人化影片。透過此工具,用戶可以在短短幾分鐘內輕鬆創建令人驚嘆的影片內容。 Jupitrr AI Video Maker 背後的 AI 技術可以自動為創作者的視頻生成素材視頻,包括素材、圖表、字幕等。該工具具有類似於編輯 Word 文件的用戶友好介面,無需複雜的時間線,使影片編輯變得輕而易舉。 它提供了一鍵存取龐大影片庫的便利性,為用戶省去了搜尋合適素材的麻煩。 Jupitrr AI Video Maker 支援多種語言,包括西班牙語、印地語、法語、普通話等,可供世界各地的廣大創作者使...

Speechmatics

Speechmatics

speechmatics.com

Speechmatics 是全球領先的語音智慧專家,結合人工智慧和機器學習的最新突破,釋放人類語音的商業價值。全球範圍內的企業都在使用 Speechmatics 來準確理解人類級別的語音並將其轉錄為文本,無論人口統計、年齡、性別、口音、方言或位置如何,都可以實時在錄製媒體上進行。 將這些文字記錄與最新的人工智慧驅動的語音功能相結合,企業可以建立利用摘要、主題、情感、章節、翻譯等的產品。 Speechmatics 每個月都會處理全球 300 多年來 50 種語言的轉錄。其神經網路在語音辨識領域開創了機器學習的先河,考慮了聲學、語言、方言、多個說話者、標點符號、大寫、上下文和隱含含義。 Spe...

Deepgram

Deepgram

deepgram.com

Deepgram 是一家基礎人工智慧公司,其使命是理解人類語言。我們讓任何開發人員只需呼叫 API 即可獲得最先進的語音 AI 轉錄和理解功能。 我們的模型提供最快、最準確的轉錄以及摘要、情緒分析和主題檢測等情境功能。 除此之外,開發人員還可以: * 處理直播或預先錄製的音頻 * 轉錄為數十種語言 * 為獨特的用例訓練自訂模型 * 透過統一的 API 存取深度 NLU * 使用我們的 SDK 以任何程式語言構建 * 部署在本地或 DG 的託管雲端上 * 取得可擴展的 GPU 基礎設施以進行訓練和推理 Deepgram 是令人自豪的 NVIDIA 合作夥伴和 Y Combinator 公司...

SpeechAce

SpeechAce

speechace.com

在 SpeechAce,我們致力於透過多功能語音辨識技術幫助語言學習者提升口語能力。我們開發了世界上第一個語音辨識 API,不僅可以幫助語言學習者評估他們的口語技能,還可以確定他們需要改進的確切領域。雖然我們的語音識別API 的第一個版本僅提供發音分數,但我們現在增強了我們的產品,包括完整的語音轉錄以及對詞彙、語法、流暢性、連貫性和相關性等更高水平技能的評估。 SpeechAce 擁有多元化的全球客戶群,其中包括一些最小(但最熱門)的新創公司以及世界上一些最大的語言學習提供者。

Altered

Altered

altered.ai

Altered 是一款新一代音訊編輯器,它將多種語音 AI 技術整合到用戶友好的應用程式中,為各個行業(包括播客、視訊遊戲工作室和電子學習)製作高品質的語音內容。

PodcastAI

PodcastAI

podcastai.com

PodcastAI 是一個使用先進的人工智慧工具來簡化播客製作的平台,提供快速轉錄、說話者識別、元數據生成和支援人工智慧主持人互動等功能。

Symbl.ai

Symbl.ai

symbl.ai

Symbl.ai 是一個對話智慧平台,使用先進的深度學習模型為開發人員提供非結構化對話資料的即時轉錄和見解。 該工具為各行業提供解決方案,例如收入情報、活動和網路研討會、遠端協作、聯絡中心和招募情報。 Symbl.ai 的功能支援自訂追蹤器、摘要、主題建模、轉錄、對話分析以及用於語音、音訊和文字資料的預先建構 UI 和元件。 憑藉其 API 技術,Symbl.ai 可以對非結構化人類對話進行即時非同步語音識別,使該工具能夠透過單一 API 呼叫來添加智慧。 此外,該平台還透過批次/非同步請求在不到 400 毫秒的時間內提供即時關鍵字、短語和意圖檢測。 Symbl.ai 包含語音到文字...

X Image Generator

X Image Generator

ximagegenerator.com

X Image Generator 是一款由人工智慧驅動的工具,可讓用戶使用 Twitter 的 xAI 中的 Grok AI 模型根據文字提示建立圖像。 使用者輸入描述所需圖像的文字提示,Grok AI 模型根據這些提示產生相應的圖像。

Phonexia

Phonexia

phonexia.com

Phonexia 是一家創新捷克軟體公司,成立於 2006 年,其願景是透過語音生物辨識和語音辨識技術釋放語音潛力。透過與布爾諾理工大學著名語音研究小組的密切合作,Phonexia 正在將最新的科學突破轉化為由深度神經網路驅動的高精度、最先進技術的日常現實。 Phonexia 為政府、法醫和商業部門提供一系列先進軟體,支援全球 60 多個國家的創新專案。

ai|coustics

ai|coustics

ai-coustics.com

ai|coustics 是一款人工智慧工具,可使用先進演算法增強語音音訊品質。他們的生成語音人工智慧技術使用戶能夠在任何情況下獲得專業級的音訊質量,無論是錄製播客、視訊會議還是傳輸音訊。 該工具不僅可以抑制背景噪音,還可以消除房間共振、補償低品質耳機並修復數位偽影以提高口語的清晰度和品質。 它甚至可以恢復音訊訊號丟失的成分和頻率。該人工智慧工具非常適合任何以音訊為中心的應用程序,包括電信、播客平台、音訊錄製或傳輸硬體以及語音轉文字系統。 利用其 HD-SPEECH API 和 SDK,將 ai|coustics 整合到音訊應用程式中非常簡單,並且可用於 Windows、Mac、Linux...

SpeechFlow

SpeechFlow

speechflow.io

SpeechFlow 是一款尖端的語音轉文字工具,可為企業和個人提供無與倫比的準確性和效率。我們先進的人工智慧技術可確保將音訊和視訊內容精確轉錄為書面文本,支援多達 14 種語言,而不僅僅是英語。 主要特點: * 多語言轉錄:支援 14 種語言,克服語言障礙。在不同的語言環境中獲得準確可靠的轉錄。 * 一體化轉錄解決方案:API與線上平台:針對企業和個人,SpeechFlow提供語音辨識API介面和線上轉錄功能,簡單易用。 * 準確的轉錄:受益於業界領先的準確性、了解行業特定術語以及全面可靠轉錄的背景。 * 行業特定模型:我們訓練有素的語音識別模型專為滿足各個行業的獨特需求而定制,可提高醫療...

Shownotes

Shownotes

shownotes.io

Shownotes 是一款由人工智慧驅動的工具,可自動總結播客劇集並建立包含完整文字記錄和字幕檔案的登陸頁面。它使用 chatGPT 轉換 YouTube 自動字幕並產生令人難忘的引言,還可以根據腳本建立部落格文章。 Shownotes 提供三種方案:免費、Creator 和 Pro。免費方案每月提供一份表演筆記、一份摘要記錄、一個登陸頁面,並且所有表演都是公開的。 Creator 計劃每月提供兩個表演筆記、一份摘要記錄、一個登陸頁面、將節目設為私有的功能、登陸頁面編輯器、完整記錄以及 ums & ahs。 Pro 計劃提供無限的表演筆記、摘要記錄、登陸頁面、將節目設為私有的功能、登陸頁...

SoundHound AI

SoundHound AI

soundhound.com

作為對話智慧的領先創新者,我們提供獨立的語音人工智慧平台,使各行業的企業能夠為其客戶提供一流的對話體驗。 SoundHound 的先進語音AI 平台以專有的Speech-to-Meaning® 和Deep Meaning Understanding® 技術為基礎,提供卓越的速度和準確性,使人類能夠透過自然說話的方式與產品和服務進行交互,就像彼此互動一樣。 SoundHound 受到全球各地公司的信賴,包括現代、梅賽德斯-奔馳、Pandora、高通、Netflix、Snap、Square、LG、VIZIO、Kia和 Stellantis。

Dictalogic

Dictalogic

dictalogic.com

Dictalogic 提供專門的模組,包括音訊到文字、語音到文字、對話到文字和任務委派,所有這些都透過一個儀表板進行。 * 純音訊:傳統的音訊聽寫,其中音訊被錄製並發送給轉錄員,轉錄員可以在任何地方(包括在家工作)。 * 音訊轉文字:數位轉換可實現語音到文字的動態轉換。在這種方法中,音訊被記錄並發送以進行轉錄,並且音訊在到達轉錄者之前被轉換為文字。我們提供多種作業選項供您探索。 * 語音轉文字:我們也提供即時語音轉文字的功能。工作流程與其他聽寫相同,可以發送給任何轉錄員。 * 對話到文字:Dictalogic Conversation 模組是一種語音到文字解決方案,結合了語音識別、說話...

ArtPro

ArtPro

artpro.com

ArtPro 是一款藝術品庫存管理軟體,旨在協助線上編目、存檔、追蹤、分享和儲存藝術品。

Voiceitt

Voiceitt

vocitec.com

Voiceitt 是一家屢獲殊榮的語音辨識新創公司和社會企業,開發了專有的自動語音辨識(ASR) 技術,可將非標準語音模式即時轉換為清晰的語音,使患有嚴重言語障礙和殘疾的兒童和成人能夠存取主流語音啟動技術和設備。 一款支援非標準語音人士進行語音交流的應用程式。您可以使用 Voiceitt 與他人以及使用 Alexa 等語音啟動設備進行語音通訊!

Laxis

Laxis

laxis.com

Laaxis 旨在優化客戶對話,是一款人工智慧會議助手,旨在幫助收入團隊從互動中獲取關鍵洞察,並在各種商業能力中表現更好。 該工具使用人工智慧系統來記錄、轉錄並提供客戶會議期間討論的要點的精確提煉,確保不遺漏任何關鍵細節。 該工具對各種專業人士都有好處,包括銷售、行銷、業務開發、專案經理以及產品和使用者體驗設計師,因為它在市場研究、追蹤投資組合筆記、捕捉客戶需求和活動等不同領域提供幫助。 它可以自動產生會議摘要和後續電子郵件,並使使用者能夠一鍵將客戶需求、行動項目和會議摘要保存在 CRM 中。 使用者還可以從單一或一組會議中提取相關見解。透過包含語言首選項,Laxis 支援多語言交互,...

Voxpow

Voxpow

voxpow.com

由機器學習提供支援的語音到文字轉換。直接在您的網站上免費。 Voxpow 支援您的全球用戶群,可識別超過 100 種語言及其變體。

Crescendo

Crescendo

crescendo.com

Crescendo Systems Corporation 是醫療、法律、執法和保險領域文件、數位聽寫、語音處理、轉錄和工作流程管理系統的領先開發商。

Kukarella

Kukarella

kukarella.com

畫外音具有完美的音訊清晰度、節奏、語調和發音。在 Kukarella 上,您可以嘗試最好的 AI 神經語音。包括所有商業權利。 Kukarella 提供 130 種語言和口音的 800 多種人工智慧語音,適合我們任何付費方案的商業用途。除了配音之外,您還可以使用 Dialogues AI 工具創建對話,或使用 Simdubbing 工具將文字翻譯和配音成數百種語言。 這還不是全部 - 您可以轉錄各種視頻、音頻和 YouTube 視頻,從網頁中抓取文本,以及識別圖像上的文本。此外,Kukarella 與一些科技領域的知名企業合作,例如 Google、Amazon、Microsoft 和 I...

Talkatoo

Talkatoo

talkatoo.com

Talkatoo 正在為醫療專業人員重塑聽寫功能。無論您是在獸醫行業還是人類醫療行業,Talkatoo 都是適合您的語音轉文字軟體解決方案。 Talkatoo 在 Windows 和 Mac 上相容,適用於您可以鍵入的任何領域(包括 PIM 和 EHR),並且非常易於使用。 * Talkatoo 是一款專為臨床使用而設計的桌面聽寫解決方案,重點是將語音轉換為文本,包括專業詞彙和醫學術語。 * 審查者讚賞 Talkatoo 能夠準確地將語音轉換為文字(包括複雜的醫學術語),並且其用戶友好的介面有助於提高創建醫療記錄的效率和生產力。 * 審閱者指出,Talkatoo 在處理大量指令時可能會很慢,...

CrystalSound

CrystalSound

crystalsound.ai

CrystalSound 是一款使用人工智慧技術的桌面應用程序,有助於消除通話、錄音和線上會議期間所有不必要的噪音和乾擾。憑藉其先進的演算法和最先進的功能,CrystalSound 可以消除背景噪音、迴聲、嘯叫效果和其他聲音,確保您能夠清晰有效地進行溝通。 CrystalSound能夠運作在Mac、Windows、Linux作業系統上,滿足使用者下載和使用的需求。有了 CrystalSound,您不必再擔心通訊應用程式的相容性問題。我們的解決方案旨在與 Teams、Zoom、Google Meet、Loom、Discord 等流行應用程式無縫協作。

LumenVox

LumenVox

lumenvox.com

LumenVox 是為世界各地的組織提供營運商級語音技術的領先供應商。作為Capacity的一部分,LumenVox透過人工智慧驅動的語音辨識和語音認證技術改變客戶體驗。 LumenVox 的 DNA 植根於 20 年的語音技術,提供最全面、最具成本效益且靈活的語音服務。該公司在語音和語音技術方面擁有悠久的歷史,使公司能夠打造不僅能理解所說內容,還能辨識說話者的語音體驗。 LumenVox 是唯一能夠為企業提供所需的靈活性和控制力的供應商,以便在任何環境(本地、多雲或混合模型)中輕鬆整合應用程式。 與其他語音提供者相比,LumenVox 通常可以將總擁有成本 (TCO) 降低多達 35%...

Avoma

Avoma

avoma.com

Avama 是面向客戶團隊的端到端人工智慧會議助理。其人工智慧技術可協助面向客戶的團隊在重要會議之前、期間和之後捕捉重要的客戶資訊。 Avama 分析對話見解和情報,幫助銷售代表縮短銷售週期並取悅更多客戶。透過 Avama,您可以自動記錄所有會議、取得完整的文字記錄和摘要筆記,以及直接同步到 CRM 的可操作見解。透過直接在記錄中搜尋並使用已確定的主題來準確找到您要查找的內容,可以更快地查看通話和會議。 Avama 與您最喜歡的工具無縫整合。

Spokestack

Spokestack

spokestack.io

Spokestack 是一個強大的開源庫平台和強大的服務,使您的軟體完全支援語音,包括: * 自動語音識別 * 語音活動偵測 * 喚醒詞 * 文字轉語音 * 自訂語音 * 自然語言理解

SpeechWrite

SpeechWrite

speechwrite.com

SpeechWrite 是一家專注於工作流程解決方案、數位聽寫、語音辨識和 PDF 解決方案的完整解決方案提供者。 SpeechWrite 的實用技術複雜而簡單,可讓您改善工作環境並更聰明地工作。 SpeechWrite 與 OEM 和技術合作夥伴密切合作,對最新技術發展和市場趨勢有廣泛的了解。 SpeechWrite 成立於 2001 年,在聽寫行業擁有 100 多年的經驗,並以其上市速度和售後支援而自豪。

Picovoice

Picovoice

picovoice.ai

Picovoice 是一個端對端平台,可根據您的需求為任何內容添加語音。 透過創新加速語音人工智慧的採用。 Picovoice 透過在裝置、行動裝置、網路瀏覽器、本地端和雲端上運行的準確、私密且快速的語音 AI 技術,將控制權帶回給企業。

CueMe

CueMe

cueme.com

CueME 是世界上最好的撞球應用程序,可找到人們親自或虛擬地參加任何級別的單打、雙打和錦標賽比賽。使用 CueME 影片、評分和排名技術與世界各地的任何人進行比賽。當您玩遊戲時,您將贏得 CueME 籌碼以及勝利和成就,以獲得認可和獎品。

Philips SpeechLive

Philips SpeechLive

speechlive.com

Philips SpeechLive 是一種基於雲端的聽寫、轉錄和語音辨識工作流程解決方案。它可以幫助作者比以往更快地從語音到文字。 SpeechLive 使用 Microsoft Azure 雲端服務透過多重驗證進行完整的端對端加密。我們的附加語音辨識服務具有多語言功能、即時和延遲選項以及語音命令功能,可在您口述時格式化您的文件。

© 2024 WebCatalog, Inc.

我們使用 Cookie 來提供並改善網站的功能。使用我們的網站,即表示您同意使用 Cookie。