Web 應用程式的專屬商店
找到合適的軟體和服務。
使用 WebCatalog Desktop 將網站轉化為傳統型應用程式,並存取大量 Mac、Windows 專屬的應用程式。使用空間來組織應用程式,並在多個帳戶間輕鬆切換,以前所未有的方式來提升工作效率。
深度學習軟體是指旨在促進深度學習模型的創建、訓練和部署的一類軟體工具和框架。深度學習是機器學習的一個子集,涉及訓練多層人工神經網路(因此稱為“深度”)來學習資料的表示。深度學習軟體通常提供以下功能: * 神經網路架構設計:用於設計和自訂深度神經網路架構的工具,包括指定層數、層類型(例如捲積、循環)以及層之間的連接。 * 資料預處理和增強:用於準備和預處理輸入資料以訓練深度學習模型的實用程序,包括標準化、資料增強和特徵提取等任務。 * 模型訓練與最佳化:在大數據集上訓練深度學習模型的演算法與技術,包括隨機梯度下降等最佳化演算法,以及正則化、dropout等處理過擬合的方法。 * 模型評估和驗證:用於評估經過訓練的模型在驗證和測試資料集上的表現的工具,包括準確性、精確度、召回率和 F1 分數等指標。 * 部署和推理:通常透過與軟體開發框架和平台集成,將經過訓練的深度學習模型部署到生產環境中以推理新資料的設施。 流行的深度學習軟體框架包括 TensorFlow、PyTorch、Keras 和 Caffe。這些框架提供了高級抽象和 API,使開發人員和研究人員能夠更輕鬆地建立和試驗深度學習模型,而無需從頭開始實現一切。
提議新的應用程式
Claude
claude.ai
Claude by Anthropic 是 Anthropic 打造的下一代人工智慧助手,經過安全、準確且可靠的培訓,可協助您出色地完成工作。
Otter
otter.ai
Otter 是一款智慧筆記應用程序,可協助您記住、搜尋和分享您的語音對話。 Otter 創建的智慧語音筆記結合了音訊、轉錄、說話者識別、內聯照片和關鍵字詞。它可以幫助商務人士、記者和學生在會議、採訪、講座以及任何重要對話中更加專注、協作和高效。
AWS Console
amazon.com
Amazon Web Services (AWS) 是 Amazon 的子公司,以按量付費的方式向個人、公司和政府提供按需雲端運算平台和 API。這些雲端運算Web服務提供了各種基本的抽象技術基礎設施以及分散式運算建構塊和工具。其中一項服務是 Amazon Elastic Compute Cloud (EC2),它允許使用者透過互聯網隨時使用虛擬電腦叢集。 AWS版本的虛擬電腦模擬了真實電腦的大部分屬性,包括用於處理的硬體中央處理單元(CPU)和圖形處理單元(GPU);本地/RAM記憶體;硬碟/SSD儲存;作業系統的選擇;聯網;以及預先安裝的應用軟體,例如網頁伺服器、資料庫和客戶關係管理 (CRM)。 AWS 技術在世界各地的伺服器場實施,並由亞馬遜子公司維護。費用是根據使用者選擇的使用量(稱為「即用即付」模式)、硬體、作業系統、軟體或網路功能的組合,以及所需的可用性、冗餘性、安全性和服務選項。訂閱者可以付費購買一台虛擬 AWS 電腦、一台專用實體電腦或兩者的叢集。作為訂閱協議的一部分,亞馬遜為訂閱者的系統提供安全保障。 AWS 在全球許多地理區域開展業務,其中有 6 個位於北美。所有服務均根據使用情況計費,但每種服務以不同的方式衡量使用情況。根據Synergy Group 的數據,截至2017 年,AWS 佔據了所有雲端(IaaS、PaaS)的34% 的主導地位,而緊隨其後的三個競爭對手微軟、谷歌和IBM 分別擁有11%、8% 和6% 的份額。
Google Cloud Platform
google.com
Google 雲端平台 (GCP) 由 Google 提供,是一套雲端運算服務,運行在 Google 內部用於其最終用戶產品(例如 Google 搜尋、Gmail、文件儲存和 YouTube)的相同基礎架構上。除了一套管理工具外,它還提供一系列模組化雲端服務,包括運算、資料儲存、資料分析和機器學習。註冊需要信用卡或銀行帳戶詳細資訊。 2008 年 4 月,Google 發布了 App Engine,這是一個用於在 Google 管理的資料中心中開發和託管 Web 應用程式的平台,這是該公司的第一個雲端運算服務。該服務於 2011 年 11 月全面推出。 Google Cloud Platform 是 Google Cloud 的一部分,其中包括 Google Cloud Platform 公有雲基礎設施,以及 G Suite、企業版 Android 和 Chrome OS,以及用於機器學習和企業地圖服務的應用程式介面 (API)。
Jasper
jasper.ai
Jasper:商業品牌人工智慧始終以您的品牌聲音在您在線上的任何地方創建內容。 Jasper 是您的創意人工智慧助手,可以以您獨特的品牌語氣學習和寫作。無論你是大膽地、厚臉皮地、正式地說話,還是只在網路上說話(u do u)。此外,Jasper Everywhere 瀏覽器擴充功能使 Jasper 始終陪伴在您身邊,從 CMS 到電子郵件、社交媒體,再到使用 Jasper API 的您自己的公司平台。 最重要的是,Jasper 具有隨著安全協議的發展而保持最新的內建安全功能,可確保您的資料安全和私密。 利用人工智慧創建內容的速度提高 5 倍。 Jasper 是最高品質的 AI 文案工具,擁有超過 3,000 條 5 星評論。最適合撰寫部落格文章、社群媒體內容和行銷文案。
OpenAI Platform
openai.com
OpenAI 是一家人工智慧研究和部署公司,致力於確保通用人工智慧造福全人類。人工智慧是一種極其強大的工具,其創建必須以安全和人類需求為核心。 OpenAI 致力於將利益一致性放在首位——置於利潤之上。 為了實現我們的使命,我們必須包容並重視構成全人類的許多不同觀點、聲音和經驗。我們對多元化、公平性和包容性的投資是持續不斷的,透過廣泛的舉措執行,並得到領導層的倡導和支持。 在 OpenAI,我們相信人工智慧有潛力幫助人們解決巨大的全球挑戰,我們希望人工智慧的優勢能廣泛分享。
Krisp
krisp.ai
Krisp 是一款智慧型應用程序,旨在提高線上會議和通話的效率和清晰度。主要是利用人工智慧進行降噪,有效消除線上互動過程中的背景噪音、語音和迴聲。 此功能可確保在各種環境下(從個人對話到團隊會議和呼叫中心)進行清晰、高品質的溝通。除了噪音消除之外,Krisp 還提供即時會議轉錄,這提高了可訪問性並有助於維護記錄。 此外,它還具備產生簡潔會議筆記和摘要的能力,有效充當AI會議助理。另一個值得注意的功能是 Krisp 的會議錄製功能,它可以自動錄製所有通訊應用程式中的虛擬會議。 Krisp專門針對呼叫中心環境提供了AI口音本地化功能,可以即時轉換座席的口音以匹配客戶的母語口音,從而實現更清晰的溝通。 它還可以安全地即時轉錄代理商和客戶的對話。使用為開發人員提供的 SDK,可以將應用程式的服務整合到各種產品中。 作為一款多功能人工智慧工具,Krisp 滿足了廣泛的使用者需求,包括個人、自由工作者、混合工作團隊、銷售團隊、專業服務和呼叫中心。
Deep Dream Generator
deepdreamgenerator.com
深夢發生器。了解卷積神經網路透過過度處理影像和增強特徵可以產生什麼。
FaceCheck.ID
facecheck.id
使用 FaceCheck.ID 人臉辨識搜尋引擎在線查找任何人。透過照片搜尋人員並驗證您正在與他們聲稱的人交談。
SpeechTexter
speechtexter.com
語音到文字轉換器。用你的聲音聽寫。用於使用語音打字的免費網路應用程式。支援 70 多種不同語言!
Notta
notta.ai
Notta 是一款領先的 AI 轉錄工具和會議記錄工具,可協助將任何語音對話快速轉錄和總結為可操作的文本,支援 58 種語言。 * 重要消息:Airgram 已加入 Notta!除了轉錄視訊/音訊檔案、現場演講之外,Notta 還與 Zoom、Microsoft Teams 和 Google Meet 等領先的視訊會議平台集成,以產生自動會議記錄。它還允許用戶查看、搜尋、編輯、匯出記錄並與團隊成員共享記錄,以實現無縫協作。 Notta 讓您能夠最大限度地發揮每次對話的價值。
Resemble.ai
resemble.ai
Resemble AI 使用專有的深度學習模型創建自訂 AI 語音,該模型使用文字轉語音和語音轉語音合成來產生高品質的 AI 生成的音訊內容。 Resemble Localize 是我們的多語言在地化工具,可以翻譯文字並將您的 AI 語音轉換為多達 100 種語言。 Resemble Fill 是我們的生成填充(音訊修復)功能,可讓您使用複製的 AI 語音修改現有語音。 Fill 可用於修改程式化音訊廣告、動態串流廣告插入 (SAI)、語音助理等。 最近,我們憑藉語音 AI 對 Netflix 獲得艾美獎提名的《安迪沃荷日記》的貢獻,榮獲 2023 年威比獎「最佳語音技術應用獎」。 除了 Netflix 之外,我們還與 Byju's、世界銀行集團、Boingo、環球影業、派拉蒙影業等合作。
Speechnotes
speechnotes.co
語音轉文字 - 語音輸入和轉錄。 免費用語音做筆記,或當場自動轉錄音訊和視訊錄音。安全、準確且超快。
DeepAI
deepai.org
為天生富有創造力的人類提供人工智慧工具
FaceMRI
facemri.com
FaceMRI 是一家位於美國的人臉辨識軟體研究小組。 FaceMRI 是 Mac 和 PC 的最先進的人臉辨識搜尋引擎。 FaceMRI 擁有一套臉部辨識軟體,可將臉部分類為性別(男性、女性、非二元)、年齡層、年齡和種族。建立出勤圖表和分析。可透過+匯入影像+匯入影片+網路搜尋(FB、LinkedIn、Instagram)+匯入資料夾+網路攝影機和IP攝影機+物聯網和安全攝影機來提取人臉。 + USB 金鑰和外部設備 FaceMRI 利用人臉辨識的力量來解鎖影像和影片的分析。用戶可以將該應用程式下載到 Mac 或 PC 上並匯入圖像和影片。它將從影片和圖像中提取面孔和人物,用戶可以向客戶添加面孔並建立自訂報告。此外,工作人員可以根據影片中的年齡、性別和種族建立人口統計圖表,並查看您的客戶是誰。 FaceMRI 還具有人員搜尋技術,因此使用者可以建立自訂報告。員工可以追蹤 Zoom 通話出勤情況、誰參加了公司通話以及誰缺席。員工可以連接到網路攝影機、安全攝影機和物聯網攝影機來追蹤誰進入您的企業。 FaceMRI 根據視訊來源建立個人報告,以便使用者可以監控誰進入您的企業。
Alibaba Cloud
alibabacloud.com
阿里雲是全球最大的雲端運算公司之一,在全球提供可擴展、安全、可靠的雲端運算服務,透過全面的雲端產品和解決方案加速數位化進程。
Jammable
jammable.com
透過 Jammable 在幾秒鐘內使用 AI 創建 AI 封面,數百個社群上傳的 AI 語音模型可供創意使用!
PromptSmart
promptsmart.com
PromptSmart 是一款提詞器應用程序,可跟隨您的聲音,幫助您製作影片或簡報。 PromptSmart 是首款具有語音辨識功能的提詞器應用程式 - 最先進的公共演講工具! 2014 年 8 月推出! PromptSmart 的誕生源自於對公開演講的熱情。 PromptSmart 的創辦人對 MBA 學生進行公開演講藝術的指導和指導。我們意識到直覺的揚聲器控制提詞器可以更好地支援許多演講者,因此我們也認識到當今的行動裝置可以滿足這一需求。考慮到這一點,PromptSmart 應運而生。 PromptSmart 也滿足了喜歡使用筆記而不是完整書面演講的演講者的需求。我們設計了數位記錄卡功能,讓演講者透過追蹤要涵蓋的關鍵資訊來保持重點。 最終結果是 PromptSmart 成為適合任何演講者風格的最先進的公開演講工具!
Landing AI
landing.ai
電腦視覺變得超級簡單。 在幾分鐘內創建並部署您的電腦視覺系統。無需複雜的程式設計或人工智慧經驗。
Jupitrr
jupitrr.com
Jupitrr AI Video Maker 是一款人工智慧驅動的工具,允許創作者將他們的錄音和播客轉換為個人化影片。透過此工具,用戶可以在短短幾分鐘內輕鬆創建令人驚嘆的影片內容。 Jupitrr AI Video Maker 背後的 AI 技術可以自動為創作者的視頻生成素材視頻,包括素材、圖表、字幕等。該工具具有類似於編輯 Word 文件的用戶友好介面,無需複雜的時間線,使影片編輯變得輕而易舉。 它提供了一鍵存取龐大影片庫的便利性,為用戶省去了搜尋合適素材的麻煩。 Jupitrr AI Video Maker 支援多種語言,包括西班牙語、印地語、法語、普通話等,可供世界各地的廣大創作者使用。除了庫存影片之外,該工具還提供了添加各種大小和样式的字幕和說明文字的選項。 它甚至包括人工智慧生成的迷人圖表,旨在簡化將視覺數據融入影片的過程。 Jupitrr AI Video Maker旨在為創作者賦能,讓他們專注於自己的創意願景,而不是在影片編輯上花費過多的精力。憑藉其簡單性和多功能性,Jupitrr AI Video Maker 對於希望增強影片製作流程的內容創作者來說是一個有價值的工具。
Roboflow
roboflow.com
只需幾十張範例圖像,您就可以在 24 小時內訓練出一個可用的、最先進的電腦視覺模型。 Roboflow 創建軟體即服務產品,讓電腦視覺建構變得簡單。 超過 25 萬名開發人員使用 Roboflow 來管理圖像資料、註釋和標記資料集、應用預處理和增強、轉換註釋檔案格式、一鍵訓練電腦視覺模型以及透過 API 或邊緣部署模型。
Speechlogger
speechlogger.com
Speech Logger 是一款基於網路的語音辨識和語音翻譯軟體,包括自動標點符號、自動儲存、時間戳記、文字內編輯功能、音訊檔案轉錄、匯出選項等。 * Speechlogger 是一款專為演講、會議或活動的自動即時字幕和翻譯而設計的工具,具有自動標點符號、發言者識別和情緒分析等附加功能。 * 審查者讚賞Speechlogger 即使在嘈雜的背景下也能準確轉錄語音的能力、其用戶友好的設計以及自動標點符號、說話人識別和情緒分析等獨特功能,他們認為這些功能優於某些付費轉錄工具。 * 用戶遇到的問題包括影響免費版本表現的廣告、偶爾出現的翻譯錯誤、轉錄不常見口音時的準確性較低、缺乏語音控制以及情緒分析和主題建模工具中的誤解。
Clarifai
clarifai.com
Clarifai 是一家獨立的人工智慧公司,專注於電腦視覺、自然語言處理和音訊辨識。 Clarifai 成立於 2013 年,是最早成立的深度學習平台之一,為非結構化圖像、視訊、文字和音訊資料提供人工智慧平台。其平台支援整個人工智慧生命週期,包括圖像、視訊、文字和音訊資料的資料探索、資料標記、模型訓練、評估和推理。 Clarifai 總部位於華盛頓特區,利用機器學習和深度神經網路自動識別和分析圖像、視訊、文字和音訊。 Clarifai 使用戶能夠透過 API、行動 SDK 和/或本地解決方案將人工智慧技術應用到他們的產品中。
Hour One
hourone.ai
一小時透過將所有工作流程集中在一個人工智慧驅動的平台上,徹底改變了企業的內容創建。我們擁有市場上最逼真的頭像,具有自然的動作,生動地動畫您的商業訊息。我們的模板可針對任何品牌進行定制,使團隊能夠大規模製作個性化內容 - 無需設計或編輯技能。此外,憑藉快速渲染和頂級安全性,Hour One 成為專為企業需求設計的首要內容作業系統。過去需要幾個月的時間,現在只需幾分鐘,並產生更高的參與度……透過「一小時」更聰明地工作,而不是更努力,並製作可產生影響力的個人化商業影片。 * HourOne 是一款影片創建工具,允許用戶使用各種模板、聲音和角色創建行銷影片和簡報。 * 使用者喜歡易用性、可供選擇的聲音和角色範圍、快速的處理和下載時間以及客戶成功團隊的支援。 * 審閱者遇到了諸如機器人文字對話功能、有限的頭像選項、臨時用戶的學習曲線、有限的品牌功能、載入時間緩慢以及某些功能缺乏明確說明等問題。
npm
npmjs.com
npm 是由 npm, Inc. 維護的 JavaScript 程式語言的套件管理器。它由一個命令列客戶端(也稱為 npm)和一個公共和付費私有包的線上資料庫(稱為 npm 註冊表)組成。
MobileEngine
services.tineye.com
TinEye 是一家圖像搜尋和識別公司。我們是電腦視覺、模式辨識、神經網路和機器學習的專家。我們的使命是讓您的圖像可搜尋。
AssemblyAI
assemblyai.com
AssemblyAI 是一家語音人工智慧公司,專注於建立能夠轉錄和理解人類語音的最先進的新型人工智慧模型。我們的客戶(例如 CallRail、Fireflies 和 Spotify)選擇 AssemblyAI 來基於語音資料建立令人難以置信的全新人工智慧體驗和產品。 AssemblyAI 模型和框架包括: - 人工智慧語音轉文字 - 音訊智能,包括摘要、情緒分析、主題偵測、內容審核、PII 編輯等 - LeMUR,一個將強大的法學碩士應用於轉錄語音的框架,您可以在其中提出複雜的問題,從轉錄中提取行動項目和回顧等等
Crescendo
crescendo.com
Crescendo Systems Corporation 是醫療、法律、執法和保險領域文件、數位聽寫、語音處理、轉錄和工作流程管理系統的領先開發商。
Speech to Note
speechtonote.com
Speech To Note 是一款由人工智慧驅動的語音辨識工具,可立即將語音轉換為文字。我們的工具使用先進的語音轉文字技術將您的文字轉錄成您可以編輯或分享的簡潔摘要。 體驗我們人工智慧驅動工具的強大功能,它可以立即將您的口語轉化為簡潔且資訊豐富的摘要。
NVIDIA Developer
developer.nvidia.com
使用生成式人工智慧建立應用程式。 使用可在任何地方運行的生產就緒 API 體驗、原型化和部署 AI。
Muse.ai
muse.ai
muse.ai 是一家影片搜尋公司,正在建立先進的人工智慧來組織全球影片。
Syte
syte.ai
Syte 是專為電子商務應用程式設計的產品發現平台。它利用視覺人工智慧來增強各種電子商務活動,包括視覺搜尋、個人化和自動產品標籤。 Syte 旨在透過提供視覺搜尋體驗將購物者與產品聯繫起來,從而提高效率、支持永續發展並消除死胡同。 它展示視覺上相似且互補的產品推薦,旨在激發和轉化不同類型的購物者。它還具有自動產品標籤系統,可節省時間、優化銷售流程並提高產品數據的準確性。 這些解決方案可以適應不同的市場現實,並且可以擴展以滿足時尚、家居裝飾和珠寶等各個行業領域的特定需求。 它適合不同的企業規模,從成長型企業到大型企業。
Face Age
getfaceage.com
Face Age利用尖端技術分析臉部肌膚屬性,捕捉皺紋、毛孔、青春痘、眼袋等細節,了解每位顧客的肌膚。 Face Age 旨在輕鬆整合到現有的電子商務平台中。 Face Age 提供各種整合選項,讓設定流程順利有效率。無論您經營的是小型精品店還是大型市場,Face Age 都能無縫適應您的技術要求。
Symbl.ai
symbl.ai
Symbl.ai 是一個對話智慧平台,使用先進的深度學習模型為開發人員提供非結構化對話資料的即時轉錄和見解。 該工具為各行業提供解決方案,例如收入情報、活動和網路研討會、遠端協作、聯絡中心和招募情報。 Symbl.ai 的功能支援自訂追蹤器、摘要、主題建模、轉錄、對話分析以及用於語音、音訊和文字資料的預先建構 UI 和元件。 憑藉其 API 技術,Symbl.ai 可以對非結構化人類對話進行即時非同步語音識別,使該工具能夠透過單一 API 呼叫來添加智慧。 此外,該平台還透過批次/非同步請求在不到 400 毫秒的時間內提供即時關鍵字、短語和意圖檢測。 Symbl.ai 包含語音到文字集成,允許為人類對話建立最準確的非同步語音識別 API。 此工具的對話分析會產生各種指標來增強使用者或座席對話分析,例如說聽比、每分鐘字數、通話時間和基於主題的情緒。 Symbl.ai 還支援跨各種對話管道(例如視訊或音訊檔案、電話和串流媒體)處理對話並提取見解。 此外,Symbl.ai 優先考慮客戶支持,提供無需使用承諾的靈活計劃和可擴展的成長選項。
Tune AI
tunehq.ai
Tune AI 正在推動 GenAI 在企業中的採用。 我們得到了 Accel、Flipkart Ventures、Together Fund、Speciale Invest、Techstars 和其他知名投資者的支持 TuneChat:我們的聊天應用程式由開源模型提供支援 TuneStudio:我們為開發人員微調和部署法學碩士的遊樂場 ChainFury:我們的開源提示引擎可在 GitHub 上找到
PixLab
pixlab.io
PixLab 是領先的獨立軟體即服務平台,適用於機器視覺和媒體處理 API。我們幫助開發人員使用我們的網路和離線 SDK 實施智慧應用程式。我們的 API 功能集包括但不限於護照和身分證掃描、內容審核、臉部辨識、光學字元辨識以及許多其他 API 端點。
Gladia
gladia.io
Gladia 是一個人工智慧知識基礎設施平台,提供即插即用的 API,使用戶能夠充分利用他們的資料。 Speech-to-Text API Alpha 是他們的最新產品,它提供即時處理和低至 1% 的單字錯誤率。 它基於 Open AI 的 Whisper 模型構建,能夠在短短 10 秒內轉錄一小時的音訊。該 API 免費提供,支援 99 種語言。 Gladia 由創辦人兼執行長 Jean-Louis Queguiner 和聯合創始人兼首席技術長 Jonathan Soto 領導。 Queguiner 擁有符號人工智慧碩士學位,並獨自建立了一個聊天機器人,用於在一個商店中管理、分類和統一所有人工智慧應用程式。 索托擁有麻省理工學院碩士學位,是多篇學術論文的作者。 Gladia 為使用者提供教學課程和文檔,並與其團隊進行一對一的入職電話會議。 他們致力於在不犧牲品質的情況下,使他們的 API 比市場上任何其他產品更易於存取且更實惠。
Talkatoo
talkatoo.com
Talkatoo 正在為醫療專業人員重塑聽寫功能。無論您是在獸醫行業還是人類醫療行業,Talkatoo 都是適合您的語音轉文字軟體解決方案。 Talkatoo 在 Windows 和 Mac 上相容,適用於您可以鍵入的任何領域(包括 PIM 和 EHR),並且非常易於使用。 * Talkatoo 是一款專為臨床使用而設計的桌面聽寫解決方案,重點是將語音轉換為文本,包括專業詞彙和醫學術語。 * 審查者讚賞 Talkatoo 能夠準確地將語音轉換為文字(包括複雜的醫學術語),並且其用戶友好的介面有助於提高創建醫療記錄的效率和生產力。 * 審閱者指出,Talkatoo 在處理大量指令時可能會很慢,有時難以識別特定的、不太常見的術語,而且其客戶支援回應可能會延遲。
Voxpow
voxpow.com
由機器學習提供支援的語音到文字轉換。直接在您的網站上免費。 Voxpow 支援您的全球用戶群,可識別超過 100 種語言及其變體。
V7
v7labs.com
V7 是一款專為電腦視覺和生成式人工智慧應用而設計的人工智慧資料引擎。該平台為企業培訓資料提供基礎設施,包括標籤、工作流程、資料集,並具有人機互動培訓功能。 它提供多種註釋屬性來提高人工智慧模型的資料品質。憑藉自動註釋、醫學成像 DICOM 註釋、資料集管理和模型管理等功能,V7 可以自動化並簡化各種任務。 其影像和視訊標註工具旨在提高資料標註的精度。此外,它還支援自訂資料管道的建置和自動化,並具有用於自動化光學字元辨識 (OCR) 和智慧型文件處理 (IDP) 工作流程的工具。 它可用於農業、汽車、建築、能源、食品飲料、醫療保健等各個行業。它提供即時團隊註釋的協作功能,並提供貼標機和模型效能分析。 憑藉其增強的自動註釋功能,它加快了註釋的速度和準確性。該平台與 AWS、Databricks 和 Voxel51 等集成,支援視訊、圖像和文字資料等一系列資料類型。
Faceplusplus
faceplusplus.com
Face++ 是一個提供電腦視覺技術的平台,讓您的應用程式能夠更好地閱讀和理解世界。
Lambda
lambdalabs.com
Lambda 提供運算來加速人類進步。我們是一支深度學習工程師團隊,致力於建立世界上最好的 GPU 雲端、叢集、伺服器和工作站。我們的產品為工程師和研究人員提供了處於人類知識前沿的動力。客戶包括英特爾、微軟、谷歌、亞馬遜研究院、騰訊、凱撒醫療機構、麻省理工學院、史丹佛大學、哈佛大學、加州理工學院、洛斯阿拉莫斯國家實驗室、迪士尼和國防部。
Speechmatics
speechmatics.com
Speechmatics 是全球領先的語音智慧專家,結合人工智慧和機器學習的最新突破,釋放人類語音的商業價值。全球範圍內的企業都在使用 Speechmatics 來準確理解人類級別的語音並將其轉錄為文本,無論人口統計、年齡、性別、口音、方言或位置如何,都可以實時在錄製媒體上進行。 將這些文字記錄與最新的人工智慧驅動的語音功能相結合,企業可以建立利用摘要、主題、情感、章節、翻譯等的產品。 Speechmatics 每個月都會處理全球 300 多年來 50 種語言的轉錄。其神經網路在語音辨識領域開創了機器學習的先河,考慮了聲學、語言、方言、多個說話者、標點符號、大寫、上下文和隱含含義。 Speechmatics 總部位於英國劍橋,在紐約也有辦公室。 Speechmatics 是註冊商標。
CrystalSound
crystalsound.ai
CrystalSound 是一款使用人工智慧技術的桌面應用程序,有助於消除通話、錄音和線上會議期間所有不必要的噪音和乾擾。憑藉其先進的演算法和最先進的功能,CrystalSound 可以消除背景噪音、迴聲、嘯叫效果和其他聲音,確保您能夠清晰有效地進行溝通。 CrystalSound能夠運作在Mac、Windows、Linux作業系統上,滿足使用者下載和使用的需求。有了 CrystalSound,您不必再擔心通訊應用程式的相容性問題。我們的解決方案旨在與 Teams、Zoom、Google Meet、Loom、Discord 等流行應用程式無縫協作。
SpeechWrite
speechwrite.com
SpeechWrite 是一家專注於工作流程解決方案、數位聽寫、語音辨識和 PDF 解決方案的完整解決方案提供者。 SpeechWrite 的實用技術複雜而簡單,可讓您改善工作環境並更聰明地工作。 SpeechWrite 與 OEM 和技術合作夥伴密切合作,對最新技術發展和市場趨勢有廣泛的了解。 SpeechWrite 成立於 2001 年,在聽寫行業擁有 100 多年的經驗,並以其上市速度和售後支援而自豪。
Thirdlane
thirdlane.com
Thirdlane Connect 是一款多功能客戶溝通和團隊協作應用程序,為您的團隊提供一系列功能,包括聊天、語音和視訊通話、會議、螢幕共享、文件共享以及與CRM 和各種其他業務應用程式的無縫整合。 Thirdlane Connect 旨在促進多通路客戶溝通和團隊協作,專為本地和遠端工作人員而設計,支援網頁瀏覽器、iPhone、Android 裝置以及 Windows、Linux 和 Mac 桌面。這項強大的應用程式與 Thirdlane 商務電話系統或 Thirdlane 多租戶 PBX 平台完全整合並由其提供支援。這些平台可以安全地部署在各種環境中,無論是在本地還是在私有雲或公有雲中,從而確保您的通訊基礎架構的靈活性和安全性。
Kili Technology
kili-technology.com
快速建立高品質資料集。 企業相信我們能夠簡化他們的資料標記操作,並為其自訂模型、生成式人工智慧和法學碩士建立最佳資料集 ___ 為什麼選擇奇力科技? 你可能不知道這一點,但: MNIST 的資料集錯誤率為 3.4%,仍被超過 38,000 篇論文引用。 ImageNet 資料集及其眾包標籤的錯誤率為 6%。該資料集可以說是 Google 和 Facebook 開發的最受歡迎的圖像識別系統的基礎。這些資料集中的系統錯誤會產生現實後果。在包含錯誤的資料上訓練的模型被迫學習這些錯誤,從而導致錯誤的預測或需要對不斷增加的資料進行重新訓練以「消除」錯誤。 每個產業都開始了解人工智慧的變革潛力並進行投資。但機器學習轉換器的革命和對機器學習模型優化的不懈關注正在達到收益遞減的地步。還有什麼?
hasty.ai
hasty.ai
Hasty 現在是 CloudFactory 的一部分,CloudFactory 是加速人工智慧生命週期的人機互動人工智慧解決方案的全球領導者。 不再為了效率而犧牲品質。 了解有關Accelerated Annotation 的更多信息,這是一款新的Vision AI 產品,它將CloudFactory 一流的員工隊伍與行業領先的AI 輔助標記技術相結合,生成高質量標記數據的速度比手動標記快5 倍。 Hasty 平台提供從原始影像和影片到生產就緒模型所需的一切。
NoahFace
noahface.com
NoahFace 提供高度可設定的軟體解決方案,將 iPad 和智慧型手機轉變為地球上最靈活、可擴展且可靠的時脈平台。 NoahFace 快速、可靠且準確,提供臉部辨識、溫度和酒精篩檢等現代功能。
Vue.ai
vue.ai
Vue.ai 是世界上第一個通用人工智慧平台之一,使世界各地的大型企業能夠跨工作流程和功能建立各種支援人工智慧的應用程式。與任何其他點解決方案不同,Vue.ai 提供的價值是將整個企業的圖像、視訊和文字資料匯集在一起,使用其AI 堆疊對其進行解碼,從而使智慧能夠在整個企業中提供數據驅動的決策。透過結合即用型 API、無程式碼和低程式碼工具,Vue.ai 使行銷、產品、業務和技術團隊能夠對收入成長、效率和成本降低產生數量級的影響。 Vue.ai 目前已部署在多個行業,包括零售、金融、保險、物流和醫療保健。 Vue.ai 是由 Ashwini Asokan 和 Anand Chandrasekaran 創立的 Mad Street Den 品牌。
Luxand.cloud
luxand.cloud
進階臉部搜尋和識別 API。 Luxand.Cloud 站在臉部辨識技術的最前沿,打造安全與創新無縫交織的未來。我們的尖端解決方案憑藉精確性和複雜性重新定義了身份驗證的格局。透過無縫存取控制提升您的數位安全性,解鎖個人化且強化的體驗。相信 Luxand.Cloud 能夠以無與倫比的可靠性引領您保護數位前沿。與我們一起踏上重新定義數位時代安全邊界的旅程。 Luxand.cloud 支援: - 人臉偵測 - 人臉辨識 - 人臉驗證 - 情緒辨識 - 人臉特徵點偵測 - 活體偵測 - 人臉裁剪
CloudSight
cloudsight.ai
CloudSight 是圖像字幕和理解領域的全球領導者。我們的目標是為世界各地的人們和公司提供最卓越、最先進的解決方案。 CloudSight 擁有兩個突破性的消費者應用程式 - CamFind,世界上第一個成功的行動視覺搜尋引擎,它允許您「搜尋物理世界」並透過從行動裝置拍照來查找任何資訊; TapTapSee是一款針對盲人和視障人士的應用程序,它利用行動裝置的攝影機和VoiceOver來拍攝物體並為用戶大聲識別它們。 此外,透過 CloudSight API 開發人員可以利用財富 500 強公司和主要零售商可用的相同技術。 CloudSight Inc. 成立於 2012 年,總部位於加州洛杉磯。
GoSpotCheck
gospotcheck.com
FORM 的GoSpotCheck 釋放了現場團隊的力量,透過唯一的行動解決方案推動市場執行,該解決方案結合了動態任務管理、行業領先的圖像識別、照片報告、現場團隊通信和高級報告- 所有這些都在一個易於使用的平台中。指導團隊、提高執行力並推動銷售,同時創建該領域的共享視圖,幫助領導者更快做出更好的決策。使用 FORM 的 GoSpotCheck 提高銷量,這是一款可即時指導、追蹤和提高績效的現場執行應用程式。
VXG
videoexpertsgroup.com
VXG 是一家全球雲端視訊監控公司,致力於簡化視訊管理並使系統以經濟高效的方式擴展。幫助連接超過 150,000 個攝影機的系統整合商、安全、存取控制、人工智慧、視訊監控、電信和 SaaS 公司建立客製化的世界級視訊監控解決方案。真正的開放雲平台旨在與其他解決方案整合或建構與 IP 攝影機配合使用的新服務。 VXG 是針對 SaaS 公司的面向未來的創新技術平台和雲端 VMS 引擎,完全靈活、可擴展、經濟高效、白標和可自訂。提供最快、最簡單的真正雲端視訊監控路徑,並提供具有完整原始程式碼和所有必要組件的完整 VMS。 完全開放(與產品無關)平台的關鍵價值在於,客戶可以在自己的雲端/資料中心部署解決方案,並整合其內部或第三方系統。客戶只需花費很少的精力即可實現最快的上市時間。同時賦予他們對產品的完全控制權、品牌化和所有權。
AI Voice Detector
aivoicedetector.com
AI語音偵測器是一款語音驗證工具,可協助偵測真偽並過濾AI產生的語音。它讓用戶安心並防止音訊操縱、錯誤訊息、語音詐騙和口頭評估中的抄襲。 * AI Voice Detector 是一款旨在區分電腦生成的聲音和真實人類聲音的工具,專門針對業務用例,確保客戶服務互動中內容的真實性和可靠的報告。 * 審閱者對該軟體針對音訊操縱和語音詐騙的保護實施、其易用性、快速處理以及無縫處理各種音訊檔案格式而沒有任何問題的能力表示讚賞。 * 使用者提到了一些限制,例如係統要求音訊檔案長度至少為 8 秒且沒有背景音樂、偶爾會將真聲誤識別為假聲,反之亦然,以及軟體整合能力有限。
Altered
altered.ai
Altered 是一款新一代音訊編輯器,它將多種語音 AI 技術整合到用戶友好的應用程式中,為各個行業(包括播客、視訊遊戲工作室和電子學習)製作高品質的語音內容。
Dictalogic
dictalogic.com
Dictalogic 提供專門的模組,包括音訊到文字、語音到文字、對話到文字和任務委派,所有這些都透過一個儀表板進行。 * 純音訊:傳統的音訊聽寫,其中音訊被錄製並發送給轉錄員,轉錄員可以在任何地方(包括在家工作)。 * 音訊轉文字:數位轉換可實現語音到文字的動態轉換。在這種方法中,音訊被記錄並發送以進行轉錄,並且音訊在到達轉錄者之前被轉換為文字。我們提供多種作業選項供您探索。 * 語音轉文字:我們也提供即時語音轉文字的功能。工作流程與其他聽寫相同,可以發送給任何轉錄員。 * 對話到文字:Dictalogic Conversation 模組是一種語音到文字解決方案,結合了語音識別、說話者識別和每個說話者的句子歸屬(也稱為分類),以提供任何對話的即時和/或非同步轉錄 -所有內容都封裝在一個可隨時存取的安全入口網站中,24/7。
Dictanote
dictanote.co
我們透過使用語音輸入幫助用戶提高工作效率! Dictanote 是一款現代筆記應用程序,具有內建語音到文字整合功能,讓您可以輕鬆以 50 多種語言語音輸入筆記。 Voice In 是語音轉文字 Chrome 擴充程序,可讓您使用語音在任何網站上的任何文字方塊中鍵入內容。
SoundHound
soundhound.com
作為對話智慧的領先創新者,我們提供獨立的語音人工智慧平台,使各行業的企業能夠為其客戶提供一流的對話體驗。 SoundHound 的先進語音AI 平台以專有的Speech-to-Meaning® 和Deep Meaning Understanding® 技術為基礎,提供卓越的速度和準確性,使人類能夠透過自然說話的方式與產品和服務進行交互,就像彼此互動一樣。 SoundHound 受到全球各地公司的信賴,包括現代、梅賽德斯-奔馳、Pandora、高通、Netflix、Snap、Square、LG、VIZIO、Kia和 Stellantis。