ページ 3 - 代替案 - Speechmatics
SubtitleO
subtitleo.com
SubtitleO は、ビデオにキャプションを追加するために設計された Web ベースのツールです。高度なテクノロジーを使用して、ビデオ内の音声をテキストに変換し、正確なキャプションを作成します。単にテキストを追加するだけではありません。 SubtitleO では、これらのキャプションをスタイル設定することもできるため、ビデオの雰囲気やテーマに完全に一致します。これは、コンテンツをよりアクセスしやすく、より幅広い視聴者にとって魅力的なものにするための理想的なツールです。
Voiceitt
vocitec.com
Voiceitt は、受賞歴のある音声認識スタートアップ兼社会企業であり、標準外の音声パターンをリアルタイムで明瞭な音声に変換する独自の自動音声認識 (ASR) テクノロジーを開発し、重度の音声障害や障害を持つ子供や大人が音声認識にアクセスできるようにします。主流の音声起動テクノロジーとデバイス。 標準的な言語ではない人々のための音声コミュニケーションをサポートするアプリ。 Voiceitt を使用すると、他のユーザーや Alexa などの音声起動デバイスと音声でコミュニケーションできます。
Voxpow
voxpow.com
機械学習を利用した音声からテキストへの変換。あなたのウェブサイトに直接、そして無料で。 Voxpow は、100 以上の言語とそのバリエーションを認識し、グローバル ユーザー ベースをサポートします。
UltraScriber
ultrascriber.com
UltraScriber は、数時間分の音声やビデオを数分で自動的に書き写すことができる Web アプリケーションです。また、転写の概要と自動分類も生成します。最後に、タイムスタンプと各段落で話している人の識別を使用して、段落ごとのトランスクリプトを視覚化できるプロフェッショナルなビューを提供します。
Maestra
maestra.ai
Maestra は、中規模小売業専用に構築されたオールインワンのマーケティング自動化プラットフォームです。このプラットフォームはリアルタイムで動作し、ブランドが単一の包括的なツールを使用して複雑なオムニチャネル キャンペーン、パーソナライズされたプロモーション、Web およびモバイルのパーソナライゼーションを実行できるようにします。
Kukarella
kukarella.com
完璧な音声の明瞭さ、ペース、抑揚、発音でナレーションを作成します。 Kukarella では、最高の AI ニューラル音声を試すことができます。すべての商業権が含まれます。 Kukarella では、有料プランのいずれかで商用利用に適した 130 の言語とアクセントで 800 を超える AI 音声へのアクセスを提供します。ナレーションに加えて、Dialogues AI ツールを使用してダイアログを作成したり、Simdubbing ツールを使用してテキストを数百の言語に翻訳して吹き替えたりすることもできます。 それだけではありません。あらゆる種類のビデオ、オーディオ、YouTube ビデオを文字に起こしたり、Web ページからテキストをスクレイピングしたり、画像上のテキストを認識したりできます。さらに、Kukarella は Google、Amazon、Microsoft、IBM などのテクノロジー業界の大手企業と提携しているため、最高のものを手に入れることができます。 カナダ政府、Salesforce、DHL、マクドナルド、ロンドン大学、ダイムラー メルセデスなどの組織の多くのクリエイティブな人材がナレーションや文字起こしに Kukarella を使用しているため、安心してご利用いただけます。
Dubber
dubber.net
Dubber は、コンプライアンス、販売およびサービス パフォーマンスのための世界的な統合クラウド通話録音および音声 AI ソリューションです。 Dubber の完全準拠の通話録音ソリューションは、クリックするだけでオンにでき、ハードウェアを必要とせず、クラウドで無限に拡張可能です。 すべての通話や会話は自動的にキャプチャされ、Dubber Voice Intelligence Cloud に安全に保存され、AI で強化され、リアルタイムの検索、センチメント分析、アラートと通知を使用してリプレイまたは洞察力に富んだ文字起こしとして即座に利用できます。
CrystalSound
crystalsound.ai
CrystalSound は、AI テクノロジーを使用したデスクトップ アプリで、通話、録音、オンライン会議中に不要なノイズや気を散らすものをすべて除去します。 CrystalSound は、高度なアルゴリズムと最先端の機能により、背景ノイズ、エコー、ハウリング効果、その他の音声を除去し、明瞭かつ効果的にコミュニケーションできるようにします。 CrystalSound は、ユーザーのダウンロードと使用のニーズを満たすために、Mac、Windows、Linux オペレーティング システム上で動作する機能を備えています。 CrystalSound を使用すると、コミュニケーション アプリとの互換性の問題を心配する必要がなくなります。当社のソリューションは、Teams、Zoom、Google Meet、Loom、Discord などの人気のあるアプリとシームレスに連携するように設計されています。
Crescendo
crescendo.com
Crescendo Systems Corporation は、医療、法律、法執行機関、保険部門向けのドキュメンテーション、デジタル ディクテーション、音声処理、文字起こし、およびワークフロー管理システムの大手開発者です。
SpeechWrite
speechwrite.com
SpeechWrite は、ワークフロー ソリューション、デジタル ディクテーション、音声認識、PDF ソリューションに特化したフル ソリューション プロバイダーです。 SpeechWrite の実用的なテクノロジーは、洗練されていながらもシンプルであり、作業環境を強化し、よりスマートに作業できるようにします。 OEM およびテクノロジー パートナーと緊密に連携することで、SpeechWrite は最新のテクノロジー開発と市場トレンドに関する広範な知識を持っています。 2001 年に設立された SpeechWrite は、ディクテーション業界で累計 100 年以上の実績があり、市場投入までのスピードと販売後のサポートに誇りを持っています。
Philips SpeechLive
speechlive.com
Philips SpeechLive は、クラウドベースのディクテーション、文字起こし、および音声認識のワークフロー ソリューションです。これにより、著者はこれまでよりも早く音声からテキストに移行できるようになります。 SpeechLive は、Microsoft Azure クラウド サービスを使用した多要素認証による完全なエンドツーエンド暗号化を備えています。当社のアドオン音声認識サービスには、多言語機能、リアルタイムおよび遅延オプション、口述しながら文書をフォーマットする音声コマンド機能が備わっています。
Verbit
verbit.co
Google、ジョンズ ホプキンス大学、CNBC、米国議会図書館など、3,000 以上の企業や機関がアクセシビリティのニーズに Verbit を活用しています。 Verbit の文字起こし、キャプション、翻訳、吹き替え、その他のソリューションは、毎回時間どおりに提供され、可能な限り最高の精度レベルに達します。 Verbit を使用すると、ライブ イベントがより魅力的になり、録画されたコンテンツがよりアクセスしやすく、見つけやすくなります。 Verbit 独自の自動音声認識 (ASR) テクノロジー、人間専用およびハイブリッド オプションから選択できます。 Verbit は、300 億ドル規模の文字起こし業界をリードしています。過去数年にわたり、Verbit は自社のサービスと専門知識を拡大するために、Automatic Sync Technologies (AST)、VITAC、Take Note、Take 1 を買収しました。 Verbit は世界最大のプロのキャプショナー労働力を雇用しています。
Thirdlane
thirdlane.com
Thirdlane Connect は、多用途の顧客コミュニケーションおよびチーム コラボレーション アプリケーションとして機能し、チャット、音声およびビデオ通話、会議、画面共有、ファイル共有、CRM やその他のさまざまなビジネス アプリケーションとのシームレスな統合などの一連の機能をチームに提供します。マルチチャネルの顧客コミュニケーションとチーム コラボレーションを促進するサードレーン コネクトは、ローカル ワーカーとリモート ワーカーの両方を対象に設計されており、Web ブラウザ、iPhone、Android デバイスに加え、Windows、Linux、Mac デスクトップもサポートしています。この強力なアプリケーションは、Thirdlane ビジネス フォン システムまたは Thirdlane マルチ テナント PBX プラットフォームと完全に統合されており、これらのプラットフォームによって動作します。これらのプラットフォームは、オンプレミス、プライベート クラウド、パブリック クラウドを問わず、さまざまな設定に安全に導入でき、通信インフラストラクチャの柔軟性とセキュリティを確保します。
Spellex
spellex.com
Spellex は、革新的な製品を提供し、世界クラスのサービスを Spellex の顧客に提供することにより、スペル チェック、ディクテーション、および支援技術ソフトウェア ソリューションを提供します。
Scribbl
scribbl.co
Scribbl は、生産性とコラボレーションを強化するための究極の AI 搭載ツールで、会議エクスペリエンスを変革します。メモを取る煩わしさから解放され、効率的な会議の新時代を迎えましょう。 Scribbl は会議を簡単にキャプチャ、文字起こし、記録できるため、ビートを逃すことはありません。 当社の高度な AI は、各会議を理解しやすいトピックと実行項目に分割し、レビュー プロセスを合理化します。 Scribbl の Chrome 拡張機能を使用すると、重要な瞬間をリアルタイムでマークし、ライブ ディスカッションと会議後の分析の間にシームレスな架け橋を作成します。 洞察の共有がかつてないほど簡単になりました。チームや外部の関係者との間でも、Scribbl の直感的な共有機能を使用すると、情報を迅速かつ効果的に広めることができます。
LumenVox
lumenvox.com
LumenVox は、世界中の組織にキャリアグレードの音声テクノロジーを提供する大手プロバイダーです。 Capacity の一部として、LumenVox は AI 主導の音声認識および音声認証テクノロジーを使用して顧客エクスペリエンスを変革します。 LumenVox の DNA は 20 年間の音声テクノロジーに基づいており、最も包括的でコスト効率が高く、柔軟な音声サービスを提供します。同社の音声および音声テクノロジーにおける深い歴史により、企業は、話されている内容を理解するだけでなく、誰が話しているのかを識別する音声エクスペリエンスを構築できます。 LumenVox は、オンプレミス、マルチクラウド、ハイブリッド モデルなど、あらゆる環境でアプリケーションを簡単に統合するために必要な柔軟性と制御を企業に提供する唯一のプロバイダーです。 他の音声プロバイダーと比較して、LumenVox は通常、総所有コスト (TCO) を 35% も削減できます。さらに、LumenVox は新しい言語モデルを平均 60 日以内にデプロイできますが、ほとんどのプロバイダーでは 6 か月以上かかります。 文字起こし機能付き ASR は、LumenVox ソフトウェア ポートフォリオの基礎です。 LumenVox の音声および音声ソフトウェア スタックは、人工知能と深層機械学習の基盤に基づいて動作し、将来も使い続けられる高性能の音声テクノロジーを提供します。エンドツーエンドのディープ ニューラル ネットワークを活用した LumenVox の ASR エンジンは、より多様なユーザー ベースにサービスを提供するために、新しい言語や方言を追加する機能を加速します。 ASR と連携して、LumenVox は書かれたテキストを言語化するための Text-to-Speech (TTS) ソフトウェアを提供します。これにより、企業はチャットボットをボイスボットに変えることができます。 LumenVox の最先端のツールセットを通じて、企業はあらゆる音声認識アプリケーションのチューニングと転写 (パラメータ、文法、バージョン アップグレード テストを含む) を実行できます。このツールセットを使用すると、顧客は音声対応アプリケーションを拡張する必要があるたびに、高価で時間のかかる専門サービスを回避できます。従来の ASR を使用しているお客様は、文法と信頼値を LumenVox ASR に簡単に移行できるため、ツールセットの恩恵を受けることができます。
Traq.ai
traq.ai
買い手がこれまで以上に多くの情報を得るようになった世界では、より多くの取引を獲得するには、台本に従うことよりも、見込み客の優先順位や問題点を理解することが重要です。 Traq.ai 会話インテリジェンス プラットフォームは、通話録音、文字起こし、AI 分析を備え、各通話から購入者中心の取引につながる洞察を抽出し、CRM に直接リンクします。 Traq.ai は、あらゆる VoIP 電話やオンライン会議ツールと互換性のある、プラットフォームに依存しない AI セールス アシスタントとして、各チーム メンバーの生産性を日々高め、効率を高めています。 Traq.ai は、営業パフォーマンスおよびコーチングのプラットフォームとして、チームの課題を明らかにするため、トレーニングを最適化し、最高レベルのパフォーマンスを引き出すことができます。無料オプションを含む透明性の高い競争力のある価格設定。
Beey
beey.io
Beey は、オーディオ ファイルとビデオ ファイルを正確にテキストに書き起こし、字幕を付け、翻訳するために設計された最先端の Web アプリケーションです。 30 を超える言語の音声認識をサポートする Beey は、ビデオ、ポッドキャスト、会議議事録などを高精度のテキストに簡単に変換します。直感的なエディターにより、テキストを簡単に修正したり、さまざまな形式でエクスポートしたりできます。 Beey は、カーソルの動きとタイムスタンプを使用して録音プレビューをテキストと同期させることで、効率的かつ正確な編集を保証します。 Beey のインタラクティブな字幕エディタを使用すると、プロフェッショナルなキャプションと字幕をシームレスに作成できます。自動翻訳機能により、コンテンツのアクセシビリティが大幅に向上します。高度な機能には、話者分離、話者認識、ストリーミング コンテンツのライブ トランスクリプションなどがあります。さらに、Beey は共有クレジットとプロジェクトによるチーム コラボレーションをサポートし、シームレスなワークフロー統合のための API 統合を提供します。 Beey の優れた機能の 1 つは、ファイルのダウンロードやアップロードを必要とせずに、YouTube などのプラットフォームからビデオを直接転写できることです。ビデオのリンクをコピーして貼り付けるだけで、残りの作業は Beey が処理し、ワークフローを合理化して効率を最大限に高めます。非常に高く評価されている新機能は、会議、講演、祝賀会、その他の公的および非公開の集まりなどのイベントのライブ文字起こしサービスをリアルタイムで提供する BeeyLive です。このライブ トランスクリプトは、即座に画面に表示したり、携帯電話でスキャンするとライブ キャプションが表示される QR コードを使用して視聴者と共有したりできます。個々のユーザーは、自分の言語への自動翻訳を設定することもできます。さらに、各視聴者はフォント サイズとプレビュー モード (連続テキストまたは字幕) をカスタマイズし、暗い表示モードと明るい表示モードを選択できます。無料トライアルやサブスクリプション プランなど、競争力のある価格オプションを備えた Beey は、さまざまな文字起こしのニーズに対応するコスト効率の高いソリューションです。 50,000 人を超えるユーザーから信頼されている Beey は、信頼性が高く多用途な文字起こしおよびキャプション ツールです。
Jetscribe.ai
jetscribe.ai
Jetscribe.ai は、ウェビナー、ポッドキャスト、説教、音声メモなどの音声またはビデオ記録を、迅速かつ正確に文字テキストに変換できる AI 文字起こしサービスです。また、文字起こしを要約、ブログ投稿、番組メモ、ハイライトなどのリッチコンテンツに変換するオプションも提供します。ポッドキャスター、マーケティング担当者、ジャーナリスト、教会奉仕者、研究者、学生、および文字起こしサービスを必要とする人に適しています。
Picovoice
picovoice.ai
Picovoice は、任意の内容に音声を追加できるエンドツーエンドのプラットフォームです。 イノベーションを通じて音声 AI の導入を加速します。 Picovoice は、オンデバイス、モバイル、Web ブラウザー、オンプレミス、およびクラウドで実行される、正確でプライベートな高速音声 AI テクノロジを使用して、企業にコントロールを取り戻します。
CueMe
cueme.com
CueME は、シングルス、ダブルス、トーナメントのあらゆるレベルの競技で、実際にプレーする人を見つけることができる世界最高のビリヤード アプリです。 CueME ビデオ、スコアリング、ランキング技術を使用して、世界中のどこにいても誰とでも対戦できます。プレイすると、勝利や実績に応じて CueME チップを獲得し、表彰や賞品を獲得できます。
Spokestack
spokestack.io
Spokestack は、ソフトウェアを完全に音声対応にするためのオープン ソース ライブラリと堅牢なサービスの強力なプラットフォームです。 * 自動音声認識 * 音声アクティビティ検出 *ウェイクワード * テキスト読み上げ * カスタムボイス * 自然言語理解
Upheal
upheal.io
Upheal は、メンタルヘルス専門家向けに特別に設計された、AI を活用した進捗メモ ツールです。治療メモを文字に起こし、ビデオ通話と分析機能を提供する自動アシスタントを提供します。 このツールは、各セッションで DAP に基づいた進捗メモを作成することで、臨床医が面倒なメモを取る時間を節約できるようにサポートします。メモは編集でき、必要に応じてセラピストの手動入力と統合することもできます。 また、このシステムは、繰り返されるテーマ、対処戦略、診断マーカー、さらには薬物への言及をセッションごとに特定する分析も提供するため、臨床医はクライアントに関する重要な傾向や洞察を迅速に理解できます。 また、Upheal は、患者情報の安全なデータ保護を確保するために、ガイド付き同意収集、エンドツーエンドの暗号化されたビデオ通話、HIPAA 準拠のストレージも提供します。 Upheal は遠隔療法と対面療法の両方のセッションに使用でき、音声録音をアップロードして後で書き起こすことができます。このツールは現在、セラピストが無料で使用できる早期アクセスを提供していますが、将来的には有料になる予定です。 Upheal は、稼働後は他の医療システムやソフトウェアと統合できるように設計されています。
Boomcaster
boomcaster.com
Boomcaster は、リモート インタビューに高品質のローカル録音機能を提供し、スタジオ グレードのオーディオと最大 4K ビデオ解像度を保証することでポッドキャスティングに革命をもたらします。各参加者の入力は個別にキャプチャされ、インターネットの不安定性から録画を保護し、比類のない鮮明さを提供します。当社の直観的なプラットフォームには、自動後処理、リアルタイム編集、主要なソーシャル プラットフォームへのワンクリック ライブストリーミングなどの機能も含まれています。 Boomcaster は、初心者のポッドキャスターと熟練の放送局の両方向けに設計されており、ポッドキャスト制作の技術的な課題を簡素化し、クリエイターが魅力的なコンテンツの配信に集中できるようにします。 Boomcaster を信頼してオーディオとビデオのポッドキャスティング体験を向上させるポッドキャスターのコミュニティに参加してください。
Recognosco
recognosco.com
ニューラル ネットワークとディープ ラーニング テクノロジを活用した、AI を活用した音声認識 SDK。パートナー向けに構築されています。 * 間接的なアプローチの採用 - パートナーと競合することなく革新的なテクノロジーを実現 * 世界中の大規模な市場と言語をカバー * 柔軟な導入: オンプレミスまたはクラウドで利用可能 * 相互に利益をもたらす長期的な関係 * 公正かつ柔軟な商業モデル * パートナーによって推進される製品ロードマップ * 究極のパートナー エクスペリエンス - 相談力があり、気配りがあり、親しみやすい。 Recognosco の音声対応プラットフォームは、ヘルスケアと法律に関する専門的なトピックを提供し、パートナーが最小限の統合作業で音声認識 SDK を使用してソリューションを強化できるようにします。 Recognosco の AI を活用した音声テクノロジーは、専門家の生産性と効率を最大化するために世界中で使用されています。 25 ヶ国、10 言語で使用され、35 を超えるパートナーとの 2000 以上の展開で使用されています。
Taption
taption.com
Taption は、音声またはビデオ コンテンツの書面への変換を中心とした幅広いサービスを提供する、技術的に高度な AI ツールです。 オーディオ ファイルまたはビデオ ファイルのトランスクリプトを生成できるため、会議、カンファレンス、または話し言葉のコンテンツの正確な文書を作成するのに便利なツールです。 この変換は単一言語に限定されず、多言語機能を備えているため、さまざまな市場での有用性が高まります。さらに、Taption はビデオ コンテンツの字幕を作成する機能を備えており、視聴者に追加のアクセシビリティ オプションを提供します。 その機能は、バイリンガル字幕の作成まで拡張されており、コンテキストや意味を失うことなく、異なる言語を話すコミュニティ間でコンテンツを共有する道を開く機能です。 Taption のもう 1 つの重要な機能は、生成されたトランスクリプトの自動翻訳サービスです。この側面は、コンテンツのローカリゼーションに役立つだけでなく、さまざまな言語環境にわたるシームレスなコミュニケーションを可能にします。 Taption は、多言語機能以外にも、トランスクリプト内で話者にラベルを付ける機能でも際立っており、ユーザーが状況を理解するための新たな層を追加します。 その製品は、コンテンツの作成と配信の効率とアクセシビリティを促進し、企業、コンテンツ作成者、個人にとって同様に価値のあるツールであることを証明しています。 興味のあるユーザーは、Taption のサービスを使用するために登録できます。
Waanee AI
waanee.ai
Waanee.ai は、カスタマー エクスペリエンス ユーティリティを構築するための AI アグリゲーター プラットフォームの開発に重点を置いています。 Waanee.ai は、カスタマー エクスペリエンス ユーティリティを構築するための AI アグリゲーター プラットフォームを開発しています。このプラットフォームは、さまざまな生成 AI モデルと音声モデル間のシームレスな移行を可能にし、コンタクト センターに無借金ソリューションを提供します。 AI を活用した自動音声応答 (IVR)、CRM 統合、包括的なダイヤラー ソフトウェア スイートなど、さまざまな機能を提供します。この最先端のソリューションは、人工知能と自然言語処理テクノロジーの力を利用して、顧客サービスを向上させ、通話のやり取りを自動化します。 Waanee.ai を利用することで、コンタクト センターは監査、コーチング、エージェントへの支援の提供などのタスクを自動化できます。 Waanee.ai が開発した優れた仮想エージェントは、人間と同様の方法で顧客と関わり、会話中の感情や感情を効果的に理解する能力を備えています。
Recordator
recordator.com
Recordator.com は、優れた録音品質で通話を録音したい人にとって、迅速かつ簡単なソリューションです。セットアップを必要とせずに、どのモバイルデバイスやキャリアでも動作します。
Datch
datch.io
Datch は、AI を活用して非常に詳細で構造化された人間中心のデータを取得し、意思決定とリソース管理のための資産の洞察を明らかにするプラットフォームです。私たちの目標は、資産の MTTR を削減し、MTBF を増加させ、より適切な計画をサポートし、より迅速な意思決定を可能にするために必要なデータとインテリジェンスを提供することで、可用性の不足を大幅に解消することです。 リソース管理、レポート、計画、スケジューリング、信頼性にわたる資産可用性の目標をサポートするために、この製品は「完璧なデータ」という 1 つの価値提案を中心に設計されています。完璧なデータとは、最前線から提供される完全かつ高精度でコンテキストに富んだレポートと、適切なタイミングで適切な担当者にデータが完全に呼び出され、抽出されることを意味します。データのキャプチャは、音声テキスト変換、リアルタイム翻訳、会話型 AI などの作業者支援機能と、キャプチャされたデータを変換するためのコンテキストとガイダンスを追加する機能によるデータ エンリッチメントの組み合わせによって実現されます。データ アクセシビリティと資産に関する洞察は、企業の文書管理システム、作業管理履歴、および資産に関連するその他の言語が豊富なデータ ソースでトレーニングされた生成検索によって裏付けられたツールです。
Jotengine
jotengine.com
Jotengine は、会話や会議を音声文字起こしやビデオキャプションに変換することで、生産性を高めます。