深層学習ソフトウェアとは、深層学習モデルの作成、トレーニング、展開を容易にするために設計されたソフトウェア ツールおよびフレームワークのカテゴリを指します。ディープ ラーニングは、データの表現を学習するために多くの層 (そのため「ディープ」という用語) を備えた人工ニューラル ネットワークをトレーニングする機械学習のサブセットです。深層学習ソフトウェアは通常、次のような機能を提供します。 * ニューラル ネットワーク アーキテクチャ設計: 層の数、層の種類 (畳み込み、再帰など)、層間の接続の指定を含む、ディープ ニューラル ネットワークのアーキテクチャを設計およびカスタマイズするためのツール。 * データの前処理と拡張: 正規化、データ拡張、特徴抽出などのタスクを含む、深層学習モデルをトレーニングするための入力データを準備および前処理するためのユーティリティ。 * モデルのトレーニングと最適化: 確率的勾配降下法などの最適化アルゴリズムや、正則化やドロップアウトなどの過学習を処理する方法など、大規模なデータセットで深層学習モデルをトレーニングするためのアルゴリズムと手法。 * モデルの評価と検証: 精度、適合率、再現率、F1 スコアなどの指標を含む、検証およびテスト データセットでトレーニングされたモデルのパフォーマンスを評価するためのツール。 * 導入と推論: 多くの場合、ソフトウェア開発フレームワークやプラットフォームとの統合を通じて、新しいデータの推論のために、トレーニング済みの深層学習モデルを運用環境に導入するための機能。 人気のある深層学習ソフトウェア フレームワークには、TensorFlow、PyTorch、Keras、Caffe などがあります。これらのフレームワークは、開発者や研究者がすべてを最初から実装することなく、ディープ ラーニング モデルの構築と実験を容易にする高レベルの抽象化と API を提供します。
新しいアプリを提案
SpeedSize
speedsize.com
SpeedSize™ は、従来の圧縮と配信に代わる最先端の AI を活用した代替品であり、オンライン ブランドに最高品質のメディア エクスペリエンスを提供するノーコード プラットフォームです。 SpeedSize 神経科学を活用した AI は、画像やビデオを分析して人間の脳が認識できないデータを排除し、同じ品質でサイズを小さくして再作成し、Web サイト訪問者ごとに最適なファイルを配信します。 Web サイトの速度を低下させることなく、Web サイトの製品プレゼンテーションを 4K 品質の画像と自動再生ビデオにアップグレードします。
Blitline
blitline.com
Blitline は、CMS/DAM システムを導入し、アプリケーションや Web サイトで大規模な安全なマルチフォーマット ファイル処理を必要とするソフトウェア企業やメディア企業にとって、最も手頃な価格の SaaS ソリューションです。
Cogniphi
cogniphi.com
私たち Cogniphi は、革新的な成果に焦点を当てた多様なイノベーター チームであり、ビジネスを驚くべきデジタルの未来に導くことができることに非常に興奮しています。 私たちは、Vision AI が AI の未来の中核となると信じています。当社のコグニティブ スイートの最初の AIVI (Artificial Intelligence Vision) は、製造、小売、ヘルスケア、監視などのさまざまなビジネス セクターにビジョン インテリジェンスのパワーをもたらすのに役立つ専用プラットフォームです。 AIVI は、複雑な空間コンピューティング、機械学習、パターン認識、異常検出、コンピューター ビジョンに依存しており、実際の環境で実証されています。現在、このプラットフォームは 150 以上の業界固有のパターンをホストし、1 万以上のカメラを駆動し、最小限の投資で企業全体で 600 万米ドルの収益を明らかにしています。 当社は、大規模なソリューションを迅速に開発、展開、運用するための実証済みの一連の機能と独自のツールと方法論を持っていることを誇りに思っています。世界中から厳選された AI 専門家ネットワークの集合的な知恵と専門知識が、当社のイノベーションとデジタル実装に不可欠なソフトウェア ブレッドボードを推進します。 当社は、当社が保有する認知テクノロジーやエンジニアリング スキル以上に、卓越性を追求する意欲と問題解決に対する情熱こそが、すべてのステークホルダーに飛躍的な成長をもたらすと強く信じています。
DeepLobe
deeplobe.ai
DeepLobe は、コードなしで AI モデルをトレーニング、構築、統合するための使いやすいプラットフォームを提供することで、あらゆる組織が AI にアクセスできるようにすることを目指しています。 DeepLobe は、企業がコンピューター ビジョンおよびテキスト分析タスク用の AI モデルを作成およびカスタマイズできるようにすることで、企業が AI テクノロジーの潜在的な利点を活用できるようにします。 DeepLobe はノーコード ソリューションに重点を置き、AI へのアクセスを民主化し、あらゆる規模や背景の組織がこれらの革新的なテクノロジーを利用できるようにしています。
DigitSquare
digit7.ai
Digit Square は、広範なデータセットを使用してコンピューター ビジョン パイプラインのアノテーション、トレーニング、自動化を行うために設計された SaaS ベースのプラットフォームです。 * 機械学習モデルの精度の向上: DigitSquare データ アノテーションにより、正確なデータのラベル付けが保証され、トレーニング中のエラーとバイアスが軽減されます。また、多様な学習例を促進し、現実世界の予測精度を向上させます。 * データの理解の向上: DigitSquare AI 支援の画像ラベル付けは、ラベル付きの例を通じてデータ コンテキストの把握、パターンの特定、ML モデルの精度の向上を支援し、貴重な洞察と情報に基づいた意思決定を可能にします。 * 生産性の向上: データ注釈プラットフォームは、画像、言語、ビデオ認識などのプロセスを自動化し、時間を大幅に節約します。また、正確な予測を実現するために機械学習モデルをトレーニングし、業界全体の生産性を向上させます。 * コラボレーションの加速: DigitSquare データ アノテーション ツールは、アノテーター間でタスクを分散することで ML モデルをスケールアップし、ラベル付け時間を短縮します。また、さまざまなデータセットのパフォーマンスと一般化も向上します。
Dragonfruit AI
dragonfruit.ai
Dragonfruit AI は、世界最大のブランドや小売業者の信頼できるパートナーであり、統合ビジョン プラットフォームで「単純に意味のあるビデオ」を提供しています。複数の拠点を持つ企業向けに特別に調整された当社のスイートには、Apple M1 と Generative AI を搭載しており、VMS や盗難警報から小売インサイト、棚在庫管理、先駆的なセルフチェックアウト不正検出まで、トップクラスのアプリが含まれています。帯域幅に制約のある環境で優れた性能を発揮するように設計された当社の世界的な存在感と堅牢な特許ポートフォリオは、企業が実用的なインテリジェンスを得るためにビデオ データを活用する方法を変革するという当社の取り組みを強調しています。
Emozo Labs
emozo.ai
Emozo の DIY リサーチ & フィードバック収集プラットフォームは、行動および感情に関する洞察を使用して、クライアントがすべてのデジタル コンテンツに対して正しい意思決定を行えるように支援します。当社のコンサルティング サービスやパネルと組み合わせることで、クライアントが従来の顧客データ分析を超えて顧客の心と心を掘り下げ、すべてのデジタル コンテンツの有効性と影響を理解できるように支援します。 私たちは、クライアントがウェブ、モバイル、ソーシャル メディア、テレビなどのあらゆるチャネルで、広告、アプリケーション、ストリーミング メディア コンテンツなど、より目的のあるデジタル コンテンツを作成および展開できるよう支援します。私たちは、顧客から得られた洞察を使用して、ブランド、メッセージング、そして挑戦を経験してください。無意識(注意と感情)と表明(アンケート)の応答を組み合わせるという当社の新しい方法は、クライアントがすべてのデジタル コンテンツの有効性を迅速に理解するのに役立ちます。 当社は AI を活用して、お客様のデバイス上で大規模かつ迅速に定性調査を可能にします。クライアントやその顧客が何かをダウンロード、インストール、保守する必要はありません。 Emozo の SaaS プラットフォームは、反復的な設計開発プロセスをサポートし、クライアントとその顧客に完全に安全なデータ保護を提供します。
Hive
thehive.ai
Hive は、コンテンツの理解、検索、生成を行うクラウドベースの AI ソリューションの大手プロバイダーであり、世界最大かつ最も革新的な何百もの組織から信頼されています。同社は、クラス最高の事前トレーニング済み AI モデルのポートフォリオを開発者に提供し、毎月数十億件の顧客 API リクエストに対応しています。 Hive はまた、独自の AI モデルとデータセットを活用したターンキー ソフトウェアも提供しており、ディープ ラーニングと生成 AI を使用して重要なビジネス ニーズに対応する画期的なアプリケーションを実現します。まとめると、Hive のテクノロジーは、プラットフォームの整合性 / コンテンツのモデレーション (AI 生成コンテンツ検出を含む)、ブランド保護、スポンサーシップの測定、コンテキストベースの広告ターゲティングなどへのアプローチを変革しています。 Hive は、General Catalyst、8VC、Tomales Bay Capital、Glynn Capital などの主要投資家から 1 億 2,000 万ドル以上を調達しました。 2021 年 4 月、Hive は 20 億ドルの評価額で 5,000 万ドルのシリーズ D を発表しました。サンフランシスコに本拠を置く同社は、全世界で 200 名を超えるフルタイム従業員を擁し、さらに、データのラベル付け業務をサポートする 500 万人を超える世界中の貢献者からなる分散した労働力を擁しています。
Imagga
imagga.com
Imaggaは、画像と動画の自動タグ付けを行うAPIプラットフォームです。開発者や企業が画像を理解する手助けをします。
Lambda
lambdalabs.com
Lambda は人類の進歩を加速するための計算を提供します。私たちは、世界最高の GPU クラウド、クラスター、サーバー、ワークステーションを構築しているディープ ラーニング エンジニアのチームです。当社の製品は、人類の知識の最前線にいるエンジニアや研究者に力を与えます。顧客には、Intel、Microsoft、Google、Amazon Research、Tencent、Kaiser Permanente、MIT、スタンフォード、ハーバード、カリフォルニア工科大学、ロス アラモス国立研究所、ディズニー、国防総省が含まれます。
OMNIOUS.AI
omnicommerce.ai
OMNIOUS.AI の AI プラットフォーム OMNICOMMERCE は、電子商取引小売業者が視覚的な検索/発見とパーソナライズされた製品推奨に基づいた直感的なショッピング エクスペリエンスを提供できるようにします。 購入者のモバイル デバイスからインスピレーションを得た写真を使用して Web サイトにアップロードし、一致する製品を見つけます。別の店で買い物をしているとき、または単に通りを歩いているときに、ソーシャル メディアで気に入ったものを購入させます。 eBay、YOOX Net-A-Porter、MUSINSA、LotteOn、TheHyundai.com、LF、Brandi、CJ ONSTYLE などの電子商取引企業は、買い物客のための商品発見を強化するために OMNICOMMERCE を信頼しています。 2021 グローバル ホット スタートアップ (AWS パートナー ネットワーク) 2020 年 Retail AI のベスト ユース ケース (NVIDIA) 2020 新しい体験のためのイノベーション (Samsung C-lab)
Irida Labs
iridalabs.com
Irida Labs は、コンピューター ビジョンと AI をエッジに導入することで、ビジョン ベースの AIoT センサーとソリューションを強化し、世界中の企業がスケーラブルなビジョン ベースのソリューションを開発できるよう支援しています。 Irida Labs は、コンピューター ビジョンとディープ ラーニングを使用して、バウンディング ボックスを現実世界のビジョン アプリケーションに変換する、AIoT に最適化された組み込みビジョン ソフトウェアを提供します。 Irida Labs のエンドツーエンド AI ソフトウェアおよびサービス プラットフォームである PerCV.ai は、広範囲にわたる人物、車両、物体の検出、識別、追跡、および 3D 姿勢推定のためのスケーラブルなビジョン ソリューションを可能にすることで、無数のコンピューター ビジョンと AI アプリケーションを可能にします。インダストリー 4.0、スマート シティとスペース、小売などの市場の拡大に貢献します。 組み込みコンピュータ ビジョンのハードウェアとソフトウェア、AI と機械学習、ビジョン システムの設計と光学における 10 年以上にわたる分野横断的なエンジニアリングの専門知識を活用して、システム設計からすぐに使用できるようになるまで、Vision-AI 製品のライフサイクル全体にわたるサポートを提供します。オンデバイスのビジョン AI を使用します。 Irida Labs の独自の最先端テクノロジーは、組み込みビジョンと ML における USPTO の特許に基づいています。 Irida Labs は、ほんの数例を挙げると、HikVision、Intel、Analog Devices、Qualcomm、Arrow、ARM などの世界クラスのリーダーとの強力なパートナーシップを通じて、最も困難なコンピュータ ビジョン アプリケーションさえも総合的にサポートできるエコシステムを構築しました。 Irida Labs の急成長しているチームはヨーロッパ、ギリシャに拠点を置いていますが、Irida Labs の事業の世界的な拠点は北欧および中央ヨーロッパから北米、アジアにまで広がっています。
Relu
relu.eu
Relu は、3D 医療画像を仮想患者に自動的に変換する AI ソフトウェア コンポーネントを作成しているソフトウェア会社です。私たちは、このテクノロジーを既存の歯科ワークフロー/ソフトウェアに簡単に統合できるようにすることに重点を置いています。
VisionBot
visionbot.com
Visionbot.com は、テキストと画像に AI を活用して現場スタッフがより効果的に共同作業できるようにする、スケーラブルで使いやすいサービスです。これにより、イベントのレポートと管理が改善され、プロジェクト実行の所要時間が短縮され、業務効率が大幅に向上します。
VXG
videoexpertsgroup.com
VXG は、ビデオ管理を簡素化し、コスト効率の高い方法でシステムを拡張できるようにする世界的なクラウド ビデオ監視会社です。システム インテグレーター、セキュリティ、アクセス コントロール、AI、ビデオ モニタリング、テレコム、SaaS 企業向けに、150,000 台以上のカメラが接続された、カスタマイズされた世界クラスのビデオ監視ソリューションの構築を支援します。真のオープン クラウド プラットフォームは、他のソリューションとの統合、または IP カメラと連携する新しいサービスの構築を目的として設計されています。 VXG は、SaaS 企業向けの将来性のある革新的なテクノロジー プラットフォームおよびクラウド VMS エンジンであり、完全に柔軟でスケーラブルで、コスト効率が高く、ホワイトラベルでカスタマイズ可能です。真のクラウドビデオ監視への最速かつ簡単なパスを提供し、完全なソースコードと必要なすべてのコンポーネントを備えた完全な VMS を提供します。 完全にオープンな (製品に依存しない) プラットフォームの主な価値により、顧客はソリューションを独自のクラウド/データ センターに展開し、社内またはサードパーティのシステムを統合できます。その結果、顧客側の労力はほとんどかからず、市場投入までの時間が最短になります。製品に対する完全なコントロール、ブランディング、所有権を彼らに与えながら。
Wicket
wicketsoft.com
Wicket 顔認証プラットフォームは、ユーザーを喜ばせ、スポーツ会場、ライブ イベント、認証施設のセキュリティを強化する摩擦のないタッチポイントで、ファン、ゲスト、従業員にセンセーショナルなイベント体験を可能にするプライバシー最優先の統合ソリューションです。 Wicket 独自のプライバシー優先アルゴリズムが Web ベースのプラットフォームに組み込まれており、1 秒未満で個人を認証するため、進入とアクセスの管理が安全かつスムーズで便利になります。
Krisp
krisp.ai
Krispは、AIを利用してノイズを除去し、リモートミーティングの音質を向上させるアプリです。リアルタイム転写機能も備えています。
Symbl.ai
symbl.ai
Symbl.aiは、会話データのリアルタイム転写と分析を提供し、さまざまな業界向けのインサイトを生成するプラットフォームです。
Shownotes
shownotes.io
Shownotes は、ポッドキャスト エピソードを自動的に要約し、完全なトランスクリプトとキャプション ファイルを含むランディング ページを作成する AI を活用したツールです。 chatGPT を使用して YouTube の自動キャプションを変換し、記憶に残る引用を生成します。また、トランスクリプトからブログ投稿を作成することもできます。 Shownotes には、Free、Creator、Pro の 3 つのプランがあります。無料プランでは、毎月 1 つのショーノート、要約トランスクリプト、ランディング ページが提供され、すべてのショーが公開されます。 クリエイター プランでは、毎月 2 つのショーノート、概要トランスクリプト、ランディング ページ、番組を非公開にする機能、ランディング ページ エディター、完全なトランスクリプト、および ums と ahs が提供されます。 プロ プランでは、無制限のショーノート、概要トランスクリプト、ランディング ページ、番組をプライベートにする機能、ランディング ページ エディター、完全なトランスクリプト、ums と ahs、キャプション ファイルが提供されます。
Hour One
hourone.ai
Hour Oneは、リアルなアバターを使用してビジネス向けのビデオコンテンツを簡単に作成できるAI搭載プラットフォームです。
AssemblyAI
assemblyai.com
AssemblyAIは、音声をテキストに転写し、音声データを分析する高度なAIツールを提供するプラットフォームです。
Gladia
gladia.io
Gladiaは、リアルタイムで音声をテキストに変換するAPIを提供するプラットフォームです。99の言語をサポートし、高精度な転写が可能です。
PodcastAI
podcastai.com
PodcastAIは、AI技術を用いてポッドキャストの制作を支援するアプリで、転写、スピーカー識別、メタデータ生成などの機能を提供します。
Deepgram
deepgram.com
Deepgramは、音声をテキストに変換し、AIを使用して言語を理解するAPIを提供するプラットフォームです。多言語対応の音声処理機能を実装します。
Speechmatics
speechmatics.com
Speechmatics は音声インテリジェンスの世界有数の専門家であり、AI と ML の最新のブレークスルーを組み合わせて、人間の音声のビジネス価値を解き放ちます。世界中の企業がスピーチマティクスを使用して、人口統計、年齢、性別、アクセント、方言、場所に関係なく、人間レベルの音声を正確に理解し、リアルタイムで記録メディアにテキストに書き起こします。 これらのトランスクリプトと最新の AI 主導の音声機能を組み合わせることで、企業は要約、トピック、センチメント、章、翻訳などを活用した製品を構築できます。 Speechmatics は、世界中で 300 年以上の文字起こしを毎月 50 の言語で処理しています。音声認識における機械学習の先駆者であるそのニューラル ネットワークは、音響、言語、方言、複数の話者、句読点、大文字の使用、文脈、暗黙の意味を考慮します。 Speechmatics は英国ケンブリッジに本社を置き、ニューヨークにもオフィスを構えています。スピーチマティクスは登録商標です。
Talkatoo
talkatoo.com
Talkatoo は医療専門家向けのディクテーションを再発明しています。獣医業界でも人間の医療業界でも、Talkatoo は音声テキスト変換ソフトウェア ソリューションです。 Talkatoo は Windows と Mac の両方で互換性があり、入力できるあらゆるフィールド (PIM と EHR を含む) で動作し、非常に使いやすいです。 * Talkatoo は、専門用語や医療用語を含む音声をテキストに変換することに重点を置いた、臨床用途向けに設計されたデスクトップ ディクテーション ソリューションです。 * 査読者は、複雑な医療用語を含む音声をテキストに正確に変換する Talkatoo の機能と、医療記録作成の効率と生産性の向上に役立つユーザーフレンドリーなインターフェイスを高く評価しています。 * 査読者は、Talkatoo は大量の命令を処理すると遅くなる可能性があり、特定の一般的ではない用語の認識が困難になる場合があり、カスタマー サポートの応答が遅れる可能性があると指摘しました。
Speechlogger
speechlogger.com
SpeechLoggerは、音声認識と翻訳を行うウェブアプリで、リアルタイムで音声をログし、転写します。自動句読点や発言者識別機能もあります。
LumenVox
lumenvox.com
LumenVox は、世界中の組織にキャリアグレードの音声テクノロジーを提供する大手プロバイダーです。 Capacity の一部として、LumenVox は AI 主導の音声認識および音声認証テクノロジーを使用して顧客エクスペリエンスを変革します。 LumenVox の DNA は 20 年間の音声テクノロジーに基づいており、最も包括的でコスト効率が高く、柔軟な音声サービスを提供します。同社の音声および音声テクノロジーにおける深い歴史により、企業は、話されている内容を理解するだけでなく、誰が話しているのかを識別する音声エクスペリエンスを構築できます。 LumenVox は、オンプレミス、マルチクラウド、ハイブリッド モデルなど、あらゆる環境でアプリケーションを簡単に統合するために必要な柔軟性と制御を企業に提供する唯一のプロバイダーです。 他の音声プロバイダーと比較して、LumenVox は通常、総所有コスト (TCO) を 35% も削減できます。さらに、LumenVox は新しい言語モデルを平均 60 日以内にデプロイできますが、ほとんどのプロバイダーでは 6 か月以上かかります。 文字起こし機能付き ASR は、LumenVox ソフトウェア ポートフォリオの基礎です。 LumenVox の音声および音声ソフトウェア スタックは、人工知能と深層機械学習の基盤に基づいて動作し、将来も使い続けられる高性能の音声テクノロジーを提供します。エンドツーエンドのディープ ニューラル ネットワークを活用した LumenVox の ASR エンジンは、より多様なユーザー ベースにサービスを提供するために、新しい言語や方言を追加する機能を加速します。 ASR と連携して、LumenVox は書かれたテキストを言語化するための Text-to-Speech (TTS) ソフトウェアを提供します。これにより、企業はチャットボットをボイスボットに変えることができます。 LumenVox の最先端のツールセットを通じて、企業はあらゆる音声認識アプリケーションのチューニングと転写 (パラメータ、文法、バージョン アップグレード テストを含む) を実行できます。このツールセットを使用すると、顧客は音声対応アプリケーションを拡張する必要があるたびに、高価で時間のかかる専門サービスを回避できます。従来の ASR を使用しているお客様は、文法と信頼値を LumenVox ASR に簡単に移行できるため、ツールセットの恩恵を受けることができます。
ArtPro
artpro.com
ArtProは、カタログ、アーカイブ、追跡、共有、およびアートワークをオンラインで保存するのに役立つように設計されたArt Inventory Managementソフトウェアです。
Kukarella
kukarella.com
完璧な音声の明瞭さ、ペース、抑揚、発音でナレーションを作成します。 Kukarella では、最高の AI ニューラル音声を試すことができます。すべての商業権が含まれます。 Kukarella では、有料プランのいずれかで商用利用に適した 130 の言語とアクセントで 800 を超える AI 音声へのアクセスを提供します。ナレーションに加えて、Dialogues AI ツールを使用してダイアログを作成したり、Simdubbing ツールを使用してテキストを数百の言語に翻訳して吹き替えたりすることもできます。 それだけではありません。あらゆる種類のビデオ、オーディオ、YouTube ビデオを文字に起こしたり、Web ページからテキストをスクレイピングしたり、画像上のテキストを認識したりできます。さらに、Kukarella は Google、Amazon、Microsoft、IBM などのテクノロジー業界の大手企業と提携しているため、最高のものを手に入れることができます。 カナダ政府、Salesforce、DHL、マクドナルド、ロンドン大学、ダイムラー メルセデスなどの組織の多くのクリエイティブな人材がナレーションや文字起こしに Kukarella を使用しているため、安心してご利用いただけます。
SpeechFlow
speechflow.io
SpeechFlowは、音声をテキストに変換するツールで、14言語をサポートし、迅速かつ正確な転写を提供します。複数の業界に対応しています。
Synth
usesynth.com
Synth は、ビジネス会話を管理および活用するための AI を活用した包括的なソリューションです。 Synth は、営業電話、社内外の会議、コールセンターでの通話やカスタマー サポートとのやり取りなど、すべての通話を文字起こし、翻訳、分析します。 Synth は、単一または複数の呼び出しの自動要約も提供します。 Synth は、自動化された CRM データ キャプチャ、多言語の文字起こしと翻訳、予測分析、Slack 経由で提供される瞬時の洞察などの一連の高度な機能を備えており、データを実行可能なビジネス戦略に組み込むことができます。 特徴: * 文字起こしと翻訳: 50 以上の言語での文字起こしと翻訳サービスを利用して、海外のクライアントと関わります。 * 自動通話要約: Synth の機能を活用して、単一または複数の通話の包括的な要約を提供し、広範な会話データを簡潔で実用的なポイント、および自動化されたレポートとドキュメントに変換します。 * 自動 CRM 同期: Synth によってキャプチャされた概要、アクション アイテム、会議の詳細で CRM を最新の状態に保ちます。 * リアルタイム インサイト: Slack 経由で見込み客情報、企業詳細、提案された質問、通話概要を即座に取得します。 * 予測分析: 会話の可能性に関するデータに基づいた洞察を活用し、次のステップに合わせた推奨事項を取得します。 * 堅牢なセキュリティ コンプライアンス: Synth はセキュリティ標準を遵守し、Synth はデータとプライバシーの保護を保証します。 使用例: * 製品開発のパワーアップ: アイデアを簡単に捉え、整理します。アクションアイテムに優先順位を付ける。洞察を要約して共有する * マーケティングとパートナーシップを合理化: コミュニケーションとコラボレーションを簡単に改善します。パートナーシップ会議を改善する。全員が同じ認識を持てるようにします。 * ユーザー調査の合理化: ユーザーの洞察を簡単に取得して思い出します。ユーザーをより深く理解する。ユーザーのフィードバックを要約します。 * データに基づいた投資決定を行う: 売り込み会議やデュー デリジェンス コールから重要な洞察を簡単に取得して思い出すことができます。ピッチミーティングの文字起こし;デューデリジェンスコールを要約します。
VoxSciences
voxsci.com
VoxSciences はボイスメールをテキストに変換し、テキスト (SMS) メッセージや電子メールとして携帯電話に配信します。
Crescendo
crescendo.com
Crescendo Systems Corporation は、医療、法律、法執行機関、保険部門向けのドキュメンテーション、デジタル ディクテーション、音声処理、文字起こし、およびワークフロー管理システムの大手開発者です。
Philips SpeechLive
speechlive.com
Philips SpeechLiveは、クラウドベースの口述、転写、音声認識ワークフローソリューションです。これは、著者がこれまで以上に早くスピーチからテキストに移行するのに役立ちます。 SpeechLiveには、Microsoft Azure Cloud Servicesを使用したマルチファクター認証を備えた完全なエンドツーエンドの暗号化があります。アドオンスピーチ認識サービスには、多言語機能、リアルタイムおよび延期オプション、および音声コマンド機能があり、指示中にドキュメントをフォーマットします。
Scribbl
scribbl.co
Scribbl は、生産性とコラボレーションを強化するための究極の AI 搭載ツールで、会議エクスペリエンスを変革します。メモを取る煩わしさから解放され、効率的な会議の新時代を迎えましょう。 Scribbl は会議を簡単にキャプチャ、文字起こし、記録できるため、ビートを逃すことはありません。 当社の高度な AI は、各会議を理解しやすいトピックと実行項目に分割し、レビュー プロセスを合理化します。 Scribbl の Chrome 拡張機能を使用すると、重要な瞬間をリアルタイムでマークし、ライブ ディスカッションと会議後の分析の間にシームレスな架け橋を作成します。 洞察の共有がかつてないほど簡単になりました。チームや外部の関係者との間でも、Scribbl の直感的な共有機能を使用すると、情報を迅速かつ効果的に広めることができます。
ai|coustics
ai-coustics.com
ai|cousticsは、高度なアルゴリズムを用いて音声オーディオの品質を向上させるAIツールです。様々なオーディオアプリケーションに対応します。
Cochl
cochl.ai
Cochl は、マシンリスニングテクノロジーに焦点を当てた研究ベースのスタートアップ企業です。私たちは、開発者や企業が製品やサービスに人間のようなリスニング能力を持たせるためのサウンド AI システムを提供しています。
CrystalSound
crystalsound.ai
CrystalSound は、AI テクノロジーを使用したデスクトップ アプリで、通話、録音、オンライン会議中に不要なノイズや気を散らすものをすべて除去します。 CrystalSound は、高度なアルゴリズムと最先端の機能により、背景ノイズ、エコー、ハウリング効果、その他の音声を除去し、明瞭かつ効果的にコミュニケーションできるようにします。 CrystalSound は、ユーザーのダウンロードと使用のニーズを満たすために、Mac、Windows、Linux オペレーティング システム上で動作する機能を備えています。 CrystalSound を使用すると、コミュニケーション アプリとの互換性の問題を心配する必要がなくなります。当社のソリューションは、Teams、Zoom、Google Meet、Loom、Discord などの人気のあるアプリとシームレスに連携するように設計されています。
Dictalogic
dictalogic.com
Dictalogicは、1つのダッシュボードを通して、テキストへのオーディオ、テキストへのスピーチ、テキストへの会話、タスク委任、タスク委任など、特殊なモジュールを提供します。 *オーディオのみ:従来のオーディオディクテーション。オーディオが録音され、どこにでも配置される可能性のあるトランスクレイバーに送信されます(在宅勤務を含む)。 *テキストへのオーディオ:デジタル変換により、音声からテキストへの変換が可能になります。このアプローチでは、オーディオが記録され、転写されるように送信され、音声が送信機に届く前にテキストに変換されます。課題に関する複数のオプションを提供します。 *テキストへのスピーチ:テキストへのリアルタイムのスピーチの機能も提供します。ワークフローは、他のディクテーションと同じであり、任意の任意の送信機に送信できます。 *テキストへの会話:Dictalogic Conversationモジュールは、各スピーカーへの音声認識、スピーカーの識別、文の帰属(ダイアリゼーションとも呼ばれる)を組み合わせたスピーチツーテキストソリューションであり、安全なポータルアクセス可能な時期にカプセル化された会話のリアルタイムおよび/または非同期転写を提供します。
Dubber
dubber.net
Dubber は、コンプライアンス、販売およびサービス パフォーマンスのための世界的な統合クラウド通話録音および音声 AI ソリューションです。 Dubber の完全準拠の通話録音ソリューションは、クリックするだけでオンにでき、ハードウェアを必要とせず、クラウドで無限に拡張可能です。 すべての通話や会話は自動的にキャプチャされ、Dubber Voice Intelligence Cloud に安全に保存され、AI で強化され、リアルタイムの検索、センチメント分析、アラートと通知を使用してリプレイまたは洞察力に富んだ文字起こしとして即座に利用できます。
Flipner AI
flipner.com
Flipner AI は、音声スニペットをすぐに公開できる記事に変換するインテリジェントな音声テキスト変換ツールおよびコンテンツ ハブであり、執筆の迅速なアシスタントとして機能します。 Flipner AI はテキスト作成に革新的なアプローチを導入し、ライターがいつでもどこでも無数のアイデアを簡単にキャプチャして整理できるようにします。この革新的なプラットフォームは、テキストと音声メモの両方を保存できる独自のコンテンツ ハブを提供し、ユーザー フレンドリーな AI ツールを通じて、考えを構造化されたドラフトや洗練されたすぐに使用できるドキュメントにシームレスに変換および統合することを容易にします。
Jotengine
jotengine.com
Jotengine は、会話や会議を音声文字起こしやビデオキャプションに変換することで、生産性を高めます。
Speech to Note
speechtonote.com
Speech to Noteは音声をリアルタイムでテキストに変換するAIツールです。メモの管理とアクセシビリティをサポートします。
Spokestack
spokestack.io
Spokestack は、ソフトウェアを完全に音声対応にするためのオープン ソース ライブラリと堅牢なサービスの強力なプラットフォームです。 * 自動音声認識 * 音声アクティビティ検出 *ウェイクワード * テキスト読み上げ * カスタムボイス * 自然言語理解
Voxpow
voxpow.com
Voxpowは、Webサイトに音声認識機能を統合し、100以上の言語で音声入力を可能にする無料のソリューションです。
CueMe
cueme.com
Cuemeは、シングル、ダブル、トーナメントのためのあらゆるレベルの競争で直接または事実上プレイする人を見つけるための世界最高のビリヤードアプリです。 Cuemeビデオ、スコアリング、ランキングテクノロジーを使用して、世界中の誰でもプレイしてください。プレイするにつれて、Cuemeチップスは、認知と賞品のための勝利と成果で勝ちます。
Datch
datch.io
Datch は、AI を活用して非常に詳細で構造化された人間中心のデータを取得し、意思決定とリソース管理のための資産の洞察を明らかにするプラットフォームです。私たちの目標は、資産の MTTR を削減し、MTBF を増加させ、より適切な計画をサポートし、より迅速な意思決定を可能にするために必要なデータとインテリジェンスを提供することで、可用性の不足を大幅に解消することです。 リソース管理、レポート、計画、スケジューリング、信頼性にわたる資産可用性の目標をサポートするために、この製品は「完璧なデータ」という 1 つの価値提案を中心に設計されています。完璧なデータとは、最前線から提供される完全かつ高精度でコンテキストに富んだレポートと、適切なタイミングで適切な担当者にデータが完全に呼び出され、抽出されることを意味します。データのキャプチャは、音声テキスト変換、リアルタイム翻訳、会話型 AI などの作業者支援機能と、キャプチャされたデータを変換するためのコンテキストとガイダンスを追加する機能によるデータ エンリッチメントの組み合わせによって実現されます。データ アクセシビリティと資産に関する洞察は、企業の文書管理システム、作業管理履歴、および資産に関連するその他の言語が豊富なデータ ソースでトレーニングされた生成検索によって裏付けられたツールです。
Jupitrr
jupitrr.com
Jupitrr AI Video Maker は、クリエイターが自分の音声録音やポッドキャストをパーソナライズされたビデオに変換できる AI を活用したツールです。このツールを使用すると、ユーザーはわずか数分で素晴らしいビデオ コンテンツを簡単に作成できます。 Jupitrr AI Video Maker の背後にある AI テクノロジーは、ストック映像、チャート、字幕などを含む、クリエイターのビデオ用のストック ビデオを生成するプロセスを自動化します。このツールは、Word ドキュメントの編集に似たユーザーフレンドリーなインターフェイスを備えているため、複雑なタイムラインの必要性がなくなり、ビデオ編集が簡単になります。 ストックビデオの膨大なライブラリにワンクリックでアクセスできる利便性を提供し、ユーザーが適切な映像を検索する手間を省きます。 Jupitrr AI Video Maker は、スペイン語、ヒンディー語、フランス語、北京語などを含む複数の言語をサポートしているため、世界中の幅広いクリエイターが利用できるようになります。このツールには、ストックビデオに加えて、さまざまなサイズやスタイルの字幕やキャプションを追加するオプションも用意されています。 AI によって生成された魅力的なチャートも含まれており、ビジュアル データをビデオに組み込むプロセスを簡素化するように設計されています。 Jupitrr AI Video Maker は、クリエイターがビデオ編集に過度の労力を費やすのではなく、クリエイティブなビジョンに集中できるようにすることで、クリエイターに力を与えることを目的としています。シンプルさと多用途性を備えた Jupitrr AI Video Maker は、ビデオ制作プロセスを強化したいと考えているコンテンツ クリエイターにとって貴重なツールです。
Phonexia
phonexia.com
Phonexiaは、音声パターンを使ってユーザーを認証し、迅速かつ安全な認証を提供する音声生体認証のプラットフォームです。
Picovoice
picovoice.ai
Picovoice は、任意の内容に音声を追加できるエンドツーエンドのプラットフォームです。 イノベーションを通じて音声 AI の導入を加速します。 Picovoice は、オンデバイス、モバイル、Web ブラウザー、オンプレミス、およびクラウドで実行される、正確でプライベートな高速音声 AI テクノロジを使用して、企業にコントロールを取り戻します。
Recognosco
recognosco.com
ニューラル ネットワークとディープ ラーニング テクノロジを活用した、AI を活用した音声認識 SDK。パートナー向けに構築されています。 * 間接的なアプローチの採用 - パートナーと競合することなく革新的なテクノロジーを実現 * 世界中の大規模な市場と言語をカバー * 柔軟な導入: オンプレミスまたはクラウドで利用可能 * 相互に利益をもたらす長期的な関係 * 公正かつ柔軟な商業モデル * パートナーによって推進される製品ロードマップ * 究極のパートナー エクスペリエンス - 相談力があり、気配りがあり、親しみやすい。 Recognosco の音声対応プラットフォームは、ヘルスケアと法律に関する専門的なトピックを提供し、パートナーが最小限の統合作業で音声認識 SDK を使用してソリューションを強化できるようにします。 Recognosco の AI を活用した音声テクノロジーは、専門家の生産性と効率を最大化するために世界中で使用されています。 25 ヶ国、10 言語で使用され、35 を超えるパートナーとの 2000 以上の展開で使用されています。
Recordator
recordator.com
Recordator.com は、優れた録音品質で通話を録音したい人にとって、迅速かつ簡単なソリューションです。セットアップを必要とせずに、どのモバイルデバイスやキャリアでも動作します。
SoundHound
soundhound.com
SoundHoundは音声AIプラットフォームで、企業が自然な会話を通じて顧客とやり取りできるようにします。
SpeechAce
speechace.com
SpeechAce では、多用途の音声認識テクノロジーを通じて、言語学習者のスピーキング能力の向上を支援することに取り組んでいます。私たちは、言語学習者が自分のスピーキングスキルを評価するだけでなく、改善すべき領域を正確に特定するのに役立つ世界初の音声認識 API を開発しました。当社の音声認識 API の最初のバージョンでは発音スコアのみが提供されていましたが、現在は完全な音声文字起こしに加え、語彙、文法、流暢さ、一貫性、関連性などのより高いレベルのスキルの評価が含まれるように機能が強化されました。 SpeechAce は、世界最大規模の言語学習プロバイダーだけでなく、小規模 (ただし最も人気のある) スタートアップ企業も含めた多様な世界規模の顧客ベースを誇っています。
SpeechWrite
speechwrite.com
SpeechWrite は、ワークフロー ソリューション、デジタル ディクテーション、音声認識、PDF ソリューションに特化したフル ソリューション プロバイダーです。 SpeechWrite の実用的なテクノロジーは、洗練されていながらもシンプルであり、作業環境を強化し、よりスマートに作業できるようにします。 OEM およびテクノロジー パートナーと緊密に連携することで、SpeechWrite は最新のテクノロジー開発と市場トレンドに関する広範な知識を持っています。 2001 年に設立された SpeechWrite は、ディクテーション業界で累計 100 年以上の実績があり、市場投入までのスピードと販売後のサポートに誇りを持っています。
Spellex
spellex.com
Spellex は、革新的な製品を提供し、世界クラスのサービスを Spellex の顧客に提供することにより、スペル チェック、ディクテーション、および支援技術ソフトウェア ソリューションを提供します。
Thirdlane
thirdlane.com
Thirdlane Connect は、多用途の顧客コミュニケーションおよびチーム コラボレーション アプリケーションとして機能し、チャット、音声およびビデオ通話、会議、画面共有、ファイル共有、CRM やその他のさまざまなビジネス アプリケーションとのシームレスな統合などの一連の機能をチームに提供します。マルチチャネルの顧客コミュニケーションとチーム コラボレーションを促進するサードレーン コネクトは、ローカル ワーカーとリモート ワーカーの両方を対象に設計されており、Web ブラウザ、iPhone、Android デバイスに加え、Windows、Linux、Mac デスクトップもサポートしています。この強力なアプリケーションは、Thirdlane ビジネス フォン システムまたは Thirdlane マルチ テナント PBX プラットフォームと完全に統合されており、これらのプラットフォームによって動作します。これらのプラットフォームは、オンプレミス、プライベート クラウド、パブリック クラウドを問わず、さまざまな設定に安全に導入でき、通信インフラストラクチャの柔軟性とセキュリティを確保します。
Vatis Tech
vatis.tech
優れた精度と手頃な価格で音声認識に革命をもたらします。 Vatis Tech の API は、独自のディープラーニング音声認識アルゴリズムを使用して、オーディオ ファイルまたはビデオ ファイルを 95% 以上の精度でテキストに自動的に変換する高度な音声テキスト変換テクノロジーを提供します。 Vatis Tech は、自社の音声テキスト変換 API エンジンと Web プラットフォームを、機敏なスタートアップ企業、巨大企業、ポッドキャスター、ジャーナリスト、開発者などに提供しています。これにより、ソリューション プロバイダーやサービス プロバイダーは、業界やユースケースに関係なく、テクノロジーをアプリケーションに統合できます。 * オンプレミスまたはクラウド上に導入 * API を使用して任意のプログラミング言語で構築 * トレーニングと推論のためのスケーラブルな GPU インフラストラクチャを入手 * 話者ダイアライゼーション、エンティティ検出、句読点、大文字または数字の変換などのコンテキスト機能。 * Web アプリケーション内のテキスト編集機能 * リアルタイムまたは事前に録音されたファイルで文字起こし