Webアプリのアプリストア

適切なソフトウェアとサービスを見つけてください。

WebCatalog Desktop を使えば、ウェブサイトをデスクトップアプリに変換したり、Mac、Windows専用の豊富なアプリにアクセスすることができます。スペースを使ってアプリを整理し、複数のアカウントを簡単に切り替えて、これまでにないほど生産性を向上させましょう。

WebCatalog Desktopをダウンロード

もっと詳しく

最も人気

深層学習ソフトウェア - 最も人気のあるアプリ - アメリカ合衆国

深層学習ソフトウェアとは、深層学習モデルの作成、トレーニング、展開を容易にするために設計されたソフトウェアツールおよびフレームワークのカテゴリを指します。ディープラーニングは、データの表現を学習するために多くの層 (そのため「ディープ」という用語) を備えた人工ニューラルネットワークをトレーニングする機械学習のサブセットです。深層学習ソフトウェアは通常、次のような機能を提供します。 * ニューラルネットワークアーキテクチャ設計: 層の数、層の種類 (畳み込み、再帰など)、層間の接続の指定を含む、ディープニューラルネットワークのアーキテクチャを設計およびカスタマイズするためのツール。 * データの前処理と拡張: 正規化、データ拡張、特徴抽出などのタスクを含む、深層学習モデルをトレーニングするための入力データを準備および前処理するためのユーティリティ。 * モデルのトレーニングと最適化: 確率的勾配降下法などの最適化アルゴリズムや、正則化やドロップアウトなどの過学習を処理する方法など、大規模なデータセットで深層学習モデルをトレーニングするためのアルゴリズムと手法。 * モデルの評価と検証: 精度、適合率、再現率、F1 スコアなどの指標を含む、検証およびテストデータセットでトレーニングされたモデルのパフォーマンスを評価するためのツール。 * 導入と推論: 多くの場合、ソフトウェア開発フレームワークやプラットフォームとの統合を通じて、新しいデータの推論のために、トレーニング済みの深層学習モデルを運用環境に導入するための機能。人気のある深層学習ソフトウェアフレームワークには、TensorFlow、PyTorch、Keras、Caffe などがあります。これらのフレームワークは、開発者や研究者がすべてを最初から実装することなく、ディープラーニングモデルの構築と実験を容易にする高レベルの抽象化と API を提供します。

新しいアプリを提案

Claude

claude.ai

Claude by Anthropic は、Anthropic が構築した次世代 AI アシスタントで、最高の仕事ができるように安全、正確、確実になるように訓練されています。

Otter

otter.ai

Otter は、音声会話を記憶、検索、共有できるスマートなメモアプリです。 Otter は、音声、文字起こし、話者の識別、インライン写真、キーフレーズを組み合わせたスマートボイスノートを作成します。ビジネスマン、ジャーナリスト、学生が、会議、インタビュー、講義など、重要な会話が行われるあらゆる場面で、より集中し、協力し、効率的に取り組むことができるように支援します。

AWS Console

amazon.com

アマゾンウェブサービス (AWS) は、個人、企業、政府にオンデマンドのクラウドコンピューティングプラットフォームと API を従量課金制で提供する Amazon の子会社です。これらのクラウドコンピューティング Web サービスは、さまざまな基本的な抽象的な技術インフラストラクチャと分散コンピューティングの構成要素とツールを提供します。これらのサービスの 1 つが Amazon Elastic Compute Cloud (EC2) です。これにより、ユーザーは、インターネット経由でいつでも利用できるコンピューターの仮想クラスターを自由に利用できるようになります。 AWS バージョンの仮想コンピュータは、処理用のハードウェア中央処理装置 (CPU) やグラフィックス処理装置 (GPU) など、実際のコンピュータの属性のほとんどをエミュレートします。ローカル/RAM メモリ。ハードディスク/SSDストレージ。オペレーティングシステムの選択。ネットワーキング; Web サーバー、データベース、顧客関係管理 (CRM) などのプリロードされたアプリケーションソフトウェアも含まれます。 AWS テクノロジーは世界中のサーバーファームに実装され、Amazon 子会社によって保守されています。料金は、加入者が必要とする可用性、冗長性、セキュリティ、およびサービスオプションによって選択された使用量 (「従量課金制」モデルと呼ばれる)、ハードウェア、オペレーティングシステム、ソフトウェア、またはネットワーク機能の組み合わせに基づいて決定されます。サブスクライバーは、単一の仮想 AWS コンピューター、専用の物理コンピューター、またはそのいずれかのクラスターの料金を支払うことができます。サブスクリプション契約の一環として、Amazon はサブスクライバーのシステムにセキュリティを提供します。 AWS は、北米の 6 か所を含む世界の多くの地理的地域で運用されています。Amazon は、実際の物理サーバーファームを構築するよりも迅速かつ安価に大規模なコンピューティング能力を取得する方法として、AWS を加入者に販売しています。すべてのサービスは使用量に基づいて請求されますが、各サービスはさまざまな方法で使用量を測定します。 Synergy Group によると、2017 年の時点で、AWS は全クラウド (IaaS、PaaS) の圧倒的な 34% を所有しており、次の 3 つの競合他社である Microsoft、Google、IBM はそれぞれ 11%、8%、6% を所有しています。

Google Cloud Platform

google.com

Google が提供する Google Cloud Platform (GCP) は、Google 検索、Gmail、ファイルストレージ、YouTube などのエンドユーザー製品に Google が社内で使用しているのと同じインフラストラクチャ上で実行されるクラウドコンピューティングサービススイートです。一連の管理ツールに加えて、コンピューティング、データストレージ、データ分析、機械学習などの一連のモジュラークラウドサービスを提供します。登録にはクレジットカードまたは銀行口座の詳細が必要です。Google Cloud Platform は、サービスとしてのインフラストラクチャ、サービスとしてのプラットフォーム、およびサーバーレスコンピューティング環境を提供します。 2008 年 4 月、Google は、Google が管理するデータセンターで Web アプリケーションを開発およびホストするためのプラットフォームである App Engine を発表しました。これは、同社初のクラウドコンピューティングサービスでした。このサービスは 2011 年 11 月に一般公開されました。App Engine の発表以来、Google は複数のクラウドサービスをプラットフォームに追加しました。 Google Cloud Platform は Google Cloud の一部であり、これには Google Cloud Platform パブリッククラウドインフラストラクチャ、G Suite、Android および Chrome OS のエンタープライズバージョン、機械学習およびエンタープライズマッピングサービス用のアプリケーションプログラミングインターフェース (API) が含まれます。

Jasper

jasper.ai

ジャスパー: On-Brand AI For Business は、オンラインでどこにいても、常にブランドの声でコンテンツを作成します。 Jasper は、独自のブランドトーンを学習して作成できるクリエイティブ AI アシスタントです。大胆に話すか、生意気に話すか、形式張って話すか、インターネット上でのみ話すか（u do u）。さらに、Jasper Everywhere ブラウザー拡張機能により、CMS から電子メール、ソーシャルメディア、そして Jasper API を使用した自社プラットフォームに至るまで、Jasper を常に使用できます。最も重要なことは、Jasper は、セキュリティプロトコルの進化に合わせて最新の状態を保つ組み込みのセキュリティ機能により、データを安全かつプライベートに保ちます。人工知能を使用してコンテンツを 5 倍高速に作成します。 Jasper は、3,000 件を超える 5 つ星のレビューを持つ最高品質の AI コピーライティングツールです。ブログ投稿、ソーシャルメディアコンテンツ、マーケティングコピーの作成に最適です。

OpenAI Platform

openai.com

OpenAI は、汎用人工知能が全人類に利益をもたらすことを保証することに専念する AI 研究および導入企業です。 AI は非常に強力なツールであり、安全性と人間のニーズを中心に据えて作成する必要があります。 OpenAI は、利益よりも利益の一致を最優先することに専念しています。私たちの使命を達成するには、人類のあらゆる領域を形成するさまざまな視点、声、経験を包括し、尊重する必要があります。多様性、公平性、包括性への当社の投資は継続的に行われており、幅広い取り組みを通じて実行され、リーダーシップによって擁護およびサポートされています。 OpenAI では、人工知能には人々が地球規模の巨大な課題を解決できる可能性があると信じており、AI の利点が広く共有されることを望んでいます。

Krisp

krisp.ai

Krisp は、オンライン会議や通話の効率と明瞭性を向上させるために設計されたインテリジェントなアプリケーションです。主にノイズキャンセリングに AI を利用し、オンラインでのやり取り中の背景ノイズ、音声、エコーを効果的に除去します。個人の会話からチーム会議、コールセンターまで、さまざまなシーンでクリアで高品質なコミュニケーションを実現します。 Krisp は、ノイズキャンセリングに加えて、リアルタイムの会議の文字起こしも提供します。これにより、アクセシビリティが向上し、記録の維持に役立ちます。さらに、簡潔な会議メモや要約を生成する機能も備えており、AI 会議アシスタントとして効果的に機能します。もう 1 つの注目すべき機能は、すべての通信アプリで仮想会議を自動的に記録する Krisp の会議記録機能です。特にコールセンター環境向けに、Krisp は AI アクセントローカリゼーション機能を提供し、エージェントのアクセントをリアルタイムで変換して顧客のネイティブのアクセントに一致させ、より明確なコミュニケーションを実現します。また、エージェントと顧客の会話をリアルタイムで安全に文字に起こします。開発者向けに提供される SDK を使用して、アプリケーションのサービスをさまざまな製品に統合できます。多機能 AI ツールとして、Krisp は個人、フリーランサー、ハイブリッドワークチーム、営業チーム、プロフェッショナルサービス、コールセンターなどの幅広いユーザーに対応します。

Deep Dream Generator

deepdreamgenerator.com

ディープドリームジェネレーター。畳み込みニューラルネットワークが画像を過剰処理し、特徴を強化することによって何を生成できるかを発見します。

FaceCheck.ID

facecheck.id

FaceCheck.ID 顔認識検索エンジンを使用して、オンラインで誰かを見つけます。写真で人物を検索し、その人物であると主張している人物と話していることを確認します。

SpeechTexter

speechtexter.com

音声からテキストへのコンバーター。あなたの声でディクテーションします。音声で入力できる無料のウェブアプリ。 70 以上の言語がサポートされています。

Notta

notta.ai

Notta は、主要な AI 文字起こしツールおよび会議メモ作成ツールであり、音声会話をすぐに実用的なテキストに書き起こして要約するのに役立ちます。58 言語がサポートされています。 ※重要なお知らせ：AirgramがNottaに加わりました！ビデオ/音声ファイル、ライブスピーチの文字起こしとは別に、Notta は Zoom、Microsoft Teams、Google Meet などの主要なビデオ会議プラットフォームと統合して、自動会議メモを生成します。また、ユーザーはトランスクリプトを確認、検索、編集、エクスポートし、チームメンバーと共有してシームレスなコラボレーションを行うこともできます。 Notta は、あらゆる会話の価値を最大化できるようにします。

Resemble.ai

resemble.ai

Resemble AI は、独自の深層学習モデルを使用してカスタム AI 音声を作成し、テキスト読み上げおよび音声合成を使用して AI が生成した高品質のオーディオコンテンツを生成します。弊社の多言語ローカリゼーションツールである Resemble Localize はテキストを翻訳し、AI 音声を最大 100 の言語に変換できます。 Resemble Fill は、クローン AI 音声で既存の音声を変更できるジェネレーティブフィル (オーディオ修復) 機能です。 Fill を使用すると、プログラマティックオーディオ広告、動的ストリーミング広告挿入 (SAI)、音声アシスタントなどを修正できます。当社は最近、Netflix のエミー賞にノミネートされたアンディウォーホルの日記への音声 AI の貢献により、2023 年のウェビー賞「音声テクノロジーの最良の利用」を受賞しました。 Netflix のほかに、Byju's、世界銀行グループ、Boingo、ユニバーサルピクチャーズ、パラマウントピクチャーズなどと提携しています。

Speechnotes

speechnotes.co

Speech to Text - 音声入力と文字起こし。無料で音声でメモを取ったり、音声やビデオの記録をその場で自動的に文字起こししたりできます。安全、正確、超高速。

DeepAI

deepai.org

生まれながらに創造的な人間のための人工知能ツール

FaceMRI

facemri.com

FaceMRI は、米国に拠点を置く顔認識ソフトウェア研究グループです。 FaceMRI は、Mac および PC 用の最も先進的な顔認識検索エンジンです。 FaceMRI には、顔を性別 (男性、女性、ノンバイナリー)、年齢層、年齢、人種に分類できる一連の顔認識ソフトウェアがあります。出席表と分析を作成します。顔は、 + 画像のインポート + ビデオのインポート + Web 検索 (FB、LinkedIn、Instagram) + フォルダーのインポート + Web カメラおよび IP カメラ + IOT およびセキュリティカメラを通じて抽出できます。 + USB キーと外部デバイス FaceMRI は顔認識の力を利用して、画像やビデオから分析を可能にします。ユーザーはアプリケーションを Mac または PC にダウンロードし、画像やビデオをインポートできます。ビデオや画像から顔や人物を抽出し、ユーザーは顧客に顔を追加してカスタムレポートを作成できます。さらに、スタッフはビデオから年齢、性別、人種に基づいた人口統計グラフを作成し、顧客が誰であるかを確認できます。 FaceMRI には人物検索テクノロジーも搭載されているため、ユーザーはカスタムレポートを作成できます。従業員は、Zoom 通話への出席、社内通話に誰が参加したか、誰が欠席したかを追跡できます。スタッフメンバーは、Web カメラ、セキュリティカメラ、IoT カメラに接続して、誰が会社に入店したかを追跡できます。 FaceMRI はビデオフィードから個人レポートを作成するため、ユーザーは誰が会社に出入りするかを監視できます。

Alibaba Cloud

alibabacloud.com

Alibaba Cloud は、世界最大のクラウドコンピューティング企業の 1 つであり、包括的なクラウド製品とソリューションによってデジタル化を加速するために、スケーラブルで安全かつ信頼性の高いクラウドコンピューティングサービスを世界中に提供しています。

Jammable

jammable.com

Jammable を使用すると、AI を使用して数秒で AI カバーを作成できます。コミュニティにアップロードされた数百の AI 音声モデルを今すぐクリエイティブに使用できます。

PromptSmart

promptsmart.com

PromptSmart は、音声に従ってビデオやプレゼンテーションの作成を支援するテレプロンプターアプリです。 PromptSmart は、音声認識を備えた史上初のテレプロンプターアプリであり、最も先進的な人前で話すツールです。 2014年8月発売開始！ PromptSmart は人前で話すことへの情熱から生まれました。 PromptSmart の創設者は、MBA 学生に人前で話す技術を指導し、指導しました。多くの弁論者は、直観的なスピーカー制御のテレプロンプターのほうがより適切にサポートされることを認識し、今日のモバイルデバイスがこのニーズに対応できることも認識しました。これを念頭に置いて、PromptSmart が作成されました。 PromptSmart は、完全に書かれたスピーチの代わりにメモを使用することを好む講演者のニーズにも対応します。デジタルノートカード機能は、取り上げるべき重要なメッセージを追跡することで、講演者が要点を維持できるように設計されました。その結果、PromptSmart は、あらゆる講演スタイルに対応する最も先進的な人前で話すツールとなるのです。

Landing AI

landing.ai

コンピュータービジョンが超簡単に。コンピュータービジョンシステムを数分で作成して展開します。複雑なプログラミングや AI の経験は必要ありません。

Jupitrr

jupitrr.com

Jupitrr AI Video Maker は、クリエイターが自分の音声録音やポッドキャストをパーソナライズされたビデオに変換できる AI を活用したツールです。このツールを使用すると、ユーザーはわずか数分で素晴らしいビデオコンテンツを簡単に作成できます。 Jupitrr AI Video Maker の背後にある AI テクノロジーは、ストック映像、チャート、字幕などを含む、クリエイターのビデオ用のストックビデオを生成するプロセスを自動化します。このツールは、Word ドキュメントの編集に似たユーザーフレンドリーなインターフェイスを備えているため、複雑なタイムラインの必要性がなくなり、ビデオ編集が簡単になります。ストックビデオの膨大なライブラリにワンクリックでアクセスできる利便性を提供し、ユーザーが適切な映像を検索する手間を省きます。 Jupitrr AI Video Maker は、スペイン語、ヒンディー語、フランス語、北京語などを含む複数の言語をサポートしているため、世界中の幅広いクリエイターが利用できるようになります。このツールには、ストックビデオに加えて、さまざまなサイズやスタイルの字幕やキャプションを追加するオプションも用意されています。 AI によって生成された魅力的なチャートも含まれており、ビジュアルデータをビデオに組み込むプロセスを簡素化するように設計されています。 Jupitrr AI Video Maker は、クリエイターがビデオ編集に過度の労力を費やすのではなく、クリエイティブなビジョンに集中できるようにすることで、クリエイターに力を与えることを目的としています。シンプルさと多用途性を備えた Jupitrr AI Video Maker は、ビデオ制作プロセスを強化したいと考えているコンテンツクリエイターにとって貴重なツールです。

Roboflow

roboflow.com

ほんの数十枚のサンプル画像を使用すれば、24 時間以内に実用的な最先端のコンピュータービジョンモデルをトレーニングできます。 Roboflow は、コンピュータービジョンを使用した構築を容易にするサービスとしてのソフトウェア製品を作成します。 250,000 人を超える開発者が Roboflow を使用して、画像データの管理、データセットへの注釈付けとラベル付け、前処理と拡張の適用、注釈ファイル形式の変換、ワンクリックでのコンピュータービジョンモデルのトレーニング、API 経由またはエッジへのモデルのデプロイを行っています。

Speechlogger

speechlogger.com

Speech Logger は、自動句読点、自動保存、タイムスタンプ、テキスト内編集機能、音声ファイルの転写、エクスポートオプションなどを備えた Web ベースの音声認識および音声翻訳ソフトウェアです。 * Speechlogger は、自動句読点、話者識別、センチメント分析などの追加機能を備えた、スピーチ、会議、またはイベントの自動ライブキャプションおよび翻訳用に設計されたツールです。 * 査読者は、騒がしい背景でも音声を正確に書き起こす Speechlogger の機能、ユーザーフレンドリーなデザイン、自動句読点、話者識別、センチメント分析などの独自の機能を高く評価しており、一部の有料文字起こしツールよりも優れていると考えています。 * ユーザーは、無料版でパフォーマンスに影響を与える広告、時折発生する翻訳エラー、あまり一般的ではないアクセントの転写時の精度の低下、音声対応コントロールの欠如、感情分析やトピックモデリングツールでの誤解などの問題を経験しました。

Clarifai

clarifai.com

Clarifai は、コンピュータービジョン、自然言語処理、音声認識を専門とする独立系人工知能企業です。 Clarifai は、2013 年に設立された最初のディープラーニングプラットフォームの 1 つで、非構造化画像、ビデオ、テキスト、オーディオデータ用の AI プラットフォームを提供します。そのプラットフォームは、画像、ビデオ、テキスト、音声データに関するデータ探索、データラベル付け、モデルトレーニング、評価、推論のための完全な AI ライフサイクルをサポートします。ワシントン DC に本社を置く Clarifai は、機械学習とディープニューラルネットワークを使用して、画像、ビデオ、テキスト、音声を自動的に識別して分析します。 Clarifai を使用すると、ユーザーは API、モバイル SDK、オンプレミスソリューションを介して AI テクノロジーを製品に実装できます。

Hour One

hourone.ai

Hour One は、すべてのワークフローを 1 つの AI 搭載プラットフォームに一元化することで、ビジネスのコンテンツ作成に革命をもたらします。当社は市場で最も本物に近いアバターを誇り、ビジネスメッセージを生き生きと表現する自然な動きを特徴としています。あらゆるブランドに合わせてカスタマイズできるテンプレートを使用すると、デザインや編集のスキルを必要とせず、チームがパーソナライズされたコンテンツを大規模に作成できるようになります。さらに、高速レンダリングと最上級のセキュリティを備えた Hour One は、企業の需要に合わせて設計された最高のコンテンツオペレーティングシステムとして際立っています。以前は何か月もかかっていた作業が、今ではわずか数分で完了し、より高いエンゲージメントを生み出すことができます。Hour One を使用すると、難しい作業ではなく賢く作業でき、インパクトをもたらすパーソナライズされたビジネスビデオを作成できます。 ※HourOneは、豊富なテンプレート、音声、キャラクターを使用してマーケティングビデオやプレゼンテーションを作成できるビデオ作成ツールです。 * ユーザーは、使いやすさ、選択できる音声とキャラクターの範囲、迅速なプロセスとダウンロード時間、カスタマーサクセスチームからのサポートを気に入っています。 * レビュー担当者は、ロボットによるテキスト読み上げ機能、アバターのオプションの制限、一般ユーザーの学習曲線、ブランディング機能の制限、読み込み時間の遅さ、特定の機能に関する明確な説明の欠如などの問題を経験しました。

npm

npmjs.com

npm は、npm, Inc. によって保守されている JavaScript プログラミング言語のパッケージマネージャーです。npm は、JavaScript ランタイム環境 Node.js のデフォルトのパッケージマネージャーです。これは、npm とも呼ばれるコマンドラインクライアントと、npm レジストリと呼ばれるパブリックパッケージと有料プライベートパッケージのオンラインデータベースで構成されます。

MobileEngine

services.tineye.com

TinEye は、画像の検索と認識を行う会社です。私たちはコンピュータービジョン、パターン認識、ニューラルネットワーク、機械学習の専門家です。私たちの使命は、あなたの画像を検索可能にすることです。

AssemblyAI

assemblyai.com

AssemblyAI は、人間の音声を文字に起こして理解できる新しい最先端の AI モデルの構築に焦点を当てた音声 AI 企業です。 CallRail、Fireflies、Spotify などの当社の顧客は、音声データに基づいて AI を活用した驚くべき新しいエクスペリエンスと製品を構築するために AssemblyAI を選択しています。 AssemblyAI のモデルとフレームワークには次のものが含まれます。 - AI 音声テキスト変換 - 要約、センチメント分析、トピック検出、コンテンツモデレーション、PII 編集などを含むオーディオインテリジェンス - LeMUR は、文字起こしされた音声に強力な LLM を適用するためのフレームワークです。高度な質問をしたり、文字起こしからアクションアイテムや要約を取り出したりすることができます。

Crescendo

crescendo.com

Crescendo Systems Corporation は、医療、法律、法執行機関、保険部門向けのドキュメンテーション、デジタルディクテーション、音声処理、文字起こし、およびワークフロー管理システムの大手開発者です。

Speech to Note

speechtonote.com

Speech To Note は、話された音声を即座にテキストに変換する AI を活用した音声認識ツールです。当社のツールは、高度な音声テキスト変換テクノロジーを使用して、ユーザーの言葉を編集または共有できる簡潔な要約に変換します。あなたの話した言葉を即座に簡潔で有益な要約に変換する、AI 駆動ツールのパワーを体験してください。

NVIDIA Developer

developer.nvidia.com

生成 AI を使用してアプリケーションを構築します。どこでも実行できる実稼働対応の API を使用して、AI を体験、プロトタイプ、デプロイします。

Muse.ai

muse.ai

muse.ai は、世界中のビデオを整理するための高度な人工知能を構築しているビデオ検索会社です。

Syte

syte.ai

Syte は、e コマースアプリケーション向けに特別に設計された製品検出プラットフォームです。ビジュアル AI を利用して、ビジュアル検索、パーソナライゼーション、自動商品タグ付けなど、さまざまな e コマース活動を強化します。 Syte は、効率を向上させ、持続可能性をサポートし、行き止まりをなくす視覚的な検索エクスペリエンスを提供することで、買い物客と商品を結びつけることを目指しています。視覚的に類似した補完的な製品の推奨事項を表示し、さまざまなタイプの買い物客を刺激し、変換することを目的としています。また、時間を節約し、販売プロセスを最適化し、製品データの精度を高める自動製品タグ付けシステムも備えています。これらのソリューションは、さまざまな市場の現実に適応でき、ファッション、室内装飾、宝飾品などのさまざまな業界分野の特定のニーズを満たすように拡張できます。成長企業から大企業まで、さまざまな企業規模に対応します。

Face Age

getfaceage.com

Face Age は、最先端のテクノロジーを利用して顔の肌の属性を分析し、しわ、毛穴、にきび、目袋などの詳細をキャプチャして、各顧客の肌を理解します。 Face Age は、既存の電子商取引プラットフォームに簡単に統合できるように設計されています。 Face Age はさまざまな統合オプションを提供し、セットアッププロセスをスムーズかつ効率的にします。小規模なブティックストアを運営している場合でも、大規模なマーケットプレイスを運営している場合でも、Face Age は技術要件にシームレスに適応します。

Symbl.ai

symbl.ai

Symbl.ai は、高度な深層学習モデルを使用して、開発者にリアルタイムの文字起こしと非構造化会話データの洞察を提供する会話インテリジェンスプラットフォームです。このツールは、収益インテリジェンス、イベントとウェビナー、リモートコラボレーション、コンタクトセンター、採用インテリジェンスなどのさまざまな業界にソリューションを提供します。 Symbl.ai の機能は、カスタムトラッカー、要約、トピックモデリング、文字起こし、会話分析、音声、オーディオ、テキストデータの事前構築された UI とコンポーネントをサポートしています。 Symbl.ai は、その API テクノロジーを使用して、非構造化人間の会話に対するリアルタイムの非同期音声認識を可能にし、単一の API 呼び出しでツールにインテリジェンスを追加できるようにします。さらに、このプラットフォームは、キーワード、フレーズ、および意図の検出を 400 ミリ秒未満で、およびバッチ/非同期リクエスト経由でリアルタイムに検出します。 Symbl.ai には音声からテキストへの統合が含まれており、人間の会話用に構築された最も正確で非同期の音声認識 API が可能になります。このツールの会話分析は、話すと聞くの比率、1 分あたりの単語数、通話時間、トピックベースの感情など、ユーザーまたはエージェントの会話分析を強化するためのさまざまな指標を生成します。 Symbl.ai は、会話の処理と、ビデオやオーディオファイル、電話、ストリーミングなどのさまざまな会話チャネルにわたる洞察の抽出もサポートしています。さらに、Symbl.ai は顧客サポートを優先し、使用量のコミットメントのない柔軟なプランとスケーラブルな成長オプションを提供します。

Tune AI

tunehq.ai

Tune AI は、企業における GenAI の導入を推進しています。私たちは、Accel、Flipkart Ventures、Togetter Fund、Speciale Invest、Techstars、その他の著名な投資家によって支援されています。 TuneChat: オープンソースモデルを活用したチャットアプリ TuneStudio: 開発者が LLM を微調整して展開するための遊び場 ChainFury: GitHub で利用できるオープンソースプロンプトエンジン

PixLab

pixlab.io

PixLab は、マシンビジョンおよびメディア処理 API 向けの主要な独立系 Software-as-a-Service プラットフォームです。当社は、開発者が Web およびオフライン SDK を使用してインテリジェントなアプリを実装できるよう支援します。当社の API 機能セットには、パスポートと ID カードのスキャン、コンテンツモデレーション、顔認識、光学式文字認識、その他多くの API エンドポイントが含まれますが、これらに限定されません。

Gladia

gladia.io

Gladia は、ユーザーがデータを最大限に活用できるようにするプラグアンドプレイ API を提供する AI ナレッジインフラストラクチャプラットフォームです。 Speech-to-Text API Alpha は最新の製品で、リアルタイム処理と 1% という低い単語エラー率を提供します。 Open AI の Whisper Models に基づいて構築されており、1 時間の音声をわずか 10 秒で書き起こすことができます。 API は無料で利用でき、99 の言語をサポートしています。 Gladia は、創設者兼 CEO の Jean-Louis Queguiner と共同創設者兼 CTO の Jonathan Soto が率いています。 Queguiner はシンボリック AI の修士号を取得しており、すべての AI アプリケーションを 1 つのストア内で管理、分類、統合するチャットボットを独力で構築しました。ソトは MIT で修士号を取得しており、複数の学術論文の著者でもあります。 Gladia は、ユーザーにチュートリアルとドキュメントを提供するだけでなく、チームとの 1 対 1 のオンボーディングコールも提供します。彼らは、品質を犠牲にすることなく、自社の API を市場の他のものよりもアクセスしやすく、手頃な価格にすることに尽力しています。

Talkatoo

talkatoo.com

Talkatoo は医療専門家向けのディクテーションを再発明しています。獣医業界でも人間の医療業界でも、Talkatoo は音声テキスト変換ソフトウェアソリューションです。 Talkatoo は Windows と Mac の両方で互換性があり、入力できるあらゆるフィールド (PIM と EHR を含む) で動作し、非常に使いやすいです。 * Talkatoo は、専門用語や医療用語を含む音声をテキストに変換することに重点を置いた、臨床用途向けに設計されたデスクトップディクテーションソリューションです。 * 査読者は、複雑な医療用語を含む音声をテキストに正確に変換する Talkatoo の機能と、医療記録作成の効率と生産性の向上に役立つユーザーフレンドリーなインターフェイスを高く評価しています。 * 査読者は、Talkatoo は大量の命令を処理すると遅くなる可能性があり、特定の一般的ではない用語の認識が困難になる場合があり、カスタマーサポートの応答が遅れる可能性があると指摘しました。

Voxpow

voxpow.com

機械学習を利用した音声からテキストへの変換。あなたのウェブサイトに直接、そして無料で。 Voxpow は、100 以上の言語とそのバリエーションを認識し、グローバルユーザーベースをサポートします。

v7labs.com

V7 は、コンピュータービジョンおよび生成 AI アプリケーション向けに設計された AI データエンジンです。このプラットフォームは、ラベル付け、ワークフロー、データセットを含むエンタープライズトレーニングデータのインフラストラクチャを提供し、人間参加型トレーニングの機能を備えています。 AI モデルのデータの品質を向上させるために、複数のアノテーションプロパティが提供されます。自動アノテーション、医療画像用の DICOM アノテーション、データセット管理、モデル管理などの機能を備えた V7 は、さまざまなタスクを自動化および合理化します。画像およびビデオの注釈ツールは、データのラベル付けの精度を向上させるように設計されています。さらに、カスタムデータパイプラインの構築と自動化を可能にし、光学式文字認識 (OCR) およびインテリジェント文書処理 (IDP) ワークフローを自動化するツールを備えています。V7 を使用すると、ユーザーは注釈タスクをアウトソーシングできます。農業、自動車、建設、エネルギー、食品飲料、ヘルスケアなどのさまざまな業界で使用できます。リアルタイムのチームアノテーションのためのコラボレーション機能を提供し、ラベラーとモデルのパフォーマンス分析を提供します。さらに、V7 は、直感的なユーザーインターフェイスを通じてアノテーションとモデルトレーニングのワークフローを促進し、より効率的になります。強化された AutoAnnotate 機能により、注釈の速度と精度が向上します。このプラットフォームは AWS、Databricks、Voxel51 などと統合されており、ビデオ、画像、テキストデータなどのさまざまなデータタイプをサポートしています。

Faceplusplus

faceplusplus.com

Face++ は、アプリケーションが世界をより深く読み取って理解できるようにするコンピュータービジョンテクノロジーを提供するプラットフォームです。

Lambda

lambdalabs.com

Lambda は人類の進歩を加速するための計算を提供します。私たちは、世界最高の GPU クラウド、クラスター、サーバー、ワークステーションを構築しているディープラーニングエンジニアのチームです。当社の製品は、人類の知識の最前線にいるエンジニアや研究者に力を与えます。顧客には、Intel、Microsoft、Google、Amazon Research、Tencent、Kaiser Permanente、MIT、スタンフォード、ハーバード、カリフォルニア工科大学、ロスアラモス国立研究所、ディズニー、国防総省が含まれます。

Speechmatics

speechmatics.com

Speechmatics は音声インテリジェンスの世界有数の専門家であり、AI と ML の最新のブレークスルーを組み合わせて、人間の音声のビジネス価値を解き放ちます。世界中の企業がスピーチマティクスを使用して、人口統計、年齢、性別、アクセント、方言、場所に関係なく、人間レベルの音声を正確に理解し、リアルタイムで記録メディアにテキストに書き起こします。これらのトランスクリプトと最新の AI 主導の音声機能を組み合わせることで、企業は要約、トピック、センチメント、章、翻訳などを活用した製品を構築できます。 Speechmatics は、世界中で 300 年以上の文字起こしを毎月 50 の言語で処理しています。音声認識における機械学習の先駆者であるそのニューラルネットワークは、音響、言語、方言、複数の話者、句読点、大文字の使用、文脈、暗黙の意味を考慮します。 Speechmatics は英国ケンブリッジに本社を置き、ニューヨークにもオフィスを構えています。スピーチマティクスは登録商標です。

CrystalSound

crystalsound.ai

CrystalSound は、AI テクノロジーを使用したデスクトップアプリで、通話、録音、オンライン会議中に不要なノイズや気を散らすものをすべて除去します。 CrystalSound は、高度なアルゴリズムと最先端の機能により、背景ノイズ、エコー、ハウリング効果、その他の音声を除去し、明瞭かつ効果的にコミュニケーションできるようにします。 CrystalSound は、ユーザーのダウンロードと使用のニーズを満たすために、Mac、Windows、Linux オペレーティングシステム上で動作する機能を備えています。 CrystalSound を使用すると、コミュニケーションアプリとの互換性の問題を心配する必要がなくなります。当社のソリューションは、Teams、Zoom、Google Meet、Loom、Discord などの人気のあるアプリとシームレスに連携するように設計されています。

SpeechWrite

speechwrite.com

SpeechWrite は、ワークフローソリューション、デジタルディクテーション、音声認識、PDF ソリューションに特化したフルソリューションプロバイダーです。 SpeechWrite の実用的なテクノロジーは、洗練されていながらもシンプルであり、作業環境を強化し、よりスマートに作業できるようにします。 OEM およびテクノロジーパートナーと緊密に連携することで、SpeechWrite は最新のテクノロジー開発と市場トレンドに関する広範な知識を持っています。 2001 年に設立された SpeechWrite は、ディクテーション業界で累計 100 年以上の実績があり、市場投入までのスピードと販売後のサポートに誇りを持っています。

Thirdlane

thirdlane.com

Thirdlane Connect は、多用途の顧客コミュニケーションおよびチームコラボレーションアプリケーションとして機能し、チャット、音声およびビデオ通話、会議、画面共有、ファイル共有、CRM やその他のさまざまなビジネスアプリケーションとのシームレスな統合などの一連の機能をチームに提供します。マルチチャネルの顧客コミュニケーションとチームコラボレーションを促進するサードレーンコネクトは、ローカルワーカーとリモートワーカーの両方を対象に設計されており、Web ブラウザ、iPhone、Android デバイスに加え、Windows、Linux、Mac デスクトップもサポートしています。この強力なアプリケーションは、Thirdlane ビジネスフォンシステムまたは Thirdlane マルチテナント PBX プラットフォームと完全に統合されており、これらのプラットフォームによって動作します。これらのプラットフォームは、オンプレミス、プライベートクラウド、パブリッククラウドを問わず、さまざまな設定に安全に導入でき、通信インフラストラクチャの柔軟性とセキュリティを確保します。

Kili Technology

kili-technology.com

高品質のデータセットを迅速に構築します。企業は、データのラベル付け業務を合理化し、カスタムモデル、生成 AI、LLM に最適なデータセットを構築するために私たちを信頼しています。 ___ なぜキリテクノロジーなのか? ご存知ないかもしれませんが、次のとおりです。 MNIST のデータセットの誤り率は 3.4% で、今でも 38,000 を超える論文で引用されています。クラウドソーシングされたラベルを含む ImageNet データセットのエラー率は 6% です。このデータセットは、おそらく、Google と Facebook が開発した最も人気のある画像認識システムを支えています。これらのデータセットの系統的エラーは現実世界に影響を及ぼします。エラーを含むデータでトレーニングされたモデルは、それらのエラーを学習することを強制されるため、誤った予測が発生したり、エラーを「洗い流す」ために増え続けるデータで再トレーニングする必要が生じたりします。あらゆる業界が AI の変革の可能性を理解し、投資し始めています。しかし、ML トランスフォーマーの革命と ML モデルの最適化への絶え間ない集中は、利益が逓減する段階に達しつつあります。他に何があるでしょうか？

hasty.ai

Hasty は現在、AI ライフサイクルを加速するヒューマンインザループ AI ソリューションの世界的リーダーである CloudFactory の一員です。効率のために品質を犠牲にする必要はもうありません。 CloudFactory のクラス最高の人材と業界をリードする AI 支援ラベル付けテクノロジーを組み合わせた新しい Vision AI 製品である Accelerated Annotation について詳細をご覧ください。手動ラベル付けの 5 倍の速さで高品質のラベル付きデータを生成します。 Hasty プラットフォームは、生の画像やビデオから本番環境に対応したモデルに移行するために必要なすべてを提供します。

NoahFace

noahface.com

NoahFace は、iPad とスマートフォンを地球上で最も柔軟でスケーラブルで信頼性の高いクロッキングプラットフォームに変える、高度に構成可能なソフトウェアソリューションを提供します。高速、信頼性、正確な NoahFace は、顔認識、体温とアルコールのスクリーニングなどの最新機能を提供します。

Vue.ai

vue.ai

Vue.ai は、世界初の汎用 AI プラットフォームの 1 つで、世界中の大企業がワークフローや機能にわたって幅広い AI 対応アプリケーションを構築できるようにします。 Vue.ai は、企業全体から画像、ビデオ、テキストデータを統合し、AI スタックでデコードして、データ主導の意思決定のために企業全体にインテリジェンスを供給できるようにする、他のポイントソリューションとは異なる価値を提供します。 Vue.ai は、すぐに使える API、ノーコード、ローコードツールの組み合わせにより、マーケティング、製品、ビジネス、テクノロジーチームが収益の増加、効率、コスト削減に桁違いの影響をもたらすことを可能にします。。 Vue.ai は現在、小売、金融、保険、物流、ヘルスケアなどの複数の業界にわたって導入されています。 Vue.ai は、Ashwini Asokan と Anand Chandrasekaran によって設立された Mad Street Den ブランドです。

Luxand.cloud

luxand.cloud

高度な顔検索および認識 API。 Luxand.Cloud は顔認識テクノロジーの最前線に立っており、セキュリティとイノベーションがシームレスに絡み合う未来を作り上げています。正確かつ洗練された当社の最先端のソリューションは、本人確認の状況を再定義します。シームレスなアクセス制御によりデジタルセキュリティを強化し、パーソナライズされ強化されたエクスペリエンスを実現します。 Luxand.Cloud を信頼して、比類のない信頼性でデジタルフロンティアを保護してください。デジタル時代のセキュリティの境界を再定義する旅に参加しましょう。 Luxand.cloud は以下をサポートします: - 顔検出 - 顔認識 - 顔検証 - 感情認識 - 顔のランドマーク検出 - 生体検出 - 顔のトリミング

CloudSight

cloudsight.ai

CloudSight は、画像キャプションと理解の世界的リーダーです。私たちの目標は、世界中の人々と企業に最も優れた最先端のソリューションを提供することです。 CloudSight には 2 つの画期的なコンシューマアプリがあります。CamFind は世界初の成功したモバイルビジュアル検索エンジンで、モバイルデバイスから写真を撮るだけで「物理世界を検索」し、あらゆる情報を見つけることができます。 TapTapSee は、モバイルデバイスのカメラと VoiceOver を利用してオブジェクトを撮影し、ユーザーに大声で識別する視覚障害者向けのアプリです。さらに、開発者は CloudSight API を通じて、フォーチュン 500 企業や大手小売業者が利用できるのと同じテクノロジーを利用できます。 CloudSight Inc. は 2012 年に設立され、カリフォルニア州ロサンゼルスに拠点を置いています。

GoSpotCheck

gospotcheck.com

FORM の GoSpotCheck は、動的なタスク管理、業界をリードする画像認識、写真レポート、フィールドチームのコミュニケーション、高度なレポートをすべて 1 つの使いやすいプラットフォーム内で組み合わせた唯一のモバイルソリューションにより、フィールドチームの力を解放して市場執行を推進します。。チームを導き、実行を改善し、売上を促進しながら、リーダーがより適切かつ迅速に意思決定を下せるよう、現場に関する共有ビューを作成します。リアルタイムでパフォーマンスをガイド、追跡、改善するフィールド実行アプリである FORM の GoSpotCheck を使用して、より多くの販売を行います。

VXG

videoexpertsgroup.com

VXG は、ビデオ管理を簡素化し、コスト効率の高い方法でシステムを拡張できるようにする世界的なクラウドビデオ監視会社です。システムインテグレーター、セキュリティ、アクセスコントロール、AI、ビデオモニタリング、テレコム、SaaS 企業向けに、150,000 台以上のカメラが接続された、カスタマイズされた世界クラスのビデオ監視ソリューションの構築を支援します。真のオープンクラウドプラットフォームは、他のソリューションとの統合、または IP カメラと連携する新しいサービスの構築を目的として設計されています。 VXG は、SaaS 企業向けの将来性のある革新的なテクノロジープラットフォームおよびクラウド VMS エンジンであり、完全に柔軟でスケーラブルで、コスト効率が高く、ホワイトラベルでカスタマイズ可能です。真のクラウドビデオ監視への最速かつ簡単なパスを提供し、完全なソースコードと必要なすべてのコンポーネントを備えた完全な VMS を提供します。完全にオープンな (製品に依存しない) プラットフォームの主な価値により、顧客はソリューションを独自のクラウド/データセンターに展開し、社内またはサードパーティのシステムを統合できます。その結果、顧客側の労力はほとんどかからず、市場投入までの時間が最短になります。製品に対する完全なコントロール、ブランディング、所有権を彼らに与えながら。

AI Voice Detector

aivoicedetector.com

AI Voice Detector は、音声の信頼性を検出し、AI によって生成された音声をフィルタリングするのに役立つ音声検証ツールです。これにより、口頭評価における音声操作、誤った情報、音声詐欺、盗作に対するユーザーの安心感と保護が提供されます。 * AI Voice Detector は、特にビジネスユースケース向けに、コンピューターで生成された音声と実際の人間の音声を区別するように設計されたツールで、顧客サービスのやり取りにおけるコンテンツの信頼性と信頼性の高いレポートを保証します。 * レビュー担当者は、オーディオ操作や音声詐欺に対する保護のためのソフトウェアの実装、使いやすさ、迅速な処理、および幅広いオーディオファイル形式を問題なくシームレスに処理できる機能を高く評価しています。 * ユーザーは、オーディオファイルの長さが 8 秒以上であり、バックグラウンドミュージックが含まれていないことをシステムが要求していること、本物の声を偽の声として誤認識したりその逆が時折発生すること、ソフトウェアの統合機能が制限されていることなどの制限について言及しました。

Altered

altered.ai

Altered は、ポッドキャスター、ビデオゲームスタジオ、e ラーニングなどのさまざまな業界向けに高品質の音声コンテンツを制作するための、複数の音声 AI テクノロジーを使いやすいアプリケーションに統合した次世代オーディオエディターです。

Dictalogic

dictalogic.com

Dictalogic は、音声からテキストへ、音声からテキストへ、会話からテキストへ、タスク委任などの特殊なモジュールをすべて 1 つのダッシュボードから提供します。 * 音声のみ: 従来の音声ディクテーション。音声が録音され、どこにいても (在宅勤務を含む) 転写担当者に送信されます。 * 音声からテキストへ: デジタル変換により、その場で音声からテキストへの変換が可能になります。このアプローチでは、音声が録音されて文字起こしのために送信され、文字起こし者に届く前に音声がテキストに変換されます。課題に関しては、探索できるように複数のオプションが用意されています。 * 音声からテキストへ: リアルタイムの音声からテキストへの機能も提供します。ワークフローは他のディクテーションと同じで、文字起こし者に送信できます。 * 会話をテキストに変換: Dictalogic 会話モジュールは、音声認識、話者識別、および各話者への文の帰属 (日記化とも呼ばれます) を組み合わせて、あらゆる会話のリアルタイムおよび/または非同期の文字起こしを提供する音声からテキストへのソリューションです。すべては、24 時間 365 日いつでもアクセスできる安全なポータルにカプセル化されています。

Dictanote

dictanote.co

音声入力を使用してユーザーの生産性向上を支援します。 Dictanote は、音声とテキストの統合が組み込まれた最新のメモアプリで、50 以上の言語でメモを音声入力することが簡単にできます。 Voice In は、音声をテキストに変換する Chrome 拡張機能で、音声を使用して任意の Web サイト上のテキストボックスに入力できるようになります。

SoundHound

soundhound.com

会話型インテリジェンスの主要なイノベーターとして、当社は、業界を超えた企業がクラス最高の会話エクスペリエンスを顧客に提供できるようにする独立した音声 AI プラットフォームを提供しています。独自の Speech-to-Meaning® および Deep Meaning Understanding® テクノロジーに基づいて構築された SoundHound の高度な音声 AI プラットフォームは、並外れた速度と精度を提供し、人間が自然に話すことによって、相互に対話するのと同じように製品やサービスと対話できるようにします。 SoundHound は、ヒュンダイ、メルセデスベンツ、パンドラ、クアルコム、Netflix、スナップ、スクエア、LG、VIZIO、KIA、ステランティスなど、世界中の企業から信頼されています。