Webアプリのアプリストア
適切なソフトウェアとサービスを見つけてください。
WebCatalog Desktop を使えば、ウェブサイトをデスクトップアプリに変換したり、Mac、Windows専用の豊富なアプリにアクセスすることができます。スペースを使ってアプリを整理し、複数のアカウントを簡単に切り替えて、これまでにないほど生産性を向上させましょう。
深層学習ソフトウェアとは、深層学習モデルの作成、トレーニング、展開を容易にするために設計されたソフトウェア ツールおよびフレームワークのカテゴリを指します。ディープ ラーニングは、データの表現を学習するために多くの層 (そのため「ディープ」という用語) を備えた人工ニューラル ネットワークをトレーニングする機械学習のサブセットです。深層学習ソフトウェアは通常、次のような機能を提供します。 * ニューラル ネットワーク アーキテクチャ設計: 層の数、層の種類 (畳み込み、再帰など)、層間の接続の指定を含む、ディープ ニューラル ネットワークのアーキテクチャを設計およびカスタマイズするためのツール。 * データの前処理と拡張: 正規化、データ拡張、特徴抽出などのタスクを含む、深層学習モデルをトレーニングするための入力データを準備および前処理するためのユーティリティ。 * モデルのトレーニングと最適化: 確率的勾配降下法などの最適化アルゴリズムや、正則化やドロップアウトなどの過学習を処理する方法など、大規模なデータセットで深層学習モデルをトレーニングするためのアルゴリズムと手法。 * モデルの評価と検証: 精度、適合率、再現率、F1 スコアなどの指標を含む、検証およびテスト データセットでトレーニングされたモデルのパフォーマンスを評価するためのツール。 * 導入と推論: 多くの場合、ソフトウェア開発フレームワークやプラットフォームとの統合を通じて、新しいデータの推論のために、トレーニング済みの深層学習モデルを運用環境に導入するための機能。 人気のある深層学習ソフトウェア フレームワークには、TensorFlow、PyTorch、Keras、Caffe などがあります。これらのフレームワークは、開発者や研究者がすべてを最初から実装することなく、ディープ ラーニング モデルの構築と実験を容易にする高レベルの抽象化と API を提供します。
新しいアプリを提案
Claude
claude.ai
Claude by Anthropic は、Anthropic が構築した次世代 AI アシスタントで、最高の仕事ができるように安全、正確、確実になるように訓練されています。
Otter
otter.ai
Otter は、音声会話を記憶、検索、共有できるスマートなメモアプリです。 Otter は、音声、文字起こし、話者の識別、インライン写真、キー フレーズを組み合わせたスマート ボイス ノートを作成します。ビジネスマン、ジャーナリスト、学生が、会議、インタビュー、講義など、重要な会話が行われるあらゆる場面で、より集中し、協力し、効率的に取り組むことができるように支援します。
FaceCheck.ID
facecheck.id
FaceCheck.ID 顔認識検索エンジンを使用して、オンラインで誰かを見つけます。写真で人物を検索し、その人物であると主張している人物と話していることを確認します。
Jasper
jasper.ai
ジャスパー: On-Brand AI For Business は、オンラインでどこにいても、常にブランドの声でコンテンツを作成します。 Jasper は、独自のブランド トーンを学習して作成できるクリエイティブ AI アシスタントです。大胆に話すか、生意気に話すか、形式張って話すか、インターネット上でのみ話すか(u do u)。さらに、Jasper Everywhere ブラウザー拡張機能により、CMS から電子メール、ソーシャル メディア、そして Jasper API を使用した自社プラットフォームに至るまで、Jasper を常に使用できます。 最も重要なことは、Jasper は、セキ...
Notta
notta.ai
Notta は、主要な AI 文字起こしツールおよび会議メモ作成ツールであり、音声会話をすぐに実用的なテキストに書き起こして要約するのに役立ちます。58 言語がサポートされています。 ※重要なお知らせ:AirgramがNottaに加わりました!ビデオ/音声ファイル、ライブスピーチの文字起こしとは別に、Notta は Zoom、Microsoft Teams、Google Meet などの主要なビデオ会議プラットフォームと統合して、自動会議メモを生成します。また、ユーザーはトランスクリプトを確認、検索、編集、エクスポートし、チームメンバーと共有してシームレスなコラボレーションを行うこともできます...
VXG
videoexpertsgroup.com
VXG は、ビデオ管理を簡素化し、コスト効率の高い方法でシステムを拡張できるようにする世界的なクラウド ビデオ監視会社です。システム インテグレーター、セキュリティ、アクセス コントロール、AI、ビデオ モニタリング、テレコム、SaaS 企業向けに、150,000 台以上のカメラが接続された、カスタマイズされた世界クラスのビデオ監視ソリューションの構築を支援します。真のオープン クラウド プラットフォームは、他のソリューションとの統合、または IP カメラと連携する新しいサービスの構築を目的として設計されています。 VXG は、SaaS 企業向けの将来性のある革新的なテクノロジー プラットフ...
AWS Console
amazon.com
アマゾン ウェブ サービス (AWS) は、個人、企業、政府にオンデマンドのクラウド コンピューティング プラットフォームと API を従量課金制で提供する Amazon の子会社です。これらのクラウド コンピューティング Web サービスは、さまざまな基本的な抽象的な技術インフラストラクチャと分散コンピューティングの構成要素とツールを提供します。これらのサービスの 1 つが Amazon Elastic Compute Cloud (EC2) です。これにより、ユーザーは、インターネット経由でいつでも利用できるコンピューターの仮想クラスターを自由に利用できるようになります。 AWS バージョ...
Google Cloud Platform
google.com
Google が提供する Google Cloud Platform (GCP) は、Google 検索、Gmail、ファイル ストレージ、YouTube などのエンドユーザー製品に Google が社内で使用しているのと同じインフラストラクチャ上で実行されるクラウド コンピューティング サービス スイートです。一連の管理ツールに加えて、コンピューティング、データ ストレージ、データ分析、機械学習などの一連のモジュラー クラウド サービスを提供します。登録にはクレジット カードまたは銀行口座の詳細が必要です。Google Cloud Platform は、サービスとしてのインフラストラクチャ、...
SpeechTexter
speechtexter.com
音声からテキストへのコンバーター。あなたの声でディクテーションします。音声で入力できる無料のウェブアプリ。 70 以上の言語がサポートされています。
Speechnotes
speechnotes.co
Speech to Text - 音声入力と文字起こし。 無料で音声でメモを取ったり、音声やビデオの記録をその場で自動的に文字起こししたりできます。安全、正確、超高速。
OpenAI Platform
openai.com
OpenAI は、汎用人工知能が全人類に利益をもたらすことを保証することに専念する AI 研究および導入企業です。 AI は非常に強力なツールであり、安全性と人間のニーズを中心に据えて作成する必要があります。 OpenAI は、利益よりも利益の一致を最優先することに専念しています。 私たちの使命を達成するには、人類のあらゆる領域を形成するさまざまな視点、声、経験を包括し、尊重する必要があります。多様性、公平性、包括性への当社の投資は継続的に行われており、幅広い取り組みを通じて実行され、リーダーシップによって擁護およびサポートされています。 OpenAI では、人工知能には人々が地球規模の巨...
FaceMRI
facemri.com
FaceMRI は、米国に拠点を置く顔認識ソフトウェア研究グループです。 FaceMRI は、Mac および PC 用の最も先進的な顔認識検索エンジンです。 FaceMRI には、顔を性別 (男性、女性、ノンバイナリー)、年齢層、年齢、人種に分類できる一連の顔認識ソフトウェアがあります。出席表と分析を作成します。顔は、 + 画像のインポート + ビデオのインポート + Web 検索 (FB、LinkedIn、Instagram) + フォルダーのインポート + Web カメラおよび IP カメラ + IOT およびセキュリティ カメラを通じて抽出できます。 + USB キーと外部デバイス F...
Deep Dream Generator
deepdreamgenerator.com
ディープドリームジェネレーター。畳み込みニューラル ネットワークが画像を過剰処理し、特徴を強化することによって何を生成できるかを発見します。
Krisp
krisp.ai
Krisp は、オンライン会議や通話の効率と明瞭性を向上させるために設計されたインテリジェントなアプリケーションです。主にノイズ キャンセリングに AI を利用し、オンラインでのやり取り中の背景ノイズ、音声、エコーを効果的に除去します。 個人の会話からチーム会議、コールセンターまで、さまざまなシーンでクリアで高品質なコミュニケーションを実現します。 Krisp は、ノイズ キャンセリングに加えて、リアルタイムの会議の文字起こしも提供します。これにより、アクセシビリティが向上し、記録の維持に役立ちます。 さらに、簡潔な会議メモや要約を生成する機能も備えており、AI 会議アシスタントとして効果...
Alibaba Cloud
alibabacloud.com
Alibaba Cloud は、世界最大のクラウド コンピューティング企業の 1 つであり、包括的なクラウド製品とソリューションによってデジタル化を加速するために、スケーラブルで安全かつ信頼性の高いクラウド コンピューティング サービスを世界中に提供しています。
Resemble.ai
resemble.ai
Resemble AI は、独自の深層学習モデルを使用してカスタム AI 音声を作成し、テキスト読み上げおよび音声合成を使用して AI が生成した高品質のオーディオ コンテンツを生成します。 弊社の多言語ローカリゼーション ツールである Resemble Localize はテキストを翻訳し、AI 音声を最大 100 の言語に変換できます。 Resemble Fill は、クローン AI 音声で既存の音声を変更できるジェネレーティブ フィル (オーディオ修復) 機能です。 Fill を使用すると、プログラマティック オーディオ広告、動的ストリーミング広告挿入 (SAI)、音声アシスタントな...
Jammable
jammable.com
Jammable を使用すると、AI を使用して数秒で AI カバーを作成できます。コミュニティにアップロードされた数百の AI 音声モデルを今すぐクリエイティブに使用できます。
Roboflow
roboflow.com
ほんの数十枚のサンプル画像を使用すれば、24 時間以内に実用的な最先端のコンピューター ビジョン モデルをトレーニングできます。 Roboflow は、コンピューター ビジョンを使用した構築を容易にするサービスとしてのソフトウェア製品を作成します。 250,000 人を超える開発者が Roboflow を使用して、画像データの管理、データセットへの注釈付けとラベル付け、前処理と拡張の適用、注釈ファイル形式の変換、ワンクリックでのコンピューター ビジョン モデルのトレーニング、API 経由またはエッジへのモデルのデプロイを行っています。
DeepAI
deepai.org
生まれながらに創造的な人間のための人工知能ツール
Clarifai
clarifai.com
Clarifai は、コンピューター ビジョン、自然言語処理、音声認識を専門とする独立系人工知能企業です。 Clarifai は、2013 年に設立された最初のディープ ラーニング プラットフォームの 1 つで、非構造化画像、ビデオ、テキスト、オーディオ データ用の AI プラットフォームを提供します。そのプラットフォームは、画像、ビデオ、テキスト、音声データに関するデータ探索、データラベル付け、モデルトレーニング、評価、推論のための完全な AI ライフサイクルをサポートします。 ワシントン DC に本社を置く Clarifai は、機械学習とディープ ニューラル ネットワークを使用して、画...
Speech to Note
speechtonote.com
Speech To Note は、話された音声を即座にテキストに変換する AI を活用した音声認識ツールです。当社のツールは、高度な音声テキスト変換テクノロジーを使用して、ユーザーの言葉を編集または共有できる簡潔な要約に変換します。 あなたの話した言葉を即座に簡潔で有益な要約に変換する、AI 駆動ツールのパワーを体験してください。
PromptSmart
promptsmart.com
PromptSmart は、音声に従ってビデオやプレゼンテーションの作成を支援するテレプロンプター アプリです。 PromptSmart は、音声認識を備えた史上初のテレプロンプター アプリであり、最も先進的な人前で話すツールです。 2014年8月発売開始! PromptSmart は人前で話すことへの情熱から生まれました。 PromptSmart の創設者は、MBA 学生に人前で話す技術を指導し、指導しました。多くの弁論者は、直観的なスピーカー制御のテレプロンプターのほうがより適切にサポートされることを認識し、今日のモバイル デバイスがこのニーズに対応できることも認識しました。これを念頭...
npm
npmjs.com
npm は、npm, Inc. によって保守されている JavaScript プログラミング言語のパッケージ マネージャーです。npm は、JavaScript ランタイム環境 Node.js のデフォルトのパッケージ マネージャーです。これは、npm とも呼ばれるコマンド ライン クライアントと、npm レジストリと呼ばれるパブリック パッケージと有料プライベート パッケージのオンライン データベースで構成されます。
PixLab
pixlab.io
PixLab は、マシン ビジョンおよびメディア処理 API 向けの主要な独立系 Software-as-a-Service プラットフォームです。当社は、開発者が Web およびオフライン SDK を使用してインテリジェントなアプリを実装できるよう支援します。当社の API 機能セットには、パスポートと ID カードのスキャン、コンテンツ モデレーション、顔認識、光学式文字認識、その他多くの API エンドポイントが含まれますが、これらに限定されません。
Gladia
gladia.io
Gladia は、ユーザーがデータを最大限に活用できるようにするプラグ アンド プレイ API を提供する AI ナレッジ インフラストラクチャ プラットフォームです。 Speech-to-Text API Alpha は最新の製品で、リアルタイム処理と 1% という低い単語エラー率を提供します。 Open AI の Whisper Models に基づいて構築されており、1 時間の音声をわずか 10 秒で書き起こすことができます。 API は無料で利用でき、99 の言語をサポートしています。 Gladia は、創設者兼 CEO の Jean-Louis Queguiner と共同創設者兼...
Hour One
hourone.ai
Hour One は、すべてのワークフローを 1 つの AI 搭載プラットフォームに一元化することで、ビジネスのコンテンツ作成に革命をもたらします。当社は市場で最も本物に近いアバターを誇り、ビジネス メッセージを生き生きと表現する自然な動きを特徴としています。あらゆるブランドに合わせてカスタマイズできるテンプレートを使用すると、デザインや編集のスキルを必要とせず、チームがパーソナライズされたコンテンツを大規模に作成できるようになります。さらに、高速レンダリングと最上級のセキュリティを備えた Hour One は、企業の需要に合わせて設計された最高のコンテンツ オペレーティング システムとして際...
Landing AI
landing.ai
コンピュータービジョンが超簡単に。 コンピューター ビジョン システムを数分で作成して展開します。複雑なプログラミングや AI の経験は必要ありません。
AI Voice Detector
aivoicedetector.com
AI Voice Detector は、音声の信頼性を検出し、AI によって生成された音声をフィルタリングするのに役立つ音声検証ツールです。これにより、口頭評価における音声操作、誤った情報、音声詐欺、盗作に対するユーザーの安心感と保護が提供されます。 * AI Voice Detector は、特にビジネス ユースケース向けに、コンピューターで生成された音声と実際の人間の音声を区別するように設計されたツールで、顧客サービスのやり取りにおけるコンテンツの信頼性と信頼性の高いレポートを保証します。 * レビュー担当者は、オーディオ操作や音声詐欺に対する保護のためのソフトウェアの実装、使いやすさ、...
Dictanote
dictanote.co
音声入力を使用してユーザーの生産性向上を支援します。 Dictanote は、音声とテキストの統合が組み込まれた最新のメモ アプリで、50 以上の言語でメモを音声入力することが簡単にできます。 Voice In は、音声をテキストに変換する Chrome 拡張機能で、音声を使用して任意の Web サイト上のテキスト ボックスに入力できるようになります。
Speechlogger
speechlogger.com
Speech Logger は、自動句読点、自動保存、タイムスタンプ、テキスト内編集機能、音声ファイルの転写、エクスポート オプションなどを備えた Web ベースの音声認識および音声翻訳ソフトウェアです。 * Speechlogger は、自動句読点、話者識別、センチメント分析などの追加機能を備えた、スピーチ、会議、またはイベントの自動ライブ キャプションおよび翻訳用に設計されたツールです。 * 査読者は、騒がしい背景でも音声を正確に書き起こす Speechlogger の機能、ユーザーフレンドリーなデザイン、自動句読点、話者識別、センチメント分析などの独自の機能を高く評価しており、一部の有...
Picture to Text
picturetotext.info
画像からテキストへのコンバーターを使用すると、画像を編集可能なテキストに簡単かつ効率的に変換できます。スキャンした文書、手書きのメモ、またはその他のビジュアル コンテンツであっても、このツールはすべてを簡単に処理します。 さまざまな種類の画像から信頼性の高いテキスト抽出による高精度をお楽しみください。ユーザーフレンドリーなインターフェイスにより、誰でも手間なく使用できます。さらに、複数の言語をサポートしているため、さまざまな言語のテキストをシームレスに処理できます。 際立った機能の 1 つは、大量のデータを処理するときに時間を節約できる、一括画像を送信する機能です。また、複数の画像形式もサ...
AssemblyAI
assemblyai.com
AssemblyAI は、人間の音声を文字に起こして理解できる新しい最先端の AI モデルの構築に焦点を当てた音声 AI 企業です。 CallRail、Fireflies、Spotify などの当社の顧客は、音声データに基づいて AI を活用した驚くべき新しいエクスペリエンスと製品を構築するために AssemblyAI を選択しています。 AssemblyAI のモデルとフレームワークには次のものが含まれます。 - AI 音声テキスト変換 - 要約、センチメント分析、トピック検出、コンテンツモデレーション、PII 編集などを含むオーディオ インテリジェンス - LeMUR は、文字起こしされ...
V7
v7labs.com
V7 は、コンピューター ビジョンおよび生成 AI アプリケーション向けに設計された AI データ エンジンです。このプラットフォームは、ラベル付け、ワークフロー、データセットを含むエンタープライズ トレーニング データのインフラストラクチャを提供し、人間参加型トレーニングの機能を備えています。 AI モデルのデータの品質を向上させるために、複数のアノテーション プロパティが提供されます。自動アノテーション、医療画像用の DICOM アノテーション、データセット管理、モデル管理などの機能を備えた V7 は、さまざまなタスクを自動化および合理化します。 画像およびビデオの注釈ツールは、データ...
Muse.ai
muse.ai
muse.ai は、世界中のビデオを整理するための高度な人工知能を構築しているビデオ検索会社です。
Kili Technology
kili-technology.com
高品質のデータセットを迅速に構築します。 企業は、データのラベル付け業務を合理化し、カスタム モデル、生成 AI、LLM に最適なデータセットを構築するために私たちを信頼しています。 ___ なぜキリテクノロジーなのか? ご存知ないかもしれませんが、次のとおりです。 MNIST のデータセットの誤り率は 3.4% で、今でも 38,000 を超える論文で引用されています。 クラウドソーシングされたラベルを含む ImageNet データセットのエラー率は 6% です。このデータセットは、おそらく、Google と Facebook が開発した最も人気のある画像認識システムを支えています...
Face Age
getfaceage.com
Face Age は、最先端のテクノロジーを利用して顔の肌の属性を分析し、しわ、毛穴、にきび、目袋などの詳細をキャプチャして、各顧客の肌を理解します。 Face Age は、既存の電子商取引プラットフォームに簡単に統合できるように設計されています。 Face Age はさまざまな統合オプションを提供し、セットアップ プロセスをスムーズかつ効率的にします。小規模なブティック ストアを運営している場合でも、大規模なマーケットプレイスを運営している場合でも、Face Age は技術要件にシームレスに適応します。
SoundHound
soundhound.com
会話型インテリジェンスの主要なイノベーターとして、当社は、業界を超えた企業がクラス最高の会話エクスペリエンスを顧客に提供できるようにする独立した音声 AI プラットフォームを提供しています。独自の Speech-to-Meaning® および Deep Meaning Understanding® テクノロジーに基づいて構築された SoundHound の高度な音声 AI プラットフォームは、並外れた速度と精度を提供し、人間が自然に話すことによって、相互に対話するのと同じように製品やサービスと対話できるようにします。 SoundHound は、ヒュンダイ、メルセデスベンツ、パンドラ、クアルコ...
NVIDIA Developer
developer.nvidia.com
生成 AI を使用してアプリケーションを構築します。 どこでも実行できる実稼働対応の API を使用して、AI を体験、プロトタイプ、デプロイします。
ai|coustics
ai-coustics.com
ai|coustics は、高度なアルゴリズムを使用して音声の音質を向上させる AI ツールです。同社の Generative Speech AI テクノロジーにより、ユーザーはポッドキャストの録音、ビデオ会議、音声の送信など、あらゆる状況でプロ グレードの音声品質を得ることができます。 このツールは、背景ノイズを抑制するだけでなく、部屋の共鳴を除去し、低品質のヘッドセットを補正し、デジタルアーティファクトを修復して、話し言葉の明瞭さと品質を向上させます。 オーディオ信号の失われた成分や周波数も取り戻します。この AI ツールは、通信、ポッドキャスティング プラットフォーム、音声録音または...
SpeechAce
speechace.com
SpeechAce では、多用途の音声認識テクノロジーを通じて、言語学習者のスピーキング能力の向上を支援することに取り組んでいます。私たちは、言語学習者が自分のスピーキングスキルを評価するだけでなく、改善すべき領域を正確に特定するのに役立つ世界初の音声認識 API を開発しました。当社の音声認識 API の最初のバージョンでは発音スコアのみが提供されていましたが、現在は完全な音声文字起こしに加え、語彙、文法、流暢さ、一貫性、関連性などのより高いレベルのスキルの評価が含まれるように機能が強化されました。 SpeechAce は、世界最大規模の言語学習プロバイダーだけでなく、小規模 (ただし最も...
Jupitrr
jupitrr.com
Jupitrr AI Video Maker は、クリエイターが自分の音声録音やポッドキャストをパーソナライズされたビデオに変換できる AI を活用したツールです。このツールを使用すると、ユーザーはわずか数分で素晴らしいビデオ コンテンツを簡単に作成できます。 Jupitrr AI Video Maker の背後にある AI テクノロジーは、ストック映像、チャート、字幕などを含む、クリエイターのビデオ用のストック ビデオを生成するプロセスを自動化します。このツールは、Word ドキュメントの編集に似たユーザーフレンドリーなインターフェイスを備えているため、複雑なタイムラインの必要性がなくなり...
MobileEngine
services.tineye.com
TinEye は、画像の検索と認識を行う会社です。私たちはコンピューター ビジョン、パターン認識、ニューラル ネットワーク、機械学習の専門家です。私たちの使命は、あなたの画像を検索可能にすることです。
Deepgram
deepgram.com
Deepgram は、人間の言語を理解することを使命とする基礎的な AI 企業です。 API 呼び出しだけで、あらゆる開発者が最先端の音声 AI 文字起こしと理解にアクセスできるようになります。 当社のモデルは、要約、センチメント分析、トピック検出などのコンテキスト機能とともに、最速かつ最も正確な文字起こしを提供します。 さらに、開発者は次のことを行うことができます。 * ライブストリーミングまたは事前に録音されたオーディオを処理します * 数十の言語で文字起こし * 独自のユースケースに合わせてカスタム モデルをトレーニングします * 統合された API を使用してディープ NLU にア...
PodcastAI
podcastai.com
PodcastAI は、高度な AI ツールを使用して、迅速な文字起こし、話者識別、メタデータ生成、AI ホストとの対話の有効化などの機能を提供することで、ポッドキャスト制作を合理化するプラットフォームです。
Speechmatics
speechmatics.com
Speechmatics は音声インテリジェンスの世界有数の専門家であり、AI と ML の最新のブレークスルーを組み合わせて、人間の音声のビジネス価値を解き放ちます。世界中の企業がスピーチマティクスを使用して、人口統計、年齢、性別、アクセント、方言、場所に関係なく、人間レベルの音声を正確に理解し、リアルタイムで記録メディアにテキストに書き起こします。 これらのトランスクリプトと最新の AI 主導の音声機能を組み合わせることで、企業は要約、トピック、センチメント、章、翻訳などを活用した製品を構築できます。 Speechmatics は、世界中で 300 年以上の文字起こしを毎月 50 の言語...
SuperAnnotate
superannotate.com
SuperAnnotate は、最高品質のトレーニング データを使用して AI モデルをより迅速に構築、微調整、反復、管理するための主要なプラットフォームです。高度なアノテーションおよび QA ツール、データ キュレーション、自動化機能、ネイティブ統合、およびデータ ガバナンスにより、企業はデータセットと成功する ML パイプラインを構築できるようになります。 SuperAnnotate の専門家で専門的に管理されたアノテーション スタッフと提携して、最高のパフォーマンスのモデルを構築するための高品質のデータを迅速に提供できるようにします。
Altered
altered.ai
Altered は、ポッドキャスター、ビデオ ゲーム スタジオ、e ラーニングなどのさまざまな業界向けに高品質の音声コンテンツを制作するための、複数の音声 AI テクノロジーを使いやすいアプリケーションに統合した次世代オーディオ エディターです。
Tune AI
tunehq.ai
Tune AI は、企業における GenAI の導入を推進しています。 私たちは、Accel、Flipkart Ventures、Togetter Fund、Speciale Invest、Techstars、その他の著名な投資家によって支援されています。 TuneChat: オープンソース モデルを活用したチャット アプリ TuneStudio: 開発者が LLM を微調整して展開するための遊び場 ChainFury: GitHub で利用できるオープンソース プロンプト エンジン
Dictalogic
dictalogic.com
Dictalogic は、音声からテキストへ、音声からテキストへ、会話からテキストへ、タスク委任などの特殊なモジュールをすべて 1 つのダッシュボードから提供します。 * 音声のみ: 従来の音声ディクテーション。音声が録音され、どこにいても (在宅勤務を含む) 転写担当者に送信されます。 * 音声からテキストへ: デジタル変換により、その場で音声からテキストへの変換が可能になります。このアプローチでは、音声が録音されて文字起こしのために送信され、文字起こし者に届く前に音声がテキストに変換されます。課題に関しては、探索できるように複数のオプションが用意されています。 * 音声からテキストへ...
ArtPro
artpro.com
ArtPro は、オンラインでアートワークをカタログ化、アーカイブ、追跡、共有、保存できるように設計されたアート在庫管理ソフトウェアです。
Lambda
lambdalabs.com
Lambda は人類の進歩を加速するための計算を提供します。私たちは、世界最高の GPU クラウド、クラスター、サーバー、ワークステーションを構築しているディープ ラーニング エンジニアのチームです。当社の製品は、人類の知識の最前線にいるエンジニアや研究者に力を与えます。顧客には、Intel、Microsoft、Google、Amazon Research、Tencent、Kaiser Permanente、MIT、スタンフォード、ハーバード、カリフォルニア工科大学、ロス アラモス国立研究所、ディズニー、国防総省が含まれます。
SpeechFlow
speechflow.io
SpeechFlow は、企業や個人に比類のない精度と効率性を提供する、最先端の音声テキスト変換ツールです。当社の高度な AI テクノロジーは、音声とビデオのコンテンツを正確にテキストに転写し、英語だけでなく最大 14 の言語をサポートします。 主な特徴: * 多言語文字起こし: 14 言語のサポートにより言語の壁を克服します。さまざまな言語コンテキストで正確で信頼性の高い文字起こしを取得します。 * オールインワンの文字起こしソリューション: API とオンライン プラットフォーム: SpeechFlow は、企業および個人向けに、シンプルで使いやすい音声認識 API インターフェイスとオ...
Phonexia
phonexia.com
Phonexia は、音声生体認証と音声認識テクノロジーで音声の可能性を解き放つというビジョンを持って 2006 年に設立された革新的なチェコのソフトウェア会社です。 Phonexia は、ブルノ工科大学の有名な音声研究グループとの緊密な関係を通じて、最新の科学的進歩を、ディープ ニューラル ネットワークを活用した高精度の最先端テクノロジーの日常的な現実に変えています。 Phonexia は、政府、法医学、商業部門向けに高度なソフトウェアのポートフォリオを提供し、世界 60 か国以上で革新的なプロジェクトを可能にします。
Faceplusplus
faceplusplus.com
Face++ は、アプリケーションが世界をより深く読み取って理解できるようにするコンピューター ビジョン テクノロジーを提供するプラットフォームです。
Capsolver
capsolver.com
Capsolver の自動キャプチャ ソルバーは、最も手頃な価格で迅速なキャプチャ解決ソリューションを提供します。シンプルな統合オプションを使用してプログラムと迅速に組み合わせて、数秒で最良の結果を得ることができます。 Capsolver は 99.15% の成功率で、毎分 1,000 万件以上のキャプチャに応答できます。これは、自動化またはスクレイピングの稼働率が 99.99% になることを意味します。予算が大きい場合は、キャプチャ パッケージを購入することもできます。 市場で最も低い価格で、reCAPTCHA V2、reCAPTCHA V3、hCaptcha、hCaptcha Click...
Vatis Tech
vatis.tech
優れた精度と手頃な価格で音声認識に革命をもたらします。 Vatis Tech の API は、独自のディープラーニング音声認識アルゴリズムを使用して、オーディオ ファイルまたはビデオ ファイルを 95% 以上の精度でテキストに自動的に変換する高度な音声テキスト変換テクノロジーを提供します。 Vatis Tech は、自社の音声テキスト変換 API エンジンと Web プラットフォームを、機敏なスタートアップ企業、巨大企業、ポッドキャスター、ジャーナリスト、開発者などに提供しています。これにより、ソリューション プロバイダーやサービス プロバイダーは、業界やユースケースに関係なく、テクノロジ...
Talkatoo
talkatoo.com
Talkatoo は医療専門家向けのディクテーションを再発明しています。獣医業界でも人間の医療業界でも、Talkatoo は音声テキスト変換ソフトウェア ソリューションです。 Talkatoo は Windows と Mac の両方で互換性があり、入力できるあらゆるフィールド (PIM と EHR を含む) で動作し、非常に使いやすいです。 * Talkatoo は、専門用語や医療用語を含む音声をテキストに変換することに重点を置いた、臨床用途向けに設計されたデスクトップ ディクテーション ソリューションです。 * 査読者は、複雑な医療用語を含む音声をテキストに正確に変換する Talkat...
Shownotes
shownotes.io
Shownotes は、ポッドキャスト エピソードを自動的に要約し、完全なトランスクリプトとキャプション ファイルを含むランディング ページを作成する AI を活用したツールです。 chatGPT を使用して YouTube の自動キャプションを変換し、記憶に残る引用を生成します。また、トランスクリプトからブログ投稿を作成することもできます。 Shownotes には、Free、Creator、Pro の 3 つのプランがあります。無料プランでは、毎月 1 つのショーノート、要約トランスクリプト、ランディング ページが提供され、すべてのショーが公開されます。 クリエイター プランでは、毎月...
Symbl.ai
symbl.ai
Symbl.ai は、高度な深層学習モデルを使用して、開発者にリアルタイムの文字起こしと非構造化会話データの洞察を提供する会話インテリジェンス プラットフォームです。 このツールは、収益インテリジェンス、イベントとウェビナー、リモート コラボレーション、コンタクト センター、採用インテリジェンスなどのさまざまな業界にソリューションを提供します。 Symbl.ai の機能は、カスタム トラッカー、要約、トピック モデリング、文字起こし、会話分析、音声、オーディオ、テキスト データの事前構築された UI とコンポーネントをサポートしています。 Symbl.ai は、その API テクノロジー...