Machine learning data catalogs enable organizations to organize, access, interpret, and collaborate around data from multiple sources while ensuring robust governance and access control. Artificial intelligence plays a central role in many features of these catalogs, supporting capabilities like machine learning-based recommendations, natural language queries, and dynamic data masking for improved security. These catalogs allow businesses to consolidate datasets in a single location, making it easier for both analysts and everyday users to search for and discover data. Users can comment on, share, and recommend datasets, providing immediate context for colleagues who are querying the data. IT administrators can implement user provisioning to prevent unauthorized access to sensitive information. Machine learning data catalogs are particularly beneficial for companies with diverse data sources, seeking a unified source of truth, and aiming to scale data usage across the organization. While IT departments typically manage these platforms to maintain organization and security, the catalogs are designed to be accessible to data scientists, analysts, and even non-technical business users. Data can be transformed, modeled, and visualized either within the catalog itself or through integration with business intelligence tools. It’s important to note that not all machine learning data catalogs include data preparation features and may require integration with business intelligence platforms for such capabilities. Additionally, these catalogs differ from master data management (MDM) systems in their focus on enhanced governance, collaboration, and machine learning-powered functionalities.
Hantar Aplikasi Baharu

Appen
appen.com
Appen menyediakan data latihan berkualiti untuk AI: anotasi data, pengumpulan rakaman pertuturan, pemurnian teks dan penilaian geo-tempatan untuk meningkatkan prestasi model pembelajaran mesin.

data.world
data.world
Platform katalog dan tadbir urus data berasaskan graf pengetahuan; memudahkan penemuan, integrasi, carian dan kolaborasi data untuk analisis dan pengurusan metadata.

TextQL
textql.com
TextQL ialah penganalisis data peribadi maya untuk perusahaan yang menjawab soalan perniagaan dalam bahasa Inggeris, menghasilkan analisis, visual, model, dan mengurus integrasi data serta katalog metadata.

Shaip
shaip.com
Shaip menyediakan data beranotasi (teks, audio, imej, video) untuk latihan model AI/ML dalam kesihatan, perbualan, penglihatan komputer dan LLM, serta toolkit untuk RLHF.

Collibra
collibra.com
Collibra ialah platform katalog dan tadbir urus data yang membantu organisasi menginventori, menerangkan metadata, menjejak garis keturunan serta mengurus privasi dan pematuhan data.

Workstream.io
workstream.io
Workstream.io memudahkan akses kepada aset analitik organisasi, mengubah data besar menjadi maklumat yang boleh digunakan oleh pasukan untuk membuat keputusan perniagaan.

Sama AI
sama.com
Sama menyediakan anotasi data untuk model AI penglihatan komputer perusahaan dengan tenaga kerja pakar dalaman dan platform perusahaan, memastikan ketepatan dan proses data beretika.

Denodo
denodo.com
Denodo membolehkan organisasi mengakses dan menggabungkan data masa nyata dari pelbagai sumber tanpa memindahkannya, menyediakan katalog, tadbir urus, pemecut pertanyaan dan sokongan untuk aplikasi AI.

CastorDoc
castordoc.com
CastorDoc ialah alat kolaboratif automatik untuk menemui, mengatalog dan mendokumentasikan aset data syarikat, menyediakan sumber rujukan tunggal dan konteks untuk analisis.

Erisna
erisna.com
Erisna ialah platform katalog dan carian data perusahaan yang menghubungkan sumber seperti Redshift, BigQuery, Synapse, Snowflake, PostgreSQL dan SQL Server untuk membina kamus data, mengesan data sensitif dan menyokong tadbir data.

Select Star
selectstar.com
Select Star ialah platform metadata yang menganalisis dan mendokumentasi data secara automatik, menyediakan katalog, garis keturunan, analisis penggunaan dan alat AI untuk tadbir urus, migrasi dan analitik sendiri.

Secoda
secoda.co
Secoda ialah platform pengurusan data yang menyambung dan menyatukan sumber, katalog, garis keturunan, tadbir urus dan pemantauan untuk memudahkan akses dan penggunaan data.

Dataland
dataland.io
Dataland ialah platform pengurusan data untuk membina dan mengurus alat dalaman, menyepadukan sumber, memproses, menganalisis dan memvisualkan data bagi sokongan keputusan.

Traceye
traceye.io
Traceye ialah platform infrastruktur pengindeksan data untuk membina dan menerapkan subgraf, menyediakan akses pantas dan konsisten kepada data blockchain yang diindeks.

Decube
decube.io
Decube ialah platform pemerhatian data yang memantau kualiti data, menemui metadata, dan menyemak perbezaan rekod; menyambung ke sumber data tanpa kod.
© 2025 WebCatalog, Inc.