Machine learning data catalogs enable organizations to organize, access, interpret, and collaborate around data from multiple sources while ensuring robust governance and access control. Artificial intelligence plays a central role in many features of these catalogs, supporting capabilities like machine learning-based recommendations, natural language queries, and dynamic data masking for improved security. These catalogs allow businesses to consolidate datasets in a single location, making it easier for both analysts and everyday users to search for and discover data. Users can comment on, share, and recommend datasets, providing immediate context for colleagues who are querying the data. IT administrators can implement user provisioning to prevent unauthorized access to sensitive information. Machine learning data catalogs are particularly beneficial for companies with diverse data sources, seeking a unified source of truth, and aiming to scale data usage across the organization. While IT departments typically manage these platforms to maintain organization and security, the catalogs are designed to be accessible to data scientists, analysts, and even non-technical business users. Data can be transformed, modeled, and visualized either within the catalog itself or through integration with business intelligence tools. It’s important to note that not all machine learning data catalogs include data preparation features and may require integration with business intelligence platforms for such capabilities. Additionally, these catalogs differ from master data management (MDM) systems in their focus on enhanced governance, collaboration, and machine learning-powered functionalities.

Appen
Appen poskytuje trénovacie údaje pre AI: anotácie dát, zber reči a textu a geo‑lokalizované hodnotenia na zlepšenie výkonu modelov.

data.world
data.world je cloudová platforma na katalógovanie, správu a vyhľadávanie dát; prepája zdroje, spravuje metadáta, podporuje federované dotazy a AI asistenciu pre analýzu.

Workstream.io
Workstream umožňuje jednoduchý prístup k analytickým zdrojom a pomáha tímom premeniť údaje organizácie na použiteľné poznatky pre rozhodovanie.

TextQL
TextQL je virtuálny firemný dátový analytik: odpovedá na prirodzené otázky v angličtine, vytvára analýzy, grafy a modely, integruje sa do tímových dátových platforiem a spravuje dátový katalóg.

Shaip
Shaip poskytuje licencované, zberané a anotované textové, audio, obrazové a video dáta pre zdravotníctvo, konverzačné AI, počítačové videnie a LLM; ponúka aj nástroje na hodnotenie a RLHF.

Collibra
Collibra je platforma na katalogizáciu, riadenie a sledovanie dát: vytvára inventár metadát, zobrazuje dátovú líniu a pomáha s ochranou osobných údajov a súladom s predpismi.

Denodo
Denodo umožňuje pripojenie k rôznym dátovým zdrojom a poskytuje prístup, integráciu v reálnom čase, katalogizáciu a správu dát bez presunu pôvodných úložísk.

Sama AI
Sama poskytuje anotácie dát pre počítačové videnie a podnikové AI modely, zabezpečuje presné a škálovateľné označovanie údajov s dôrazom na etiku a zamestnávanie.

Erisna
Erisna je podnikový katalóg a vyhľadávač dát. Pripája sa k Redshift, BigQuery, Synapse, Snowflake, PostgreSQL či SQL Server, vytvára dátový slovník, deteguje citlivé dáta a zlepšuje správu dát.

Select Star
Select Star je platforma pre metadata, ktorá automaticky analyzuje a dokumentuje dáta, poskytuje katalóg, sledovanie dátových tokov, analýzu využitia a nástroje na správu a governance.

Secoda
Secoda centralizuje dáta a metadata: katalogizuje zdroje, sleduje líniu, umožňuje vyhľadávanie, dokumentáciu, správu prístupu a monitorovanie kvality.

CastorDoc
CastorDoc je kolaboračný nástroj na automatické objavovanie, katalógovanie a dokumentovanie firemných dát; poskytuje centrálny zdroj informácií a kontext pri vyhľadávaní tabuliek a zdrojov.

Dataland
Dataland umožňuje bezpečne vytvárať, integrovať, spracovávať a vizualizovať interné dátové nástroje, aby obchodní používatelia mohli analyzovať a spravovať dáta.

Traceye
Traceye je podniková platforma na indexovanie dát, ktorá umožňuje vytváranie a nasadzovanie subgrafov a rýchly prístup k indexovaným blockchainovým dátam.

Decube
Decube je platforma pozorovateľnosti údajov, ktorá monitoruje kvalitu dát, poskytuje dátový katalóg a porovnáva rozdiely v dátach, s bezkódovým pripojením k bežným zdrojom.
Riešenia
© 2026 WebCatalog, Inc.