Machine learning data catalogs enable organizations to organize, access, interpret, and collaborate around data from multiple sources while ensuring robust governance and access control. Artificial intelligence plays a central role in many features of these catalogs, supporting capabilities like machine learning-based recommendations, natural language queries, and dynamic data masking for improved security. These catalogs allow businesses to consolidate datasets in a single location, making it easier for both analysts and everyday users to search for and discover data. Users can comment on, share, and recommend datasets, providing immediate context for colleagues who are querying the data. IT administrators can implement user provisioning to prevent unauthorized access to sensitive information. Machine learning data catalogs are particularly beneficial for companies with diverse data sources, seeking a unified source of truth, and aiming to scale data usage across the organization. While IT departments typically manage these platforms to maintain organization and security, the catalogs are designed to be accessible to data scientists, analysts, and even non-technical business users. Data can be transformed, modeled, and visualized either within the catalog itself or through integration with business intelligence tools. It’s important to note that not all machine learning data catalogs include data preparation features and may require integration with business intelligence platforms for such capabilities. Additionally, these catalogs differ from master data management (MDM) systems in their focus on enhanced governance, collaboration, and machine learning-powered functionalities.

Appen
Appen pruža visoko kvalitetne podatke za treniranje AI modela: označavanje podataka, prikupljanje govora, obrada teksta i geo-lokalne evaluacije za poboljšanje razumijevanja jezika i slika.

data.world
data.world je cloud platforma za katalogizaciju i upravljanje podacima koja povezuje izvore, omogućuje pretraživanje i upravljanje metapodacima te podržava suradnju i ponovno korištenje podataka.

Workstream.io
Workstream olakšava pristup analitičkim podacima i alatima, omogućujući timovima izvlačenje korisnih informacija iz podataka za donošenje poslovnih odluka.

TextQL
TextQL je virtualni analitičar podataka za tvrtke: odgovara na upite na engleskom, izvodi analize, vizualizacije i modele, integrira se u postojeće podatkovne sustave i upravlja katalogom.

Shaip
Shaip pruža kvalitetne, anotirane podatke (tekst, audio, slika, video) i alat za odgovorno usklađivanje i evaluaciju LLM‑ova za razvoj nepristranih AI/ML modela.

Collibra
Collibra je platforma za katalogizaciju i upravljanje podacima: inventarizira podatke, bilježi metapodatke, prati podrijetlo te upravlja privatnošću i usklađenošću.

Denodo
Denodo povezuje i virtualizira podatke iz različitih izvora u stvarnom vremenu, omogućujući pristup, upravljanje i isporuku bez premještanja podataka.

Sama AI
Sama AI pruža označavanje podataka za računalni vid, isporučujući točne i skalabilne anotacije za razvoj poslovnih AI modela uz naglasak na etički pristup.

Erisna
Erisna je platforma za katalogizaciju i pretraživanje podataka koja povezuje izvore (Redshift, BigQuery, Synapse, Snowflake, PostgreSQL, SQL Server), stvara rječnik, otkriva osjetljive podatke i podržava upravljanje.

Select Star
Select Star je platforma za metapodatke koja automatski analizira i dokumentira podatke, pruža katalog, sljedivost, analizu korištenja i AI asistente te pomaže u upravljanju, migracijama, samoposlužnoj analitici i optimizaciji troškova.

Secoda
Secoda je platforma za upravljanje podacima koja povezuje izvore, katalogizira imovinu, prati kvalitetu i linearnost podataka te omogućuje pretraživanje i suradnju između tehničkih i poslovnih korisnika.

CastorDoc
CastorDoc je alat za otkrivanje i katalogizaciju podataka: centralizira, dokumentira i olakšava traženje, razumijevanje i suradnju oko podataka u tvrtki.

Dataland
Dataland je platforma za izradu i upravljanje internim alatima za integraciju, obradu, analizu i vizualizaciju podataka za poslovne korisnike.

Traceye
Traceye je platforma za indeksiranje podataka koja omogućuje izradu i postavljanje subgrafa te brz, siguran i skalabilan pristup indeksiranim blockchain podacima.

Decube
Decube je platforma za praćenje kvalitete podataka: automatski nadzire i testira podatke, otkriva promjene shema, katalogizira metapodatke i uspoređuje razlike u podacima.
Rješenja
© 2026 WebCatalog, Inc.