Machine learning data catalogs enable organizations to organize, access, interpret, and collaborate around data from multiple sources while ensuring robust governance and access control. Artificial intelligence plays a central role in many features of these catalogs, supporting capabilities like machine learning-based recommendations, natural language queries, and dynamic data masking for improved security. These catalogs allow businesses to consolidate datasets in a single location, making it easier for both analysts and everyday users to search for and discover data. Users can comment on, share, and recommend datasets, providing immediate context for colleagues who are querying the data. IT administrators can implement user provisioning to prevent unauthorized access to sensitive information. Machine learning data catalogs are particularly beneficial for companies with diverse data sources, seeking a unified source of truth, and aiming to scale data usage across the organization. While IT departments typically manage these platforms to maintain organization and security, the catalogs are designed to be accessible to data scientists, analysts, and even non-technical business users. Data can be transformed, modeled, and visualized either within the catalog itself or through integration with business intelligence tools. It’s important to note that not all machine learning data catalogs include data preparation features and may require integration with business intelligence platforms for such capabilities. Additionally, these catalogs differ from master data management (MDM) systems in their focus on enhanced governance, collaboration, and machine learning-powered functionalities.
Pošalji novu aplikaciju

Appen
appen.com
Appen pruža visoko kvalitetne podatke za treniranje AI modela: označavanje podataka, prikupljanje govora, obrada teksta i geo-lokalne evaluacije za poboljšanje razumijevanja jezika i slika.

data.world
data.world
data.world je cloud platforma za katalogizaciju i upravljanje podacima koja povezuje izvore, omogućuje pretraživanje i upravljanje metapodacima te podržava suradnju i ponovno korištenje podataka.

TextQL
textql.com
TextQL je virtualni analitičar podataka za tvrtke: odgovara na upite na engleskom, izvodi analize, vizualizacije i modele, integrira se u postojeće podatkovne sustave i upravlja katalogom.

Shaip
shaip.com
Shaip pruža kvalitetne, anotirane podatke (tekst, audio, slika, video) i alat za odgovorno usklađivanje i evaluaciju LLM‑ova za razvoj nepristranih AI/ML modela.

Collibra
collibra.com
Collibra je platforma za katalogizaciju i upravljanje podacima: inventarizira podatke, bilježi metapodatke, prati podrijetlo te upravlja privatnošću i usklađenošću.

Workstream.io
workstream.io
Workstream olakšava pristup analitičkim podacima i alatima, omogućujući timovima izvlačenje korisnih informacija iz podataka za donošenje poslovnih odluka.

Sama AI
sama.com
Sama AI pruža označavanje podataka za računalni vid, isporučujući točne i skalabilne anotacije za razvoj poslovnih AI modela uz naglasak na etički pristup.

Denodo
denodo.com
Denodo povezuje i virtualizira podatke iz različitih izvora u stvarnom vremenu, omogućujući pristup, upravljanje i isporuku bez premještanja podataka.

CastorDoc
castordoc.com
CastorDoc je alat za otkrivanje i katalogizaciju podataka: centralizira, dokumentira i olakšava traženje, razumijevanje i suradnju oko podataka u tvrtki.

Erisna
erisna.com
Erisna je platforma za katalogizaciju i pretraživanje podataka koja povezuje izvore (Redshift, BigQuery, Synapse, Snowflake, PostgreSQL, SQL Server), stvara rječnik, otkriva osjetljive podatke i podržava upravljanje.

Select Star
selectstar.com
Select Star je platforma za metapodatke koja automatski analizira i dokumentira podatke, pruža katalog, sljedivost, analizu korištenja i AI asistente te pomaže u upravljanju, migracijama, samoposlužnoj analitici i optimizaciji troškova.

Secoda
secoda.co
Secoda je platforma za upravljanje podacima koja povezuje izvore, katalogizira imovinu, prati kvalitetu i linearnost podataka te omogućuje pretraživanje i suradnju između tehničkih i poslovnih korisnika.

Dataland
dataland.io
Dataland je platforma za izradu i upravljanje internim alatima za integraciju, obradu, analizu i vizualizaciju podataka za poslovne korisnike.

Traceye
traceye.io
Traceye je platforma za indeksiranje podataka koja omogućuje izradu i postavljanje subgrafa te brz, siguran i skalabilan pristup indeksiranim blockchain podacima.

Decube
decube.io
Decube je platforma za praćenje kvalitete podataka: automatski nadzire i testira podatke, otkriva promjene shema, katalogizira metapodatke i uspoređuje razlike u podacima.