Datamerkingsprogramvare, også kjent som opplæringsdata, datamerking eller datamerkingsprogramvare, spiller en kritisk rolle i å konvertere umerkede data til merkede data, avgjørende for å utvikle nøyaktige kunstig intelligens-algoritmer. Disse verktøyene tilbyr en rekke funksjoner, inkludert maskinlæringsassistert merking, involvering av menneskelig arbeidsstyrke eller brukerdrevet merking. Noen plattformer tillater til og med en kombinasjon av disse tilnærmingene, og tilbyr fleksibilitet i valg av merkemetoder basert på faktorer som kostnad, kvalitet og hastighet. Disse verktøyene varierer i støtte for ulike datatyper som bilder, videoer, lyd og tekst, inkludert undersett som satellittbilder og LIDAR. Merknadstyper er også forskjellige, og omfatter oppgaver som bildesegmentering, objektgjenkjenning, navngitt enhetsgjenkjenning (NER), sentimentanalyse, transkripsjon og følelsesgjenkjenning. For å sikre etikettkvalitet bruker de fleste programvare beregninger som konsensus og grunnsannhet. Denne kvalitetssikringen er avgjørende for overvåket læring, en grunnleggende maskinlæringstilnærming som krever merkede data for nøyaktige spådommer. Integrasjon med datavitenskap og maskinlæringsplattformer er vanlig, noe som letter sømløs dataoverføring fra merking til modellopplæring. For å kvalifisere for inkludering i kategorien Datamerking, integrerer et produkt vanligvis administrerte arbeidsstyrker eller datamerkingstjenester, garanterer etikettnøyaktighet og konsistens, tilbyr analyser for å overvåke merkingsnøyaktighet og hastighet, og tillater sømløs integrasjon med datavitenskap og maskinlæringsplattformer.