Billedgenkendelsessoftware, også kaldet computervision, gør det muligt for applikationer at fortolke billeder eller videoer. Den behandler billeder som input og genererer output såsom etiketter eller afgrænsningsfelter gennem computervisionsalgoritmer. Det omfatter forskellige funktioner som billedgendannelse, genkendelse af objekter og scenegendannelse, typisk integreret i intelligente applikationer. Dataforskere bruger billedgenkendelsessoftware til at træne modeller, mens udviklere indarbejder billedgenkendelsesfunktioner i deres software. Formatet for adgang til denne software varierer baseret på brugernes behov, lige fra maskinlæringsbiblioteker eller rammer til API'er, SDK'er eller end-to-end platforme. Det er vigtigt at skelne billedgenkendelsessoftware fra relaterede værktøjer. Mens datavidenskab og maskinlæringsplatforme tilbyder funktioner til træning af computervisionsmodeller, har de bredere fokus. Desuden adskiller billedgenkendelse sig, selvom det er en form for maskinlæring, fra andre maskinlæringsfunktioner som anbefalingsmotorer eller mønstergenkendelse. Tekstgenkendelsessoftware falder ind under kategorien Optical Character Recognition (OCR). Mens mange billedgenkendelsessoftware tjener flere formål, er nogle specialiserede i specifikke områder som logogenkendelse, ansigtsgenkendelse, objektgenkendelse eller eksplicit indholdsgenkendelse. De håndterer muligvis kun billedfiler eller både billeder og videoer. Mens de fleste opererer i skyen, understøtter nogle desuden kantbehandling eller behandling på enheden. For at blive inkluderet i kategorien billedgenkendelse skal et produkt: * Tilbyd en dyb læringsalgoritme, der er skræddersyet til billedgenkendelse. * Interface med billeddatapuljer for at lære specifikke funktioner eller løsninger. * Accepter billeddata som input og giv en løsning som output. * Aktiver billedgenkendelsesfunktioner for andre applikationer, processer eller tjenester.
© 2026 WebCatalog, Inc.