Deep learning software refers to a category of software tools and frameworks designed to facilitate the creation, training, and deployment of deep learning models. Deep learning is a subset of machine learning that involves training artificial neural networks with many layers (hence the term "deep") to learn representations of data. Deep learning software typically provides functionalities such as: * Neural network architecture design: Tools for designing and customizing the architecture of deep neural networks, including specifying the number of layers, types of layers (e.g., convolutional, recurrent), and connections between layers. * Data preprocessing and augmentation: Utilities for preparing and preprocessing input data for training deep learning models, including tasks such as normalization, data augmentation, and feature extraction. * Model training and optimization: Algorithms and techniques for training deep learning models on large datasets, including optimization algorithms like stochastic gradient descent, and methods for handling overfitting such as regularization and dropout. * Model evaluation and validation: Tools for evaluating the performance of trained models on validation and test datasets, including metrics such as accuracy, precision, recall, and F1-score. * Deployment and inference: Facilities for deploying trained deep learning models into production environments for inference on new data, often through integration with software development frameworks and platforms. Popular deep learning software frameworks include TensorFlow, PyTorch, Keras, and Caffe. These frameworks provide high-level abstractions and APIs that make it easier for developers and researchers to build and experiment with deep learning models without having to implement everything from scratch.

Chooch
Chooch automatski analizira slike i video, prepoznaje objekte i radnje, pretražuje vizualne podatke i šalje upozorenja radi automatizacije nadzora i izvještavanja.

PodcastAI
PodcastAI koristi AI za transkripciju, prepoznavanje govornika, obradu zvuka, automatsko generiranje metapodataka i omogućavanje interakcija s AI u produkciji podcasta.

Faceplusplus
Face++ je platforma računalnog vida koja putem API-ja otkriva i analizira lica na slikama (detekcija, atributi, identifikacija).

Speechace
SpeechAce koristi prepoznavanje govora za transkripciju i objektivnu procjenu izgovora, vokabulara, gramatike i tečnosti.

Face Age
Face Age analizira kožu lica (bore, pore, akne, podočnjake) za procjenu dobi i stanja kože te se jednostavno integrira u postojeće e‑commerce platforme.

ArtPro
ArtPro je softver za upravljanje inventarom umjetnina koji omogućuje katalogizaciju, arhiviranje, praćenje, dijeljenje i pohranu umjetničkih djela online.

Philips SpeechLive
Philips SpeechLive je cloud aplikacija za diktiranje, transkripciju i prepoznavanje govora; snima glas, pretvara ga u tekst i omogućuje sigurnu pohranu te suradnju.

Flipner AI
Flipner AI pretvara glasovne snimke u tekst i nudi spremište za audio i tekstualne bilješke te ih organizira u nacrte i gotove članke.

INTSIG
INTSIG razvija aplikacije i API-je za skeniranje i OCR dokumenata, prepoznavanje vizitki i ID-a, upravljanje dokumentima, eKYC i automatizaciju obrade računa.

CrystalSound
CrystalSound je desktop aplikacija koja uklanja neželjene zvukove (pozadinu, odjek, tuđe glasove) tijekom poziva, snimanja i online sastanaka; radi na Windows, Mac i Linux.

DeepLobe
DeepLobe omogućuje organizacijama bez kodiranja trenirati, izgraditi i integrirati AI modele za računalni vid i analizu teksta.

Scribbl
Scribbl automatski snima i transkribira sastanke, razlaže ih na teme i zadatke, omogućuje označavanje trenutaka putem Chrome ekstenzije i jednostavno dijeljenje zapisa.

Capsolver
Capsolver automatski rješava razne CAPTCHA izazove (reCAPTCHA, hCaptcha, FunCaptcha, image-to-text itd.) putem API-ja, omogućujući pouzdanu integraciju u automatizaciju i scraping.

SpeechFlow
SpeechFlow pretvara audio i video u tekst na 14 jezika; nudi online alat i API, prepoznavanje govornika, vremenske oznake i brze, točne transkripcije.

Relu
Relu razvija AI komponentu koja automatski pretvara 3D medicinske snimke u virtualnog pacijenta i integrira se u postojeći stomatološki radni tijek/softver.

Voxpow
VoxPow pretvara govor u tekst na webu, podržava 100+ jezika i varijanti te se integrira izravno u web stranice besplatno.

hasty.ai
Hasty (sada dio CloudFactory) nudi alat za označavanje slika i videa s podrškom AI i ljudskom provjerom za izradu modela spremnih za produkciju.

Picovoice
Picovoice je platforma za dodavanje glasovne funkcionalnosti: obrada govora na uređaju ili u oblaku, transkripcija, prepoznavanje naredbi, detekcija aktivnosti i prepoznavanje govornika.

SentiSight.ai
SentiSight.ai je web-platforma za označavanje slika i razvoj/obuči AI modela za prepoznavanje (klasifikacija, detekcija, pretraga sličnosti), uz timsko označavanje i pretrenirane modele.

OMNIOUS.AI
OMNIOUS.AI OMNICOMMERCE omogućuje e-trgovinama vizualno pretraživanje proizvoda i personalizirane preporuke za kupce.

Landing AI
Landing AI je platforma za računalni vid koja omogućuje jednostavno kreiranje, označavanje, treniranje i implementaciju modela bez potrebe za kodiranjem, za oblak i edge.

Talkatoo
Talkatoo je stolna aplikacija za pretvaranje govora u tekst za medicinske i veterinarske zapise (Windows/Mac). Prepoznaje medicinske termine; ponekad sporo ili promaši rijetke riječi.

Vue.ai
Vue.ai je AI platforma koja tvrtkama omogućuje analizu slike, videa i teksta te pruža API-je i alate za automatizirano označavanje, pretraživanje, preporuke i upravljanje sadržajem.

Enablex.ai
Enablex.ai je CPaaS platforma koja omogućava integraciju video, glasovnih poziva, SMS-a i WhatsApp poruka putem API-ja, SDK-a i niskokodnih rješenja.

LumenVox
LumenVox nudi prepoznavanje govora (ASR) s transkripcijom, text-to-speech i autentifikaciju glasa te alate za podešavanje; podržava lokalnu, oblačnu i hibridnu implementaciju.

Nyckel
Nyckel omogućuje jednostavnu klasifikaciju slika i teksta: izradite vlastiti model bez znanja o strojnome učenju u nekoliko minuta.

Jupitrr
Jupitrr pretvara glasovne zapise i podcaste u personalizirane videozapise koristeći AI; automatski dodaje stock snimke, titlove, grafikone i podržava više jezika.

Vatis Tech
Vatis Tech je API i web platforma koja automatski pretvara audio/video u tekst (u stvarnom vremenu ili iz snimki) s podrškom za diarizaciju, interpunkciju i detekciju entiteta.

Dubber
Dubber snima pozive u oblaku za usklađenost i poboljšanje prodaje i službi; automatski pohranjuje razgovore, pruža transkripte, pretraživanje, analizu sentimenta i obavijesti.

SpeechWrite
SpeechWrite omogućuje digitalni diktat, automatsku transkripciju govora i upravljanje tijekovima rada za zdravstvene, pravne i profesionalne timove.

Synth
Synth prepisuje, prevodi i analizira poslovne pozive i sastanke, automatski sažima razgovore, sinkronizira CRM, i pruža uvidе u stvarnom vremenu te prediktivne preporuke.

VisionBot
VisionBot omogućuje terenskom osoblju suradnju pomoću AI za tekst i slike radi boljeg izvještavanja, upravljanja događajima i brže provedbe projekata.

Uniphore
Uniphore je platforma za razgovornu AI koja prepoznaje govor, analizira osjećaje, pomaže agentima u stvarnom vremenu i daje uvide u korisničke interakcije.

Phonexia
Phonexia je aplikacija za provjeru i prepoznavanje govornika; autentificira korisnike glasom i integrira se u postojeće sustave za bržu i sigurniju provjeru identiteta.

Shownotes
Shownotes automatski sažima podcast epizode, kreira stranicu s punim transkriptom i datotekom titlova, može generirati citat i blog post; dostupni su Free, Creator i Pro planovi.

Thirdlane
Thirdlane Connect je aplikacija za komunikaciju i suradnju koja pruža chat, glasovne i video pozive, konferencije, dijeljenje zaslona/datoteka te integraciju s CRM/PBX.

Imagga
Imagga je cloud i lokalni API za automatsko označavanje, kategorizaciju i prepoznavanje slika i videa; omogućuje prilagođeno treniranje i obradu velikih količina medija.

Crescendo
Crescendo pruža sustave za dokumentaciju, digitalno diktiranje, obradu govora, transkripciju i upravljanje radnim tokovima za medicinski, pravni, policijski i osiguravajući sektor.

Spokestack
Spokestack je platforma i skup otvorenih biblioteka za glas: prepoznavanje govora (ASR), detekciju glasovnosti, wakeword, TTS, prilagođeni glas i NLU za glasovne naredbe i diktat.

ximilar
Ximilar nudi platformu za računalni vid i vizualnu pretragu: izrada prilagođenih modela za prepoznavanje slika, detekciju objekata, OCR, označavanje i preporuke proizvoda.

Partium
Partium je aplikacija za brzu pretragu rezervnih dijelova; omogućuje pronalazak, potvrdu i narudžbu točnih dijelova te poboljšava podatke o dijelovima.

Dragonfruit AI
Dragonfruit AI pruža platformu za video nadzor i analitiku za više lokacija: VMS, alarmi, upravljanje zalihama, maloprodajni uvidi i otkrivanje prijevara pri samoposluženju.

MobileEngine
MobileEngine: aplikacija za pretraživanje i prepoznavanje slika; omogućuje pronalazak i identifikaciju sličnih slika.

Syte
Syte je platforma za e-trgovinu koja koristi vizualni AI za vizualnu pretragu, personalizirane preporuke, automatsko označavanje proizvoda i podršku upravljanju zalihama.

NoahFace
NoahFace pretvara iPad/telefon u sustav za evidenciju radnog vremena i posjetitelja s prepoznavanjem lica, radom offline, mobilnim prijavama, geolokacijom i opcionalnim provjerama temperature i alkohola.

VoxSciences
VoxSciences pretvara govornu poštu u tekst i šalje ga na mobilni kao SMS i/ili e‑poštu.

CueMe
CueME povezuje igrače biljarda za igru uživo ili virtualno (singl, double, turniri), nudi video, bodovanje i rangiranje te dodjeljuje CueME žetone za pobjede i postignuća.

Wicket
Wicket je platforma za prepoznavanje lica koja uz poštovanje privatnosti omogućuje brzu (ispod 1 s) provjeru identiteta za ulaske i upravljanje pristupom na sportskim i drugim događajima.

SpeedSize
SpeedSize koristi AI za optimizaciju slika i videa: smanjuje veličinu uz zadržavanje kvalitete, automatski dostavlja optimalne formate (AVIF/WebP) i radi s CDN-ovima.

CloudSight
CloudSight prepoznaje i opisuje sadržaj slika; nudi aplikacije za vizualnu pretragu i pomoć slabovidnima te API za integraciju prepoznavanja slike.

Waanee AI
Waanee AI je platforma koja agregira generativne AI i govorne modele za kontakt centre: nudi IVR, CRM integraciju, dialer i virtualne agente za automatizaciju poziva, nadzor i pomoć agentima.

Blitline
Blitline omogućuje sigurno, višeformatno i skalabilno obradu datoteka za softverske i medijske tvrtke s CMS/DAM sustavima.

Yactraq
Yactraq analizira snimke poziva i glas korisnika (VoC), pruža govornu analitiku, prediktivno rangiranje leadova i podršku za virtualne agente.

Spellex
Spellex je aplikacija za provjeru pravopisa, diktiranje i asistivnu jezičnu podršku te upravljanje korisničkim računima i resursima za poboljšanje pisanja.

Recognosco
Recognosco je SDK za prepoznavanje govora temeljen na dubokom učenju; omogućuje partnerima integraciju govornog unosa i specijalizirane rječnike (zdravstvo, pravo), lokalno ili u oblaku.

DigitSquare
DigitSquare je SaaS platforma za označavanje podataka, treniranje i automatizaciju računalnog vida s velikim skupovima podataka, uključujući slike, video i tekst.

Cochl
Cochl razvija tehnologiju za strojno slušanje. Pruža AI sustav za prepoznavanje zvukova programerima i tvrtkama.

Emozo Labs
Emozo Labs je SaaS DIY platforma za istraživanja i prikupljanje povratnih informacija: mjeri emocionalne i ponašajne reakcije te ankete za procjenu digitalnog sadržaja bez instalacije.

Cogniphi
Cogniphi AIVI je platforma računalnog vida koja koristi strojno učenje i otkrivanje anomalija za nadzor i analizu u proizvodnji, maloprodaji, zdravstvu i sigurnosti.

Zippin
Zippin omogućuje bezblagajni sustav kupovine: prati proizvode kamerama i senzorima, automatski obračunava kupnje pri izlazu i pruža trgovcima podatke o ponašanju i zalihama.
© 2026 WebCatalog, Inc.