Voice recognition software transforms spoken language into text through speech recognition algorithms. It serves diverse purposes, aiding people with disabilities, powering in-car systems, supporting military operations, and facilitating business dictation. Additionally, it converts audio and video files into text, serving in customer service, healthcare, and legal documentation processes. Businesses leverage voice recognition software to enhance communication, translating interactions into a manageable, searchable data format. Advanced solutions incorporate artificial intelligence and biometric voice recognition technologies. Some offer APIs or web services for seamless integration with web pages or other software like call center tools. To be included in the Voice Recognition category, a product should: * Support various natural languages with comprehensive vocabularies and recognition models. * Enable document creation and sharing using text converted through voice recognition. * Process diverse audio and video file formats. * Provide updates to language models and allow user-driven vocabulary improvements. * Offer adaptive features for transcribing noisy speech. * Capture information from telephones, handheld recorders, or mobile devices.

Otter
Otter snima glasovne razgovore i stvara automatske transkripte s označavanjem govornika; uključuje audio, fotografije i ključne fraze te omogućuje pretraživanje, dijeljenje i suradnju.

OpenAI Platform
OpenAI Platforma omogućuje pristup AI modelima za generiranje i obradu teksta, prijevod, stvaranje slika, automatizaciju zadataka i integraciju preko API-ja te realno-vremenske razgovore.

Notta
Notta je AI alat za transkripciju i sažimanje govora na više jezika, radi u realnom vremenu, integrira se s video konferencijama i omogućuje uređivanje, pretraživanje i dijeljenje transkripata.

Jasper
Jasper je AI alat za pisanje koji generira sadržaj u tonu vaše marke za blogove, društvene mreže, e-poštu i platforme, s ekstenzijom za preglednik i sigurnosnim značajkama.

Speechnotes
Speechnotes je alat za govor u tekst: u stvarnom vremenu pretvara govor u tekst, diktira i automatski transkribira audio/video zapise te omogućuje uređivanje i izvoz dokumenata.

DeepAI
DeepAI pruža alate za obradu slike i videa, obradu prirodnog jezika, chat-agente i generiranje AI slika za integraciju u aplikacije i automatizaciju zadataka.

Krisp
Krisp uklanja pozadinsku buku i odjeke u pozivima pomoću AI, nudi transkripcije, snimanje i sažete bilješke sastanaka te prilagodbu naglaska za kontakt centre.

SpeechTexter
Pretvara govor u tekst pomoću diktiranja glasom; web-aplikacija koja podržava više od 70 jezika.

PromptSmart
PromptSmart je teleprompter aplikacija koja prati glas govornika i automatski pomiče tekst; uključuje digitalne bilješke za ključne poruke.

Speech to Note
Speech to Note pretvara govor u tekst u stvarnom vremenu i stvara sažete bilješke koje možete uređivati, organizirati u mape i čitati naglas.

Jammable
Jammable je web platforma za izradu AI covera i glasovnih modela: nudi biblioteku AI glasova, ekstrakciju acapella, uklanjanje reverba/tišine i kreiranje duet covera.

Gladia
Gladia je platforma koja putem API-ja pretvara govor u tekst u stvarnom vremenu i asinhrono, podržava 99 jezika i omogućuje brzu i točnu transkripciju.

Resemble.ai
Resemble.ai stvara prilagođene AI glasove pomoću tekst‑u‑govor i govor‑u‑govor tehnologije, prevodi i lokalizira glas u do 100 jezika te omogućava izmjene postojećeg govora.

Deepgram
Deepgram nudi API za automatsku transkripciju i razumijevanje govora (sažeci, sentiment, teme), podržava streaming, više jezika, prilagodljive modele i on‑prem ili cloud raspoređivanje.

Dictanote
Dictanote omogućuje unošenje bilješki glasom i automatsku pretvorbu govora u tekst (50+ jezika) te Chrome proširenje za tipkanje glasom.

Kukarella
Kukarella je alat za AI glasovne komentare i sinhronizaciju s pristupom stotinama glasova, prijevodima i dubingom, transkripciju, prepoznavanje teksta na slikama i izvlačenje teksta s weba; komercijalna prava uključena.

Recordator
Recordator je aplikacija za snimanje dolaznih i odlaznih telefonskih poziva na mobilnim uređajima, bez zahtjevnog podešavanja, za pohranu i upravljanje snimkama.

Voiceitt
Voiceitt je aplikacija koja u stvarnom vremenu prevodi nesandardni govor u razumljiv tekst ili glas, omogućujući komunikaciju i korištenje glasovnih uređaja.

Speechlogger
Web-aplikacija za prepoznavanje govora i prijevod uživo; nudi automatsku interpunkciju, automatsko spremanje, vremenske oznake, uređivanje teksta, transkripciju audiozapisa, izvoz, identifikaciju govornika i analizu sentimenta.

AssemblyAI
AssemblyAI pretvara govor u tekst i analizira audio: transkripcija, sažeci, analiza sentimenta, detekcija tema, moderacija i uklanjanje PII.

Datch
Datch koristi AI za strukturirano prikupljanje točnih izvještaja s terena i pruža uvid u imovinu radi bržeg donošenja odluka, planiranja i upravljanja resursima.

SoundHound
SoundHound je glasovna AI platforma koja omogućuje tvrtkama prepoznavanje govora, razumijevanje upita i upravljanje glasovnim sučeljima u uređajima i automobilima.

Dictalogic
Dictalogic pretvara audio i govor u tekst (diktat, real-time, transkripcija razgovora s identifikacijom govornika) i omogućuje upravljanje delegiranjem zadataka kroz jednu nadzornu ploču.

Hour One
Hour One je AI platforma za stvaranje personaliziranih poslovnih videozapisa: pretvara tekst u govor s virtualnim avatarima, nudi predloške, glasove i osnovne opcije brendiranja.

Voxpow
VoxPow pretvara govor u tekst na webu, podržava 100+ jezika i varijanti te se integrira izravno u web stranice besplatno.

AI Voice Detector
AI Voice Detector je alat za provjeru autentičnosti govora: razlikuje računalno generirane i ljudske glasove, pomaže otkriti manipulacije, prevare i plagijat u audiozapisima.

ai|coustics
ai|coustics poboljšava kvalitetu govornog zvuka: uklanja šum, rezonance i artefakte, obnavlja izgubljene frekvencije te radi na više platformi putem API/SDK-a.

Speechmatics
Speechmatics pretvara govor u tekst (u stvarnom vremenu i iz snimki), prepoznaje jezike, dijalekte i više govornika te nudi sažetke, teme, sentiment i prijevod.

Symbl.ai
Symbl.ai pruža API za prepoznavanje govora i analizu razgovora u stvarnom vremenu i asinkrono: transkripcija, izdvajanje ključnih riječi, tema, namjere i metrike razgovora.

Altered
Altered je audio editor koji ujedinjuje više tehnologija glasovne AI za izradu visokokvalitetnog glasovnog sadržaja za podcaste, videoigre i e-učenje.

PodcastAI
PodcastAI koristi AI za transkripciju, prepoznavanje govornika, obradu zvuka, automatsko generiranje metapodataka i omogućavanje interakcija s AI u produkciji podcasta.

Flipner AI
Flipner AI pretvara glasovne snimke u tekst i nudi spremište za audio i tekstualne bilješke te ih organizira u nacrte i gotove članke.

Jupitrr
Jupitrr pretvara glasovne zapise i podcaste u personalizirane videozapise koristeći AI; automatski dodaje stock snimke, titlove, grafikone i podržava više jezika.

ArtPro
ArtPro je softver za upravljanje inventarom umjetnina koji omogućuje katalogizaciju, arhiviranje, praćenje, dijeljenje i pohranu umjetničkih djela online.

CrystalSound
CrystalSound je desktop aplikacija koja uklanja neželjene zvukove (pozadinu, odjek, tuđe glasove) tijekom poziva, snimanja i online sastanaka; radi na Windows, Mac i Linux.

Scribbl
Scribbl automatski snima i transkribira sastanke, razlaže ih na teme i zadatke, omogućuje označavanje trenutaka putem Chrome ekstenzije i jednostavno dijeljenje zapisa.

Picovoice
Picovoice je platforma za dodavanje glasovne funkcionalnosti: obrada govora na uređaju ili u oblaku, transkripcija, prepoznavanje naredbi, detekcija aktivnosti i prepoznavanje govornika.

Speechace
SpeechAce koristi prepoznavanje govora za transkripciju i objektivnu procjenu izgovora, vokabulara, gramatike i tečnosti.

Talkatoo
Talkatoo je stolna aplikacija za pretvaranje govora u tekst za medicinske i veterinarske zapise (Windows/Mac). Prepoznaje medicinske termine; ponekad sporo ili promaši rijetke riječi.

SpeechWrite
SpeechWrite omogućuje digitalni diktat, automatsku transkripciju govora i upravljanje tijekovima rada za zdravstvene, pravne i profesionalne timove.

Philips SpeechLive
Philips SpeechLive je cloud aplikacija za diktiranje, transkripciju i prepoznavanje govora; snima glas, pretvara ga u tekst i omogućuje sigurnu pohranu te suradnju.

SpeechFlow
SpeechFlow pretvara audio i video u tekst na 14 jezika; nudi online alat i API, prepoznavanje govornika, vremenske oznake i brze, točne transkripcije.

Vatis Tech
Vatis Tech je API i web platforma koja automatski pretvara audio/video u tekst (u stvarnom vremenu ili iz snimki) s podrškom za diarizaciju, interpunkciju i detekciju entiteta.

LumenVox
LumenVox nudi prepoznavanje govora (ASR) s transkripcijom, text-to-speech i autentifikaciju glasa te alate za podešavanje; podržava lokalnu, oblačnu i hibridnu implementaciju.

Uniphore
Uniphore je platforma za razgovornu AI koja prepoznaje govor, analizira osjećaje, pomaže agentima u stvarnom vremenu i daje uvide u korisničke interakcije.

Phonexia
Phonexia je aplikacija za provjeru i prepoznavanje govornika; autentificira korisnike glasom i integrira se u postojeće sustave za bržu i sigurniju provjeru identiteta.

Shownotes
Shownotes automatski sažima podcast epizode, kreira stranicu s punim transkriptom i datotekom titlova, može generirati citat i blog post; dostupni su Free, Creator i Pro planovi.

Thirdlane
Thirdlane Connect je aplikacija za komunikaciju i suradnju koja pruža chat, glasovne i video pozive, konferencije, dijeljenje zaslona/datoteka te integraciju s CRM/PBX.

Crescendo
Crescendo pruža sustave za dokumentaciju, digitalno diktiranje, obradu govora, transkripciju i upravljanje radnim tokovima za medicinski, pravni, policijski i osiguravajući sektor.

Spokestack
Spokestack je platforma i skup otvorenih biblioteka za glas: prepoznavanje govora (ASR), detekciju glasovnosti, wakeword, TTS, prilagođeni glas i NLU za glasovne naredbe i diktat.

Dubber
Dubber snima pozive u oblaku za usklađenost i poboljšanje prodaje i službi; automatski pohranjuje razgovore, pruža transkripte, pretraživanje, analizu sentimenta i obavijesti.

VoxSciences
VoxSciences pretvara govornu poštu u tekst i šalje ga na mobilni kao SMS i/ili e‑poštu.

CueMe
CueME povezuje igrače biljarda za igru uživo ili virtualno (singl, double, turniri), nudi video, bodovanje i rangiranje te dodjeljuje CueME žetone za pobjede i postignuća.

Synth
Synth prepisuje, prevodi i analizira poslovne pozive i sastanke, automatski sažima razgovore, sinkronizira CRM, i pruža uvidе u stvarnom vremenu te prediktivne preporuke.

Waanee AI
Waanee AI je platforma koja agregira generativne AI i govorne modele za kontakt centre: nudi IVR, CRM integraciju, dialer i virtualne agente za automatizaciju poziva, nadzor i pomoć agentima.

Yactraq
Yactraq analizira snimke poziva i glas korisnika (VoC), pruža govornu analitiku, prediktivno rangiranje leadova i podršku za virtualne agente.

Spellex
Spellex je aplikacija za provjeru pravopisa, diktiranje i asistivnu jezičnu podršku te upravljanje korisničkim računima i resursima za poboljšanje pisanja.

Recognosco
Recognosco je SDK za prepoznavanje govora temeljen na dubokom učenju; omogućuje partnerima integraciju govornog unosa i specijalizirane rječnike (zdravstvo, pravo), lokalno ili u oblaku.

Cochl
Cochl razvija tehnologiju za strojno slušanje. Pruža AI sustav za prepoznavanje zvukova programerima i tvrtkama.

Jotengine
Jotengine pretvara razgovore i sastanke u tekst: audio transkripte i titlove za video.
Rješenja
© 2026 WebCatalog, Inc.