WebCatalog

Voice recognition software transforms spoken language into text through speech recognition algorithms. It serves diverse purposes, aiding people with disabilities, powering in-car systems, supporting military operations, and facilitating business dictation. Additionally, it converts audio and video files into text, serving in customer service, healthcare, and legal documentation processes. Businesses leverage voice recognition software to enhance communication, translating interactions into a manageable, searchable data format. Advanced solutions incorporate artificial intelligence and biometric voice recognition technologies. Some offer APIs or web services for seamless integration with web pages or other software like call center tools. To be included in the Voice Recognition category, a product should: * Support various natural languages with comprehensive vocabularies and recognition models. * Enable document creation and sharing using text converted through voice recognition. * Process diverse audio and video file formats. * Provide updates to language models and allow user-driven vocabulary improvements. * Offer adaptive features for transcribing noisy speech. * Capture information from telephones, handheld recorders, or mobile devices.

Otter

Otter snima glasovne razgovore i stvara automatske transkripte s označavanjem govornika; uključuje audio, fotografije i ključne fraze te omogućuje pretraživanje, dijeljenje i suradnju.

OpenAI Platform

OpenAI Platforma omogućuje pristup AI modelima za generiranje i obradu teksta, prijevod, stvaranje slika, automatizaciju zadataka i integraciju preko API-ja te realno-vremenske razgovore.

Notta

Notta je AI alat za transkripciju i sažimanje govora na više jezika, radi u realnom vremenu, integrira se s video konferencijama i omogućuje uređivanje, pretraživanje i dijeljenje transkripata.

Jasper

Jasper je AI alat za pisanje koji generira sadržaj u tonu vaše marke za blogove, društvene mreže, e-poštu i platforme, s ekstenzijom za preglednik i sigurnosnim značajkama.

SpeechTexter

Pretvara govor u tekst pomoću diktiranja glasom; web-aplikacija koja podržava više od 70 jezika.

DeepAI

DeepAI pruža alate za obradu slike i videa, obradu prirodnog jezika, chat-agente i generiranje AI slika za integraciju u aplikacije i automatizaciju zadataka.

Speechnotes

Speechnotes je alat za govor u tekst: u stvarnom vremenu pretvara govor u tekst, diktira i automatski transkribira audio/video zapise te omogućuje uređivanje i izvoz dokumenata.

PromptSmart

PromptSmart je teleprompter aplikacija koja prati glas govornika i automatski pomiče tekst; uključuje digitalne bilješke za ključne poruke.

Krisp

Krisp uklanja pozadinsku buku i odjeke u pozivima pomoću AI, nudi transkripcije, snimanje i sažete bilješke sastanaka te prilagodbu naglaska za kontakt centre.

Deepgram

Deepgram nudi API za automatsku transkripciju i razumijevanje govora (sažeci, sentiment, teme), podržava streaming, više jezika, prilagodljive modele i on‑prem ili cloud raspoređivanje.

Jammable

Jammable je web platforma za izradu AI covera i glasovnih modela: nudi biblioteku AI glasova, ekstrakciju acapella, uklanjanje reverba/tišine i kreiranje duet covera.

Speech to Note

Speech to Note pretvara govor u tekst u stvarnom vremenu i stvara sažete bilješke koje možete uređivati, organizirati u mape i čitati naglas.

Gladia

Gladia je platforma koja putem API-ja pretvara govor u tekst u stvarnom vremenu i asinhrono, podržava 99 jezika i omogućuje brzu i točnu transkripciju.

Resemble.ai

Resemble.ai stvara prilagođene AI glasove pomoću tekst‑u‑govor i govor‑u‑govor tehnologije, prevodi i lokalizira glas u do 100 jezika te omogućava izmjene postojećeg govora.

Dictanote

Dictanote omogućuje unošenje bilješki glasom i automatsku pretvorbu govora u tekst (50+ jezika) te Chrome proširenje za tipkanje glasom.

Recordator

Recordator je aplikacija za snimanje dolaznih i odlaznih telefonskih poziva na mobilnim uređajima, bez zahtjevnog podešavanja, za pohranu i upravljanje snimkama.

Voiceitt

Voiceitt je aplikacija koja u stvarnom vremenu prevodi nesandardni govor u razumljiv tekst ili glas, omogućujući komunikaciju i korištenje glasovnih uređaja.

SoundHound

SoundHound je glasovna AI platforma koja omogućuje tvrtkama prepoznavanje govora, razumijevanje upita i upravljanje glasovnim sučeljima u uređajima i automobilima.

Hour One

Hour One je AI platforma za stvaranje personaliziranih poslovnih videozapisa: pretvara tekst u govor s virtualnim avatarima, nudi predloške, glasove i osnovne opcije brendiranja.

Speechlogger

Web-aplikacija za prepoznavanje govora i prijevod uživo; nudi automatsku interpunkciju, automatsko spremanje, vremenske oznake, uređivanje teksta, transkripciju audiozapisa, izvoz, identifikaciju govornika i analizu sentimenta.

Dictalogic

Dictalogic pretvara audio i govor u tekst (diktat, real-time, transkripcija razgovora s identifikacijom govornika) i omogućuje upravljanje delegiranjem zadataka kroz jednu nadzornu ploču.

AI Voice Detector

AI Voice Detector je alat za provjeru autentičnosti govora: razlikuje računalno generirane i ljudske glasove, pomaže otkriti manipulacije, prevare i plagijat u audiozapisima.

ai-coustics

AI platforma za poboljšanje govora u stvarnom vremenu, s API/SDK alatima za detekciju glasa, čišćenje zvuka i izolaciju govornika.

Altered

Altered je audio editor koji ujedinjuje više tehnologija glasovne AI za izradu visokokvalitetnog glasovnog sadržaja za podcaste, videoigre i e-učenje.

AssemblyAI

AssemblyAI pretvara govor u tekst i analizira audio: transkripcija, sažeci, analiza sentimenta, detekcija tema, moderacija i uklanjanje PII.

Speechace

SpeechAce koristi prepoznavanje govora za transkripciju i objektivnu procjenu izgovora, vokabulara, gramatike i tečnosti.

Speechmatics

Speechmatics pretvara govor u tekst (u stvarnom vremenu i iz snimki), prepoznaje jezike, dijalekte i više govornika te nudi sažetke, teme, sentiment i prijevod.

Kukarella

Kukarella je alat za AI glasovne komentare i sinhronizaciju s pristupom stotinama glasova, prijevodima i dubingom, transkripciju, prepoznavanje teksta na slikama i izvlačenje teksta s weba; komercijalna prava uključena.

PodcastAI

PodcastAI koristi AI za transkripciju, prepoznavanje govornika, obradu zvuka, automatsko generiranje metapodataka i omogućavanje interakcija s AI u produkciji podcasta.

Scribbl

Scribbl automatski snima i transkribira sastanke, razlaže ih na teme i zadatke, omogućuje označavanje trenutaka putem Chrome ekstenzije i jednostavno dijeljenje zapisa.

SpeechFlow

SpeechFlow pretvara audio i video u tekst na 14 jezika; nudi online alat i API, prepoznavanje govornika, vremenske oznake i brze, točne transkripcije.

Philips SpeechLive

Philips SpeechLive je cloud aplikacija za diktiranje, transkripciju i prepoznavanje govora; snima glas, pretvara ga u tekst i omogućuje sigurnu pohranu te suradnju.

Flipner AI

Flipner AI pretvara glasovne snimke u tekst i nudi spremište za audio i tekstualne bilješke te ih organizira u nacrte i gotove članke.

ArtPro

ArtPro je softver za upravljanje inventarom umjetnina koji omogućuje katalogizaciju, arhiviranje, praćenje, dijeljenje i pohranu umjetničkih djela online.

Picovoice

Picovoice je platforma za dodavanje glasovne funkcionalnosti: obrada govora na uređaju ili u oblaku, transkripcija, prepoznavanje naredbi, detekcija aktivnosti i prepoznavanje govornika.

CrystalSound

CrystalSound je desktop aplikacija koja uklanja neželjene zvukove (pozadinu, odjek, tuđe glasove) tijekom poziva, snimanja i online sastanaka; radi na Windows, Mac i Linux.

SpeechWrite

SpeechWrite omogućuje digitalni diktat, automatsku transkripciju govora i upravljanje tijekovima rada za zdravstvene, pravne i profesionalne timove.

LumenVox

LumenVox nudi prepoznavanje govora (ASR) s transkripcijom, text-to-speech i autentifikaciju glasa te alate za podešavanje; podržava lokalnu, oblačnu i hibridnu implementaciju.

Talkatoo

Talkatoo je stolna aplikacija za pretvaranje govora u tekst za medicinske i veterinarske zapise (Windows/Mac). Prepoznaje medicinske termine; ponekad sporo ili promaši rijetke riječi.

Dubber

Dubber snima pozive u oblaku za usklađenost i poboljšanje prodaje i službi; automatski pohranjuje razgovore, pruža transkripte, pretraživanje, analizu sentimenta i obavijesti.

Thirdlane

Thirdlane Connect je aplikacija za komunikaciju i suradnju koja pruža chat, glasovne i video pozive, konferencije, dijeljenje zaslona/datoteka te integraciju s CRM/PBX.

Synth

Synth prepisuje, prevodi i analizira poslovne pozive i sastanke, automatski sažima razgovore, sinkronizira CRM, i pruža uvidе u stvarnom vremenu te prediktivne preporuke.

Uniphore

Uniphore je platforma za razgovornu AI koja prepoznaje govor, analizira osjećaje, pomaže agentima u stvarnom vremenu i daje uvide u korisničke interakcije.

Datch

Datch koristi AI za strukturirano prikupljanje točnih izvještaja s terena i pruža uvid u imovinu radi bržeg donošenja odluka, planiranja i upravljanja resursima.

Jupitrr

Jupitrr pretvara glasovne zapise i podcaste u personalizirane videozapise koristeći AI; automatski dodaje stock snimke, titlove, grafikone i podržava više jezika.

Voxpow

VoxPow pretvara govor u tekst na webu, podržava 100+ jezika i varijanti te se integrira izravno u web stranice besplatno.

Vatis Tech

Vatis Tech je API i web platforma koja automatski pretvara audio/video u tekst (u stvarnom vremenu ili iz snimki) s podrškom za diarizaciju, interpunkciju i detekciju entiteta.

Shownotes

Shownotes automatski sažima podcast epizode, kreira stranicu s punim transkriptom i datotekom titlova, može generirati citat i blog post; dostupni su Free, Creator i Pro planovi.

CueMe

CueME povezuje igrače biljarda za igru uživo ili virtualno (singl, double, turniri), nudi video, bodovanje i rangiranje te dodjeljuje CueME žetone za pobjede i postignuća.

Crescendo

Crescendo pruža sustave za dokumentaciju, digitalno diktiranje, obradu govora, transkripciju i upravljanje radnim tokovima za medicinski, pravni, policijski i osiguravajući sektor.

Spokestack

Spokestack je platforma i skup otvorenih biblioteka za glas: prepoznavanje govora (ASR), detekciju glasovnosti, wakeword, TTS, prilagođeni glas i NLU za glasovne naredbe i diktat.

Phonexia

Phonexia je aplikacija za provjeru i prepoznavanje govornika; autentificira korisnike glasom i integrira se u postojeće sustave za bržu i sigurniju provjeru identiteta.

VoxSciences

VoxSciences pretvara govornu poštu u tekst i šalje ga na mobilni kao SMS i/ili e‑poštu.

Yactraq

Yactraq analizira snimke poziva i glas korisnika (VoC), pruža govornu analitiku, prediktivno rangiranje leadova i podršku za virtualne agente.

Spellex

Spellex je aplikacija za provjeru pravopisa, diktiranje i asistivnu jezičnu podršku te upravljanje korisničkim računima i resursima za poboljšanje pisanja.

Recognosco

Recognosco je SDK za prepoznavanje govora temeljen na dubokom učenju; omogućuje partnerima integraciju govornog unosa i specijalizirane rječnike (zdravstvo, pravo), lokalno ili u oblaku.

Cochl

Cochl razvija tehnologiju za strojno slušanje. Pruža AI sustav za prepoznavanje zvukova programerima i tvrtkama.

Jotengine

Jotengine pretvara razgovore i sastanke u tekst: audio transkripte i titlove za video.

Voice Recognition Software - Najpopularnije aplikacije