Otter
otter.ai
Otter es una aplicación inteligente para tomar notas que te permite recordar, buscar y compartir tus conversaciones de voz. Otter crea notas de voz inteligentes que combinan audio, transcripción, identificación del hablante, fotografías en línea y frases clave. Ayuda a empresarios, periodistas y estudiantes a estar más concentrados, colaborativos y eficientes en reuniones, entrevistas, conferencias y dondequiera que ocurran conversaciones importantes.
Google Cloud Platform
google.com
Google Cloud Platform (GCP), ofrecido por Google, es un conjunto de servicios de computación en la nube que se ejecuta en la misma infraestructura que Google usa internamente para sus productos de usuario final, como Google Search, Gmail, Almacenamiento de archivos y YouTube. Junto con un conjunto de herramientas de gestión, proporciona una serie de servicios en la nube modular que incluyen informática, almacenamiento de datos, análisis de datos y aprendizaje automático. El registro requiere una tarjeta de crédito o detalles de la cuenta bancaria. La plataforma Cloud Google proporciona infraestructura como servicio, plataforma como servicio y entornos informáticos sin servidor. En abril de 2008, Google anunció App Engine, una plataforma para desarrollar y alojar aplicaciones web en los centros de datos administrados por Google, que fue el primer servicio de computación en la nube de la compañía. El servicio generalmente estuvo disponible en noviembre de 2011. Desde el anuncio del motor de aplicaciones, Google agregó múltiples servicios en la nube a la plataforma. Google Cloud Platform es parte de Google Cloud, que incluye la infraestructura de la nube pública de Google Cloud Platform, así como las versiones G, las versiones empresariales de Android y Chrome OS, e interfaces de programación de aplicaciones (API) para los servicios de mapeo empresarial y de aprendizaje automático.
Jasper
jasper.ai
Jasper: On-Brand AI For Business crea contenido en cualquier lugar donde esté en línea, con la voz de su marca, siempre. Jasper es su asistente creativo de IA que puede aprender y escribir en el tono de su marca único. Ya sea que hables con audacia, descaro, formalmente o solo en Internet (u do u). Además, la extensión del navegador Jasper Everywhere mantiene a Jasper a su lado, desde su CMS hasta el correo electrónico, las redes sociales y la plataforma de su propia empresa con Jasper API. Lo más importante es que Jasper mantiene sus datos seguros y privados con funciones de seguridad integradas que se mantienen actualizadas a medida que evolucionan los protocolos de seguridad. Cree contenido 5 veces más rápido con inteligencia artificial. Jasper es la herramienta de redacción publicitaria de IA de la más alta calidad con más de 3000 reseñas de 5 estrellas. Lo mejor para escribir publicaciones de blogs, contenido de redes sociales y textos de marketing.
SpeechTexter
speechtexter.com
Conversor de voz a texto. Dicta con tu voz. Aplicación web gratuita para escribir con tu voz. ¡Más de 70 idiomas diferentes compatibles!
Speechnotes
speechnotes.co
Voz a texto: escritura y transcripción de voz. Tome notas con su voz de forma gratuita o transcriba automáticamente grabaciones de audio y vídeo en el momento. Seguro, preciso y súper rápido.
Notta
notta.ai
Notta es una herramienta líder de transcripción de IA y toma de notas de reuniones que ayuda a transcribir y resumir cualquier conversación de voz en texto procesable rápidamente, con 58 idiomas compatibles. *Noticia importante: ¡Airgram se une a Notta! Además de transcribir archivos de video/audio y discursos en vivo, Notta se integra con las principales plataformas de videoconferencia, incluidas Zoom, Microsoft Teams y Google Meet, para generar notas de reuniones automatizadas. También permite a los usuarios revisar, buscar, editar, exportar y compartir las transcripciones con los miembros del equipo para una colaboración perfecta. Notta le permite maximizar el valor de cada conversación.
Krisp
krisp.ai
Krisp es una aplicación inteligente diseñada para mejorar la eficiencia y claridad de las reuniones y llamadas en línea. Principalmente, utiliza IA para la cancelación de ruido, eliminando eficazmente los ruidos de fondo, las voces y los ecos durante las interacciones en línea. Esta característica garantiza una comunicación clara y de alta calidad en diversos entornos, desde conversaciones individuales hasta reuniones de equipo y centros de llamadas. Además de la cancelación de ruido, Krisp también ofrece transcripciones de reuniones en tiempo real, lo que mejora la accesibilidad y ayuda a mantener registros. Además, posee la capacidad de generar resúmenes y notas de reuniones concisas, sirviendo eficazmente como asistente de reuniones de IA. Otra característica notable es la función de grabación de reuniones de Krisp, que graba automáticamente reuniones virtuales en todas las aplicaciones de comunicación. Específicamente para entornos de centros de llamadas, Krisp proporciona una función de localización de acentos de IA que convierte los acentos de los agentes en tiempo real para que coincidan con el acento nativo de los clientes para una comunicación más clara. También transcribe de forma segura las conversaciones de agentes y clientes en tiempo real. Los servicios de la aplicación se pueden integrar en varios productos utilizando el SDK proporcionado para desarrolladores. Como herramienta de inteligencia artificial multifuncional, Krisp está dirigida a una amplia gama de usuarios, incluidos individuos, autónomos, equipos de trabajo híbridos, equipos de ventas, servicios profesionales y centros de llamadas.
DeepAI
deepai.org
Herramientas artificialmente inteligentes para humanos naturalmente creativos
Jammable
jammable.com
Cree portadas de IA usando IA en segundos con Jammable, ¡con cientos de modelos de voz de IA cargados por la comunidad disponibles para uso creativo ahora!
Resemble.ai
resemble.ai
Resemble AI crea voces de IA personalizadas utilizando modelos patentados de aprendizaje profundo que producen contenido de audio de alta calidad generado por IA mediante síntesis de texto a voz y de voz a voz. Resemble Localize, nuestra herramienta de localización multilingüe, traduce texto y puede convertir su voz de IA a hasta 100 idiomas. Resemble Fill es nuestra función de relleno generativo (audio en pintura) que le permite modificar el habla existente con su voz AI clonada. Fill se puede utilizar para revisar anuncios de audio programáticos, inserción dinámica de anuncios en streaming (SAI), asistentes de voz y más. Recientemente ganamos un premio Webby 2023 por el 'Mejor uso de la tecnología de voz' por la contribución de nuestra IA de voz a Andy Warhol Diaries de Netflix, nominada al Emmy. Además de Netflix, nos asociamos con Byju's, el Grupo del Banco Mundial, Boingo, Universal Pictures, Paramount Pictures y más.
ServiceNow
servicenow.com
ServiceNow (NYSE: NOW) hace que el mundo funcione mejor para todos. Nuestra plataforma y soluciones basadas en la nube ayudan a digitalizar y unificar las organizaciones para que puedan encontrar formas mejores, más inteligentes y más rápidas de hacer que el trabajo fluya. Así, los empleados y los clientes pueden estar más conectados, ser más innovadores y más ágiles. Y todos podemos crear el futuro que imaginamos. El mundo trabaja con ServiceNow.
Speech to Note
speechtonote.com
Speech To Note es una herramienta de reconocimiento de voz impulsada por IA que convierte el audio hablado en texto al instante. Nuestra herramienta utiliza tecnología avanzada de voz a texto para transcribir sus palabras en resúmenes concisos que puede editar o compartir. Experimente el poder de nuestra herramienta basada en IA, ya que transforma instantáneamente sus palabras habladas en un resumen conciso e informativo.
PromptSmart
promptsmart.com
PromptSmart es una aplicación de teleprompter que sigue tu voz y te ayuda a realizar vídeos o presentaciones. PromptSmart es la primera aplicación de teleprompter con reconocimiento de voz: ¡la herramienta para hablar en público más avanzada! ¡Lanzamiento en agosto de 2014! PromptSmart nació de la pasión por hablar en público. Los fundadores de PromptSmart entrenaron y orientaron a estudiantes de MBA en el arte de hablar en público. Al darnos cuenta de que muchos oradores contarían mejor con un teleprompter intuitivo controlado por un altavoz, también reconocimos que los dispositivos móviles actuales podrían abordar esta necesidad. Con esto en mente, se creó PromptSmart. PromptSmart también aborda las necesidades de los oradores que prefieren utilizar notas en lugar de discursos completamente escritos. Diseñamos la función de tarjeta de notas digital para permitir que los oradores se mantengan concentrados al realizar un seguimiento de los mensajes clave que deben cubrir. ¡El resultado final es que PromptSmart es la herramienta para hablar en público más avanzada para cualquier estilo de orador!
Clarifai
clarifai.com
Clarifai es una empresa independiente de inteligencia artificial que se especializa en visión por computadora, procesamiento del lenguaje natural y reconocimiento de audio. Clarifai, una de las primeras plataformas de aprendizaje profundo fundada en 2013, proporciona una plataforma de inteligencia artificial para datos de imágenes, videos, textos y audio no estructurados. Su plataforma admite el ciclo de vida completo de la IA para la exploración de datos, el etiquetado de datos, el entrenamiento de modelos, la evaluación y la inferencia en torno a imágenes, videos, textos y datos de audio. Clarifai, con sede en Washington DC, utiliza aprendizaje automático y redes neuronales profundas para identificar y analizar imágenes, vídeos, texto y audio de forma automática. Clarifai permite a los usuarios implementar tecnología de inteligencia artificial en sus productos a través de API, SDK móvil y/o soluciones locales.
Gladia
gladia.io
Gladia es una plataforma de infraestructura de conocimiento de IA que proporciona API plug-and-play para permitir a los usuarios aprovechar al máximo sus datos. La API Alpha de voz a texto es su última oferta y ofrece procesamiento en tiempo real y una tasa de error de palabras de tan solo el 1%. Está construido sobre Whisper Models de Open AI y es capaz de transcribir una hora de audio en solo 10 segundos. La API está disponible de forma gratuita y admite 99 idiomas. Gladia está dirigida por Jean-Louis Queguiner, fundador y director ejecutivo, y Jonathan Soto, cofundador y director de tecnología. Queguiner tiene una maestría en IA simbólica y ha creado por sí solo un chatbot para seleccionar, clasificar y unificar todas las aplicaciones de IA en una sola tienda. Soto tiene una maestría del MIT y es autor de múltiples artículos académicos. Gladia proporciona tutoriales y documentación para los usuarios, así como una llamada de incorporación personalizada con su equipo. Están comprometidos a hacer que sus API sean accesibles y más asequibles que cualquier otra cosa en el mercado, sin sacrificar la calidad.
Hour One
hourone.ai
Hour One revoluciona la creación de contenido para empresas al centralizar todos los flujos de trabajo en una plataforma impulsada por IA. Contamos con los avatares más realistas del mercado, con movimientos naturales que animan vívidamente sus mensajes comerciales. Nuestras plantillas, personalizables para cualquier marca, permiten a los equipos crear contenido personalizado a escala, sin necesidad de habilidades de diseño o edición. Además, con una renderización rápida y seguridad de primer nivel, Hour One se destaca como el principal sistema operativo de contenido diseñado para las demandas empresariales. Lo que antes llevaba meses, ahora solo lleva unos minutos y produce una mayor participación... trabaje de manera más inteligente, no más intensa, con Hour One y produzca videos comerciales personalizados que generen impacto. * HourOne es una herramienta de creación de videos que permite a los usuarios crear presentaciones y videos de marketing con una variedad de plantillas, voces y personajes. * A los usuarios les gusta la facilidad de uso, la variedad de voces y personajes para elegir, el proceso rápido y el tiempo de descarga, y el soporte del equipo de éxito del cliente. * Los revisores experimentaron problemas como una función robótica de texto para hablar, opciones de avatar limitadas, una curva de aprendizaje para usuarios ocasionales, capacidades de marca limitadas, tiempo de carga lento y falta de instrucciones claras para ciertas funciones.
AI Voice Detector
aivoicedetector.com
AI Voice Detector es una herramienta de verificación de voz que ayuda a detectar la autenticidad y filtrar las voces generadas por IA. Ofrece a los usuarios tranquilidad y protección contra la manipulación de audio, la desinformación, las estafas de voz y el plagio en las evaluaciones orales. * AI Voice Detector es una herramienta diseñada para distinguir entre voces generadas por computadora y voces humanas reales, específicamente para casos de uso empresarial, garantizando la autenticidad del contenido y la generación de informes confiables en las interacciones de servicio al cliente. * Los revisores aprecian la implementación del software para la protección contra la manipulación de audio y las estafas de voz, su facilidad de uso, su rápido procesamiento y la capacidad de procesar perfectamente una amplia gama de formatos de archivos de audio sin ningún problema. * Los usuarios mencionaron limitaciones como el sistema que requiere que los archivos de audio tengan al menos 8 segundos de duración y no tengan música de fondo, la identificación errónea ocasional de voces reales como falsas y viceversa, y capacidades limitadas de integración de software.
Prolific
prolific.com
Prolific es una plataforma que permite a los investigadores recopilar datos de alta calidad generados por humanos a escala de un gran grupo examinado de participantes y encargados de tareas de investigación. Al utilizar la plataforma Prolific, los investigadores pueden seleccionar, contactar y gestionar participantes de la investigación del grupo diverso, examinado y tratado de manera justa de Prolific, para ofrecer investigaciones que cambien el mundo y la próxima generación de IA.
SAP
sap.com
SAP es la empresa líder en aplicaciones empresariales e inteligencia artificial empresarial. Se encuentran en la intersección de los negocios y la tecnología, donde sus innovaciones están diseñadas para abordar directamente desafíos comerciales reales y producir impactos en el mundo real. Sus soluciones son la columna vertebral de los procesos más complejos y exigentes del mundo. El portafolio integrado de SAP une los elementos de las organizaciones modernas (desde la fuerza laboral y las finanzas hasta los clientes y las cadenas de suministro) en un ecosistema unificado que impulsa el progreso.
Dictanote
dictanote.co
¡Ayudamos a los usuarios a mejorar la productividad mediante el uso de escritura por voz! Dictanote es una aplicación de notas moderna con integración de voz a texto incorporada, lo que le facilita escribir notas por voz en más de 50 idiomas. Voice In es la extensión de Chrome de conversión de voz a texto que te permite usar tu voz para escribir en cualquier cuadro de texto en cualquier sitio web.
Speechlogger
speechlogger.com
Speech Logger es un software de traducción de voz y reconocimiento de voz basado en la web que incluye puntuación automática, guardado automático, marcas de tiempo, capacidad de edición de texto, transcripción de archivos de audio, opciones de exportación y más. * Speechlogger es una herramienta diseñada para subtítulos y traducción automática en vivo de discursos, reuniones o eventos, con funciones adicionales como puntuación automática, identificación del orador y análisis de sentimientos. * Los revisores aprecian la capacidad de Speechlogger para transcribir discursos con precisión incluso en entornos ruidosos, su diseño fácil de usar y sus características únicas como puntuación automática, identificación del hablante y análisis de sentimientos, que consideran superiores a algunas herramientas de transcripción pagas. * Los usuarios experimentaron problemas como anuncios que afectaban el rendimiento en la versión gratuita, errores ocasionales en la traducción, menos precisión al transcribir acentos menos comunes, falta de controles habilitados por voz y malas interpretaciones en el análisis de sentimientos y las herramientas de modelado de temas.
V7
v7labs.com
V7 es un motor de datos de IA diseñado para visión por computadora y aplicaciones de IA generativa. La plataforma proporciona una infraestructura para datos de capacitación empresarial que incluye etiquetado, flujos de trabajo, conjuntos de datos y tiene una función para capacitación humana en el circuito. Ofrece múltiples propiedades de anotación para mejorar la calidad de los datos de los modelos de IA. Con funciones como anotación automática, anotación DICOM para imágenes médicas, gestión de conjuntos de datos y gestión de modelos, V7 automatiza y agiliza diversas tareas. Sus herramientas de anotación de imágenes y videos están diseñadas para mejorar la precisión del etiquetado de datos. Además, permite la creación y automatización de canales de datos personalizados y tiene herramientas para automatizar los flujos de trabajo de reconocimiento óptico de caracteres (OCR) y procesamiento inteligente de documentos (IDP). V7 permite a los usuarios subcontratar tareas de anotación. Se puede utilizar en diversas industrias, como la agricultura, la automoción, la construcción, la energía, la alimentación y las bebidas, la atención sanitaria y más. Ofrece funciones de colaboración para anotaciones en equipo en tiempo real y proporciona análisis de rendimiento de modelos y etiquetadores. Además, V7 también facilita los flujos de trabajo de anotación y entrenamiento de modelos para que sean más eficientes a través de una interfaz de usuario intuitiva. Con su función AutoAnnotate mejorada, acelera la velocidad y precisión de las anotaciones. La plataforma se integra con AWS, Databricks y Voxel51, entre otros, y admite una variedad de tipos de datos, incluidos videos, imágenes y texto.
Softcatalà Traductor
softcatala.org
TraductorTraductor catalán <> {castellano, inglés, portugués, francés} basado en la tecnología de Apertium.
Riku.AI
riku.ai
Experimente con I.A. Un parque infantil, múltiples proveedores. Riku es la bóveda de tu A.I. creaciones y un lugar para guardar, distribuir y experimentar con la última tecnología. Riku es la solución integral para crear modelos personalizados con tecnología NLP. Riku.AI agrega el mejor modelo de lenguaje grande en un solo lugar para que aprender, construir y compartir con tecnología de IA sea lo más simple posible.
SoundHound
soundhound.com
Como innovador líder en inteligencia conversacional, ofrecemos una plataforma de inteligencia artificial de voz independiente que permite a las empresas de todos los sectores ofrecer las mejores experiencias conversacionales a sus clientes. Construida sobre tecnologías patentadas Speech-to-Meaning® y Deep Meaning Understanding®, la avanzada plataforma de inteligencia artificial de voz de SoundHound proporciona una velocidad y precisión excepcionales y permite a los humanos interactuar con productos y servicios como lo hacen entre sí: hablando con naturalidad. SoundHound cuenta con la confianza de empresas de todo el mundo, incluidas Hyundai, Mercedes-Benz, Pandora, Qualcomm, Netflix, Snap, Square, LG, VIZIO, KIA y Stellantis.
AssemblyAI
assemblyai.com
AssemblyAI es una empresa de inteligencia artificial del habla centrada en la creación de nuevos modelos de inteligencia artificial de última generación que puedan transcribir y comprender el habla humana. Nuestros clientes, como CallRail, Fireflies y Spotify, eligen AssemblyAI para crear nuevas e increíbles experiencias y productos impulsados por IA basados en datos de voz. Los modelos y marcos de AssemblyAI incluyen: - AI de voz a texto - Inteligencia de audio, que incluye resumen, análisis de sentimientos, detección de temas, moderación de contenido, redacción de PII y más - LeMUR, un marco para aplicar potentes LLM al discurso transcrito, donde puede hacer preguntas sofisticadas, extraer elementos de acción y resúmenes de su transcripción, y más
ai|coustics
ai-coustics.com
ai|coustics es una herramienta de inteligencia artificial que mejora la calidad del audio del habla mediante algoritmos avanzados. Su tecnología Generative Speech AI permite a los usuarios tener una calidad de audio de nivel profesional en cualquier situación, ya sea grabando un podcast, videoconferencia o transmitiendo audio. La herramienta no sólo suprime el ruido de fondo, sino que también elimina las resonancias de la habitación, compensa los auriculares de baja calidad y repara artefactos digitales para mejorar la claridad y la calidad de las palabras habladas. Incluso recupera componentes y frecuencias perdidas de la señal de audio. La herramienta de inteligencia artificial es perfecta para cualquier aplicación centrada en audio, incluidas telecomunicaciones, plataformas de podcasting, hardware de transmisión o grabación de audio y sistemas de voz a texto. Integrar ai|coustics en una aplicación de audio es simple con su API Y SDK HD-SPEECH y está disponible para plataformas Windows, Mac, Linux, Web, Android e iOS, ejecutándose en entornos integrados, de escritorio y en la nube. Los usuarios pueden experimentar el poder de la herramienta de primera mano visitando su PÁGINA DE JUEGOS, donde pueden ver y escuchar los efectos transformadores de AI Speech Enhancement en acción. ai|coustics también proporciona información de contacto, incluido correo electrónico, teléfono y dirección, así como enlaces al aviso de su sitio y a su política de privacidad. Los usuarios que buscan mejorar la calidad de audio de sus aplicaciones de voz pueden beneficiarse de los algoritmos avanzados de IA de ai|coustics que elevan la calidad del audio a estándares de nivel profesional.
Kili Technology
kili-technology.com
Cree conjuntos de datos de alta calidad rápidamente. Las empresas confían en nosotros para optimizar sus operaciones de etiquetado de datos y crear los mejores conjuntos de datos para sus modelos personalizados, IA generativa y LLM. ___ ¿Por qué Kili Tecnología? Quizás no lo sepas, pero: El conjunto de datos del MNIST tiene una tasa de error del 3,4% y todavía es citado en más de 38.000 artículos. El conjunto de datos ImageNet, con sus etiquetas de colaboración colectiva, tiene una tasa de error del 6%. Podría decirse que este conjunto de datos sustenta los sistemas de reconocimiento de imágenes más populares desarrollados por Google y Facebook. El error sistémico en estos conjuntos de datos tiene consecuencias en el mundo real. Los modelos entrenados con datos que contienen errores se ven obligados a aprender esos errores, lo que genera predicciones falsas o la necesidad de volver a entrenar con cantidades cada vez mayores de datos para "eliminar" los errores. Todas las industrias han comenzado a comprender el potencial transformador de la IA y a invertir. Pero la revolución de los transformadores de ML y el enfoque incesante en la optimización del modelo de ML están llegando al punto de generar rendimientos decrecientes. ¿Qué más hay?
IBM
ibm.com
IBM Cognos Analytics actúa como su copiloto confiable para los negocios con el objetivo de hacerle más inteligente, más rápido y más seguro en sus decisiones basadas en datos. IBM Cognos Analytics brinda a todos los usuarios, ya sea científico de datos, analista de negocios o especialista en no IT, más poder para realizar un análisis relevante de una manera que se vincule con los objetivos organizacionales. Acorta el viaje de cada usuario de análisis simple a sofisticado, lo que les permite aprovechar los datos para explorar lo desconocido, identificar nuevas relaciones, obtener una comprensión más profunda de los resultados y desafiar el status quo. Visualice, analice y comparta información procesable sobre sus datos con cualquier persona en su organización con IBM Cognos Analytics.
SpeechAce
speechace.com
En SpeechAce, estamos comprometidos a ayudar a los estudiantes de idiomas a mejorar sus habilidades para hablar a través de una tecnología versátil de reconocimiento de voz. Desarrollamos la primera API de reconocimiento de voz del mundo que no solo ayuda a los estudiantes de idiomas a evaluar sus habilidades para hablar, sino también a identificar sus áreas exactas de mejora. Si bien la primera versión de nuestra API de reconocimiento de voz solo proporcionaba una puntuación de pronunciación, ahora hemos mejorado nuestras ofertas para incluir la transcripción completa del habla junto con la evaluación de habilidades de nivel superior, como vocabulario, gramática, fluidez, coherencia y relevancia. SpeechAce cuenta con una diversa base de clientes en todo el mundo que incluye algunas de las empresas emergentes más pequeñas (pero más populares), así como algunos de los proveedores de aprendizaje de idiomas más grandes del mundo.
© 2025 WebCatalog, Inc.