
Closed
Posted
Paid on delivery
Busco un desarrollador o arquitecto de soluciones de IA con experiencia comprobable en la implementación de agentes de voz automatizados de baja latencia. El objetivo es gestionar un volumen de 5,700 llamadas mensuales (aprox. 28,000 minutos) de forma eficiente y con costos de infraestructura optimizados. Requerimientos Técnicos (Stack Obligatorio): Para este proyecto, NO buscamos soluciones cerradas (tipo Vapi o Retell). Queremos una arquitectura basada en componentes que nos permita escalar sin márgenes excesivos por minuto. El candidato debe dominar: Orquestación: LiveKit o similares para el manejo de WebRTC y transporte de audio. STT (Speech-to-Text): Deepgram (Nova-2) por su baja latencia. LLM (Cerebro): Implementación vía Groq (usando Llama 3) para garantizar respuestas en milisegundos. TTS (Text-to-Speech): Cartesia o Deepgram Aura. Telefonía: Integración directa con Twilio o Telnyx. Automatización: Conexión de datos mediante n8n para el registro de leads en CRM. Desafíos a Resolver: Optimización de Costos: El 80% de las llamadas son de prospección básica (<5 min). La arquitectura debe ser extremadamente barata en estos casos. Latencia: La conversación debe sentirse natural, con tiempos de respuesta menores a 800ms. Lógica de Negocio: El agente debe distinguir entre consultas breves (curiosos), soporte técnico y cierre de ventas (llamadas de 15 min). Entregables: Agente de voz funcional configurado en nuestro servidor/VPS. Documentación de la arquitectura y flujos de n8n. Pruebas de estrés iniciales para asegurar que soporta llamadas concurrentes. A los candidatos: Por favor, al postularte inicia tu mensaje con la frase "Latencia Cero" para saber que leíste todo. Adjunta ejemplos de agentes de voz que hayas desplegado previamente y explícanos brevemente cómo gestionarías la concurrencia en este volumen.
Project ID: 40418948
70 proposals
Remote project
Active 9 days ago
Set your budget and timeframe
Get paid for your work
Outline your proposal
It's free to sign up and bid on jobs
70 freelancers are bidding on average $484 USD for this job

Zero Latency i’ve done very similar recently, built low-latency voice agents with LiveKit + Deepgram + Groq hitting sub-700ms end-to-end. What concurrency peak do you expect per minute, and do you need call recording/compliance storage? How complex is CRM sync via n8n (real-time vs batch)? I suggest early intent classification (fast LLM or rules) to route short calls to lightweight flows; this cuts cost and latency. I also suggest streaming STT→LLM→TTS pipeline with partial responses; this keeps conversations natural under 800ms. I’ll set up LiveKit with Twilio/Telnyx, wire Deepgram streaming and Groq Llama 3 orchestration. Then I’ll build routing logic, n8n workflows, and autoscaling workers. Finally, I’ll run load tests, tune latency, and document deployment. Best, Dev S.
$450 USD in 4 days
5.9
5.9

Hi there To build a low-latency voice agent with “Latencia <800ms” and cost efficiency, the most critical part is controlling the real-time audio pipeline and decision flow across STT, LLM, and TTS. I’ll approach this by structuring a streaming pipeline using LiveKit for audio transport, Deepgram for STT, Groq (Llama 3) for fast inference, and Cartesia/Deepgram for TTS, with logic branching for short vs long calls to optimize cost. This means I understand how a call flows: audio stream - transcription - intent classification - response generation - audio playback, all within milliseconds while handling multiple concurrent calls. My process is simple: first define call flows, concurrency model, and cost strategy. Then build the real-time pipeline and n8n integrations. Finally, run stress tests, optimize latency, and stabilize production deployment. Final timeline and budget will be defined precisely once infrastructure and call scenarios are confirmed. If this aligns with you, let’s discuss in detail via private chat.
$500 USD in 7 days
5.4
5.4

Latencia Cero — HE DESPLEGADO AGENTES DE VOZ EN TIEMPO REAL CON PIPELINE STT–LLM–TTS SUB-SEGUNDO, OPTIMIZADOS PARA ALTO VOLUMEN Y BAJO COSTE. Puedo diseñar e implementar una arquitectura completamente modular basada en LiveKit (WebRTC), Deepgram Nova-2 (STT), Groq + Llama 3 (LLM) y Cartesia/Deepgram Aura (TTS), integrada con Twilio/Telnyx para telefonía y n8n para automatización y CRM. Mi enfoque: pipeline asíncrono con streaming bidireccional, prefetching de respuestas, y manejo inteligente de turnos para mantener latencias <800ms. Para optimización de costes, aplicaré routing dinámico: llamadas cortas (<5 min) con prompts ligeros y contexto mínimo; llamadas largas con memoria estructurada y control de tokens. Además, caching semántico y fallback simplificado para consultas repetitivas. Gestión de concurrencia: uso de workers escalables (Node.js/Go), colas (Redis/Kafka), y balanceo horizontal en VPS. LiveKit manejará sesiones concurrentes mientras el backend distribuye carga por microservicios. Roles: Admin (configuración, monitoreo), Operador/CRM (leads, seguimiento), Usuario final (interacción por voz). Entregables: agente funcional en su servidor, flujos n8n documentados, arquitectura completa, pruebas de carga iniciales. Incluyo código fuente completo y 2 años de soporte continuo post-lanzamiento.
$500 USD in 7 days
5.0
5.0

Good to see this project, Latencia Cero — Implementaré el agente de voz sobre LiveKit con Deepgram Nova-2 para STT, Groq (Llama 3) como LLM y Cartesia para TTS, integrado a Twilio y n8n para registro automático en CRM. Entregaré documentación completa y pruebas de concurrencia. Para las llamadas de prospección cortas, configuraré un flujo ligero que omita el LLM cuando la intención se resuelva solo con STT y lógica de reglas — reduciendo costo y latencia bajo 500ms en esos casos. El LLM se activará únicamente para soporte o cierre de ventas. Questions: 1) ¿Qué CRM utilizan actualmente para el registro de leads vía n8n? 2) ¿Cuántas llamadas concurrentes simultáneas deben soportarse como pico máximo? Looking forward to discussing further. Best regards, Kamran
$276 USD in 10 days
4.6
4.6

✋ ¡Hola! ✋ El objetivo del proyecto: CONSTRUIR UN SISTEMA DE AGENTE DE VOZ CON IA DE CÓDIGO ABIERTO Y BAJA LATENCIA, DISEÑADO PARA LA GESTIÓN AUTOMATIZADA DE LLAMADAS DE ALTO VOLUMEN Y LA INTEGRACIÓN CON CRM. Latencia Cero He leído detenidamente sus requisitos para un sistema de agente de voz modular y de baja latencia, utilizando LiveKit, Deepgram, Groq Llama 3, Cartesia o Aura TTS, Twilio o Telnyx, y automatización con n8n; todo ello con una estricta optimización de costos y capacidad para gestionar la concurrencia de miles de llamadas. Soy la candidata ideal para este proyecto, ya que me especializo en sistemas de comunicación con IA en tiempo real y en arquitecturas de voz escalables. * Orquestación de voz mediante WebRTC basada en LiveKit, con transmisión de baja latencia. * Integración de Deepgram (STT) y Groq (LLM) para lograr tiempos de respuesta inferiores a 800 ms. * Integración con Twilio mediante flujos de trabajo en n8n para la automatización de *leads* en el CRM. Me encargaré de proporcionar la arquitectura del sistema, su despliegue en un VPS, las pruebas, la entrega del código fuente completo, la documentación y la configuración de las pruebas de estrés. Cuento con más de 9 años de experiencia como desarrolladora *full-stack* y he completado proyectos similares de agentes de voz con IA y automatización. Espero tener la oportunidad de conversar con usted para llegar a un acuerdo. Saludos cordiales, ¡Elisha Mariam!
$251 USD in 12 days
4.6
4.6

Latencia Cero, encantado. Entiendo que buscan un agente de voz modular con LiveKit, Deepgram, Groq y Cartesia, sin depender de plataformas cerradas. Tengo experiencia armando flujos de voz de baja latencia y afinando cada salto para mantener tiempos por debajo de 800ms. Puedo encargarme de entregar un agente completo en su VPS con: - LiveKit para WebRTC - Deepgram STT en tiempo real - Groq con Llama 3 para decisiones rápidas - Cartesia/Deepgram Aura para TTS - Telefonía con Twilio o Telnyx - Flujos n8n conectados a su CRM Suelo trabajar con pipelines asincrónicos para garantizar concurrencia estable y costos bajos en llamadas cortas. Puedo comenzar de inmediato y tener una primera versión en pocos días. ¿Prefieren manejar la multiplexación de audio directamente en LiveKit o delegarla en un microservicio separado para equilibrar carga cuando crezcan las llamadas concurrentes? Saludos, Slavko
$250 USD in 6 days
4.2
4.2

Hello Dear! Greetings from Toriqul Global Solutions! We are a reliable and experienced web design & development company led by Engineer Toriqul Islam (B.Sc. in CSE, RUET), with over 10 years of proven industry experience delivering quality digital solutions. At Toriqul Global Solutions, we build modern, user-friendly, high-performance websites focused on simplicity, elegance, and functionality to boost engagement and business growth. I have some questions——— 1. Do you have accounts with LiveKit, Groq, Deepgram, Twilio ready? 2. Expected concurrent call peak (e.g., 10 or 50 lines)? Technologies We Use: Custom Websites Development Using ======>Full Stack Development. 1. HTML5 2. CSS3 3. Bootstrap4 4. jQuery 5. JavaScript 6. AngularJS 7. React JS 8. Node.js 9. WordPress 10. PHP 11. Ruby on Rails 12. MYSQL 13. Laravel 14. .NET 15. CodeIgniter 16. React Native 17. SQL / MySQL 18. Mobile app development 19. Python 20. MongoDB and more skills What will you get? • Responsive design on All Devices •Reusable components •Clean code •Timely delivery tested •Clear communication We would be honored to discuss your project requirements and help bring your ideas to life. Thank you for your time and consideration. Warm Regards, Toriqul Global Solutions
$250 USD in 5 days
4.4
4.4

Hi there, Strong alignment with this project comes from experience building low-latency voice AI systems using modular, scalable architectures with real-time streaming and telephony integrations. Clear understanding of your requirement to develop an open, cost-optimized voice agent using LiveKit/WebRTC, Deepgram STT, Groq (Llama 3) for ultra-fast inference, and TTS via Cartesia or Aura, integrated with Twilio/Telnyx and n8n workflows. Expertise in real-time pipelines ensures sub-800ms latency through streaming STT→LLM→TTS loops, async processing, and efficient session handling with scalable concurrency management. Risk is minimized through load balancing, session isolation, fallback handling, and cost-aware routing for short vs long calls. Available to start immediately happy to discuss architecture and concurrency strategy in detail. Recent work: https://www.freelancer.com/u/chiragardeshna Regards Chirag
$250 USD in 7 days
4.4
4.4

Hi, I have strong experience in AI voice agent architecture, low-latency conversational systems, WebRTC pipelines (LiveKit), STT/TTS integrations (Deepgram, Cartesia), LLM orchestration (Groq/Llama 3), and full-stack automation using Twilio, Telnyx, and n8n for CRM workflows. I’ve also worked on designing modular, cost-optimized voice systems where concurrency, routing logic, and response latency are carefully engineered for real-time performance. I can build your open, component-based voice agent architecture with LiveKit for audio transport, Deepgram for ultra-low-latency transcription, Groq for response generation, and Cartesia/Deepgram Aura for natural TTS, fully integrated with Twilio/Telnyx and n8n for CRM logging. I focus on keeping latency under control while separating flows for short qualification calls vs longer sales/support conversations, ensuring scalable concurrency on VPS infrastructure without vendor lock-in costs. Best regards, Juan
$350 USD in 7 days
3.8
3.8

Hello There!!! ★★★★ ( Latencia ultra baja voice agent architecture con stack open-source escalable y optimizado ) ★★★★ I understand you need an open-source voice agent system capable of handling ~5,700 calls/month with ultra-low latency (<800ms), using LiveKit, Deepgram, Groq (Llama 3), Cartesia/TTS, Twilio/Telnyx, and n8n for CRM automation. Focus is cost efficiency, concurrency handling, and scalable architecture—not closed SaaS tools. ⚜ LiveKit/WebRTC real-time audio orchestration ⚜ Deepgram STT integration (Nova-2 low latency) ⚜ Groq LLM (Llama 3) for instant responses ⚜ TTS via Cartesia or Deepgram Aura ⚜ Twilio/Telnyx telephony integration ⚜ n8n CRM automation & lead routing ⚜ Load handling + concurrency optimization I’ve worked on AI voice pipelines and real-time systems focusing on low latency and scalable event-driven architecture. I’ll design modular components so calls are cheap, fast, and stable under concurrency. Let’s discuss architecture and deployment plan. Warm Regards, Farhin B.
$256 USD in 10 days
3.8
3.8

Latencia Cero As you know, the main problem of this project is that we need to handle a high volume of calls efficiently while maintaining low latency and cost-effectiveness. I will design a microservices architecture that leverages LiveKit for WebRTC orchestration, ensuring optimal audio transport. Deepgram will be implemented for STT, focusing on low-latency processing. For LLM, I'll utilize Groq with Llama 3 to facilitate rapid responses, while integrating Twilio for telephony and n8n for lead data automation. Each component will be independently scalable to accommodate varying loads and will focus on minimizing costs for short calls. The deliverable will be a fully functional voice agent configured on your server, complete with architecture documentation, n8n workflows, and initial stress testing results to validate concurrent call handling. My background includes deploying similar voice agents that support thousands of calls monthly. I can start immediately. Best Regards.
$250 USD in 7 days
1.5
1.5

Hola, Latencia Cero. Estoy muy interesado en tu proyecto y tengo la experiencia que buscas para implementar agentes de voz automatizados con baja latencia. He trabajado con tecnologías como LiveKit para orquestar WebRTC y Deepgram para STT, así que estoy familiarizado con los requisitos técnicos que mencionas. También tengo experiencia integrando sistemas de telefonía con Twilio y manejando datos a través de n8n. Para abordar los desafíos del proyecto, optimizaré la arquitectura para minimizar costos, especialmente en llamadas cortas, asegurando al mismo tiempo una experiencia natural con tiempos de respuesta rápidos. Puedo compartir ejemplos de proyectos anteriores donde he desplegado soluciones similares. Además, puedo explicar cómo gestionaría la concurrencia para asegurar que el sistema maneje eficientemente el volumen requerido. Espero poder colaborar contigo en este emocionante desafío.
$500 USD in 7 days
0.8
0.8

Latencia Cero — Hola, ⭐15+ años como Sr Developer aquí⭐ Puedo implementar un agente de voz open source de baja latencia con LiveKit/WebRTC, Deepgram Nova-2, Groq/Llama 3, Cartesia o Aura, y telefonía directa con Twilio o Telnyx. Para este volumen, manejaría la concurrencia con sesiones aisladas por llamada, workers separados para STT/LLM/TTS, métricas en tiempo real y escalado según carga. También conectaría n8n para registrar leads en el CRM y separar correctamente llamadas cortas, soporte técnico y oportunidades de venta. Mi enfoque sería optimizar costo por minuto, mantener respuestas por debajo de 800ms y probar llamadas concurrentes antes del hand-off. He trabajado con flujos de voz, automatización, APIs y agentes IA, y puedo mostrarle ejemplos o arquitectura de proyectos similares en privado. Si cree que soy buen candidato, puede escribirme cuando quiera. — GAZMIR
$250 USD in 7 days
1.0
1.0

Hola, gracias por compartir este emocionante proyecto. Tengo una amplia experiencia en el desarrollo de agentes de voz automatizados, con especialización en la reducción de latencia. He implementado arquitecturas eficientes utilizando tecnologías como LiveKit para orquestación, y estoy familiarizada con Deepgram y Groq para garantizar un rendimiento óptimo. Mi enfoque se centra en la optimización de costos, logrando un balance entre la calidad y el gasto, especialmente para llamadas rápidas de prospección. Además, tengo experiencia en integrar soluciones de telefonía como Twilio y en la automatización con n8n. Espero tener la oportunidad de discutir más sobre su visión y explorar cómo puedo contribuir a su proyecto.
$555 USD in 2 days
0.0
0.0

Hello, I have 7+ years of experience in AI Chatbot Development, WebRTC, and n8n. I understand your requirement for developing an Automated Voice Agent with low latency capabilities to efficiently handle a volume of 5,700 monthly calls. I specialize in building scalable systems with a focus on performance and real-time processing. With expertise in full-stack development and modern web/mobile apps, I can design a low-latency architecture using components like LiveKit for WebRTC, Deepgram for STT, Groq for LLM, and Cartesia for TTS. I have experience integrating with Twilio and Telnyx for telephony and automating data connections through n8n. Let's discuss your project further. Start the chat so we can explore the details. Thanks.
$500 USD in 7 days
0.0
0.0

Hello, I am Vishal Maharaj, with 20 years of experience in Automation, WebRTC, n8n, and AI Chatbot Development. I have carefully reviewed your project requirements for developing an Automated Voice Agent using open-source technologies. To address your needs, I propose an architecture leveraging LiveKit for WebRTC orchestration, Deepgram for STT, Groq for LLM implementation, and Cartesia or Deepgram Aura for TTS. Integration with Twilio or Telnyx for telephony and utilizing n8n for CRM lead registration will ensure seamless automation. I will focus on optimizing costs for basic prospecting calls, achieving low latency responses, and implementing logic for different call types. The deliverables will include a fully functional voice agent, detailed architecture documentation, and stress testing results. Please initiate a chat to discuss further. Cheers, Vishal Maharaj
$500 USD in 5 days
0.0
0.0

Hello! This is James from Hollywood. I’ve carefully read your project description about developing an automated voice agent and I’m excited about the opportunity! With over 15 years of experience in AI and automation, I have the skills to deliver a robust solution that meets your needs. I understand the importance of creating a seamless voice assistance experience using technologies like Twilio and Natural Language Processing. My background includes building AI-powered tools and systems that enhance user interaction, and I’m confident I can deliver a solution that not only works but excels. Could you please clarify the following questions to help me better understand the project? 1. What specific functionalities do you envision for the voice agent? 2. Are there any existing systems or platforms you want this agent to integrate with? 3. What is your timeline for project completion? My approach would include an initial phase of requirements gathering, followed by prototyping and iterative development to ensure we’re on the right track. I’m dedicated to creating solutions that are not just technically sound but also practical for your business. Let’s discuss how we can turn your vision into reality! Looking forward to your response.
$500 USD in 5 days
0.0
0.0

Latencia Cero Hola, Quieres un agente de voz open source, de baja latencia, que maneje miles de llamadas con costos controlados usando LiveKit, Deepgram, Groq y Twilio/Telnyx—sin depender de soluciones cerradas. He trabajado en sistemas de voz en tiempo real donde el reto principal era latencia + costo. En un proyecto similar, orquesté audio con WebRTC, STT en streaming, y respuestas rápidas del modelo, manteniendo tiempos por debajo de 1s y optimizando llamadas cortas para reducir gasto. También integré flujos con herramientas tipo n8n para registrar leads y eventos en tiempo real. Para tu caso, lo plantearía así: * LiveKit como capa central de audio (WebRTC + manejo de sesiones concurrentes) * Deepgram streaming (Nova-2) para STT continuo y rápido * Groq + Llama 3 con prompts diferenciados según tipo de llamada * TTS con Cartesia/Deepgram optimizado para respuestas cortas * Twilio/Telnyx como gateway, conectando al pipeline en tiempo real * n8n para logging, CRM y eventos clave Para costo: enrutar llamadas cortas (<5 min) con prompts simples y respuestas más directas, reduciendo uso de tokens y TTS. Para concurrencia: workers escalables (containers) manejando sesiones independientes vía LiveKit, con control de colas y fallback si hay picos. Puedo documentar toda la arquitectura y dejarlo listo en tu VPS con pruebas de carga. Pregunta clave: ¿cuántas llamadas concurrentes esperas en picos? Saludos, Mihailo
$500 USD in 7 days
0.0
0.0

Hola, este proyecto encaja con una arquitectura de voz AI optimizada para coste, latencia y control técnico real. Antes de avanzar, me gustaría validar tres detalles: Pregunta 1 - ¿Cuántas llamadas concurrentes esperan en hora pico? Pregunta 2 - ¿El agente debe hablar solo español o también otros idiomas? Pregunta 3 - ¿Qué CRM recibirá los leads desde n8n? Plantearía una solución modular con LiveKit para audio en tiempo real, Deepgram Nova 2 para transcripción, Groq y Llama 3 como motor de decisión, Cartesia o Aura para voz, y Twilio o Telnyx para telefonía. La lógica separaría llamadas rápidas de prospección, soporte técnico y oportunidades de venta, ajustando prompts, contexto y consumo de tokens según el tipo de llamada para evitar costes innecesarios. Para la concurrencia, usaría sesiones independientes por llamada, monitoreo de latencia STT LLM TTS, límites por worker y despliegue escalable en VPS o contenedores. El resultado sería un agente funcional, documentado, conectado con n8n y probado con llamadas concurrentes antes de producción.
$500 USD in 7 days
0.0
0.0

Hola, Latencia Cero Tengo experiencia construyendo sistemas de agentes de voz en tiempo real con arquitecturas modulares de baja latencia, similares a lo que necesitas. He trabajado con pipelines de audio en tiempo real usando STT, LLM y TTS, donde la prioridad es mantener una conversación natural con respuestas por debajo de 800ms. Para tu caso, implementaría LiveKit para WebRTC, Deepgram Nova-2 para transcripción, Groq (Llama 3) para inferencia rápida y Cartesia o Deepgram Aura para voz. Twilio o Telnyx para telefonía y n8n para automatización y CRM. Para manejar las 5,700 llamadas mensuales, usaría una arquitectura escalable con contenedores y workers paralelos, separando STT, LLM y TTS para evitar cuellos de botella. También implementaría colas y balanceo de carga para optimizar concurrencia y reducir costos en llamadas cortas. ¿Ya tienes un VPS o cloud definido, o prefieres que proponga la infraestructura más eficiente en coste? Portfolio: https://www.freelancer.pk/u/salahuddin1973 Saludos, Naufal
$300 USD in 2 days
0.0
0.0

Monterrey, Mexico
Payment method verified
Member since May 1, 2025
$30-250 USD
$10-30 USD
$250-750 USD
$10-30 USD
$30-250 USD
£20-250 GBP
$30-250 USD
$250-750 USD
$10000-20000 USD
$250-750 USD
$15-25 USD / hour
$30-250 USD
₹1500-12500 INR
min €100000 EUR
£20-250 GBP
₹1250-2500 INR / hour
$250-750 USD
₹750-1250 INR / hour
£20-250 GBP
₹12500-37500 INR
$30-250 USD
₹400-750 INR / hour
₹750-1250 INR / hour
$250-750 USD
₹10000-150000 INR