API en producción · 92.11% accuracy

Identifica sonidos del entorno con
embeddings + k-NN

SoundGuard clasifica audio ambiental en 50 categorías usando Amazon Nova Multimodal Embeddings y búsqueda vectorial sobre S3 Vectors. Sin entrenamiento, sin GPU, todo serverless.

POST https://poi8bb5go9.execute-api.us-east-1.amazonaws.com/classify
92.11%
Accuracy (k=1, fold 1)
50
Clases ESC-50
~600 ms
Latencia p50 / clip
0
GPUs necesarias

Sin entrenamiento

Bedrock Nova genera embeddings de 1024 dimensiones. El "modelo" es un índice vectorial que se reconstruye con nuevos clips.

Pipeline CT/CD

Step Functions detecta nuevos clips, embebe, evalúa y promueve a producción solo si pasa el gate ≥ 90% accuracy.

Explicable

Cada predicción devuelve los k vecinos más cercanos del índice — siempre puedes ver "por qué" se clasificó así.

Accesibilidad

Diseñado para personas con pérdida auditiva: alertas visuales para sirenas, alarmas, vidrios, llantos.

Serverless en AWS

API Gateway + Lambda + Bedrock + S3 Vectors + DynamoDB. Toda la infra en Terraform, costos casi cero en reposo.

Open source

Código, infra, contratos de API, evaluación y poster: todo público en GitHub bajo la organización del equipo.

¿Listo para probarlo?
Sube un .wav, .mp3 o .ogg (≤ 5 MB, ≤ 30 seg) y obtén la clase predicha más los 5 vecinos más cercanos.
Abrir demo →