Home Ciencia y Tecnología Susurros del vacío, transcrito con AI

Susurros del vacío, transcrito con AI

36
0

Las ‘voces auditivas’ no tienen que ser preocupantes, por ejemplo, cuando la radio definida por software program (SDR) es su pasatiempo. Puede tomar bastante tiempo y atención para sacar voces del éter y decodificarlas. Por lo tanto, [theckid] se le ocurrió una solución ingeniosa: Radiotranscriptor. Es un script de Python Homebrew que captura el audio SDR y lo transcribe usando el modelo Whisper de OpenAI, que se ejecuta en su GPU si está disponible. Es delgado y geek, y te ayuda a escuchar ‘la voz en el ruido’ sin escucharlo activamente tú mismo.

Esta herramienta va más allá de la escucha y la grabación básicas. El radiotranscriptor combina SDR, detección de actividad de voz (VAD) y aprendizaje profundo. Renova el audio de 48 kHz a 16 kHz en tiempo actual. Mantiene un búfer de rodadura y solo transcribe la voz actual detectada del aire. Continuamente escribe en un registro diario, por lo que puede revisar las fantasmas de la señal de ayer mientras se registran nuevos hallazgos. Ofrece soporte de GPU con CUDA, con Fallback to CPU.

Seguro que también tiene sus peculiaridades: registros de fantasmas, palabras duplicadas, pero es útil y hackable para su gusto. Desea cambiar el modelo, ajustar el umbral, agregar detección de altavoces: El código esta aquí para bifurcarse y extender. ¿Y por qué no hacer un esfuerzo adicional y convertirlo en arte?

fuente

LEAVE A REPLY

Please enter your comment!
Please enter your name here