Análisis de audio con FFT y Espectrograma

Este proyecto es un programa en Python que permite analizar un archivo de audio mediante la Transformada Rápida de Fourier (FFT) y la generación de un espectrograma. El programa es ideal para analizar archivos de audio en formato .mp3, .m4a, .flac, .ogg o .wav, y está diseñado para ejecutarse de manera ordenada en Google Colab.

Transformada Rápida de Fourier (FFT) y Espectrograma.

La Transformada Rápida de Fourier (FFT) es un algoritmo eficiente para calcular la Transformada de Fourier Discreta (DFT), que convierte una señal del dominio del tiempo al dominio de la frecuencia. En términos simples, descompone una señal en sus componentes de frecuencia, permitiendo analizar qué frecuencias están presentes y con qué intensidad.

Un espectrograma es una representación visual de cómo las frecuencias de una señal varían con el tiempo. Se genera aplicando la FFT a segmentos cortos de la señal (ventanas de tiempo) y luego mapeando la intensidad de cada frecuencia en una gráfica 2D, donde:

El eje horizontal representa el tiempo.
El eje vertical representa la frecuencia.
El color o intensidad indica la magnitud de cada componente frecuencial.

Características principales.

Transformada Rápida de Fourier (FFT):
- Calcula la FFT del audio para analizar las frecuencias dominantes.
- Muestra una gráfica de las magnitudes de las frecuencias.
Espectrograma:
- Genera un espectrograma para visualizar la distribución de frecuencias a lo largo del tiempo.
- Muestra la intensidad de las frecuencias en diferentes momentos del audio.
Procesamiento automático:
- Carga automáticamente el archivo de audio desde la carpeta transcribir.
- Verifica si el archivo está en formato .mp3, .m4a, .flac, .ogg o .wav.

Cómo usar el programa.

1. Configuración del entorno.

Clona el repositorio:

git clone https://github.com/tu-usuario/tu-repositorio.git
cd tu-repositorio

Instala las dependencias:

pip install librosa matplotlib numpy scipy

Crea la carpeta llamada EVIDENCIAS:

Coloca tu archivo de audio (.mp3, .m4a, .flac, .ogg o .wav) en la carpeta EVIDENCIAS y luego, pulsa el siguiente paso para que arroje el análisis en pantalla y en formato ZIP.

Previo a darte el analisis espectografico y de fft, veras esto:

Procesando archivo: EVIDENCIAS/archivo_audio.audio
Información técnica del archivo:

[FORMAT]
 filename=EVIDENCIAS/archivo_audio.audio
 nb_streams=1
 nb_programs=0
 format_name=wav
 format_long_name=WAV / WAVE (Waveform Audio)
 start_time=N/A
 duration=616.360000
 size=29585324
 bit_rate=384000
 probe_score=99
[/FORMAT]

Análisis de transcodificación:
El archivo ESTÁ transcodificado. El codec 'pcm_s16le' NO coincide con el formato 'wav'.

Cómo citar este trabajo.

Usa la siguiente entrada BibTeX si utilizas este trabajo en tu investigación:

@article{joséRLeonett,
  title={Análisis FFT y Espectrográfico de audios},
  author={José R. Leonett},
  year={2024}
}

Licencia.

Este proyecto está bajo la licencia MIT. Consulta el archivo LICENSE para más detalles.

Name		Name	Last commit message	Last commit date
Latest commit History 18 Commits
Audio_FFT_Espectrograma.ipynb		Audio_FFT_Espectrograma.ipynb
LICENSE		LICENSE
README.md		README.md
SECURITY.md		SECURITY.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Análisis de audio con FFT y Espectrograma

Transformada Rápida de Fourier (FFT) y Espectrograma.

Características principales.

Cómo usar el programa.

1. Configuración del entorno.

Cómo citar este trabajo.

About

Releases

Packages

Languages

License

jrleonett/FFT-Espectrograma

Folders and files

Latest commit

History

Repository files navigation

Análisis de audio con FFT y Espectrograma

Transformada Rápida de Fourier (FFT) y Espectrograma.

Características principales.

Cómo usar el programa.

1. Configuración del entorno.

Cómo citar este trabajo.

About

Resources

License

Security policy

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages