2025-07-02 13:58:33 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:58:33 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00
2025-07-02 13:54:05 +08:00

安装依赖pip install -r requirements.txt

训练模型 python main.py --mode train --casia_path ./CAISA --savee_path ./SAVEE --ravdess_path ./RAVDESS --epochs 50

参数说明: --mode:运行模式,选择train进行训练 --casia_pathCASIA数据集路径 --savee_pathSAVEE数据集路径 --ravdess_pathRAVDESS数据集路径 --epochs训练轮数默认为100

预测情感 python predict.py --audio ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --model ./output/emotion_model

参数说明: --audio:要预测的音频文件路径 --model:训练好的模型目录,默认为./output/emotion_model

音频可视化 单个音频可视化: python waveform_only.py --audio_path ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --output_path ./output/waveform.png

参数说明: --audio_path:音频文件路径 --output_path:输出波形图保存路径

批量音频可视化: python batch_waveform.py --audio_dir ./RAVDESS/Actor_01 --output_dir ./output/waveforms --limit 5

参数说明: --audio_dir:音频文件目录 --output_dir:输出波形图保存目录 --limit:处理文件数量限制,默认处理所有文件 --file_ext音频文件扩展名默认为wav

Description
No description provided
Readme 753 MiB
Languages
Java 76.9%
Jupyter Notebook 14%
Python 9.1%