安装依赖:pip install -r requirements.txt 训练模型 python main.py --mode train --casia_path ./CAISA --savee_path ./SAVEE --ravdess_path ./RAVDESS --epochs 50 参数说明: `--mode`:运行模式,选择`train`进行训练 `--casia_path`:CASIA数据集路径 `--savee_path`:SAVEE数据集路径 `--ravdess_path`:RAVDESS数据集路径 `--epochs`:训练轮数,默认为100 预测情感 python predict.py --audio ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --model ./output/emotion_model 参数说明: `--audio`:要预测的音频文件路径 `--model`:训练好的模型目录,默认为./output/emotion_model 音频可视化 单个音频可视化: python waveform_only.py --audio_path ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --output_path ./output/waveform.png 参数说明: `--audio_path`:音频文件路径 `--output_path`:输出波形图保存路径 批量音频可视化: python batch_waveform.py --audio_dir ./RAVDESS/Actor_01 --output_dir ./output/waveforms --limit 5 参数说明: `--audio_dir`:音频文件目录 `--output_dir`:输出波形图保存目录 `--limit`:处理文件数量限制,默认处理所有文件 `--file_ext`:音频文件扩展名,默认为wav