chuban

2025-07-02 13:54:05 +08:00
commit 4b3870440c
6351 changed files with 282880 additions and 0 deletions
--- a/README.md
+++ b/README.md
@@ -0,0 +1,36 @@
+安装依赖：pip install -r requirements.txt
+
+训练模型
+python main.py --mode train --casia_path ./CAISA --savee_path ./SAVEE --ravdess_path ./RAVDESS --epochs 50
+
+参数说明：
+`--mode`：运行模式，选择`train`进行训练
+`--casia_path`：CASIA数据集路径
+`--savee_path`：SAVEE数据集路径
+`--ravdess_path`：RAVDESS数据集路径
+`--epochs`：训练轮数，默认为100
+
+预测情感
+python predict.py --audio ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --model ./output/emotion_model
+
+参数说明：
+`--audio`：要预测的音频文件路径
+`--model`：训练好的模型目录，默认为./output/emotion_model
+
+音频可视化
+单个音频可视化：
+python waveform_only.py --audio_path ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --output_path ./output/waveform.png
+
+参数说明：
+`--audio_path`：音频文件路径
+`--output_path`：输出波形图保存路径
+
+批量音频可视化：
+python batch_waveform.py --audio_dir ./RAVDESS/Actor_01 --output_dir ./output/waveforms --limit 5
+
+参数说明：
+`--audio_dir`：音频文件目录
+`--output_dir`：输出波形图保存目录
+`--limit`：处理文件数量限制，默认处理所有文件
+`--file_ext`：音频文件扩展名，默认为wav
+