yuyinfenxi

lzc/yuyinfenxi

Fork 0

Go to file

lzc 79b2864afe 上传需求文档

2025-07-02 13:58:33 +08:00

__pycache__

chuban

2025-07-02 13:54:05 +08:00

CAISA

chuban

2025-07-02 13:54:05 +08:00

data_utils

chuban

2025-07-02 13:54:05 +08:00

doc

上传需求文档

2025-07-02 13:58:33 +08:00

models

chuban

2025-07-02 13:54:05 +08:00

output

chuban

2025-07-02 13:54:05 +08:00

RAVDESS

chuban

2025-07-02 13:54:05 +08:00

SAVEE/AudioData

chuban

2025-07-02 13:54:05 +08:00

utils

chuban

2025-07-02 13:54:05 +08:00

batch_waveform.py

chuban

2025-07-02 13:54:05 +08:00

main.py

chuban

2025-07-02 13:54:05 +08:00

model_checkpoint.h5

chuban

2025-07-02 13:54:05 +08:00

predict.py

chuban

2025-07-02 13:54:05 +08:00

README.md

chuban

2025-07-02 13:54:05 +08:00

requirements.txt

chuban

2025-07-02 13:54:05 +08:00

train.py

chuban

2025-07-02 13:54:05 +08:00

waveform_only.py

chuban

2025-07-02 13:54:05 +08:00

语音情感分析.ipynb

chuban

2025-07-02 13:54:05 +08:00

语音情感分析.py

chuban

2025-07-02 13:54:05 +08:00

README.md

安装依赖：pip install -r requirements.txt

训练模型 python main.py --mode train --casia_path ./CAISA --savee_path ./SAVEE --ravdess_path ./RAVDESS --epochs 50

参数说明： --mode：运行模式，选择train进行训练 --casia_path：CASIA数据集路径 --savee_path：SAVEE数据集路径 --ravdess_path：RAVDESS数据集路径 --epochs：训练轮数，默认为100

预测情感 python predict.py --audio ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --model ./output/emotion_model

参数说明： --audio：要预测的音频文件路径 --model：训练好的模型目录，默认为./output/emotion_model

音频可视化单个音频可视化： python waveform_only.py --audio_path ./RAVDESS/Actor_01/03-01-01-01-01-01-01.wav --output_path ./output/waveform.png

参数说明： --audio_path：音频文件路径 --output_path：输出波形图保存路径

批量音频可视化： python batch_waveform.py --audio_dir ./RAVDESS/Actor_01 --output_dir ./output/waveforms --limit 5

参数说明： --audio_dir：音频文件目录 --output_dir：输出波形图保存目录 --limit：处理文件数量限制，默认处理所有文件 --file_ext：音频文件扩展名，默认为wav

README.md Unescape Escape

README.md