返回列表 发布新帖

基于Emotion2Vec模型的批量音频情感自动标注工具

21 0
发表于 2024-11-9 14:24:42 | 查看全部 阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
简介
基于emotion2vec对输入的音频进行情绪八分类(生气、厌恶、恐惧、开心、中立、其他、难过、吃惊)
或emotion2vec+large对输入的音频进行情绪进行五分类(生气、开心、中性、伤心、未知)
此项目包含一个音频时长筛选/批量重命名脚本preprocess_audio.py批量推理脚本recognize.py和一个音频分类脚本classify.py和一个webui.py界面

依赖项
Python 3.10.8
安装所需依赖pip install -r requirements.txt
快速使用
如果您想快速使用可以使用此打包好的文件 数据集格式可以参考此数据集 输入可以参考此格式:  啊
  1. input
  2. └───speaker
  3.    ├───xxx.wav
  4.    └─── xxx.lab
复制代码
参考输出为此格式:
  1. output
  2. └───speaker0
  3.    └───emotion
  4.        └───【emotion】{text}   
复制代码
经过处理后的文件将会被自动归类并重命名,以反映出音频中包含的情感及其相关内容。一个典型的输出文件示例如下:
  • output/小明/生气/【生气】我很生气.wav
  • output/小明/开心/【开心】我很开心.wav
开源地址:https://github.com/Alexw1111/RefAudioEmoTagger
下载地址:https://www.123pan.com/s/BYgpjv-xVmJv.html


风起于青萍之末,浪成于微澜之间。跌谷底也要开花。沉海底也要望月。与其抱怨于黑暗。不如提灯向前行。

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

908164873@Qq.com

让我们一起寻找开源的乐趣
加入QQ群把ヽ( ̄ω ̄( ̄ω ̄〃)ゝ
  • 关注公众号
  • 添加微信客服
Copyright © 2001-2024 ROOT开源 版权所有 All Rights Reserved. 网站地图|仅供演示|仅供演示
关灯 在本版发帖 官方QQ群 QQ客服返回顶部
快速回复 返回顶部 返回列表