Skip to content

renchunxia/DCASE2016

 
 

Repository files navigation

DCASE2016

声音场景识别 DCASE2016

  • 任务介绍以及数据库下载:http://www.cs.tut.fi/sgn/arg/dcase2016/task-acoustic-scene-classification
  • 依赖库:numpy、scipy、librosa、keras、tensorflow or theano
  • 实验采用Mel能量谱+CNN+随机森林
  • 试验的confuse matrix如下:
  • image
  • cnn本身训练好的feature map特征其实是非常稀疏的、但带噪时即使采用过拟合手段有dropout,交叉验证、早停法、权重衰减、正则化,仍然有一些数值较低的权重,而不是0。
  • 在有噪声的情况下(场景声音混杂了其他声音事件、如交谈声、风声等),很多神经元节点其实本身的权重都不会偏向0,而是以一个较小的值存在、本实验思想主要尝试使用随机森林的自助重采样,直接摒弃部分CNN的冗余特征构建决策树、bagging方式实现声音场景的识别,而未被采样到的袋外数据可以做validation data。

About

声音场景识别

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%
pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy