Inproceedings,

Deep neural networks for acoustic emotion recognition: Raising the benchmarks

A. Stuhlsatz, C. Meyer, F. Eyben, T. Zielke, G. Meier, and B. Schuller.
2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), page 5688-5691. (May 2011)
DOI: 10.1109/ICASSP.2011.5947651

Abstract

Deep Neural Networks (DNNs) denote multilayer artificial neural networks with more than one hidden layer and millions of free parameters. We propose a Generalized Discriminant Analysis (GerDA) based on DNNs to learn discriminative features of low dimension optimized with respect to a fast classification from a large set of acoustic features for emotion recognition. On nine frequently used emotional speech corpora, we compare the performance of GerDA features and their subsequent linear classification with previously reported benchmarks obtained using the same set of acoustic features classified by Support Vector Machines (SVMs). Our results impressively show that low-dimensional GerDA features capture hidden information from the acoustic features leading to a significantly raised unweighted average recall and considerably raised weighted average recall.

BibTeX key: stuhlsatz2011deep
entry type: inproceedings
booktitle: 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
year: 2011
month: May
pages: 5688-5691
annote: Generalized Discriminant Analysis (GerDA) based on DNNs to learn discriminative features of low dimension; Experiments on 9 emotion speech corpora show that GerDA features perform better than previously reported benchmarks;
date-added: 2016-06-01 13:33:18 +0000
issn: 1520-6149
bdsk-file-1: YnBsaXN0MDDUAQIDBAUGJCVYJHZlcnNpb25YJG9iamVjdHNZJGFyY2hpdmVyVCR0b3ASAAGGoKgHCBMUFRYaIVUkbnVsbNMJCgsMDxJXTlMua2V5c1pOUy5vYmplY3RzViRjbGFzc6INDoACgAOiEBGABIAFgAdccmVsYXRpdmVQYXRoWWFsaWFzRGF0YV8QN1N0dWhsc2F0ei9EZWVwIG5ldXJhbCBuZXR3b3JrcyBmb3IgYWNvdXN0aWMgZW1vdGlvbi5wZGbSFwsYGVdOUy5kYXRhTxECDAAAAAACDAACAAAWQXBwbGUgU1NEIFNNMTI4QyBNZWRpYQAAAAAAAAAAAEJEAAH/////H0RlZXAgbmV1cmFsIG5ldHdvciNGRkZGRkZGRi5wZGYAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAP////8AAAAAUERGIAAAAAAAAQADAAAKIGN1AAAAAAAAAAAAAAAAAAlTdHVobHNhdHoAAAIAYC86VXNlcnM6bWljaGFlbDpEcm9wYm94OlVuaTpiaWJsaW9ncmFwaHk6U3R1aGxzYXR6OkRlZXAgbmV1cmFsIG5ldHdvcmtzIGZvciBhY291c3RpYyBlbW90aW9uLnBkZgAOAFwALQBEAGUAZQBwACAAbgBlAHUAcgBhAGwAIABuAGUAdAB3AG8AcgBrAHMAIABmAG8AcgAgAGEAYwBvAHUAcwB0AGkAYwAgAGUAbQBvAHQAaQBvAG4ALgBwAGQAZgAPAC4AFgBBAHAAcABsAGUAIABTAFMARAAgAFMATQAxADIAOABDACAATQBlAGQAaQBhABIAXlVzZXJzL21pY2hhZWwvRHJvcGJveC9VbmkvYmlibGlvZ3JhcGh5L1N0dWhsc2F0ei9EZWVwIG5ldXJhbCBuZXR3b3JrcyBmb3IgYWNvdXN0aWMgZW1vdGlvbi5wZGYAEwABLwAAFQACAA7//wAAgAbSGxwdHlokY2xhc3NuYW1lWCRjbGFzc2VzXU5TTXV0YWJsZURhdGGjHR8gVk5TRGF0YVhOU09iamVjdNIbHCIjXE5TRGljdGlvbmFyeaIiIF8QD05TS2V5ZWRBcmNoaXZlctEmJ1Ryb290gAEACAARABoAIwAtADIANwBAAEYATQBVAGAAZwBqAGwAbgBxAHMAdQB3AIQAjgDIAM0A1QLlAucC7AL3AwADDgMSAxkDIgMnAzQDNwNJA0wDUQAAAAAAAAIBAAAAAAAAACgAAAAAAAAAAAAAAAAAAANT
date-modified: 2017-02-22 13:00:49 +0000
bdsk-url-1: http://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=5947651
DOI: 10.1109/ICASSP.2011.5947651

PUMA

Deep neural networks for acoustic emotion recognition: Raising the benchmarks

Abstract

Tags

Users

Comments and Reviewsshow / hide

Cite this publication

More citation styles

search on