Multimodal Sequence to Sequence Seq2Seq2Sentiment: Models ...€¦ · sentiment prediction for the...

Seq2Seq2Sentiment: Multimodal Sequence to Sequence Models for Sentiment Analysis

Hai Pham*1, Thomas Manzini*1, Paul Pu Liang2, Barnabás Póczos2

1 Language Technologies Institute, 2 Machine Learning DepartmentSchool of Computer Science, Carnegie Mellon University

*Authors Contributed Equally

● Research Problem○ Does representing multiple modalities jointly improve

sentiment prediction for the CMU-MOSI dataset?

● Dataset○ Multimodal Corpus of Sentiment Intensity and

Subjectivity Analysis in Online Opinion Videos (MOSI)○ Modalities: Video, Audio, Text Transcripts○ 89 speakers, 93 videos split into 2199 labeled opinion segments○ Labels for Sentiment: {-1, 1} or {-3, -2, -1, 0, 1, 2, 3}○ Average video length: 2-5min

Introduction

● Research Problem○ Does representing multiple modalities jointly improve

sentiment prediction for the CMU-MOSI dataset?

● Dataset○ Multimodal Corpus of Sentiment Intensity and

Subjectivity Analysis in Online Opinion Videos (MOSI)○ Modalities: Video, Audio, Text Transcripts○ 89 speakers, 93 videos split into 2199 labeled opinion segments○ Labels for Sentiment: {-1, 1} or {-3, -2, -1, 0, 1, 2, 3}

Introduction

Baseline & Metrics● LSTM Multi Modal Baseline

○ Concatenates all modalities together and predicts sentiment from these modalities.

○ 75% Accuracy (Chen et. al.)

● Metrics○ For both {-1, 1} or {-3, -2, -1, 0, 1, 2, 3} cases

○ Precision/Recall (Test)○ F1 Score (Test)

● Word-level Temporal Methods○ Gu et al. ACL 2018, Chen et al. ICMI 2017

● Context-Dependent Methods○ Poria et al. ACL 2017

● Memory-based Methods○ Zadeh et al. AAAI 2018

● Tensor-based Methods○ Liu et al. ACL 2018, Zadeh et al. EMNLP 2017

● Conditional Approaches○ Mirza et al. 2014, Kingma et al. 2014, & Pandey et al. 2017

● Attention-based Methods○ Bahdanau et al. 2014, Luong et al. 2015

Related Work

See our paper for an exhaustive review of related work

Seq2Seq Modality Translation

Hierarchical Seq2Seq Modality Translation

● We explored several different network architectures for generating representations

ExperimentsDenoted as

A → B

Concat(A,B) → C

A → Concat(B,C)

Concat(A,B) → Concat(B,C)

Embed(A, B) → C

T = Text Modality, A = Audio Modality, V = Visual (facial) modality

● Unimodal Baseline

Experiments

Results (Bi-Modal)● Bimodal Baseline & Experimental Results

10 Point Boost

12 Point Boost

Results (Tri-Modal)● Trimodal Baseline & Experimental Results

Results - Takeaways● We clearly outperform the baselines in the bi-modal domain

○ In the 7-class paradigm we often outperform by a large margin

○ For datasets without transcripts this approach may result in significant gains

● Slightly outperform baseline in tri-modal multiclass setting

● Significantly longer training times than the baseline alone

Future Work● Our method is unsupervised, we will pre-train seq2seq model

with external dataset

● Use variational seq2seq to refine the training

● Further explore end-to-end training

● Explore additional methods for encoding sequences with 2 modalities○ Multi-view LSTM

Acknowledgements

● Amir Zadeh● Volkan Cirik● Louis-Philippe Morency ● Somya Wadhwa● Minghai Chen● Hieu Pham● Workshop Reviewers● *AWS*

Thank you!

Appendix

Problem Formulation

Problem Formulation (cont’d)

Seq2Seq Modality Translation

Hierarchical Seq2Seq Modality Translation

Multimodal Sequence to Sequence Seq2Seq2Sentiment: Models ...€¦ · sentiment prediction for the...

Documents

Transcript of Multimodal Sequence to Sequence Seq2Seq2Sentiment: Models ...€¦ · sentiment prediction for the...

A Multimodal Human-Robot Interaction Datasetwebdiis.unizar.es/~jcivera/papers/azagra_etal_film_ws...A Multimodal Human-Robot Interaction Dataset Pablo Azagra Universidad de Zaragoza

Multimodal Sentiment Analysis using Hierarchical …...multimodal sentiment analysis have simply concatenated the feature vectors of di erent modalities. However, this does not take

Journal of Theoretical and Applied Information Technology ... · sentiment analysis model. This includes several key points mainly: the dataset collection, preprocessing operations,

GoEmotions: A Dataset of Fine-Grained Emotions · 2020. 5. 5. · Sentiment balancing. We reduce sentiment bias by removing subreddits with little representation of positive, negative,

Sentiment Analysis Introduction to - unipi.itdidawiki.di.unipi.it/.../mds/txa/introduction_to_sentiment_analysis.pdf · Sentiment Analysis is not a dataset. Sentiment Analysis is

CMU-MOSEAS: A Multimodal Language Dataset for Spanish, … · 2020. 11. 11. · dataset for Spanish, Portuguese, German and French. The proposed dataset, called CMU-MOSEAS (CMU Multimodal

Creating A Musical Performance Dataset for Multimodal ...static.tongtianta.site/paper_pdf/fc7a6b80-186c-11e... · ground-truth annotation ﬁles including frame-level and note-level

Evaluation Datasets for Twitter Sentiment Analysis: A survey and a new dataset, the STS-Gold

Multimodal Sentiment Analysis: A Multitask Learning Approachchaib/publications/Multimodal... · Textual Sentiment analysis is a very active area of re-search in Natural Language Processing

Multimodal Sentiment Analysis To Explore the Structure of ... · 3 TUMBLR DATASET Tumblr is a microblogging service where users post multimedia content that often contains the following

IEEE INTELLIGENT SYSTEMS, VOL. X, NO. X, MONTH, …mihalcea/papers/perezrosas.is13.pdf · Multimodal Sentiment Analysis of Spanish Online Videos ... automatic sentiment analysis,

Multimodal Sentiment Analysis with Word-Level Fusion and …pliang/slides/icmi2017_gme... · 2018. 2. 6. · § Krippendorf’sAlpha: 0.77. 6 CMU-MOSI Dataset. 7 1 Three Main Challenges

Tensor Fusion Network for Multimodal Sentiment Analysis

NewsBag: A Multimodal Benchmark Dataset for Fake News …iab-rubric.org/papers/2020_SafeAI_FakeNews.pdf · 2020. 2. 3. · NewsBag: A Multimodal Benchmark Dataset for Fake News Detection

CH-SIMS: A Chinese Multimodal Sentiment Analysis Dataset ...3 CH-SIMS Dataset In this section, we introduce a novel Chinese multi-modal sentiment analysis dataset with independent

Dissemination, Ethics, Communication, and Exploitation · Tutorial @ IJCAI 2016 8.5 Public Engagement. ... (IVCJ 2016) Special Issue Multimodal Sentiment Analysis and Mining in the

Sentiment Classification menggunakan Machine Learning ...it.maranatha.edu/wp-content/uploads/2016/01/20121023.Sentiment... · Dataset terdiri dari 2000 movie reviews3 yang dibagi

Benchmarking Multimodal Sentiment AnalysisBenchmarking Multimodal Sentiment Analysis Erik Cambriaa, Devamanyu Hazarikad, Soujanya Poriac, Amir Hussainb, R.B.V. Subramaanyamd a School

Entheos: A Multimodal Dataset for Studying Enthusiasm

EDEN: Multimodal Synthetic Dataset of Enclosed GarDEN ......EDEN: Multimodal Synthetic Dataset of Enclosed GarDEN Scenes Hoang-An Le1 Thomas Mensink1,2 Partha Das1,3 Sezer Karaoglu1,3