Дмитрий Ветров. Математика больших данных: тензоры,...

36
Mathematics of Big Data Dmitry P. Vetrov Head of Big Data and Information Retrieval Department, Faculty of Computer Science, HSE.

Transcript of Дмитрий Ветров. Математика больших данных: тензоры,...

Page 1: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Mathematics of Big Data

Dmitry P. VetrovHead of Big Data and Information Retrieval Department,

Faculty of Computer Science, HSE.

Page 2: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Outline

• Intro to Machine learning

• Big Data specifics

• Bayesian framework and its extensions

• Learning from incomplete data

• Deep learning

• Stochastic optimization

• Tensor decompositions

Page 3: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Bayesian methods research group

Founded in 2007. Currently consists of 8 students, 5 PhD students, 1 researcher and 1 associate professor.

Page 4: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Bayesian methods research group

Page 5: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

What is machine learning?

Page 6: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Simple example

Page 7: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Areas of application

Page 8: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Stages

Page 9: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Entering the Age of Big Data

Data

Computationalspeed

Page 10: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

First Steps towards Mathematics of Big Data

Page 11: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Bayesian Framework

Page 12: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Bayesian Learning and Inference

Page 13: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Advantages of Bayesian inference

Page 14: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Graphical Models

Page 15: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Application

Page 16: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Incomplete data

Page 17: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Incomplete data

Page 18: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

EM algorithm

Page 19: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

General idea of SVM

Page 20: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Latent variable SVM

Page 21: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Semantic image segmentation

Page 22: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Weak annotation

Page 23: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Example: Latent DirichletAllocation

Page 24: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

LDA: model

Page 25: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Deep learning

Page 26: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Secret of Success of Neural Nets

Page 27: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Stochastic Optimization

Page 28: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Advanced Stochastic Optimization

Page 29: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Tensor perspective

Page 30: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Advantages of TT Decomposition

Page 31: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Word2vec project

Page 32: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

A Surprising effect

Page 33: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Latent semantic model

Page 34: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Results

Computer can now assign different semantic representations to different occurrences of same word depending on the context

Page 35: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

Conclusion

Page 36: Дмитрий Ветров. Математика больших данных: тензоры, нейросети, байесовский вывод

References

• (Osokin15) A. Osokin, D. Vetrov. Submodular Relaxation for Inference in Markov Random Fields. In IEEE TPAMI, 2015.

• (Novikov14) A. Novikov, A. Rodomanov, A. Osokin, D. Vetrov. Putting MRF on a Tensor Train. In ICML2014

• (Bartunov14) S. Bartunov, D. Vetrov. Variational Inference for Sequential Distance Dependent Chinese Restaurant Process. In ICML2014

• (Shapovalov15) R. Shapovalov, A. Osokin, D. Vetrov, P. Kohli. Multi-utility Learning: Structured-output Learning with Multiple Annotation-specific Loss Functions. In EMMCVPR15

• (Kirillov14) A. Kirillov, K. Lobacheva, M. Gavrikov, A. Osokin, D. Vetrov. Deep Part-Based Shape Model with Latent Variables. In GraphiCon14