[OpenStack Days Korea 2016] Track3 - 머신러닝과 오픈스택
-
Upload
openstack-korea-community -
Category
Technology
-
view
15.850 -
download
1
Transcript of [OpenStack Days Korea 2016] Track3 - 머신러닝과 오픈스택
Machine Learning & OpenStack
MHR Inc,
1
Machine Learning?
2
Image Captioning, What a surprise!!!
3
http://cs.stanford.edu/people/karpathy/deepimagesent/
Deep Learning을이용한 Image Captioning 샘플
Image Captioning Process
4
Recognize Object
Detect Words
Generate sentences
Rank sentences
Identify Object
결코쉽지않은작업
Big Event!!!, VS Alpha GO
5
누가이길까?
Deep Blue VS in Chess
6
딥 블루는 세계 체스 챔피언 그랜드마스터 가리 카스파로프를 시간제한이 있는 정식 대국에서 이긴 최초의 컴퓨터이다. 딥블루는 1996년 2월 10일 카스파로프와의 첫 번째 체스 대국에서이겼다. 그러나 나머지 다섯 번의 대국에서 카스파로프가 3번 이기고2번 비겼기 때문에 최종적으로는 4-2의 점수로 카스파로프가 승리했다.
마지막 대국이 끝난 것은 1996년 2월 17일이다.
이후에 딥 블루에 엄청난 성능향상 작업이 있었고 1997년 5월에 다시맞붙었다. 성능이 향상된 새로운 컴퓨터의 비공식적인 별명은 '디퍼블루'(Deeper Blue)였다. 6번의 대국은 5월 11일에 최종적으로 끝났고3.5-2.5의 점수로 딥 블루가 승리했다. 이로써 딥 블루는 시간 제한이있는 정식 체스 토너먼트에서 세계 챔피언을 꺾은 최초의 컴퓨터가되었다.
Source - WIKI
Human VS Machine In Finance Industry
• Goove WM, Zald DH등이 작성한 Clinical
versus Mechanical Prediction: a meta-
analysis 논문에 의하면 136건의 사례를
조사해보니 수학적 모델이 사람보다
비슷하거나 더 좋은 결과를 가져올 확률이
94%라고 한다.
7
(source - http://www.ncbi.nlm.nih.gov/pubmed/10752360)
Algorithm Trading
8
• 알고리즘 트레이딩은 수학적 계산과 IT 시스템을
이용해 트레이딩을 하는 것으로 시스템 트레이딩
, Algo Trading 혹은 Blackbox 트레이딩이라고 한
다.
• 알고리즘 트레이딩은 투자은행, 연기금, 헤지펀드
, 증권회사등 많은 곳에서 사용되고 있으며, 최근
몇년사이에는 수학적지식과 IT지식을 가진 개인
들도 많이 참여하고 있다.
James Harris Simons
9
• Renaissance Technology 설립자
• MIT, UC 버클리 수학박사
• 전 하버드대 수학교수
• 수학자 및 헤지펀드 매니져
• 1976년 베블런상 수상
• 2006년 역대 최고 연봉
– 17억달러(2조원)
https://en.wikipedia.org/wiki/James_Harris_Simons
실제로 그를 만나본 사람들은
'사이먼스는 돈이 중요한 사람이라기보다는 단순히 수학에 미친 사람’
Algorithm Trading
10
미국은 2012년 알고리즘 트레이딩 거래량이 85%에 달할만큼 알고리즘 트레이딩은 가파르게 증가
Behind the Magic
11
Essense of Machine Learning
12
y = f(x)
• Training: given a training set of labeled examples {(x1,y1), …, (xN,yN)}, estimate the prediction function f by minimizing the prediction error on the training set
• Testing: apply f to a never before seen test example x and output the predicted value y = f(x)
output prediction
function
Image
feature
Finding Parameter is What ML does
13
Machine Learning
14
Supervised Learning
15
• Prediction• Classification (discrete labels),
Regression (real values)
Unsupervised Learning
16
• Clustering• Probability distribution estimation• Finding association (in features)• Dimension reduction
What Machine Learning can do
17
Clustering Regression Classification
Supervised LearningUnsupervised Learning
Regression
18
predictor variable x,y = w0 + w1x
Training Data Set
Regression Example -
19
아래처럼주택가격예측을하고싶다면…
Traditional Approach
20
수많은반복과노력이필요…
Y = ax + b
Hypothesis
Find ‘a’ and ‘b’ By hands
Regression - Machine Learning Approach
21
기계에의한수많은반복
Y = ax + b
Hypothesis
Find ‘a’ and ‘b’ By Iteration
Classification
22
1) Model Training 2) Classification
Classification - Logistic Regression
23
최적의 w를찾아 Decision Boundary 결정
OpenStack & Machine Learning
24
A Serious Pain in Machine Learning
25
Training Time
54.65 Hours
• Intel i7, 4.5Ghz, 4 Core
• Boosted Tree
• Numerical Data
• Data : 29,177
• 189 Features Only
26
Nightmare
27
Hyperparameter Optimization
28
Hyperparameter > Model Parameter
Fore Better Result
Who Knows
29
Do everything
If no Domain Knowledge
This is The Machine Learning!!!
30
정원꾸미는 것과 유사함
• Seeds = Algorithms
• Nutrients = Data
• Gardener = You
• Plants = Programs
Magic?
Machine Learning in Practice
31
Understanding domain, prior
knowledge, and goals
Data integration, selection, cleaning,
pre-processing, etc.
Learningmodels
Interpreting results
Consolidating and deploying
discovered knowledge
Infinite loop
algorithm
The Only Solution, So far
32
Parallelization + Automation
So More Computing Power
33
OpenStack!!!
34
APPS USERS ADMINS
Connects to apps via APIsSelf-service Portals for users
OpenStack
Virtual Data Center
To Provide Unlimited Computing Resources
Virtual Data Center Virtual Data Center Virtual Data Center
Machine Learning
35
No Doubt!!!
Faster then you think
OpenStack for Machine Learning?
36
GPU Spark High Speed Network
37
.