Thailand Hadoop Big Data Challenge #1

11
Thailand Hadoop Big Data Challenge #1 Kan Ouivirach

Transcript of Thailand Hadoop Big Data Challenge #1

Page 1: Thailand Hadoop Big Data Challenge #1

Thailand Hadoop Big Data Challenge #1

Kan Ouivirach

Page 2: Thailand Hadoop Big Data Challenge #1

เบื้องต้น

• ใช้ข้อมูล Airline on-time performance ปี 2008

• เทคโลโนยีที่ใช้

• Amazon Elastic MapReduce (EMR)

• Hadoop Streaming

• Python

2

Page 3: Thailand Hadoop Big Data Challenge #1

คำถาม?

• 5 สายการบินที่มีจำนวนเที่ยวบินมากที่สุด?

• เวลา Arrival Delay เฉลี่ยของ 5 สายการบินนั้น?

• เวลา Arrival Delay และเวลา Departure Delay ของแต่ละแอร์พอร์ต?

• ความสัมพันธ์ระหว่าง Weather Delay กับ Arrival Delay และ Departure Delay?

• วันไหนเหมาะแก่การเดินทาง?

3

Page 4: Thailand Hadoop Big Data Challenge #1

5 สายการบินที่มีจำนวนเที่ยวบินมากที่สุด?

1. WN จำนวน 1,201,754 เที่ยวบิน

2. AA จำนวน 604,885 เที่ยวบิน

3. OO จำนวน 567,159 เที่ยวบิน

4. MQ จำนวน 490,693 เที่ยวบิน

5. US จำนวน 453,589 เที่ยวบิน

4

Page 5: Thailand Hadoop Big Data Challenge #1

เวลา Arrival Delay เฉลี่ยของ 5 สายการบินนั้น?

5

Page 6: Thailand Hadoop Big Data Challenge #1

เวลา Arrival Delay และเวลา Departure Delay ของแต่ละแอร์พอร์ต?

6

Page 7: Thailand Hadoop Big Data Challenge #1

ความสัมพันธ์ระหว่าง Weather Delay กับ Arrival Delay และ Departure Delay?

7

Page 8: Thailand Hadoop Big Data Challenge #1

วันไหนเหมาะแก่การเดินทาง?

8

Page 9: Thailand Hadoop Big Data Challenge #1

Demo

9

Page 10: Thailand Hadoop Big Data Challenge #1

https://github.com/zkan/thailand-hadoop-big-data-challenge-1

http://zkan.github.io/thailand-hadoop-big-data-challenge-1/

10

Page 11: Thailand Hadoop Big Data Challenge #1

Thank You