CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

27
CHƯƠNG 6 CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU VÀ PHÂN TÍCH DỮ LIỆU NGHIÊN CỨU MARKETING

description

NGHIÊN CỨU MARKETING. CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU. 1. KIỂM TRA CHỈNH LÝ DỮ LIỆU. Kiểm tra thực đ ịa: xác đ ịnh tính trung thực và chính xác của dữ liệu Chỉnh lý dữ liệu: bổ sung thiếu sót và hiệu chỉnh các sai sót. KIỂM TRA THỰC ĐỊA. Kiểm tra phần xác nhận - PowerPoint PPT Presentation

Transcript of CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Page 1: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

CHƯƠNG 6CHƯƠNG 6CHUẨN BỊ DỮ LIỆU, XỬ LÝ CHUẨN BỊ DỮ LIỆU, XỬ LÝ

VÀ PHÂN TÍCH DỮ LIỆUVÀ PHÂN TÍCH DỮ LIỆU

NGHIÊN CỨU MARKETING

Page 2: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

1. KIỂM TRA CHỈNH LÝ DỮ LIỆU

• Kiểm tra thực địa: xác định tính trung thực và chính xác của dữ liệu

• Chỉnh lý dữ liệu: bổ sung thiếu sót và hiệu chỉnh các sai sót

Page 3: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

KIỂM TRA THỰC ĐỊA

• Kiểm tra phần xác nhận

• Giám sát viên tổ chức kiểm tra thực địa ít nhất 20% số mẫu

• Trở lại địa chỉ đã chọn mẫu, hỏi một vài chỉ tiêu quan trọng để đối chiếu

Page 4: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

CHỈNH LÝ DỮ LIỆU

• Những cuộc phỏng vấn giả tạo

• Câu trả lời không đầy đủ

• Câu trả lời lạc đề, sai nội dung

• Câu trả lời không đọc được

Page 5: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

NGUYÊN TẮC CHỈNH LÝ

• Bổ sung, chỉnh sửa nếu có khoảng 20% sai sót trở lên

• Hiệu chỉnh sai sót nhỏ từ việc suy luận từ các câu trả lời khác

• Dùng viết màu khác để chỉnh sửa, không được xóa dữ liệu gốc

• Thống nhất nguyên tắc chỉnh lý chung

Page 6: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Page 7: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

THỐNG KÊ MÔ TẢ

(1) Đo lường độ tập trung: • Số trung bình (mean)• Mode• Số trung vị (Median)(2) Đo lường độ phân tán:• Phương sai hay độ lệch chuẩn (Var/St.d) • Dãy biến động (Range)• Hệ số biến động (C.V)

Page 8: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

PHÂN TÍCH TẦN SỐ

• Đếm tần số xuất hiện

• Đồ thị phân phối tần số• Biểu thị sự chọn lựa nhãn hiệu,

SP được ưa thích

Page 9: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

PHÂN TÍCH BẢNG CHÉO (CROSSTABULATION)

• Là kỹ thuật thống kê mô tả hai hay ba biến cùng lúc

• Mỗi ô trong bảng chứa đựng sự kết hợp phân loại của hai biến (theo hàng, cột)

• Nếu vấn đề trong xử lý Cross- tabulation hai biến chưa đuợc kết luận rõ ràng, ta cần tiến hành xử lý 3 biến để làm rõ hoặc bác bỏ mối quan hệ ban đầu.

Page 10: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

CROSSTAB HAI BIẾN

Điều tra 100 hộ về nhu cầu mua TV

• 40 hộ mua TV màn hình phẳng

• 60 hộ mua TV màn hình cong

• Nhà nghiên cứu muốn tìm hiểu chi tiết nguyên nhân dẫn đến quyết định mua hàng (làm rõ vấn đề nghiên cứu), sẽ sử dụng phân tích bảng chéo – thống kê mô tả hai chiều

Page 11: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Chỉ tiêu Thu nhập cao

Thu nhập thấp

Tổng theo hàng

Mua TV phẳng% theo hàng% theo cột

3075%60%

1025%20%

40100%

Mua TV cong% theo hàng% theo cột

2034%40%

4066%80%

60100%

Tổng theo cột

50100%

50100%

100100%

Page 12: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

CROSSTAB BA BIẾNHai biến ban đầu

Không có sự kết hợp giữa hai biến?

Có sự kết hợpgiữa hai biến?

Giới thiệu biến thứ ba

Giới thiệu biến thứ ba

Không có sự thay đổi trong mối liên hệ giữa hai

biến ban đầu

Không có sự liên hệ giữa hai biến

ban đầu

Làm rõ quan hệgiữa hai biến ban

đầu

Làm nổi bật mối liên hệ giữa hai

biến ban đầu

Page 13: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

LÀM RÕ MQH BAN ĐẦU

Mức độ mua hàng Tình trạng hôn nhân

Có gia đình Chưa có gia đình

Cao (%)Thấp (%)Số khách hàng

(người)

3169700

5248300

VD: nghiên cứu mối liên hệ giữa việc mua quần áo thời trang và tình trạng hôn nhân. Khách hàng chia hai loại cao và thấp dựa vào mức độ mua.

Page 14: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Khả năng mua quần áo theo hôn nhân va giới tính

Mức độ mua hàng Giới tính

Nam Nữ

Có GĐ Chưa có GĐ

Có GĐ Chưa có GĐ

Cao (%)Thấp (%)Số khách hàng người)

3565

400

4060

120

2575

300

6040180

Page 15: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Không có liên hệ hai biến ban đầu

VD: xét mối QH giữa việc sở hữu xe gắn máy và trình độ học vấn bậc ĐH.

Sở hữu xe máy Trình độ học vấn

Có bằng đại học

Chưa có bằng đại học

Có (%)Không (%)Tổng cộng (%)Số người phỏng vấn

3268100250

2179

100750

Page 16: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Sở hữu Thu nhập

Thấp Cao

Có ĐH Chưa có ĐH

Có ĐH Chưa có ĐH

Có (%)Không (%)Số người được

phỏng vấn

2080

100

208070

4060

150

406050

Mối liên hệ giữa sở hữu xe máy với trình độ học vấn và thu nhập

Page 17: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Làm nổi bật mối quan hệ ban đầu

VD: nghiên cứu việc du lịch nước ngoài có ảnh hưởng bởi tuổi hay không. Một mẫu 1000 người được phỏng vấn trong 2 độ tuổi: < 45 tuổi và > 45 tuổi.

Thái độ Tuổi

mong muốn du lịch < 45 > 45

Có (%)Không (%)Số người được phỏng vấn

5050500

5050500

Page 18: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Thái độ du lịch Giới tính

Nam Nữ

<45 tuổi

>45 tuổi

<45 tuổi

>45 tuổi

Có (%)Không (%)

Số người được phỏng vấn

6040300

4060

300

3565

200

6535

200

Mối liên hệ giữa việc du lịch với độ tuổi và giới tính

Page 19: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Không có sự thay đổi trong mối liên hệ ban đầu

Dùng phân phối “chi bình phương” để kiểm định mối quan hệ giữa các biến.

• H0: không có mối quan hệ giữa các biến• H1: có mối quan hệ giữa các biến

Giá trị kiểm định 2 trong kết quả phân tích sẽ cung cấp mức ý nghĩa của kiểm định P-value.

Nếu sig.< = : bác bỏ giả thuyết H0, nghĩa là các biến có liên hệ nhau.

Page 20: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

• Phân khúc thị trường để nhận dạng các biến phân nhóm khách hàng

• Xác định phẩm chất của nhãn hiệu ảnh hưởng đến sự chọn lựa của khách hàng

• Tìm hiểu thói quen sử dụng phương tiện thông tin của thị trường mục tiêu

• Nhận dạng những đặc điểm của khách hàng nhạy cảm về giá

PHÂN TÍCH NHÂN TỐ(Factor Analysis)

Page 21: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Những lợi ích cơ bản mà khách hàng cần tìm khi mua kem đánh răng

V1: Chống được sâu răng

V2: Tạo được hàm răng sáng

V3: Không làm nhiễm trùng nướu răng

V4: Tạo hơi thở thơm tho

V5: Chống được canxi hóa răng

V6: Có hàm răng hấp dẫn

V7: Có hàm răng khỏe mạnh

Page 22: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

LẬP MA TRẬN TƯƠNG QUAN

Biến V1 V2 V3 V4 V5 V6 V7

V1

V2

V3

V4

V5

V6

V7

1,000,130,670,170,700,130,56

1,000,210,710,150,690,22

1,000,190,490,160,73

1,000,130,690,21

1,000,210,72

1,000,31

1,00

Page 23: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Để xác định tất cả 7 biến có tương quan như thế nào, ta sử dụng kiểm định Barlett’s để kiểm định giả thuyết (phần mềm SPSS):

H0: Các biến không có tương quan

H1: Có tương quan giữa các biến

Trong phân tích nhân tô,ú ta mong đợi bác bỏ giả thuyết H0, nghĩa là chấp nhận giả thuyết H1 các biến có

liên quan với nhau (Điều này có được khi giá trị P sau khi kiểm định phải nhỏ hơn mức ý nghĩa xử lý )

Page 24: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Xác định số nhân tố

• Quyết định trước số nhân tố: qua phán đoán, nhà NC quyết định số nhân tố trước khi phân tích.

• Dựa vào phương sai tổng hợp của từng nhân tố (Eigenvalue): những nhân tố có Eigenvalue > 1 mới được đưa vào mô hình. Nếu số biến ban đầu ít hơn 20 thì cách tiếp cận này vẫn còn tác dụng.

• Quyết định dựa vào phần trăm phương sai của từng nhân tố (cột 5): Số nhân tố được chọn vào mô hình phải có tổng phương sai tích lũy giữa hai nhân tố lớn hơn 60%. (tùy thuộc vào vấn đề nghiên cứu mức độ này có thể thấp hơn).

Page 25: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Initial Variable

(1)

Statistics Communality

(2)

Factor

(3)

Eigenvalue

(4)

Percent of

variance (5)

Cumulative Percentage

(6)

V1

V2

V3

V4

V5

V6

V7

1.00 1.00 1.00 1.00 1.00 1.00 1.00

1 2 3 4 5 6 7

3.38 1.96 0.52 0.44 0.30 0.27 0.90

48.3 28.0 7.6 6.4 4.3 4.0 1.4

48.3 76.3 83.9 90.3 94.6 98.6

100.0

Page 26: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Ma trận nhan to chuan hoa

Factor

Nhân tố 1

Nhân tố 2

Nhân tố lợi ích về sức khỏe (F1)

Nhân tố lợi ích về xã hội (F2)

V1

V2

V3

V4

V5

V6

V7

0.850.090.830.100.840.130.86

0.040.890.110.890.070.880.21

chống sâu răng

chống nhiễm trùng nướu

chống canxi hóa

răng khỏe

răng sáng

hơi thở thơm tho

hàm răng hấp dẫn

Page 27: CHƯƠNG 6 CHUẨN BỊ DỮ LIỆU, XỬ LÝ VÀ PHÂN TÍCH DỮ LIỆU

Xac dinh diem nhan to

Ước lượng điểm nhân tố của F1 và F2

F1= 0,31x1 + 0,29 x3 + 0,3x5 +0,29x7

F2= 0,38x2 + 0,38x4 + 0,37x6

Variable Factor 1 Factor 2

V1

V2

V3

V4

V5

V6

V7

.30931-.05548.29250

-.04918.30199

-.04160.29173

-.06814.38315

-.03331.38087

-.05191.37478.00697