Thống kê ứng dụng - Chương 12: Hồi quy tuyến tính đa biến
Đa cộng tuyến: tình trạng các biến đầu vào
của PTHQ có tương quan chặt với nhau
● Biểu hiện của đa cộng tuyến
● R
2 cao mà KQ KĐ Student lại không khẳng định
được các hệ số bê-ta là khác 0
● Hệ số tương quan tuyến tính giữa các biến đầu
vào là lớn r
ij
● Hệ số phóng đại phương sai VIFj = 1/(1-R2j) có giá
trị lớn (>5 – 10)
19 trang |
Chia sẻ: nhung.12 | Lượt xem: 1310 | Lượt tải: 0
Bạn đang xem nội dung tài liệu Thống kê ứng dụng - Chương 12: Hồi quy tuyến tính đa biến, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
CHƯƠNG 12
HỒI QUY TUYẾN TÍNH ĐA BIẾN
Ths. Nguyễn Tiến Dũng
Viện Kinh tế và Quản lý, Trường ĐH Bách khoa Hà Nội
Email: dung.nguyentien3@hust.edu.vn
MỤC TIÊU CỦA CHƯƠNG
●Sau khi kết thúc chương này, người học có
thể
● Nêu được ý nghĩa của phân tích hồi quy đa biến
(hồi quy bội) trong NCKH
● Mô tả được cách xác định phương trình hồi quy đa
biến với dữ liệu mẫu
● Kể tên và biết cách tính các chỉ tiêu đánh giá mức
độ phù hợp của mô hình hồi quy đa biến
● Hiểu các giả định và cách kiểm tra tính đúng đắn
của các giả định khi xây dựng phương trình hồi
quy bội
© Nguyễn Tiến Dũng Thống kê ứng dụng 2
CÁC NỘI DUNG CHÍNH
12.1 Phương trình hồi quy tuyến tính tổng thể
đa biến
12.2 Phương trình hồi quy tuyến tính mẫu đa
biến
12.3 Hồi quy với biến đầu vào định tính
12.4 Hồi quy phi tuyến
© Nguyễn Tiến Dũng Thống kê ứng dụng 3
Vai trò và ý nghĩa của hồi quy đa biến
●Muốn nghiên cứu ảnh hưởng đồng thời của
nhiều biến đầu vào tới 1 biến đầu ra
●Các biến đầu vào và biến đầu ra đều có dữ
liệu định lượng (khoảng, tỷ lệ)
●Trong số các biến đầu vào, có biến định tính
(biến giả)
© Nguyễn Tiến Dũng Thống kê ứng dụng 4
12.1 PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH BỘI VỚI
DỮ LIỆU TỔNG THỂ
● TD Trang 358: 3 biến độc lập
● yi = b0 + b1x1i + b2x2i + b3x3i + ei
● KQ làm việc = f(PT tình huống, Khả năng trình bày
viết, Khả năng trình bày miệng)
● x1 = Khả năng PT tình huống
● x2 = Khả năng trình bày viết
● x3 = Khả năng trình bày miệng
● y = Kết quả làm việc
● bj: hệ số độ dốc của y theo xj, trong điều kiện các biến
khác được giữ nguyên không đổi hệ số hồi quy
riêng phần
© Nguyễn Tiến Dũng Thống kê ứng dụng 5
12.2 PHƯƠNG TRÌNH HỒI QUY TUYẾN TÍNH MẪU ĐA
BIẾN
●TD: PTHQTT mẫu với 3 biến đầu vào
© Nguyễn Tiến Dũng Thống kê ứng dụng 6
0 1 1 2 2 3 3
0 1 1 2 2 3 3
( 1, )
ˆ
i i i i i
i i i i
y b b x b x b x e i n
y b b x b x b x
Data Analysis (Excel): Regression
© Nguyễn Tiến Dũng Thống kê ứng dụng 7
Hiểu các kết quả phân tích
●SSR = 171,3057
●SSE = 37,6277
●SST = 208,9333
●Hệ số xác định bội R2 = SSR/SST = 0,8199
●Hệ số xác định bội hiệu chỉnh R2adj = 0,7708
© Nguyễn Tiến Dũng Thống kê ứng dụng 8
2 2 1
1 (1 )
1
adj
n
R R
n k
Đánh giá ý nghĩa toàn diện của mô hình
●H0: b1=b2=b3=0
●H1: Có ít nhất một hệ số bi khác 0
●Chỉ tiêu KĐ Fisher
● p-value(FStat) = 0,0002 < 0,05 Mô hình có ý
nghĩa
© Nguyễn Tiến Dũng Thống kê ứng dụng 9
S
/
16,6931
/ ( 1)
tat
MSR SSR k
F
MSE SSE n k
Sai số chuẩn của ước lượng (Standard Error)
●Đo lường sự phân tán của các giá trị thực tế
trong dữ liệu mẫu của biến phụ thuộc xung
quanh giá trị của biến phụ thuộc được dự
đoán bằng đường hồi quy
© Nguyễn Tiến Dũng Thống kê ứng dụng 10
/
37,6277
1,8495
1 15 3 1
Y X
SSE
s
n k
Đánh giá ý nghĩa của từng biến độc lập
●KĐ tính khác không của các hệ số
bj
●Chỉ tiêu KĐ tStat
●Các hệ số bj được Excel tính sẵn
trong bảng Coefficients
●Số bậc tự do: df = n-k-1
●KQ: Các hệ số của x1, x2 và x3 đều
không thực sự khác 0 với độ tin
cậy 95% Tại sao?
© Nguyễn Tiến Dũng Thống kê ứng dụng 11
0
1
S
: 0
: 0
j
j
j
j
tat
b
H
H
b
t
s
b
b
Hiện tượng đa cộng tuyến (Multi-collinearity)
●Đa cộng tuyến: tình trạng các biến đầu vào
của PTHQ có tương quan chặt với nhau
●Biểu hiện của đa cộng tuyến
● R2 cao mà KQ KĐ Student lại không khẳng định
được các hệ số bê-ta là khác 0
● Hệ số tương quan tuyến tính giữa các biến đầu
vào là lớn rij
● Hệ số phóng đại phương sai VIFj = 1/(1-R
2
j) có giá
trị lớn (>5 – 10)
© Nguyễn Tiến Dũng Thống kê ứng dụng 12
Hệ số tương quan giữa 2 biến và VIF
x1 x2 x3 VIF
x1 1,0000 0,5781 0,6761 1,8429
x2 0,5781 1,0000 0,8675 4,0435
x3 0,6761 0,8675 1,000 4,9590
© Nguyễn Tiến Dũng Thống kê ứng dụng 13
Khắc phục hiện tượng đa cộng tuyến
© Nguyễn Tiến Dũng Thống kê ứng dụng 14
Kiểm tra các giả định của mô hình HQTT đa biến: Phân
tích phần dư
●Quan hệ tuyến tính giữa biến đầu ra và các
biến đầu vào
● Vẽ đồ thị phần dư lần lượt theo từng biến đầu vào
●Phần dư có phân phối normal
●PS của phần dư không đổi
● KĐ Park: Mô hình HQTT Ln(e2) theo y^
●Không có sự tự tương quan
● KĐ Durbin-Watson
●Không có hiện tượng đa cộng tuyến
© Nguyễn Tiến Dũng Thống kê ứng dụng 15
12.3 HỒI QUY VỚI BIẾN ĐẦU VÀO ĐỊNH TÍNH
●Hồi quy với biến giả (dummy variables)
●TD:
● Thu nhập = f(Số năm kinh nghiệm; Bằng MBA)
● y = Thu nhập
● x1 = Số năm kinh nghiệm
● d = Bằng MBA (1=có; 0=không)
© Nguyễn Tiến Dũng Thống kê ứng dụng 16
Hồi quy với biến giả (MBA)
© Nguyễn Tiến Dũng Thống kê ứng dụng 17
ˆ 8993,52 1072,14. 2935,39.y x d
Một số vấn đề liên quan đến việc sử dụng biến giả
●Để phân biệt m loại/nhóm, cần dùng m-1 biến
giả
●Việc gán giá trị 1 và 0 cho loại nào không
quan trọng. Chỉ lưu ý việc giải thích KQ.
●Loại nhận giá trị 0 gọi là loại cơ sở.
●Hệ số gắn với biến giả d được gọi là hệ số
tung độ gốc chênh lệch.
© Nguyễn Tiến Dũng Thống kê ứng dụng 18
12.4 HỒI QUY PHI TUYẾN
●Các dạng hàm phi tuyến thường dùng
● Hàm bậc 2
● Hàm đa thức bậc n
● Hàm mũ
● Hàm logarit
●Cách thực hiện
● Vẽ đồ thị dự đoán mối liên hệ
● Thực hiện PTHQ phi tuyến trực tiếp
● Tuyến tính hóa PTHQ tuyến tính
© Nguyễn Tiến Dũng Thống kê ứng dụng 19
Các file đính kèm theo tài liệu này:
- tkud2015_ch12_4485.pdf