Hồi quy tuyến tính được sử dụng khá rộng rãi do đơn giản, dễ sử dụng, đáp ứng khá tốt nhiều quá trình trong thực tế. Trong phần này ta xét trường hợp có hai biến.
Xét 2 biến `X` và `Y`, và `n` cặp số liệu (`x_i, y_i`). Ta cần tìm đường thẳng hồi quy có phương trình `y=ax+b` (Hình 1). Vậy ta cần xác định hai hệ số `a` và `b` của đường thẳng trên thỏa điểu kiện bình phương cực tiểu.
Hình 1 Đường thẳng hồi quy
Áp dụng công thức (2) cho trường hợp này, ta có:
`SS_E=sum_(i=1)^n (y_i-ax_i-b)^2` | (7) |
Các hệ số `a` và `b` của phương trình hồi quy được xác định từ hệ hai phương trình sau :
`(partial SS_E)/(partial a)=-2sum_(i=1)^n (y_i-ax_i-b)x_i=0` | (8) |
`(partial SS_E)/(partial b)=-2sum_(i=1)^n (y_i-ax_i-b)=0` | (9) |
Sắp xếp lại hệ phương trình trên, ta có :
`nb+asum_(i=1)^n x_i=sum_(i=1)^n y_i` | (10) |
`bsum_(i=1)^n x_i+asum_(i=1)^n x_i^2=sum_(i=1)^n x_iy_i` | (11) |
Giải hệ phương trình (10) và (11), ta thu được các kết quả sau :
`a=(nsum xy-sum x sum y)/(nsum x^2-(sum x)^2)` | (12) |
`b=(sum y sum x^2-sum x sum xy)/(n sum x^2-(sum x)^2)` | (13) |
Thí dụ
Ta sử dụng lại số liệu về chiều cao và cân nặng của 10 học sinh. Gọi `X` là chiều cao và `Y` là cân nặng. Sau khí tính toán các thừa số trong các phương trình (12) và (13) ta có Bảng 1 sau :
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | `sum` | |
---|---|---|---|---|---|---|---|---|---|---|---|
`x` | 1,57 | 1,62 | 1,58 | 1,64 | 1,74 | 1,68 | 1,71 | 1,60 | 1,66 | 1,64 | 16,44 |
`y` | 55 | 72 | 52 | 65 | 82 | 79 | 78 | 66 | 78 | 71 | 698 |
`x^2` | 2,4649 | 2,6244 | 2,4964 | 2,6896 | 3,0276 | 2,8224 | 2,9241 | 2,56 | 2,7556 | 2,6896 | 27,0546 |
`xy` | 86,35 | 116,64 | 82,16 | 106,6 | 142,68 | 132,72 | 133,38 | 105,6 | 129,48 | 116,44 | 1152,05 |
Sử dụng các công thức (12) và (13) để xác định các hệ số `a` và `b` của phương trình hồi quy, ta có:
`a=((10xx1152,5)-(16,44xx698))/((10xx27,0546)-(16,44)^2)``=166,593`
`b=((698xx27,0546)-(16,44xx1152,05))/((10xx27,0546)-(16,44)^2)``=-204,079`
Vậy theo số liệu đã cho, quan hệ giũa chiều cao `x` và cân nặng `y` được biểu diễn bằng công thức:
`y=166,593x-204,079`
Trang web này được cập nhật lần cuối ngày 27/11/2018
Thống kê
Các chuyên đề
Xử lý dữ liệu
Ma trận
R