Một cách tổng quát, hồi quy (regression) là nhóm các phương pháp đi tìm mối tương quan định lượng giữa hai nhóm biến và trình bày mối tương quan này dưới dạng các phương trình. Thí dụ như khi ta khảo sát nội dung hồi quy trong thống kê với trường hợp rất đơn giản là hồi quy tuyến tính giữa hai biến thì ta có phương trình:
| `Y=b_0+b_1X` | (1) |
trong đó `Y` là biến phụ thuộc, `X` là biến độc lập, `b_0` và `b_1` là các hệ số.
Khi đã biết được mối tương quan này, chúng ta có thể tiến hành các hoạt động mang lại lợi ích cho mình và cho mọi người. Thí dụ khi ta biết ảnh hưởng của nhiệt độ lò nướng và tỷ lệ đường đến giá trị cảm quan của bánh quy thì ta có thể điều chỉnh các thông số này trong sản xuất để thu được các sản phẩm được nhiều người ưa chuộng.
Thuật ngữ "hồi quy" được Francis Galton sử dụng đầu tiên khi nghiên cứu về di truyền. Ông nhận thấy rằng kích thước của cây đậu hoa thế hệ con có mối quan hệ với kích thước của bố mẹ chúng và ông gọi mối quan hệ này là "regression" (ngược trở về, thoái lui).
Nhìn chung, các phương pháp xử lý thuộc nhóm hồi quy có các tính chất sau:
`Y=f(X_1,X_2,...,X_n)`(2)
trong đó `Y` là biến phụ thuộc, `X_i` là các biến độc lập.
Dựa vào tiêu chí sử dụng để phân loại mà ta có thể chia các phương pháp hồi quy thành các loại khác nhau.
Trang web này được cập nhật lần cuối ngày 26/11/2018
Dữ liệu đa biến
Các chuyên đề
Xử lý dữ liệu
Ma trận
R