Hồi quy logistic là gì

      42

1. Lúc nào sử dụng?

Hồi quy logistic (thường được gọi đơn giản và dễ dàng là hồi quy logistic nhị thức) được sử dụng để dự đoán phần trăm một quan cạnh bên rơi vào một trong những trong các loại của biến phụ thuộc vào dựa bên trên một hoặc những biến tự do có thể liên tiếp hoặc phân loại. Mặt khác, nếu đổi mới phụ thuộc của công ty là một số đếm, phương thức thống kê nên được xem như xét là hồi quy Poisson. Xung quanh ra, trường hợp bạn có rất nhiều hơn nhì loại thay đổi phụ thuộc, đó là lúc hồi quy logistic nhiều thức (multinomial logistic regression) yêu cầu được sử dụng.

Bạn đang xem: Hồi quy logistic là gì

Ví dụ, chúng ta cũng có thể sử dụng hồi quy logistic nhị thức để hiểu liệu hoàn toàn có thể dự đoán thành tích bài kiểm tra dựa trên thời hạn ôn tập cùng mức độ lo ngại của bài kiểm tra hay không (tức là, trong những số ấy biến phụ thuộc vào là “thành tích thi”, được đo trên thang phân đôi – “đạt” hoặc “không đạt” – và bạn có hai biến độc lập: “thời gian ôn tập” cùng “lo lắng lúc kiểm tra”).

2. Quy mô hồi quy logistic

Mô hình hồi quy logistic được sử dụng để dự đoán một đổi thay phân loại vì chưng một hoặc nhiều biến chủ quyền liên tục hoặc phân loại. Phát triển thành phụ thuộc hoàn toàn có thể là nhị thức (binary), thiết bị tự (ordinal) hoặc đa phân nhiều loại (multicategorical).

Biến hòa bình có thể là khoảng/tỉ lệ, lưỡng phân (dichotomous), rời rộc (discrete) hoặc các thành phần hỗn hợp của tất cả.

Phương trình hồi quy logistic (trường đúng theo biến phụ thuộc là nhị thức) là:

*

Trong đó phường là phần trăm quan ngay cạnh một trường hợp i trong tác dụng biến Y cùng với một cực hiếm = 1; e là 1 trong hằng số toán học Euler có mức giá trị gần bởi 2.71828; và những hệ số hồi quy β khớp ứng với các biến quan liêu sát.

Chúng ta thương sử dụng mô hình hồi quy để ước lượng hiệu ứng của những biến X về một Odds (Y=1).

3. Diễn giải hiệu ứng trong hồi quy logistic

Cho mục đích ước lượng và tiên đoán, các xác suất có số lượng giới hạn nghiêm trọng. Đầu tiên, chúng bị ràng buộc vào phạm vi tự 0 mang đến 1. Điều này ngụ ý rằng nếu cho 1 hiệu ứng thực của vươn lên là X về tác dụng của biến Y vượt thừa 1, sự diễn giải có thể là vấn đề. Giới hạn thứ hai, tỷ lệ không thể là âm. Giả sử mang lại hiệu ứng của một biến tự do về biến Y là âm, sự diễn giải theo thông số hồi quy logistic là vô nghĩa. Một vấn đề rằng hệ số hồi quy chỉ nên là dương.

Làm gắng nào để giải quyết và xử lý hai sự việc trên?

Có hai cách tiếp cận thông qua việc họ thực hiện tại hai thay đổi đổi. Sản phẩm công nghệ nhất, chúng ta đổi khác xác suất vào Odds (O) là:

*

Đó là, Odds rằng một sự kiện sẽ xẩy ra là tỉ lệ của chu kỳ kì vọng rằng sự kiện sẽ xẩy ra với tần số kì vọng rằng sự kiện sẽ không còn xảy ra. Đây là mối quan hệ trực tiếp thân Odds (Y=1) và tỷ lệ Y=1. Như vậy, nhận định rằng Odds rất có thể có quý giá vô cùng, thì tỷ lệ với Odds hiện nay cho phép hệ số hồi quy rất có thể có bất kỳ giá trị nào.

Bước tiếp sau là để giải quyết vấn đề vật dụng hai. Mối quan hệ giữa Odds và xác suất, mở rộng một chút đại số học, chúng ta cũng có thể trình bày lại công thức Odds (O) ở trên theo logarit của Odds (Y=1):

*

Để đo lường và tính toán logarit cho một trường hợp tình cờ trong số lượng dân sinh cho cực hiếm về một biến chủ quyền hoặc hiệp biến. Bổ sung cập nhật vào biến dựa vào Y có giá trị 1 (ví dụ, 1 (phiếu bầu cho Obama trong những năm 2008), 0 (phiếu bầu cho McCain trong năm 2008, tại thai cử Mỹ). Trả định rằng phần trăm bầu phiếu mang lại Obama P(Y=1) là 0.218 ; và vì vậy 1-P = 0.782 . Chúng ta tính được Odds là: Odds=0.218/0.782=0.279. Giá trị này chỉ cho chúng ta nhìn thấy Odds thu được, hiện nay chúng ta phải thường xuyên giả định rằng các hệ số hồi quy logistic tương quan là vào hướng thiết yếu xác. Vị đó chúng ta cần sử dụng công thức logarit của Odds.

Theo đó, logarit tự nhiên (loge , kí hiệu ln) của Odds (ví dụ ln 0.279 = -1.276). Vày đó, logarit của xác suất của phiếu thai cho Obama là ‘-1.276’. Như vậy, nếu bọn chúng ra chỉ tạm dừng ở dự kiến xác suất, bạn cũng có thể đi đến các hiệu quả sai (một số dương). đồ vật hai, cảm giác đúng của những hiệp biến được tương quan là được reviews không đúng nút (đánh giá bán thấp). Ưu điểm thiết yếu của logarit Odds rằng những hệ số chiếm được là ràng buộc, và chúng có thể là âm cũng như dương, phạm vi tự âm vô cùng mang lại dương vô cùng.

Phát biểu theo cách này, hồi quy logistic thấy chính xác như hồi quy bội sinh sống phía bên đề xuất của phương trình logarit Odds. Phía phía bên trái của phương trình không là điểm số của Y. Nó là logarit của Odds (Y=1). Điều này còn có nghĩa rằng mỗi đơn vị chức năng của X bao gồm hiệu ứng của β về logarit Odds của Y. Logarit Odds của Y không là 1 ý tưởng dễ, vị vậy, bọn họ cần một cách khác để lý giải về cảm giác trong hồi quy logistic, xin phát âm phần tiếp theo.

4. Ước lượng quy mô hồi quy logistic với sự hợp lí cực đại (Maximum Likelihood)

Bởi do hồi quy logistic vận động về một vươn lên là phân loại, cách thức của bình phương nhỏ dại nhất (ordinary least squares – OLS) là ko thể áp dụng (nó giả định một biến dựa vào được triển lẵm chuẩn). Vì chưng vậy, một phương pháp ước lược chung hơn được áp dụng để phân phát hiện giá trị tương xứng tốt của các tham số. Điều này được điện thoại tư vấn là “ước lượng hợp lý cực đại” (Maximum likelihood estimation).

Hợp lí cực to (Maximum likelihood) là một kĩ thuật mong lượng tác động để chọn những ước lượng tham số rằng cực đại sự phù hợp của bộ tài liệu mẫu là được quan liêu sát. Vào hồi quy logistic, phù hợp lí cực đại chọn các ước lượng hệ số rằng sự cực to về logarit của phần trăm của quan sát cỗ giá trị rõ ràng của biến nhờ vào trong mẫu mang đến một bộ đã cho của các giá trị X.

Nhưng câu hỏi nghiên cứu vớt cơ bản được giải quyết bởi phương pháp hợp lí cực to là: Các quý giá tham số gì của dân sinh có trong thực tiễn đã làm cho phát sinh mẫu mã mà bọn họ được quan sát?

Bởi vày hồi quy logistic sử dụng phương pháp hợp lí cực đại, hệ số xác định (R2) rất có thể không được ước lượng trực tiếp. Bởi đó, bọn họ có hai lúng túng cho việc diễn giải hồi quy logistic: Đầu tiên, làm thế nào thì cũng ta nhận xét được ‘điều xuất sắc của sự phù hợp’ (goodness of fit) – một giả thuyết vô hiệu tổng quát? vật dụng hai, làm nạm nào bọn họ đánh giá chỉ được hiệu ứng từng phần của mỗi đổi thay X? Để vấn đáp câu hỏi, vui miệng xem phần tiếp theo.

5. Suy luận thống kê cùng giả thuyết vô hiệu

Câu hỏi sản phẩm công nghệ nhất, làm cho thế nào cũng ta review được ‘điều giỏi của sự phù hợp’ (goodness of fit) – một trả thuyết vô hiệu tổng quát? những suy luận thống kê, cùng rất giả thuyết vô hiệu được diễn giải theo quá trình sau đây:

– Bước đầu tiên trong diễn giải hồi quy là đánh giá giả thuyết vô hiệu hóa tổng quát mắng (golbal null hypothesis) rằng các biến độc lập không có bất kể mối tương tác nào với Y. Trong phương thức hồi quy OLS, họ thực hiện vấn đề này bằng chất vấn liệu R2 phải là 0 trong dân số sử dụng một F-test. Trong khi hồi quy logistic sử dụng cách thức hợp lí cực lớn (không OLS): đưa thuyết vô hiệu hóa H0 là: β0 = β0 = β0 = 0 . Họ đo lường size củ phần dư từ quy mô này với 1 logarit những thống kê sự phải chăng (likelihood statistic).

– Sau đó bọn họ ước lượng quy mô một lần nữa, đưa định rằng mang thuyết loại bỏ là sai lầm, rằng bọn họ tìm thấy cực hiếm hợp lí cực đại của những hệ số β vào mẫu. Một đợt nữa, chúng ta đo lường kích thước của phần dư từ mô hình này với cùng một logarit thống kê lại sự vừa lòng lí.

– Cuối cùng, họ so sánh hai thống kê bởi tính toán một thống kê lại kiểm tra: -2(ln Lnull – ln Lmodel)

Thống kê này nói cho chúng biết gồm bao nhiêu phần dư (hoặc dự đoán lỗi), rất có thể giảm bằng phương pháp sử dụng những biến X. đưa thuyết vô hiệu gợi ý rằng sự sút này là 0 ; trường hợp thống kê là đủ bự (trong một đánh giá Chi-bình phương cùng với df = số đổi thay độc lập), chúng ta bác vứt giả thuyết vô hiệu. Tại đây, họ kết luận rằng tối thiểu một biến chủ quyền có hiệu ứng với logarit Odds.

SPSS cũng chạy ra thống kê lại R2 để giúp review sự mạnh khỏe của sự liên kết. Tuy vậy nó như 1 R2 giả, tránh việc được diễn giải bởi vì hồi quy logistic không áp dụng R2 y hệt như hồi quy tuyến tính.

Câu hỏi đồ vật hai, làm nắm nào chúng ta đánh giá chỉ được hiệu ứng từng phần của mỗi vươn lên là X?

Khi trả thuyết vô hiệu tổng quát lác bị chưng bỏ, họ sẽ reviews hiệu ứng từng phần của các biến dự đoán.

Như vào hồi quy con đường tính bội, trong hồi quy logistic, điều đó ngụ ý rằng trả thuyết vô hiệu cho mỗi biến độc lập bao gồm trong phương trình. đưa thuyết vô hiệu rằng mỗi thông số hồi quy là bởi 0, hoặc nó không ảnh hưởng đến logarit Odds.

Mỗi ước lượng hệ số B gồm một không đúng số chuẩn (standard error) – cường độ trung bình, họ kì vọng B biến hóa từ một mẫu mã này với mẫu mã khác bởi cơ hội may rủi. Để kiểm tra chân thành và ý nghĩa của B, một thống kê kiểm tra (không buộc phải t-test, nhưng là Wald Chi-bình phương) được tính toán, với 1df – bậc trường đoản cú do. Buộc phải nhớ rằng thông số B đãi đằng những cảm giác của một 1-1 vị đổi khác của X về logarit Odds.

Trong giáo dục, cảm giác là dương, khi giáo dục đào tạo tăng lên, logarit Odds cũng tăng lên.

Giá trị Exp(B) của một biến tự do X được sử dụng để dự đoán phần trăm của một sự kiện xảy ra dựa bên trên sự biến hóa một đơn vị trong một biến hòa bình khi tất cả các biến độc lập khác được giữ không đổi. Nó cho thấy thêm rằng lúc nó tăng một 1-1 vị, Odds cho việc kiện “có” là được nhân lên vị một giá trị của quý giá Exp(B) (đây là hàm e nón B, trả sử 1.05, có nghĩa là tăng 5%).

6. Mở rộng hồi quy logistic

Bên yêu cầu của phương trình hồi quy logistic tương tự như như bất kì quy mô hồi quy làm sao khác, nên chúng ta có thể bao gồm các biến tự do phân loại và liên tục trong hồi quy logistic. Bọn họ cũng có thể bao gồm các hiệu ứng tương tác.

Hồi quy logistic có chức năng mở rộng trong hai cách:

Hồi quy logistic trang bị bậc (Ordinal Logistic Regression) được áp dụng để phân tích logarit tích trữ Odds của điểm số ở đồ vật hạng tối đa tiếp theo của một biến thứ tự được nhóm gộp. Ví dụ như điển hình là 1 thang đo khảo sát thái độ để lựa chọn giữa “rất không đồng ý, không đồng ý, trung lập, đồng ý, hết sức đồng ý”. Bạn cũng có thể sử dụng hồi quy logistic sản phẩm công nghệ bậc để chất vấn liệu một đơn vị chức năng của X tăng, logarit Odds của chọn “không đồng ý” thay bởi vì “rất đồng ý”, hoặc lựa chọn “đồng ý” thay do “trung lập”.

– Hồi quy logistic đa thức (Multinomial logistic regression) được áp dụng để phân tích các loại đa lựa chọn của các kết quả. Ví dụ, bọn họ muốn dự đoán liệu một người là kết hôn, ly hôn, ly thân, không kết hôn. Nếu sẽ là sự loại bỏ lẫn nhau và bình thường sức, chúng ta có thể phân tích logarit xác suất cược của mỗi tác dụng so cùng với một mặt đường cơ sở. Ví dụ, bạn cũng có thể phân tích logarit tỷ lệ cược của việc kết hôn đối với chưa lúc nào kết hôn, ly hôn so với chưa bao giờ kết hôn và ly thân so với chưa lúc nào kết hôn. Bạn có thể kiểm tra đưa thuyết về phần nhiều hiệu ứng của các biến dự đoán về từng Odds này. Quy mô hồi quy logistic nhiều thức kế tiếp để bọn họ kiểm tra những đa thức danh nghĩa.

7. Các giả định kiểm tra

Các đưa định cơ bạn dạng của hồi quy logistic nhị thức bao gồm:

– biến phụ thuộc của người tiêu dùng nên được tính toán trên thang đo nhị phân. Ví dụ về những biến nhị phân bao gồm giới tính (nam cùng nữ), thành tích thi (đạt và không đạt), đẳng cấp tính phương pháp (hướng nội hoặc hướng ngoại) v.v. Mặc dù nhiên, nếu trở nên phụ thuộc của bạn được giám sát trên thang liên tục, bạn sẽ cần tiến hành hồi quy con đường tính bội, trong lúc nếu biến hóa phụ thuộc của doanh nghiệp được tính toán trên thang đo sản phẩm tự, thì hồi quy logistic máy bậc đang là tương thích hơn.

Xem thêm: Mb Bank Là Ngân Hàng Mb Là Ngân Hàng Gì ? Ngân Hàng Mb Có Tốt Không?

– Một hoặc nhiều đổi mới độc lập, có thể là liên tiếp (tức là biến khoảng tầm hoặc tỷ lệ) hoặc biến phân các loại (tức là trở nên thứ tự hoặc danh nghĩa). Lấy ví dụ như về các biến liên tục bao gồm thời gian ôn tập (đo bởi giờ), trí tối ưu (đo bởi điểm IQ), thành tích thi (đo từ bỏ 0 mang đến 100)v.v. Ví dụ về các biến sản phẩm công nghệ tự bao gồm các mục Likert (ví dụ: thang điểm 5 hoặc 7 tự “rất đồng ý” mang lại “rất ko đồng ý”). Ví dụ về các biến danh nghĩa bao hàm giới tính (nam cùng nữ), khu vực sống (thành thị cùng nông thôn), ngành nghề (ví dụ: 5 nhóm: điện, CNTT, cơ khí, ngoại ngữ, gớm tế).

– những quan cạnh bên là tự do và biến dựa vào phải có những danh mục sa thải lẫn nhau cùng đầy đủ.

– cần phải có mối quan lại hệ đường tính giữa bất kỳ biến hòa bình liên tục nào với phép biến hóa logarit Odds (hay có cách gọi khác là Logit) của vươn lên là phụ thuộc. Bạn cũng có thể sử dụng các bước Box-Tidwell (1962) để kiểm soát sự tuyến tính đến giả định này.

Bạn có thể kiểm tra đưa định số 4 bằng cách sử dụng thống kê lại SPSS. Những giả định 1, 2 với 3 nên được khám nghiệm đầu tiên, trước lúc chuyển sang đưa định 4. Bạn nên kiểm tra những giả định này theo sản phẩm tự này bởi nó đại diện cho một sản phẩm tự này. Nếu như bạn không chạy bình chọn thống kê trên các giả định này một cách thiết yếu xác, kết quả bạn nhận thấy khi chạy hồi quy logistic nhị thức hoàn toàn có thể không hợp lệ.

8. đối chiếu hồi quy Logistic nhị thức vào SPSS

Ví dụ, bạn có thể sử dụng hồi quy logistic nhị thức nhằm hiểu liệu hoàn toàn có thể dự đoán thành tích bài thi Toán của những sinh viên dựa trên thời hạn ôn tập, nấc độ băn khoăn lo lắng của bài kiểm tra và yếu tố giới tính hay không (tức là, trong đó biến phụ thuộc là “thành tích thi”, được đo trên thang lưỡng phân “đạt” hoặc “không đạt” và ba biến số độc lập: “thời gian ôn tập” và “giới tính”). Có 20 sinh viên được mời tham gia một cuộc test nghiệm, kể từ thời điểm bài học của môn Toán giải tích xong xuôi đến ngày thi cuối kì, chúng ta được đề nghị lưu lại tổng số giờ ôn bài xích (cộng dồn của từng ngày) giành cho môn Toán. Kết thúc kì thi, nhà nghiên cứu và phân tích thu thập điểm số của 20 sinh viên này theo thang điểm 10 (nếu ≥5 là đạt được ‘1’, với  Regression > Binary Logistic…

*

Bước 2: Trong hộp thoại Logistic Regression, chúng ta gửi biến phụ thuộc vào ‘Diemthi’ vào ô Dependent, chuyển các biến độc lập ‘Gioitinh’, ‘Ontap’ vào Covariates.

*

Bước 3: Nhấp vào nút Categorical nhằm mở hộp thoại Logistic Regression: Define Categorical Variables. Gửi biến độc lập phân loai “Gioitinh” từ cùng Covariates vào hộp Categorical Covariates. Tại vùng Change Contrast, chúng ta chuyển “Last” thành “Fist”, tiếp theo nhấp vào Change. Tiếp nối nhấp vào Continue.

*

Bước 4: Nhấp vào nút Options để mở vỏ hộp thoại Logistic Regression: Options. Vào vùng Statistics và Plots, họ chọn Classification plots, Hosmer-Lemeshow goodness-of-fit, Casewise listing of residuals CI for exp(B). Trong vùng Display, nhấp vào At last step. Kế tiếp nhấp vào Continue.

*

Bước 5: Nhấp OK nhằm chạy kết quả.

Đọc kết quả:

Nói chung, hồi quy logistic chạy ra không hề ít bảng, nhưng chúng ta có thể cần vồ cập những bảng bao gồm dưới đây:

*

Bảng Case Processing Summary cho bọn họ các tin tức mô tả điểm sáng dữ liệu gửi vào phân tích hồi quy logistic nhị phân. Có 20 quan liền kề được gửi vào phân tích (Included in Analysis), không có quan giáp nào bị thiếu thốn (Missing Cases), không tồn tại quan liền kề nào ko được lựa chọn (Unselected Cases).

Tiếp theo, chúng ta bỏ qua phần Block 0 bởi vì các hiệu quả phân tích tại đây nằm nghỉ ngơi trường vừa lòng không có bất kỳ biến hòa bình nào được chuyển vào mô hình. Bọn họ sẽ sử dụng tác dụng ở Block 1 với khá đầy đủ các biến hòa bình được chuyển vào xử lý.

*

Bảng đầu tiên là Omnibus Tests of model Coefficients. Bảng này cho thấy các thông số của mô hình. Step 1 là bước thứ nhất trong chạy mô hình Logistic. Vì ở đây bọn họ dùng phương pháp Enter đưa những biến độc lập vào cùng một lần nên chỉ xuất hiện thêm Step 1 trong hiệu quả thống kê. Trường hợp dùng các phương thức khác bảng này sẽ sở hữu thêm những Step 2, 3, 4 tùy con số biến gửi vào. Cách thức Enter tạo nên 3 cực hiếm Chi-bình phương, df cùng sig. Của Step, BlockModel đều như nhau. Trong toàn bộ trường hợp, giá trị p = 0.001 2 giả. Hồi quy logistic không áp dụng giá trị R2 như là với hồi quy tuyến đường tính. Cũng tương tự -2LL, 2 chỉ số này dùng làm so sánh các quy mô hồi quy không giống nhau trên cùng một cỗ số liệu, cùng một biến phụ thuộc. Mô hình hồi quy xuất sắc hơn sẽ sở hữu được R2 khủng hơn.

*

Kết quả kiểm tra Hosmer và Lemeshow test cho biết sự cân xứng của mô hình hồi quy tổng thể. Cực hiếm p nhỏ (thường dưới 5%) tức là mô hình không phù hợp. Nhưng mà giá trị phường lớn không độc nhất thiết có nghĩa là mô hình của chúng ta phù hợp, chỉ là không tồn tại đủ bằng chứng để nói rằng nó tương xứng kém. Nhiều tình huống có thể gây trả giá trị phường lớn, bao hàm cả sức khỏe mạnh thống kê kém. Sức to gan thấp là giữa những lý do khiến cho thử nghiệm này bị chỉ trích nhiều. Trong lấy một ví dụ này, giá chỉ trị phường = 0.93 > 0.05 cho biết một quy mô hồi quy là cân xứng tốt, giỏi nói không giống đi là mô hình hồi quy tổng thể và toàn diện được chấp nhập.

*

Bảng Classification Table cho biết xác xuất một điểm thi được dự đoán (ở nút đạt) so với được quan gần kề thực tế. Điểm cắt là 0.5 cho thấy thêm rằng nếu phần trăm ước tính của việc kiện xảy ra to hơn hoặc bằng 0.5, SPSS phân nhiều loại sự khiếu nại là đã xảy ra (tức là đạt, thừa qua bài thi). Nếu xác suất nhỏ dại hơn 0.5, SPSS phân các loại sự khiếu nại là không xẩy ra (không đạt bài xích thi). Như vậy, vào 10 trường hòa hợp quan sát thực tế là ko đạt, thì cả 8 trường hợp được dự kiến là ko đạt, tỉ trọng dự đoán và đúng là 8/10 = 80%. Trong 10 trường vừa lòng quan sát thực tế là đạt (vượt qua bài bác kiểm tra), dự đoán có 9 trường thích hợp là đạt, tỉ trọng dự đoán chính xác là 9/10 = 90%. Như vậy, xác suất trung bình dự đoán chính xác là (10*80 + 10*90) = 85%.

*

Bảng Variables in the Equation cung cung cấp nhiều tin tức về phương trình hồi quy. Kiểm nghiệm Wald (cột ” Wald “) được sử dụng để xác định ý nghĩa sâu sắc thống kê cho từng phát triển thành độc lập. Ý nghĩa thống kê của phân tách được search thấy vào cột ” Sig. “. Ví dụ trong trường hợp này, giá bán trị phường của kiểm định Wald với thay đổi ‘Gioitinh’, ‘Ontap’ nhỏ dại hơn 0.05 (độ tin cẩn 95%) cho biết nó bao gồm hiệu ứng đáng chú ý vào trong mô hình dự đoán vươn lên là Diemthi. Ví như biến chủ quyền nào có mức giá trị phường > 0.05 thì cho thấy nó không có sự cảm giác lên đổi thay phụ thuộc. Trong lấy ví dụ như này, cả hai đổi mới ‘Gioitinh’ và ‘Ontap’ là có tác động đến dự đoán biến ‘Diemthi’ của những sinh viên.

Giá trị cột Exp(B) được sử dụng để tham dự đoán tỷ lệ của một sự kiện xảy ra dựa bên trên sự thay đổi một đơn vị trong một biến chủ quyền khi tất cả các biến tự do khác được duy trì không đổi. Ví dụ: bảng cho biết tỷ lệ sinh viên vượt qua bài bác thi (loại “đạt”) là 20.345 gấp nhiều lần so với nam so với nữ. Tức là nữ có khả năng vượt qua bài bác thi cao vội vàng 20.345 lần so với nam, cùng với khoảng tin tưởng là 1.209 – 342.554. Khoảng tin tưởng này là quá rộng, gồm thể bởi vì do cỡ chủng loại là bé dại và việc này mang ý nghĩa minh họa các hơn.

Cột B là hệ số hồi quy của những biến độc lập. Giả dụ B dấn dấu âm, tức thị biến chủ quyền đang tác động nghịch lên trở thành phụ thuộc, ngược lại, B với dấu dương diễn đạt biến hòa bình tác hễ thuận lên biến đổi phụ thuộc. Những trường hợp biến hòa bình có giá chỉ trị phường > 0.05 trong kiểm định Wald sẽ không được chuyển vào phương trình hồi quy. Phương trình hồi quy thu được là:

*

Như vậy, số giờ ôn tập cao làm tăng kĩ năng vượt qua bài xích thi, và những sinh viên nữ có công dụng vượt qua bài xích thi cao hơn nữa sinh viên nam.

Một ưu núm rất mạnh mẽ của hồi quy logistic nhị thức là kĩ năng dự báo. Ví dụ, một sv nữ, với số giờ ôn tập là 5 giờ, núm vào phương trình:

*

Trong khi, vẫn 5 giờ đồng hồ ôn tập, xác xuất này sinh sống sinh viên nam đang là:

*

Như vậy, phần trăm trong cả hai trường đúng theo là to hơn 50%. Hay nói không giống đi, ví như ôn tập 5 tiếng thì năng lực vượt qua bài xích thi của những sinh viên là khá béo (>0.5).

9. đánh giá giả định hồi quy về việc tuyến tính thân biến hòa bình liên tụcLogit của biến phụ thuộc

Cách 1: Vẽ biểu vật quan hệ thân biến độc lập liên tục và xác suất p dự đoán

Bước 1: chọn Analyze > Regression > Binary Logistic…

Bước 2: Trong vỏ hộp thoại Logistic Regression, chúng ta đưa biến dựa vào ‘Diemthi’ vào ô Dependent, chuyển các biến chủ quyền ‘Gioitinh’, ‘Ontap’ vào Covariates.

Bước 3: Nhấp vào nút Save, ghi lại vào ô Probabilities (đây là phần trăm dự đoán Diemthi). Nhấp Continue và kế tiếp nhấp OK nhằm chạy kết quả.

*

Kết quả: Trong file dữ liệu xuất hiện thêm cột PRE-1, đây đó là xác xuất tiên đoán Diemthi của những sinh viên.

*

Bây giờ, họ tiến hành vẽ đồ thị quan hệ giữa biến hóa Diemthi (trục y) với biến hòa bình liên tục “Ontap” (trục x). Vui tươi đọc bài xích vẽ vật thị phân tán để xem hướng dẫn vẽ đồ vật thị.

*

Như vậy, đồ thị thể hiện một con đường thẳng xuyên thẳng qua đám mây những điểm số. Những điểm số cũng giải pháp đều mặt đường cơ sở cho biết sự đồng biến. Tuy vậy cỡ mẫu mã là quá nhỏ dại để quan sát thấy ví dụ một mối quan hệ tuyến tính giữa biến chuyển Ontap và xác suất dự đoán Diemthi của các sinh viên. Nhưng lại cỡ mẫu to hơn sẽ quan cạnh bên thấy rõ sự tuyến đường tính. Vì đó, mang định về quan hệ tuyến tính thân biến liên tục ‘Ontap’ và tỷ lệ p dự kiến là được đáp ứng.

Cách 2: kiểm tra Box-Tidwell

Mặc dù hồi quy logistic thường xuyên được xem là không có giả định, họ giả định rằng những mối quan hệ giới tính giữa những yếu tố dự đoán tiếp tục và logit (tỷ lệ cược log) là tuyến đường tính. Mang định này rất có thể được kiểm tra bằng cách đưa vào quy mô các cửa hàng giữa những yếu tố dự đoán thường xuyên và logarit của chúng. Trường hợp một hệ trọng như vậy là xứng đáng kể, thì giả định đã bị vi phạm. Tôi nên lưu ý với các bạn rằng size mẫu cũng là một yếu tố làm việc đây, do vậy bạn không nên quá xem xét một liên can đáng đề cập khi kích cỡ mẫu lớn. Nếu không tồn tại tương tác logarit làm sao là quan tiền trọng, hãy xóa nó khỏi mô hình, report rằng không có vấn đề gì với giả định và trình bày tác dụng của quy mô mà không có các điều khoản tương tác logarit.

Dưới đây, cửa hàng chúng tôi trình bày giải pháp tạo hàm logarit tự nhiên (Ln) của một biến dự đoán liên tục. Trường hợp biến dự kiến có các giá trị tự 0 trở xuống, trước tiên hãy cung cấp mỗi điểm số một hằng số sao cho không có giá trị nào bởi 0 hoặc nhỏ tuổi hơn. Hình dưới là giải pháp nhập những hiệu ứng tương tác. Trong ngăn bên trái, chọn cả nhì yếu tố dự kiến sẽ được gửi vào xúc tiến và tiếp nối nhấp vào nút >a* b>.

– cách 1: chuyển đổi logarit tự nhiên và thoải mái với một biến liên tục ‘Ontap’. Nhấp vào Transform > Compute Variable để mở hộp thoại Compute Variable. Nhập thương hiệu biến new là OntapLN vào ô Target Variable. Tiếp nối nhập hàm logarit thoải mái và tự nhiên (LN) với mức giá trị Ontap như hình bên dưới đây:

*

– cách 2: Thêm hiệu ứng giữa trở nên Ontap với OntapLN vào trong quy mô hồi quy. Trong hộp thoại Logistic Regression, nhấp chon bến Ontap và trở thành OntapLN, sau đó nhấp nút >a*b> . Cuối cùng, chạy lại quy mô hồi quy.

*

– cách 3: Đọc hiệu quả trong bảng Variables in the Equation

*

Như vậy, hiệu ứng thúc đẩy ‘OntapLN by giờ đồng hồ ôn tập’ là ko có chân thành và ý nghĩa (p = 0.204 > 0.05). Trường hợp một hiệu ứng tương tác là bao gồm ý nghĩa, bọn họ sẽ nỗ lực thêm vào sức mạnh quy mô của các yếu tố dự đoán (có nghĩa là, đang đa thức).

Tài liệu tham khảo

Coolican, H. (2018). Research methods và statistics in psychology. Routledge.Hanneman, R. A., Kposowa, A. J., & Riddle, M. D. (2012). Basic statistics for social research (Vol. 38). John Wiley và Sons.Jackson, S. L. (2015). Research methods và statistics: A critical thinking approach. Cengage Learning.McQueen, R. A., & Knussen, C. (2006). Introduction khổng lồ research methods & statistics in psychology. Pearson education.Peers, I. (2006). Statistical analysis for education and psychology researchers: Tools for researchers in education and psychology. Routledge.