Xây dựng câu hỏi cho nhân tố phụ thuộc và các sai lầm

      37
Nếu mô hình nghiên cứu của chúng ta có cả biến độc lập và biến phụ thuộc thì chúng ta sẽ cần xây dựng thang đo cho cả 2 nhóm biến này chứ không chỉ có mỗi biến độc lập. Bài viết này sẽ chỉ ra 2 sai lầm cơ bản nhưng cực kỳ nghiêm trọng mà các bạn mới làm nghiên cứu hay gặp phải.

Bạn đang xem: Xây dựng câu hỏi cho nhân tố phụ thuộc và các sai lầm


*

Sai lầm 1: Thiếu câu hỏi cho biến phụ thuộcBạn sẽ không thực hiện được phân tích hồi quy bội và các kiểm định sử dụng đến biến phụ thuộc về sau. Mình sẽ lấy 1 ví dụ rất phổ biến về các đề tài liên quan đến chất lượng dịch vụ sử dụng mô hình SERVPERF.
*

Trên tài liệu gốc của các tác giả, chúng ta gần như chỉ tìm được 22 biến quan sát cho 5 thành phần biết độc lập:
Và mặc nhiên một số bạn lấy 22 câu này đưa vào bảng câu hỏi và nghĩ là đã hoàn thành các câu hỏi cho toàn bộ mô hình. Tuy nhiên, biến phụ thuộc Chất lượng dịch vụ (Service Quality) là một biến cực kỳ quan trọng lại chưa có bất kỳ biến quan sát nào để hình thành nên thang đo Chất lượng dịch vụ.
Và giảng viên hướng dẫn vì nguyên nhân gì đó bỏ qua điều này và duyệt bảng câu hỏi để bạn tiến hành khảo sát 300 người. Đến khi đã hoàn thành khảo sát và cầm kết quả trên tay, tiến hành nhập liệu để chạy các kiểm định và tới bước hồi quy, bạn mới phát hiện ra sẽ chạy hồi quy bằng cách nào khi không có dữ liệu của biến phụ thuộc?
*
Hiện nay trên Internet có rất nhiều đề tài nghiên cứu, luận văn thạc sĩ mắc phải sai lầm này nhưng vẫn được chấm đạt bởi hội đồng. Dẫn đến hệ quả là những bạn sinh viên, những người nghiên cứu về sau không nắm vững kiến thức về phương pháp nghiên cứu, kế thừa lại bảng khảo sát của những tác giả này vì tin rằng: Đó là nghiên cứu đăng báo, đó là luận văn thạc sĩ đã được chấm đậu thì bảng câu hỏi của họ đã đúng rồi.
Đây là cách xây dựng biến quan sát hoàn toàn sai lầm. Sai về lý thuyết nghiên cứu, sai cả về tính logic.
Ví dụ về cách xây dựng biến quan sát sai
với trường hợp mô hình SERVPERF. Biến phụ thuộc Sự hài lòng về chất lượng dịch vụ được đo lường thông quan các biến quan sát:

Để hiểu được đầy đủ nội dung bài viết này, trước hết cần nắm được lý thuyết về mô hình bậc cao tại bài viết Mô hình thành phần thứ bậc, mô hình bậc cao trong PLS-SEM. Để xử lý vấn đề đo lường của các HCM trong PLS-SEM, các nhà nghiên cứu có thể dựa trên hai phương pháp tiếp cận chính cho đặc điểm kỹ thuật của họ trong mô hình đường dẫn PLS (Becker và cộng sự, 2012; Ringle và cộng sự, 2012; Wetzels và cộng sự, 2009): (1) phương pháp tiếp cận các biến quan sát lặp lại (repeated indicator approach)(2) cách tiếp cận hai giai đoạn (two-stages approach). Phạm vi bài viết này sẽ đi vào chi tiết kỹ thuật biến quan sát lặp lại.

1. Giới thiệu phương pháp biến quan sát lặp lại

Trong phương pháp tiếp cận biến quan sát lặp lại, tất cả biến quan sát của các LOC được gán cho mô hình đo lường của các HOC (Lohmöller, 1989; Wold, 1982). Trong các ví dụ mô hình bậc hai ở dưới, phương pháp tiếp cận biến quan sát lặp lại sử dụng các biến quan sát x1 đến x9 của các LOC để thiết lập mô hình đo lường của HOC. Do đó, các biến quan sát được sử dụng hai lần: một lần cho các LOC và một lần nữa cho HOC. Nếu có bất kỳ biến quan sát nào của LOC bị loại do không đạt tiêu chuẩn kiểm định, khi xóa nó khỏi LOC cũng sẽ cần xóa nó khỏi HOC. Cách tiếp cận này được mở rộng đến các HCM bậc ba hoặc bậc bốn,…

*

*

Xét ví dụ bên dưới khi biểu diễn lên diagram phần mềm SMARTPLS, biến Chất lượng dịch vụ (CLDV) là HOC được đo qua ba LOC gồm Nhân viên (NV), Giá cả (GC), Cơ sở vật chất (CSVC). Áp dụng kỹ thuật biến quan sát lặp lại, chúng ta sẽ kéo 11 biến quan sát từ NV, GC, CSVC thả vào biến bậc hai CLDV.

Xem thêm: Màu Be Trông Như Thế Nào? Màu Be Phối Với Màu Gì Phù Hợp Nhất

*
Mô hình bậc hai Chất lượng dịch vụ

2. Những lưu ý về phương pháp biến quan sát lặp lại

Đầu tiên, mối quan hệ giữa HOC và các LOC bị sai lệch đáng kể nếu các mô hình đo lường của các LOC thay đổi mạnh về số lượng biến quan sát (Becker và cộng sự, 2012). Hãy xem xét, ví dụ, một HCM với hai LOC, một với tám biến quan sát (LOC) và một với hai biến quan sát (LOCK). Khi sử dụng phương pháp biến quan sát lặp lại, tất cả mười biến quan sát được gán đồng thời cho HỌC. Vì chúng chia sẻ một số lượng lớn các biến quan sát ở HCM, mối quan hệ mạnh mẽ hơn giữa HỌC và LOC được kỳ vọng. Hơn nữa, năng lực dự báo của các LOC là một phần chức năng của độ tin cậy, phụ thuộc vào số lượng biến quan sát (Diamantopoulos, Sarstedt, Fuchs, Kaiser, & Wilczynski, 2012). Càng nhiều biến quan sát dẫn đến độ tin cậy càng cao hơn và do đó, năng lực dự báo mạnh hơn (Peter & Churchill, 1986), đặc biệt khi mô hình đo lường là mô hình kết quả. Để tránh bất kỳ sự sai lệch về mô hình nào trong các ước lượng tham số, các nhà nghiên cứu phải đảm bảo rằng số lượng biến quan sát là gần tương đồng nhau giữa các LOC. Nếu điều này là không khả thi từ góc độ lý thuyết đo lường, các nhà nghiên cứu nên đánh giá một cách có hệ thống, hiệu quả của việc loại bỏ biến quan sát trên các mối quan hệ giữa HOC và các LOC.

Thứ hai, các nhà nghiên cứu nên đánh giá không chỉ các mô hình đo lường của các LOC mà còn mô hình đo lường của HOC. Đánh giá mô hình đo lường của HOC nghĩa là chúng ta đánh giá mối quan hệ giữa HOC và các LOC của nó.

– Nếu mối quan hệ giữa HOC và LOC là kết quả, chúng ta sẽ đánh giá phương sai trung bình được trích xuất (AVE), độ tin cậy tổng hợp (CR) và độ tin cậy (Cronbach’s Alpha) của HOC. Việc làm này sẽ đánh giá xem trong các LOC của một HOC, LOC nào phù hợp hay không phù hợp cần loại bỏ. Trong ví dụ bên dưới, biến Hài lòng công việc (HL) là HOC được đo qua ba LOC gồm Yêu thích công việc (YT), Nói tốt về công ty (GT), Trung thành với công ty (TT), đây là loại HCM kết quả – kết quả. Bên cạnh đánh giá mô hình đo lường các LOC gồm YT, GT, TT, chúng ta cũng nên đánh giá thêm mô hình đo lường của HOC là HL với các chỉ số liên quan đến độ tin cậy, tính hội tụ, tính phân biệt.

*

– Nếu mối quan hệ giữa HOC và LOC là nguyên nhân, chúng ta không đánh giá độ tin cậy, tính hội tụ của HOC mà nên xem xét sự cộng tuyến các mối quan hệ giữa các LOC và HOC. Nếu xảy ra tình trạng cộng tuyến nghiêm trọng giữa các LOC, chúng ta cần tính đến việc xử lý cộng tuyến để các kết quả ước lượng không bị sai lệch.

Thứ ba, việc sử dụng các HCM dạng kết quả – nguyên nhân và nguyên nhân – nguyên nhân gặp vấn đề khi HOC đóng vai trò là biến phụ thuộc trong mối quan hệ với biến khác trong mô hình. Do biến quan sát của HOC được lặp lại từ biến quan sát của các LOC, nên gần như 100% phương sai của HOC đều được giải thích bởi các LOC (R bình phương tiệm cận 1). Kết quả là, bất kỳ hệ số đường dẫn nào khác (tức là khác với LOC) cho các mối quan hệ tác động lên HOC sẽ rất nhỏ (có thể là 0) và không đáng kể (Ringle và cộng sự, 2012). Ở ví dụ bên dưới, biến HOC CLDV là biến phụ thuộc trong mối quan hệ với SHL, R bình phương của CLDV bằng 1, trong khi đó hệ số tác động từ SHL lên CLDV lại bằng 0, nghĩa là SHL hoàn toàn không có tác động nào lên CLDV.

*

Để xử lý vấn đề này trong mô hình mà mối quan hệ giữa HOC và LOC ở dạng nguyên nhân, các nhà nghiên cứu sử dụng đến cách tiếp cận hai giai đoạn (two-stages approach) sẽ được giới thiệu trong bài viết Xử lý biến bậc hai SMARTPLS: Phương pháp tiếp cận hai giai đoạn.