Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.
Ghi chú bài giảng Khánh Duy 1
Giới thiệu kinh tế lượng với dữ liệu bảng (Panel Data)
I. Lý thuyết  Đọc Gujarati, chương 1...
Ghi chú bài giảng Khánh Duy 2
II. Thực hành
Mở file File Grunfeld.wf1
1. Thiết lập cấu trúc file dữ liệu bảng (Structuring...
Ghi chú bài giảng Khánh Duy 3
Dim(10,20) ?
2. Ước lượng mô hình bình phương tối thiểu dạng gộp (Pooled Least Square Model)...
Ghi chú bài giảng Khánh Duy 4
Hình 3
Khoảng thời gian (t=20), dữ liệu chéo (10)
PS hồi quy Yit = -43.02 + 0.231K + 0.115V ...
Ghi chú bài giảng Khánh Duy 5
3. Ước lượng mô hình tác động cố định (FEM_Fixed Effects Model)
a. Ước lượng
- Tại Equation...
Ghi chú bài giảng Khánh Duy 6
Các hằng số trên là các hằng số chung của tất cả các công ty  không thể viết PT hồi quy
bìn...
Ghi chú bài giảng Khánh Duy 7
b. Tìm các hệ số chặn cho từng đơn vị chéo (Original fixed effects): Để phân tích ảnh
hưởng ...
Ghi chú bài giảng Khánh Duy 8
10 52.18274 -6.546=52.18 - 58.729
-Xem thêm phụ lục để biết cách ước lượng FEM bằng cách khá...
Ghi chú bài giảng Khánh Duy 9
Ghi chú bài giảng Khánh Duy 10
b. Tính toán các tác động ngẫu nhiên
-Equation: View  Fixed/Random Effects Effects  Cross...
Ghi chú bài giảng Khánh Duy 11
4. Kiểm định Hausman
Giả thuyết :
H0 : Cov(εi,Xs) = 0 (dùng mô hình REM)
H1 : Cov(εi,Xs) # ...
Ghi chú bài giảng Khánh Duy 12
b. Nếu chọn mẫu không ngẫu nhiên  FEM
Phụ lục
1. FEM nếu ước lượng bằng cách dùng 10 biến ...
Ghi chú bài giảng Khánh Duy 13
Variable Coefficient Std. Error t-Statistic Prob.
C -69.1435 49.6855 -1.3916 0.1657
D2 170....
Upcoming SlideShare
Loading in …5
×

Dữ liệu mảng

15,330 views

Published on

thiệu tới các bạn đọc tài liệu hướng dẫn thực hành phân tích dữ liệu mảng của Khánh Duy

Published in: Education
  • Login to see the comments

Dữ liệu mảng

  1. 1. Ghi chú bài giảng Khánh Duy 1 Giới thiệu kinh tế lượng với dữ liệu bảng (Panel Data) I. Lý thuyết  Đọc Gujarati, chương 16 Sử dụng những biến giả để kiểm sóat những đặc điểm riêng K là tổng tài sản V là giá trị của công ty INV là chỉ số đo luờng hiệu quả công ty (ROE) Ước luợng xem K và V ảnh hứởng thế nào đến I (biến đầu tư) Mô hình (1)Mô hình dạng gộp (Pooled Regression) (2) Mô hình tác động cố định FEM (Fixed effects model)  thừơng SD nhất (3) Mô hình ảnh hưởng ngẫu nhiên REM hay ECM (mô hình có các thành phần ngẩu nhiên) Commented [s1]: Khó nhất của khóa ABF1
  2. 2. Ghi chú bài giảng Khánh Duy 2 II. Thực hành Mở file File Grunfeld.wf1 1. Thiết lập cấu trúc file dữ liệu bảng (Structuring the workfile) Proc/Structure/Resize Current Page - Chọn undated with ID series - Nhập 2 biến xác định thứ tự các quan sát (ví dụ i: 1-10) và thứ tự thời gian (ví dụ t:1- 20) Hình 1 Dữ liệu dạng bằng thì khai báo như trên Nếu dữ liệu không cân bằng thì sao?  gõ trực tiếp lệnh vào cửa sổ lệnh ?
  3. 3. Ghi chú bài giảng Khánh Duy 3 Dim(10,20) ? 2. Ước lượng mô hình bình phương tối thiểu dạng gộp (Pooled Least Square Model) - QuickEstimate Equation - Nhập các biến để xác định mô hình Hình 2 Commented [s2]: Tài chính hay dùng
  4. 4. Ghi chú bài giảng Khánh Duy 4 Hình 3 Khoảng thời gian (t=20), dữ liệu chéo (10) PS hồi quy Yit = -43.02 + 0.231K + 0.115V + uit  Vốn và giá trị của công ty ảnh hưởng thuận đến đầu tư 2 biến giải thích đuợc 81.1% phần trăm biến thiên của biến Y Mô hình dạng pooled không kiểm soát đuợc từng đặc điểm riêng của từng công ty
  5. 5. Ghi chú bài giảng Khánh Duy 5 3. Ước lượng mô hình tác động cố định (FEM_Fixed Effects Model) a. Ước lượng - Tại Equation Estimate -Chọn Panel Options  Chọn Fixed cho các đơn vị chéo (Cross-section) Hình 4 Mỗi 1 đơn vị chéo (từng công ty) khác nhau thì khác nhau (cross-section fixed) Nếu mỗi năm có các hằng số khác nhau thì cũng fix period Hình 5 Commented [s3]: Nếu không có lựa chọn này tức là chưa tinh chỉnh dữ liệu (Structuze rezise)
  6. 6. Ghi chú bài giảng Khánh Duy 6 Các hằng số trên là các hằng số chung của tất cả các công ty  không thể viết PT hồi quy bình thường như trên Vậy viết PT hồi quy của từng công ty ntn ??? (không nhất thiết phải viết) Và tại sao lại chọn mô hình này mà không chọn mô hình trước?
  7. 7. Ghi chú bài giảng Khánh Duy 7 b. Tìm các hệ số chặn cho từng đơn vị chéo (Original fixed effects): Để phân tích ảnh hưởng của sự không đồng nhất giữa các đơn vị chéo cụ thể như khả năng quản lý, triết lý quản lý, chính sách của từng doanh nghiệp… đến biến phụ thuộc -Equation: ViewsFixed/Randam EffectsCross-section Effects Hình 6 Hình 7 Tác động cố định chênh lệch của các đơn vị chéo so với trung bình chung Vậy, hàm hồi quy của Công ty (1) Yit = -58.7 – 10.4 + 0.31Kit + 0.109Vit + u^it (hàm hồi quy mẫu) Tương tự cho các công ty khác Công ty (10) Yit = -58.7 + 52.18 + 0.31Kit + 0.109Vit + u^it (Khi nghiên cứu không cần thiết phải chỉ ra các hệ số chặn của từng công ty, hay viết ra hệ số hồi quy) Hình 8. Tác động cố định thực (gốc) của các đơn vị chéo I Effect Intercept Note 1 -10.41447 -69.143 = - 10.41 - 58.729 2 159.5914 100.862 3 -176.3897 -235.119 4 31.09403 -27.635 5 -56.5879 -115.317 6 35.65544 -23.074 7 -7.953918 -66.683 8 1.370412 -57.359 9 -28.54801 -87.277 Commented [s4]: Tìm hệ số alpha0 riêng của từng công ty riêng để viết hệ số hồi quy của từng cty Commented [s5]: Hệ số chặn của từng công ty sẽ khác nhau (không đưa vào nghiên cứu chính, có thể đưa vào phần phụ lục)
  8. 8. Ghi chú bài giảng Khánh Duy 8 10 52.18274 -6.546=52.18 - 58.729 -Xem thêm phụ lục để biết cách ước lượng FEM bằng cách khác (sử dụng các biến giả) Vậy, cần kiểm định xem các alphai (beta1i= = alpha0+alphai) là hệ số chặn của hàm hồi quy của từng công ty) ???  nếu không khác nhau thì chỉ cần sử dụng MH ước luợng Pooled H0 : alpha0=alpha1= … =alpha10 (Mô hình Pooled regresson) H1 : Không có chuyện các alphai đều bằng nhau (không nên chọn Pooled Regression, có thể sửng dụng FEM hoặc REM)  xem phần dưới c. Kiểm định sự bằng nhau của các tác động cố định -Equation: View Fixed/Random Effects Testing Redundant Fixed Effects- Likelihood Ration Hình 9 Dùng Cross-section F hoặc thống kê Chi-square, 2 kiểm định đều có ý nghĩa thống kê với Pro =0 (<alpha) Vậy ta chấp nhận H1 (có sự khác nhau …)  không nên xài mô hình Pooled 3. Mô hình tác động ngẫu nhiên (REM_Random Effects Models) Hay còn gọi là Mô hình các thành phần sai số (ECM_Error Components Model) Chú ý nếu Dummy càng nhiều thì sai số mô hình càng cao a. Ước lượng Hình 10 Hình 11
  9. 9. Ghi chú bài giảng Khánh Duy 9
  10. 10. Ghi chú bài giảng Khánh Duy 10 b. Tính toán các tác động ngẫu nhiên -Equation: View  Fixed/Random Effects Effects  Cross-section Effects Hình 12 Hình 13 Vậy trong 2 mô hình FEM và REM ta chọn mô hình nào?  không có quy tắc duy nhất nào để chọn mô hình, mà dựa trên quy tắc kinh nghiệm Hoặc dùng kiểm định Hausman để quyết định chọn mô hình (xem phần dưới)
  11. 11. Ghi chú bài giảng Khánh Duy 11 4. Kiểm định Hausman Giả thuyết : H0 : Cov(εi,Xs) = 0 (dùng mô hình REM) H1 : Cov(εi,Xs) # 0 (không xài REM,nên xài FEM) Equation: ViewFixed/Random Effects testing …Hausman test Hình 14 Hình 15 Ho: Không có tương quan giữa các biến giải thích và thành phần ngẫu nhiên (chọn ECM, hay REM) H1: Có tương quan giữa các biến giải thích và thành phần ngẫu nhiên (chọn FEM) P-value(Hausman)=0.35 (>0.05) nên chưa đủ cơ sở để bác bỏ Ho. Chọn ECM Có thể tham khảo một số quy tắc kinh nghiệm trong Gujarati để lựa chọn REM hay FEM. (1) T lớn, N nhỏ  FEM/REM đều đuợc (2) Nếu Cov(εi,Xs) =0  REM và ngược lại (3) N lớn,T nhỏ a. Nếu chọn mẫu ngẫu nhiên  REM Commented [s6]: Biến độc lập bất kỳ
  12. 12. Ghi chú bài giảng Khánh Duy 12 b. Nếu chọn mẫu không ngẫu nhiên  FEM Phụ lục 1. FEM nếu ước lượng bằng cách dùng 10 biến Dummy cho 10 công ty Dependent Variable: INV Method: Panel Least Squares Date: 05/02/12 Time: 14:36 Sample: 1 200 Periods included: 20 Cross-sections included: 10 Total panel (balanced) observations: 200 Variable Coefficient Std. Error t-Statistic Prob. D1 -69.1435 49.6855 -1.3916 0.1657 D2 100.8624 24.9137 4.0485 0.0001 D3 -235.1187 24.4183 -9.6288 0.0000 D4 -27.6350 14.0698 -1.9641 0.0510 D5 -115.3169 14.1620 -8.1427 0.0000 D6 -23.0736 12.6612 -1.8224 0.0700 D7 -66.6829 12.8376 -5.1943 0.0000 D8 -57.3586 13.9856 -4.1013 0.0001 D9 -87.2770 12.8851 -6.7735 0.0000 D10 -6.5463 11.8199 -0.5538 0.5803 V 0.1098 0.0119 9.2596 0.0000 K 0.3106 0.0174 17.8835 0.0000 R-squared 0.944 Mean dependent var 145.91 Adjusted R-squared 0.941 S.D. dependent var 216.89 S.E. of regression 52.737 Akaike info criterion 10.83 Sum squared resid 522855.166 Schwarz criterion 11.02 Log likelihood -1070.662 Hannan-Quinn criter. 10.91 Durbin-Watson stat 0.699 2. FEM nếu dùng 9 biến giả công ty, với công ty 1 là cơ sở Dependent Variable: INV Method: Panel Least Squares Date: 05/02/12 Time: 14:41 Sample: 1 200 Periods included: 20 Cross-sections included: 10 Total panel (balanced) observations: 200 Commented [s7]: Sẽ xảy ra đa cộng tuyến hoàn hảo nếu làm như vậy
  13. 13. Ghi chú bài giảng Khánh Duy 13 Variable Coefficient Std. Error t-Statistic Prob. C -69.1435 49.6855 -1.3916 0.1657 D2 170.0059 31.1585 5.4562 0.0000 D3 -165.9753 31.7621 -5.2256 0.0000 D4 41.5085 43.8897 0.9457 0.3455 D5 -46.1734 50.4785 -0.9147 0.3615 D6 46.0699 46.7898 0.9846 0.3261 D7 2.4606 50.5475 0.0487 0.9612 D8 11.7849 44.0319 0.2676 0.7893 D9 -18.1335 48.4358 -0.3744 0.7085 D10 62.5972 50.3070 1.2443 0.2149 V 0.1098 0.0119 9.2596 0.0000 K 0.3106 0.0174 17.8835 0.0000 R-squared 0.9441 Mean dependent var 145.9068 Adjusted R-squared 0.9409 S.D. dependent var 216.8855 S.E. of regression 52.7366 Akaike info criterion 10.8266 Sum squared resid 522855.2000 Schwarz criterion 11.0245 Log likelihood -1070.6620 Hannan-Quinn criter. 10.9067 F-statistic 288.8925 Durbin-Watson stat 0.6992 Prob(F-statistic) 0.0000

×