Regresi Linear Berganda Data Panel + Uji Asumsi Klasik Normalitas di Stata 13 SE
Gambar : Cover Artikel
REGRESI LINEAR BERGANDA DATA PANEL + UJI ASUMSI KLASIK NORMALITAS
Ditulis oleh : Dimas Purbo Wicaksono Fenda Putra, S.E.
A.Proses Pengolahan Data
Proses pengolahan data merupakan salah satu tahapan penting dalam
sebuah penelitian. Penulis ingin meneliti pengaruh Produksi dan
Distribusi terhadap Penjualan di empat perusahaan (samsung, xiaomi,
polytron, dan sony) dengan sampel 20 tahun dan jumlah 80 total sampel. Satuan
yang digunakan setiap
variabel penelitian berbeda, maka penulis menyamakan satuannya. Alasan penulis ingin meneliti data ini
adalah untuk melihat apakah Produksi dan Distribusi dapat mempengaruhi terhadap
jumlah Penjualan atau sebaliknya. Perlu diketahui bahwa data yang digunakan merupakan data modifikasi dan
bukan real dari keempat perusahaan. Berikut ini hal
yang mendasari penelitian :
- Hubungan jumlah penduduk dan pengangguran terbuka
- Hubungan upah minimum dan pengangguran terbuka
- Hubungan pertumbuhan ekonomi dan pengangguran terbuka
Variabel yang digunakan dalam
penelitian yaitu variabel independen dan dependen yang meliputi:
a.Variabel Independent :
- Produksi (X1)
- Distribusi (X2)
b.Variabel Dependent :
- Penjualan (Y)
Saran dari Penulis ketika akan melakukan suatu penelitian, usahakan data berasal
dari satu sumber (khusus untuk pengolahan data). Masing-masing lembaga seperti
Badan Pusat Statistika, Bank Indonesia, Wordbank, dan lembaga kredibel lainnya
memiliki metode pengambilan data masing-masing. Jika data yang digunakan adalah data primer maka lakukan
pengambilan data dengan teknik yang benar agar hasil yang didapat sesuai dengan
fakta lapangan.
B.Langkah Pengolahan Data
Beberapa langkah yang dilakukan dalam proses pengolahan data antara lain :
Langkah
1 : Menyiapkan
data yang akan diolah, usahakan data telah disusun terlebih dahulu. Berikut
susunan data.
Gambar
: Data Latihan
Model
Penelitian
Produksi (X1)
|
Penjualan (Y)
|
Distribusi (X2)
|
Gambar
: Model Penelitian
Model penelitian ini menggambarkan
variabel bebas yang digunakan adalah Produksi (X1), Distribusi (X2), dan Penjualan (Y).
Langkah 2 :
Buka aplikasi stata 13 MP (sesuai dengan versi stata yang digunakan). Pilih File => Import => Excel spreadsheet
(*.xls;*.xlsx)
Gambar
: Pengolah Data Stata 13 SE
Langkah
3 :
Klik Browser.
Gambar
: Pengolah Data Stata 13 SE
Langkah
4 :
Pilih folder data yang akan diteliti dalam format Microsoft Excel.
Gambar
: Pengolah Data Stata 13 SE
Langkah
5 : Kemudian keluar tampilan Import
Excel.
Gambar
: Pengolah Data Stata 13 SE
Langkah
6 : Centang pada Import
firs row as variable names (sehingga nama variabel otomatis terinput).
Klik open.
Gambar
: Pengolah Data Stata 13 SE
Langkah 7 :
Gunakan Command untuk men-setting periode waktu (karena dalam
analisis data panel, periode waktu sangat penting).
Tuliskan xtset Tahun (disesuaikan
dengan nama pada format excel).
Gambar
: Pengolah Data Stata 13 SE
Gambar
: Pengolah Data Stata 13 SE
Kemudian akan keluar tampilan keterangan :
Gambar
: Pengolah Data Stata 13 SE
Langkah 8 : Lakukan
analisis data panel. Pertama-tama cari model GLS random effect. Klik Statistics
=> Longitudinal/panel data => Linear models => Linear regression (FE, RE, PA, BE).
Gambar
: Pengolah Data Stata 13 SE
Langkah 9 : Pada
tampilan jendela analisis data panel dengan model GLS random effect isikan dependent
variable yaitu
Y_Penjualan dan independent
variables yaitu
X1_Produksi X2_Distribusi. Model type
(affects which options are available) pilih GLS random-effects. Kemudian klik ok.
Gambar
: Pengolah Data Stata 13 SE
Metode lain dapat juga dengan menggunakan
menu Command dengan menuliskan xtreg Y_Penjualan X1_Produksi
X2_Distribusi, re
Gambar
: Pengolah Data Stata 13 SE
Langkah
10 :
Hasilnya sebagai berikut.
Gambar
: Hasil Output Pengolah Data Stata 13 SE
Interpretasi Output :
Berdasarkan
output diatas
perlu diperhatikan
pada asumsi random effect. Nilai R
square sebesar 0.7565 yang artinya variabel X1_Produksi dan X2_Distribusi
berpengaruh terhadap Y_Penjualan sebesar 0.7565 atau 75.65% dan sisanya sebesar
24.35% dipengaruhi
oleh variabel yang lain diluar model. Sementara untuk signifikan antar variabel
menunjukkan nilai dibawah tingkat alpha 0.05 (5%), sehingga dapat disimpulkan
bahwa seluruh variabel data signifikan (Probabilitas X1_Penjualan : 0.000 <
0.05) (Probabilitas X2_Distribusi : 0.000 < 0.05). Kedua variabel independen
memiliki nilai yang positif (Coefficient
X1_Produksi : 0.1100955) (Coefficient X2_Distribusi
: 0.3033932).
Langkah 11 :
Berikutnya yaitu
dengan melihat model ML random effect. Klik Statistics => Longitudinal/panel
data => Linear models => Linear regression (FE, RE, PA, BE).
Gambar
: Pengolah Data Stata 13 SE
Langkah 12 : Pada
tampilan jendela analisis data panel dengan model ML random effect isikan dependent variable yaitu Y_Penjualan dan independent variables yaitu X1_Produksi X2_Distribusi. Model type (affects which options are
available) pilih ML random-effects.
Kemudian klik ok.
Gambar
: Pengolah Data Stata 13 SE
Metode lain dapat juga dengan menggunakan
menu Command dengan menuliskan xtreg Y_Penjualan X1_Produksi
X2_Distribusi, mle.
Gambar
: Pengolah Data Stata 13 SE
Langkah
13 :
Hasilnya sebagai berikut.
Gambar
: Hasil Output Pengolah Data Stata 13 SE
Interpretasi Output :
Hipotesa :
Jika nilai LF chi square ML random effect < nilai Wald Chi Sqaure GLS random Effect => ML
random effect
Jika nilai LF chi square ML random effect >
nilai Wald Chi Sqaure GLS random Effect => GLS
random Effect
Berdasarkan
output diatas yang perlu diperhatikan
adalah nilai LF chi square. Nilai LF chi square (2) sebesar 113.02, hasil
ini bandingkan dengan nilai Wald Chi
Square (2) pada hasil GLS random
effect sebelumnya. Nilai Wald Chi
Square (2) sebesar 239.26. LF chi
square (2) < Wald Chi Square
(113.02 < 239.26), artinya ML
regression atau ML random effect lebih
baik daripada GLS random effect.
Langkah 14 :
Berikutnya yaitu
lihat hasil dari model Fixed Effect.
Klik Statistics => Longitudinal/panel data => Linear models => Linear regression (FE, RE, PA, BE).
Gambar
: Pengolah Data Stata 13 SE
Langkah 15 :
Pada tampilan jendela analisis data panel dengan model fixed effect isikan dependent
variable yaitu
Y_Penjualan dan independent
variables yaitu
X1_Produksi X2_Distribusi. Model type
(affects which options are available)
pilih fixed effects. Klik ok.
Gambar
: Pengolah Data Stata 13 SE
Metode lain dapat dengan menggunakan
menu Command dengan menuliskan xtreg Y_Penjualan X1_Produksi
X2_Distribusi, fe.
Gambar
: Pengolah Data Stata 13 SE
Langkah
16 : Hasilnya sebagai berikut.
Gambar
: Hasil Output Pengolah Data Stata 13 SE
Interpretasi Output :
Hipotesa :
Jika
nilai R squarefixed effect < nilai R square GLS random Effect => GLS
random Effect.
Jika
nilai R squarefixed effect > nilai R square GLS random Effect
=> fixed
effect.
Berdasarkan
output diatas menunjukkan nilai R square
sebesar 0.7552, jika
dibandingkan
dengan nilai dari R square GLS random effect sebesar 0.7565 maka model
GLS random effect lebih baik daripada
fixed effect (R sqaure fixed effect < R square
GLS random effect atau 0.7552 <
0.7565).
Setelah
mengetahui bahwa model yang lebih baik adalah GLS random effect. Berikutnya interpretasikan hasil dari GLS random effect.
Hasil
GLS random effect :
Gambar
: Hasil Output Pengolah Data Stata 13 SE
Interpretasi Output :
Number
of obs = 80 (total sampel)
Number
of groups = 20 tahun (jumlah sampel)
Persamaan
regresi :
Y = a +
bx1 + bx2 +e
Y (Penjualan) = a - bx1(Produksi) +
bx2(Distribusi) + e.
Y = -63.30414
+0.1100955 +0.3033932+ e
Uji
Signifikansi Paramater Individual (Uji Statistik t) :
- Nilai konstanta sebesar 63.30414 menunjukkan jika variabel independen X1 (Produksi) dan X2 (Distribusi) dianggap konstan maka rata-rata Y (Penjualan) sebesar 63.30414.
- Nilai koefisien regresi X1 (Produksi) sebesar 0.1100955 menunjukkan setiap kenaikan Produksi sebesar 1% maka Y (Penjualan) akan meningkat sebesar 0.1100955 persen.
- Nilai koefisien regresi X2 (Distribusi) sebesar 0.3033932 menunjukkan setiap kenaikan Distribusi sebesar 1% maka Y (Penjualan) akan meningkat sebesar 0.3033932 persen.
Nilai Probabilitas :
- Produksi (X1) : 0.000 < 0.05 (signifikan)
- Distribusi (X2) : 0.000 < 0.05 (signifikan)
- Constanta : 0.033 < 0.05 (signifikan)
Kesimpulan
: hasil
kedua variabel signifikan terhadap Y (Penjualan).
Koefisien Determinasi (R2) :
Hasil output R-squared memiliki besaran nilai 0.7565 yang berarti variasi tiga variabel independen X1 (Produksi) dan X2 (Distribusi) mampu menjelaskan 75.65% variasi variabel Y (Penjualan). Sisanya 24.35% dijelaskan oleh variabel lain yang tidak diteliti.
Kesimpulan : Model regresi sangat baik karena nilainya di atas 50%.
Pengujian Asumsi Klasik
Uji asumsi klasik yang digunakan adalah uji normalitas.
UJI NORMALITAS
Langkah 17 : Tuliskan
sktest X1_Produksi X2_Distribusi dibagian
Command.
Gambar : Pengolah Data Stata 13 SE
Langkah 18 :
Tekan enter. Hasilnya sebagai berikut.
Gambar
: Output Pengolah Data Stata 13
Interpretasi Output :
Berdasarkan hasil output
di atas :
Nilai
Pr (Skewness) :
- Produksi (X1) : 0.0020
- Distribusi (X2) : 0.0000
Nilai
Pr (Kurtosis) :
- Produksi (X1) : 0.6330
- Distribusi (X2) : 0.7086
- Suku Bunga (X3) : 0.0000
Nilai
Prob > chi2 :
- Produksi (X1) : 0.0145 < 0.05 (Tidak Berdistribusi Normal)
- Distribusi (X2) : 0.0000 < 0.05 (Tidak Berdistribusi Normal)
Kesimpulan
: Berdasarkan
hasil uji normalitas disimpulkan untuk Produksi (X1) dan Distribusi (X2) belum
berdistribusi normal karena nilainya dibawah 0.05.
Selain
menggunakan sktest. Pengujian normalitas juga dapat dilakukan menggunakan grafik dalam
bentuk histograms, box plots, symmetry
plots dan quantile-normal plots.
Langkah pertama yaitu menguji grafik box plots. Tuliskan graph box X1_Produksi dibagian Command. Kemudian graph box X2_Distribusi dibagian Command.
Gambar
: Pengolah Data Stata 13 SE
Gambar
: Pengolah Data Stata 13 SE
Tekan enter pada
masing-masing fungsi. Hasilnya sebagai berikut.
Box
Plot Produksi (X1)
Gambar
: Hasil Output Pengolah Data Stata 13
Interpretasi Output :
Grafik diatas menunjukkan variabel Produksi (X1) terdapat outlier. Outlier ini ditunjukkan dengan adanya 3 titik pada grafik. Sehingga data tidak berdistribusi normal.
Box
Plot Distribusi (X2)
Gambar
: Output Pengolah Data Stata 13
Interpretasi Output :
Grafik diatas menunjukkan variabel Distribusi (X2) terdapat outlier. Outlier ini ditunjukkan dengan adanya 9 titik pada grafik. Sehingga data tidak berdistribusi normal.
Kedua
yaitu menguji
grafik Normal Quantile Plot. Caranya
dengan menguji
ke menu Graphics => Distribusi Graphs => Normal Quantile Plot.
Gambar
: Hasil Output Pengolah Data Stata 13
Masukkan
variabel yang akan dilakukan pengujian dimenu variable. Cek satu persatu variabel.
Gambar
: Pengolah Data Stata 13 SE
Gambar
: Pengolah Data Stata 13 SE
Hasilnya sebagai berikut.
Uji
Plot Produksi (X1)
Gambar
: Output Pengolah Data Stata 13
Interpretasi Output :
Hasil uji plot variabel Produksi (X1) menunjukkan sebaran data menjauhi garis linear, sehingga data tidak berdistribusi normal.
Uji Plot Distribusi (X2)
Gambar
: Hasil Output Pengolah Data Stata 13
Interpretasi Output :
Hasil uji plot variabel Distribusi (X2) menunjukkan sebaran data menjauhi garis linear, sehingga data tidak berdistribusi normal.
Informasi
ekonometrika secara lengkap, silakan kunjungi channel youtube saya di : Dimas Channel
Note : Silakan bagi teman-teman yang ingin meng-copy artikel ini. Mohon sertakan sumber aslinya. Terima Kasih :-)
Note : Silakan bagi teman-teman yang ingin meng-copy artikel ini. Mohon sertakan sumber aslinya. Terima Kasih :-)
Regression Data Panel Model Least Square Dummy Variables (LSDV) With STATA 16
ReplyDeletehttp://bit.ly/Stata16LSDV