AksiomatikMetodologi dan Statistika
Artikel

Regresi Linier

Perkiraan parameter via OLS dengan asumsi linearitas, eksogenitas, homoskedastisitas, dan tidak ada autokorelasi.

y=Xβ+ε,  β^=(XTX)1XTyy = X\beta + \varepsilon,\; \hat\beta = (X^T X)^{-1}X^T y

Regresi linier memodelkan hubungan antara variabel respons y dan sekumpulan prediktor X melalui parameter beta. Estimasi parameter paling umum adalah Ordinary Least Squares (OLS), yang meminimalkan jumlah kuadrat residu. Di bawah asumsi klasik Gauss–Markov (linearitas dalam parameter, eksogenitas E[ε|X]=0, tidak ada multikolinieritas sempurna, dan varian error konstan/ homoskedastik), OLS bersifat BLUE (Best Linear Unbiased Estimator). Untuk inferensi (uji t/ F serta CI), asumsi normalitas residual membantu, tetapi pada sampel besar hasilnya tetap andal via pendekatan asimtotik.

Asumsi utama yang perlu diperiksa: (1) linearitas (cek plot residu vs nilai terprediksi), (2) eksogenitas (pertimbangkan variabel pengganggu/omitted variable), (3) tidak ada multikolinieritas sempurna (dan hindari yang tinggi), (4) homoskedastisitas (varian residual konstan), (5) tidak ada autokorelasi (khususnya untuk data runtun waktu), dan (6) normalitas residual untuk validitas uji pada n kecil. Diagnostik residu dan uji formal memandu apakah tindakan perbaikan diperlukan.

Multikolinieritas & VIF

Multikolinieritas tinggi (prediktor saling berkorelasi kuat) tidak membuat OLS bias, namun menaikkan varians estimator sehingga uji t menjadi lemah dan koefisien tidak stabil terhadap perubahan kecil pada data. Ukurannya dapat dilihat melalui Variance Inflation Factor (VIF); aturan praktis, VIF di atas 5–10 menandakan masalah. Strategi mitigasi: hapus/ gabungkan variabel yang sangat berkorelasi, transformasi, regularisasi (bila tujuan prediksi), atau gunakan domain knowledge untuk pemilihan model.

Heteroskedastisitas & SE Robust

Heteroskedastisitas berarti varian error tidak konstan di sepanjang rentang prediksi. Ini tidak membuat OLS bias, tetapi standar error konvensional menjadi tidak valid sehingga uji t/ F salah. Uji umum: Breusch–Pagan atau White. Jika terdeteksi, gunakan standard error robust (HC3/HC0) atau Weighted Least Squares bila struktur varian diketahui. Lihat juga artikel uji normalitas untuk konteks bentuk distribusi residual dan homogenitas pada desain eksperimen.

Autokorelasi & Durbin–Watson

Pada data time series, residual sering berkorelasi antar waktu (AR(1) dan seterusnya). Kondisi ini melanggar asumsi independensi dan mengganggu inferensi. Gunakan uji Durbin–Watson atau Breusch–Godfrey untuk mendeteksi autokorelasi. Solusi: sertakan dinamika (lag variabel), gunakan model ARIMA/ARIMAX, atau pakai standard error Newey–West (HAC) bila fokusnya inferensi koefisien pada model OLS yang tetap.

Uji t, Uji F, dan Goodness‑of‑Fit

Koefisien individual diuji dengan uji t (H0: betaⱼ = 0), sedangkan signifikansi model bersama diuji dengan uji F (semua beta non‑intersep = 0). Goodness‑of‑fit dilaporkan melalui R² dan adjusted‑R²; ingat bahwa R² tinggi tidak selalu berarti model tepat secara kausal. Validasi silang (cross‑validation) dan uji asumsi lebih penting untuk menilai kegunaan model, terutama untuk prediksi.

Interpretasi & Perangkap Umum

Interpretasi betaⱼ adalah perubahan rata‑rata y untuk kenaikan satu unit Xⱼ, menahan variabel lain konstan. Perangkap umum meliputi menganggap korelasi sebagai kausalitas, mengabaikan variabel terlewat (omitted variable bias), dan melakukan eksplorasi model berlebih (p‑hacking). Untuk outcome biner, pertimbangkan regresi logistik agar interpretasi berbasis odds ratio lebih tepat.

Praktik pelaporan yang disarankan: tabel koefisien dengan SE/robust SE, nilai t, p‑value, dan CI; ringkasan asumsi dan diagnostik (QQ‑plot, residu vs prediksi, leverage/Cook's distance); serta strategi penanganan pelanggaran asumsi yang ditemukan.

Rujukan

Artikel disusun untuk keperluan akademik dan terhubung ke kalkulator Aksiomatik. Lihat semua kalkulator