Korelasi Point‑Biserial
Ukuran asosiasi antara variabel biner (0/1) dan variabel kontinu; identik secara matematis dengan r Pearson.
Rumus
Di mana Ȳ1 dan Ȳ0 adalah mean kelompok Y=1 dan Y=0; sY simpangan baku gabungan; n0, n1 ukuran kelompok.
Korelasi point‑biserial identik dengan korelasi Pearson jika variabel biner di‑encode sebagai 0/1. Koefisien ini mengukur asosiasi linier antara variabel kontinu dan status biner (mis. lulus/gagal, treatment/control). Asumsi utama mengikuti Pearson: hubungan linier, observasi independen, dan variabel kontinu kira‑kira normal di tiap level biner (untuk inferensi t). Alternatifnya, uji beda mean dua kelompok (t‑test) ekuivalen dengan menguji signifikansi r_pb.
Interpretasi: tanda positif berarti kelompok Y=1 memiliki rata‑rata lebih tinggi; besarannya mencerminkan kekuatan asosiasi. Untuk pelaporan, sertakan r_pb, p‑value, dan interval kepercayaan bila tersedia. Pertimbangkan ketidakseimbangan ukuran kelompok (n0 vs n1) karena memengaruhi standar error. Pada data biner yang merepresentasikan kejadian jarang, interpretasi bisa dilengkapi dengan uji logistik (regresi logistik) untuk pemodelan probabilitas.
Kata kunci: korelasi point‑biserial, variabel biner, perbedaan mean, uji t dua sampel, Pearson ekuivalensi, encoding 0/1.
Rujukan
- Wikipedia contributors Point-biserial correlation coefficient. Wikipediahttps://en.wikipedia.org/wiki/Point-biserial_correlation_coefficient
- SciPy Documentation scipy.stats.pointbiserialr. API referencehttps://docs.scipy.org/doc/scipy-1.15.2/reference/generated/scipy.stats.pointbiserialr.html
- LeBlanc, V., & Cox, M. A. A. (2017). Interpretation of the point-biserial correlation coefficient in the context of a school examination. The Quantitative Methods for Psychology, 13(1)https://www.tqmp.org/RegularArticles/vol13-1/p046/p046.pdf