
Bagi orang sudah mempelajari statistika tentu akan sangat familiar dengan p-value, saat pertama kali belajar saya membuat machine learning saya tidak mengerti apa itu p-value saya hanya diberi tahu bahwa jika nilanya lebih kecil dari 0.05 maka machine learning dinyatakan sudah layak. Alasan kenapa bisa seperti itu saya tidak mengetahuinya. Pada kesempatan ini saya akan membahas apa itu p-value, bagaimana cara menggunakan, dan bagaimana contoh kasusnya.
Disclaimer: Karena artikel ini ditujukan untuk pembaca yang sedang mempelajari statistika dasar, saya akan menggunakan istilah “menolak” dan “menerima” hipotesis agar lebih mudah dipahami. Namun secara teknis, statistika tidak pernah benar-benar membuktikan suatu hipotesis benar. Statistika hanya memberikan dasar untuk menolak atau gagal menolak hipotesis berdasarkan bukti dari data yang dianalisis.
Apa itu p-value
Probability value atau biasa disebut juga dengan p-value merupakan angka yang mengambarkan kemungkinan mendapatkan data yang diamati dibawah hipotesis nol dalam uji statistik. Atau untuk lebih mudahnya p-value adalah angka untuk mengukur seberapa kuat data kita terhadap hipotesis nol (H₀).
Apa itu hipotesis nol (H₀)
Pada sebuah uji statistik pasti diawali dengan hipotesis nol. Hipotesis nol menyatakan bahwa tidak ada hubungan antar variable yang anda teliti. Atau bisa disebut juga bahwa hipotesis awal adalah sebuah asumsi awal yang kita bangun yang menyatakan bahwa “kok ngga ada efek ya”, “ngga ada perbedaan”, atau “ngga ada hubungan antar variable deh”.
Contoh dari pembuatan hipotesis nol adalah. Misalnya kita sedang menguji obat penurun demam, di uji ke seratus orang yang sedang mengalami demam tinggi. Maka hipotesis nol yang kita buat adalah seperti ini:
- Hipotesis nol (H0) = obat baru tidak menurunkan demam
- Hipotesis alternatif (H1) = obat baru terbukti menurunkan demam
Jadi initinya pada posisi awal statistik adalah skeptis terhadap apa yang sedang diteliti terlebih dahulu. Misal ada pertanyaan, ” Kenapa harus skeptis dulu? bukannya kita sudah menduga bahwa penelitian yang dilakukan pasti ada efeknya ya? Karena kalau sudah tau tidak ada hubungan pasti tidak diteliti kan?”.
Pada dasarnya lebih mudah untuk membantah dari pada membuktikan. Jika membantah maka hanya ada dua kemungkinan jawaban yang ada yaitu iya atau tidak. Tetapi jika harus membuktikan maka akan banyak sekali kemungkinan jawaban yang ada. Statistik bekerja dengan konsep ini, dia bekerja untuk membantah atau mendukung hipotesis awal.
Bagaimana cara menghitung p-value
Pada dasarnya anda bisa menggunakan aplikasi seperti (SPSS, Python, dan R)
Anda juga bisa menggunakan table untuk menemukan p-value yang bisa anda temukan secara online, atau anda bisa menggunakan p-value calculator. Jika anda sudah menemukan nilai p-value yang anda teliti maka, anda bisa dengan lebih mudah menolak atau menerima hipotesis awal yang sudah anda buat.
Secara matematis, p-value diperoleh dengan menghitung luas area di bawah kurva distribusi probabilitas menggunakan konsep integral dalam kalkulus. Area yang dihitung adalah semua kemungkinan nilai statistik yang sama ekstrem atau lebih ekstrem dibandingkan nilai hasil pengamatan, relatif terhadap keseluruhan luas kurva. Dalam proses ini, standar deviasi berperan penting karena menunjukkan seberapa jauh data menyebar dari rata-rata, yang memengaruhi bentuk dan lebar distribusi tersebut.
P-value dan statistika inferensial
Statistika infrensial adalah sebuah metode analisa data sebuah populasi menggunakan sample. Hasil akhir dari statistika inferensial sebuah kesimpulan yang menggambarkan kondisi sebuah populasi secara umum. P-value memiliki peranan penting dalam statistika inferensial, dia yang menentukan apakah sebuah hipotesis dapat diterima atau ditolak.
Pada dasarnya untuk setiap penelitian memiliki parameter tersendiri terhadap berapakah nilai p-value yang layak dijadikan sebagai acuan.
Pada dassarnya semakin kecil nilai p-value makan semakin baik, tetapi pada umumnya nilai yang digunakan untuk penelitian adalah x ≤ 0.005. Ada beberapa bidang penelitian yang menggunakan nilai ambang batas hingga 0.001.
Baca juga: Deep work: cara fokus di dunia yang penuh distraksi