Rabu, 13 Januari 2010

Regresi

Nama : Yurnalis (070677)
Kelas : 3B

Regresi

Salah satu teknik analisis data yang sedang ngetrend belakangan ini adalah regresi. Regresi adalah salah satu metode peramalan yang dikenal dalam statistic. dalam dunia pendidikan, regresi sangat sering digunakan oleh mahasiswa yang sedang menyelesaikan tugas akhir.
Analisis regresi berguna untuk :
• mengetahui pengaruh antara variable bebas (yang juga dikenal dengan prediktor) yang disimbolkan dengan X dan variable terikat (yang juga dikenal dengan kriterium) yang disimbolkan dengan Y.
Istilah variable bebas dan variable terikat berasal dari matematika. Dalam penelitian:
• variable bebas adalah variable yang dimanipulasikan oleh peneliti. Misalnya seorang peneliti di bidang pendidikan yang mengkaji akibat dari berbagai metode pengajaran. Peneliti dapat menentukan metode (sebagai variable bebas) dengan menggunakan berbagai macam metode. Dalam bahasa yang lebih lugas, variable bebas adalah variable yang meramalkan sedangkan variable terikat adalah variable yang diramalkan.
• Variable terikat adalah akibat yang di duga mengikuti perubahan dari variable bebas.Contoh, misalnya kita mengkaji tentang hubungan antara kecerdasan dan prestasi sekolah, maka kecerdasan adalah variable bebas dan prestasi sekolah adalah variable terikat. Jika kita meneliti hubungan antara merokok dan penyakit kanker, maka merokok adalah variable bebas dan penyakit kanker adalah variable terikat.

Jenis-jenis Persamaan Regresi :
a. Regresi Linier :
- Regresi Linier Sederhana
- Regresi Linier Berganda

b. Regresi Nonlinier
- Regresi Eksponensial

Dalam melakukan penentuan variable bebas dan variable terikat harus dilandasi dengan teori yang kuat. Hal ini karena statistic tidak dapat membedakan data yang memiliki teori dengan data yang tidak berteori. Jika data yang kita gunakan tidak memiliki landasan teori yang kuat, maka kesimpulan yang kita ambil akan sangat menyesatkan. Misalnya, kita memprediksi prestasi belajar dengan hasil panen padi. Secara statistic, bisa jadi prestasi belajar dipengaruhi oleh panen padi. Akan tetapi dalam kenyataannya, hasil analisis ini tidak dapat dibuktikan.
Model regresi bermacam-macam. Misalnya, regresi linear, regresi parabola, regresi hiperbola, regresi fungsi pangkat tiga dan lain-lain. Akan tetapi, regresi yang paling sering digunakan adalah regresi linear. model regresi linear dapat dituliskan dalam bentuk matematis sebagai berikut:



β0 = intersep Y untuk populasi
β0 = slope untuk populasi
ε = random error dalam Y untuk observasi ke-i

Dalam menentukan persamaan model regresi linear sederhana diperlukan metode tertentu. Metode yang paling sering digunakan adalah metode kuadrat terkecil (Least Square method). Pada dasarnya, least square method adalah metode meminimasi persamaan kuadrat. Dengan meminimasi persamaan kuadrat tersebut, maka akan didapatkan nilai untuk slope dan nilai untuk intersep yang akan membuat persamaan itu menjadi yang paling baik. misalnya, jika kita ingin meramal hubungan antara intelejensi dan prestasi belajar. Dengan menggunakan metode regresi linear sederhana, kita mendapatkan persamaan sebagai berikut:
Y = 2,55 + 0,93 (X) Maka -12,77 disebut intersep dan 0,93 disebut slope. Slope sebesar 0,93 berarti bahwa setiap peningkan 1 unit X (intelejensi), maka diperkirakan akan terjadi peningkatan sebesar 0,93 pada prestasi belajar. Nilai 2,55 melambangkan prestasi belajar. Kita bias gunakan model regresi yang telah kita hasilkan tersebut untuk memprediksi prestasi belajar seorang anak apabila dia memiliki intelejensi tertentu.
Pada postingan berikut insya Allah saya akan mendemonstrasikan bagaimana melakukan perhitungan untuk menemukan model persamaan regresi linear sederhana.

Dibawah ini contoh dari Analisis Regresi :

Perbandingan antara nilai PreTest dan PostTest dari 30 orang siswa pada mata pelajaran Sejarah


ANALISIS OUTPUT
Berdasarkan tabel diatas di dapatkan output hasil perhitungan dalam SPSS adalah sebagai berikut :
Regression




Pembahasan 1 :
 Mean PreTest = 6,1667
 Mean PosTest = 7,5000
 Standar deviasi dari PreTest = 1,01992
 Standar deviasi dari PosTest = 0.93772
 Banyaknya data yang dianalisis adalah = 30 siswa
 Korelasi Pearson di peroleh , r = 0,667



Pembahasan 2 :
 Pada tabel model Summary diperoleh R = 0,445 artinya variabel PosTest dapat menerangkan variabilitas sebesar 44,5% dari variabilitas PreTest, sedangkan sisanya diterangkan oleh variabel lain (dimana R merupakan koefisien determinasi)
 Dan nilai Durbin-Watson =1,719 yang berarti tidak terjadi autokorelas (non autokorelasi). Dikaitkan dengan penguji yang dilakukan D-W, nilai yang terletak 1,65 < onblur="try {parent.deselectBloggerImageGracefully();} catch(e) {}" href="https://blogger.googleusercontent.com/img/b/R29vZ2xl/AVvXsEi3n7617qxvfGNA9pRvBWM_7kFoB5t6Vl2seY_wp_DO9NzzN50NpxPY6JX7XxMLN0Hm71MfBy8C2pZPJHe9PU8WKQNl7ofY0J7V4W-rtWXKTY7-cVpMP0BO-igMUBlBeEMlJT9Ne6HC77yZ/s1600-h/6.JPG">
< b="0" b="0" hitung =" 22.443," tabel =" 2,62"> F tabel maka disimpulkan bahwa kita dapat menolak Ho. artinya ada hubungan linier antara PosTest dengan PreTest ( hasil ini bisa juga dilihat pada nilai Signifikansi sebesar 0,000 yang artinya signifikansi pada taraf 1% ).
 Pada bagian residual, mean square nya = 0,598
 Sehingga total df nya 29.


Pembahasan 4 :
Untuk Pengujian signifikan koefisien regresi dilakukan sbb, (table Coefficients)
a. Untuk Konstanta
 Hipotesis : Ho = koefisien regresi tidak signifikasi
H1 = koefisien regresi signifikan
 Pada taraf signifikansi 5%, nilai t tabel atau t 0,025;28 = 2,048 dan t hit = 0,627 karena t hit < ho =" koefisien" h1 =" koefisien" 28 =" 2,048" hit =" 4,737"> t table, maka dapat disimpulkan tolak Ho. Artinya PosTest berpengaruh pada PreTest. Hal ini bisa dilihat dari nilai Sig. = 0,000 yang lebih kecil dari taraf signifikansi 5%. Sehingga model regresi yang terbentuk adalah :
PreTest = 0.725 + 0,725 PosTest
Tanda + pada variabel PosTest menunjukkan arah yang searah, artinya bila nilai PreTest naik maka nilai Postest juga akan naik begitupun sebaliknya.
• 95.0% Confidence Interval untuk masing-masing koefisien regresi yang distandarisasi. Pada kasus ini kita menggunakan taraf kepercayaan 95 %.
• Untuk Konstanta:
• Lower Bound adalah nilai terendah dari hasil tes keseluruhan, yaitu -1.645
• Upper Bound adalah nilai tertinggi dari hasil tes keseluruhan, yaitu 3.096
• Untuk PostTes :
• Lower Bound adalah nilai terendah dari hasil tes keseluruhan, yaitu 0.412
• Upper Bound adalah nilai tertinggi dari hasil tes keseluruhan, yaitu 1.039



Nama : YURNALIS (070677)
Kelas : 3B

K O R E L A S I

Analisis korelasi yaitu suatu analisis yang digunakan untuk melihat hubungan antara dua variable. Ingat Analisis korelasi tidak mempersoalkan apakah variable pertama itu respon atau peubah bebas, begitu pula variable yang kedua.
koefisien korelasi, adalah nilai yang menunjukkan kekuatan dan arah hubungan linier antara dua peubah acak (random variable).

Korelasi yang biasa digunakan dalam penelitian adalah:

a. Korelasi Pearson Product Moment
Korelasi ini dilakukan jika sepasang variabel kontinu, memiliki korelasi. Jumlah pengamatan variabel X dan Y harus sama, atau kedua nilai variabel tersebut berpasangan. Semakin besar nilai koefisien korelasinya maka akan semakin besar pula derajat hubungan antara kedua variabel. Korelasi Pearson biasanya pada hubungan yang berbentuk linier (keduanya meningkat atau keduanya menurun). Koefisien korelasi ini tidak menunjukkan adanya hubungan kausal antar variabelnya.
Contoh kasus: jika terdapat hubungan korelasi antara variabel citra merek dengan kepuasan konsumen motor merek Honda.

b. Korelasi Spearman
Jika pengamatan dari 2 variabel X dan Y adalah dalam bentuk skala ordinal, maka derajat korelasi dicari dengan koefisien korelasi spearman. Prosedurnya terdiri atas:
1. Atur Pengamatan dari kedua variabel dalam bentuk ranking.
2. Cari beda dari masing-masing pengamatan yang sudah berpasangan
3. Hitung koefisien korelasi Spearman dengan rumus:

ρ = 1 = 6∑d12 / N3 – N
dimana:
d1 = beda antara 2 pengamatan berpasangan
N = total pengamatan
ρ = koefisien korelasi spearman

Contoh aplikasi : jika seorang peneliti ingin melihat apakah ada korelasi antara kasus kematian pada ternak yang yang sakit dengan kematian ternak akibat stress, maka secara random diambil 10 sampel ternak.
Penyelesaian kasus tersebut secara manual dapat digunakan dengan langkah pemeringkatan terlebih dahulu pada kedua variabel (kematian karena sakit dan kematian karena stress).

c. Korelasi Rank Kendall
Analisis korelasi rank Kendall digunakan untuk mencari hubungan dan menguji hipotesis antara dua variabel atau lebih, bila datanya berbentuk ordinal atau ranking. Kelebihan metode ini bila digunakan untuk menganalisis sampel berukuran lebih dari 10 dan dapat dikembangkan untuk mencari koefisien korelasi parsial.

Metode yang digunakan pada analisis koefisien korelasi rank Kendall yang diberi notasi τ adalah sebagai berikut.
1. Beri ranking data observasi pada variabel X dan variabel Y.
2. Susun n objek sehingga ranking X untuk subjek itu dalam urutan wajar, yaitu 1, 2, 3, …, n. Apabila terdapat ranking yang sama maka ranking-nya adalah rata-ratanya.
3. Amati ranking Y dalam urutan yang bersesuaian dengan ranking X yang ada dalam urutan wajar kemudian tentukan jumlah angka pasangan concordant (Nc) dan jumlah angka pasangan discordant (Nd).
4. Statistik uji yang digunakan:

τ = Nc – Nd / (N(N-1)/2)
dimana:
τ = koefisien korelasi rank Kendall
Nc = jumlah angka pasangan concordant
Nd = jumlah angka pasangan discordant
N = ukuran sampel

Dibawah ini merupakan perhitungan korelsi pada nilai UTS dan UAS dari 30 mahasiswa dalam Mata Kuliah Matematika.

Data Mentah
Korelasi antara nilai UTS dan UAS dari 30 mahasiswa dalam MK.Matematika



Analisis OUTPUT

Dari table diatas diperoleh output SPSS sebagai berikut :

Correlations




Pembahasan 1 :
 Mean dari nilai UTS = 48,7667
 Mean dari nilai UAS = 60,0000
 Standar deviasi nilai UTS = 12,18445
 Standar deviasi nilai UAS = 12,50655
 Banyaknya data yang di analisis adalah = 30
 Pada table Correlations didapatkan hasil :
• Dengan menggunakan korelasi Pearson, diperoleh ; r = 0,964 itu berarti hubungan antara nilai UTS dengan nilai UAS sangat kuat. Dari koefisien korelasi yang bertanda + diperolah artinya ada hubungan yang searah.

Hipotesis :
H0 ; p = 0 (tidak ada hubungan antara kedua variabel)
H1 ; p = 0 (ada hubungan antara kedua variabel)
Pengambilan keputusan menggunakan angka pembanding t tabel dengan kriteria sebagai berikut:




Untuk pengujian dalam SPSS digunakan kriteria sebagai berikut:



Dengan menggunakan Sig.=0.05



Dari statistika t tabel = t (28;0,025) = 2,048 (dari tabel distribusi t).
• Bila nilai t hitung dengan t tabel dibandingkan, ternyata nilai t hitung lebih besar dari nilai t tabel. Kesimpulanya tolak Ho.
• Artinya ada hubungan antara variabel nilai UTS dengan variabel nilai UAS pada signifikansi 5% secara nyata dan bersifat positif.



Pembahasan 2 :
Dengan menggunakan nilai koefisien korelasi Kendall’s tau_b diperoleh :
1. Nilai Korelasinya = 0,949; artinya asosiasi antara nilai UTS dan nilai UAS searah (bila nilai UTS tinggi maka nilai UAS juga tinggi, begitu pula sebaliknya).
2. Hasil dari output Sig.(2-tailed) = 0,000 (nilainya lebih kecil dari tingkat signifikansi) sehingga dapat disimpulkan hasil tersebut signifikan pada tafar signifikansi 0,05, bahkan pada taraf signifikansi 0,01. Maka dapat disimpulkan terdapat hubungan yang signifikan antara nilai UTS dengan nilai UAS.
Dengan menggunakan nilai koefisien korelasi Spearman diperoleh :
1. Nilai korelasinya = 0,987; artinya asosiasi antara nilai UTS dengan nilai UAS searah (bila nilaiUTS tinggi maka nilai UAS juga tinggi, begitu pula sebalikya).
2. Hasil output pada Sig.(2-tailed) = 0,000 (nilai lebih kecil dari tingkat signifikansi) sehingga dapat disimpulkan hasil tersebut signifikan pada tafar signifikansi 0,05, bahkan pada taraf signifikansi 0,01. Maka dapat disimpulkan terdapat hubungan yang signifikan antara nilai UTS dengan nilai UAS.