safarila.blogspot.com

WELCOME TO MY BLOG

SAFARILA.BLOGSPOT.COM
` Education
` Entertainment
- Tourism
` Culinary
` Knowledge of other General

Total Tayangan Halaman

Label


Lihat Kartu Ucapan Lainnya (KapanLagi.com)

Lihat Kartu Ucapan Lainnya (KapanLagi.com)

Lee Min Ho, dkk

Lee Min Ho, dkk
Boys Before Flowers

Jumat, 22 April 2011

STATISTIK TEST

5. Statistik Tes Signifikansi Dari Estimasi Kuadrat Terkecil:
Pertama-Order Tes

Dalam bab 4 kami mengembangkan formula untuk estimasi parameter hubungan ekonomi dengan menggunakan metode kuadrat terkecil. Tahap selanjutnya adalah menetapkan kriteria untuk menilai 'kebaikan' dari estimasi parameter. Kami membagi kriteria yang tersedia ke dalam tiga kelompok: teori kriteria apriori, kriteria statistik dan kriteria ekonometrik. Kriteria teoritis ditetapkan oleh teori ekonomi dan lihat tanda dan ukuran koefisien. Mereka didefinisikan pada tahap pertama penelitian ekonometrika, yaitu dalam tahap spesifikasi model. Dalam bab ini kita harus mengembangkan kriteria statistik atau tes urutan pertama untuk evaluasi estimasi parameter. Kriteria ekonometrik atau tes kedua order akan diperiksa dalam bab-bab berikutnya.
Dua tes yang paling umum digunakan dalam ekonometrik adalah sebagai berikut:
Yang pertama adalah kuadrat dari koefisien korelasi r2 yang digunakan untuk menilai kekuatan penjelas dari regresi linier Y atas X. kita akan membuktikan bahwa r2 adalah ukuran dari kebaikan fit dari garis regresi dengan nilai-nilai sampel yang diamati Y dan X.
Tes kedua adalah didasarkan pada kesalahan standar dari estimasi parameter dan diterapkan untuk menilai keandalan statistik estimasi dari koefisien regresi bo dan b1. Ini memberikan ukuran tingkat keyakinan bahwa kita dapat atribut ke bo estimasi dan b1. Hal ini memungkinkan peneliti untuk menentukan 'baik' bagaimana perkiraan parameter sesungguhnya dari hubungan bo (populasi) dan b1 adalah. Dalam bab 8 kita akan mengembangkan teknik statistik alternatif untuk menilai pentingnya hasil OLS, teknik analisis varians.

5.1 UJI DARI KEBAIKAN DARI FIT DENGAN r2
5.1.1 DEFINISI r2
Setelah estimasi parameter dan penentuan garis regresi kuadrat terkecil, kita perlu tahu bagaimana 'baik' adalah sesuai dengan garis ini untuk pengamatan sampel Y dan X, artinya kita perlu mengukur dispersi pengamatan sekitar garis regresi.Pengetahuan ini sangat penting, karena semakin dekat pengamatan ke baris, semakin baik kebaikan fit, yaitu lebih baik adalah penjelasan variasi Y oleh perubahan pada variabel penjelas.
Kami akan membuktikan bahwa ukuran kebaikan fit adalah kuadrat dari koefisien korelasi r2, yang menunjukkan persentase dari total variasi variabel dependen yang dapat dijelaskan oleh variabel X. independen Kami plot pengamatan pada rekan persegi panjang -ordinat sistem. Selanjutnya kita dihitung sarana dan kita menggambar garis tegak melalui titik-titik ini berarti
Dengan pas garis Y = b0 + b1 X kami mencoba untuk memperoleh penjelasan tentang variasi dari variabel dependen Y dihasilkan oleh perubahan variabel penjelas X. Namun, fakta bahwa pengamatan menyimpang dari garis estimasi menunjukkan bahwa regresi garis menjelaskan hanya sebagian dari total variasi variabel dependen, A bagian dari variasi, yang didefinisikan sebagai ei = Yi - Y, tetap tidak terjelaskan.
(1) Kita mungkin menghitung total variasi variabel dependen dengan membandingkan setiap nilai Y untuk nilai Y rata-rata dan menambahkan semua penyimpangan yang dihasilkan. 1 yang menunjukkan penyimpangan dari nilai-nilai Yi sekitar mereka maksud Y dengan huruf kecil kami.
Perhatikan bahwa untuk menemukan variasi total Y kami alun-alun penyimpangan sederhana, karena dengan definisi jumlah penyimpangan sederhana berarti variabel setiap sekitar adalah identik sama dengan nol.
1 Ketika kita berbicara tentang perubahan di Y kita harus mendefinisikan 'dasar referensi' tersebut. Artinya, nilai variabel Y, yang kita membandingkan nilai lain yang mungkin dianggap oleh variabel ini. Sebagai nilai referensi tersebut kita dapat mengambil asal (Y = 0) atau nilai rata-rata (Y) atau statistik lainnya Y (median, dll). Namun, itu adalah adat dan komputasi nyaman untuk mengambil rata-rata sebagai nilai referensi dan mengungkapkan total variasi Y sebagai jumlah dari penyimpangan Y dari mean mereka.
(2) Dengan cara yang sama kita mendefinisikan penyimpangan dari kemunduran (yaitu diperkirakan dari baris) nilai-nilai, Y dari nilai rata-rata, Yi = Y1 - Y. ini adalah bagian dari variasi total Yi yang dijelaskan oleh garis regresi. Dengan demikian jumlah kuadrat dari deviasi totalnya dijelaskan oleh variasi garis regresi dari variabel dependen.
n n
[Menjelaskan variasi] = Σ y21 = Σ (Yi - Y)2
i i

(3) Kita telah mendefinisikan ei sisa sebagai perbedaan ei = Yi - Yi, yaitu sebagai bagian dari variasi variabel dependen yang tidak dijelaskan oleh garis regresi dan dikaitkan dengan keberadaan variabel gangguan u . sehingga jumlah dari kuadrat residual terjelaskan memberikan variasi total variabel Y tergantung sekitar.
n n
Dijelaskan variasi = Σ e21 = Σ (Yi - Yi)2
i i

Dalam ringkasan
ei = Yi – Yi = penyimpangan pengamatan Yi dari garis regresi
yi = Yi – Y = penyimpangan Yi dari artinya
yi = Yi – Y = penyimpangan dari nilai kemunduran Yi dari rata-rata
Menggabungkan ekspresi kita mendapatkan
Yi = yi + Y dan Yi = yi + Y
Mengganti dalam ekspresi dari residu kita menemukan
ei = (yi + Y) – (yi + Y)
ei = yi – yi
yi = yi – ei
Dan
Persamaan ini menunjukkan bahwa setiap penyimpangan dari nilai-nilai yang diamati dari Y berarti perusahaan terdiri dari dua komponen, yang pertama adalah dijelaskan oleh variasi garis regresi dan yang kedua adalah variasi.

5.1.2 MEMBATASI NILAI YANG KOEFISIEN PENENTUAN, r2
Hal ini dapat dibuktikan bahwa koefisien determinasi dapat mengasumsikan nilai berbaring antara nol dan satu, yang mengatakan
0 ≤ r2 ≤ 1
Karena itu
r2 = 1 - Σe2
Σy2

Ingat bahwa Σe2 / Σy2 adalah proporsi variasi terjelaskan dari Y di sekitar mereka Y. berarti Jika semua pengamatan terletak pada garis regresi, tidak akan ada pencar poin: dengan kata lain variasi total Y dijelaskan sepenuhnya oleh garis regresi yang ditaksir, dan karenanya tidak akan ada variasi dijelaskan: yang Σe2 / Σy2 = 0 dan karenanya r2 = 1. Di sisi lain, jika garis regresi menjelaskan hanya bagian dari variasi dalam Y, akan ada beberapa variasi yang tidak dapat dijelaskan. Oleh karena itu r2 akan lebih kecil dari 1, Akhirnya jika garis regresi tidak menjelaskan bagian dari variasi Y, Σe2 / Σy2 = 1, Σe2 karena = Σy2. Oleh karena itu dalam hal ini r2 = 0.

5.1.3 HUBUNGAN ANTARA r2 DAN LERENG ATAS b.
Hubungan antara kuadrat dari koefisien korelasi, r2 dan kemiringan garis regresi diberikan oleh rumus.
r2 = b1 - Σxy
Σy2
Bukti. Kami menemukan bahwa

r2 = (Σxy)2
(Σx2) (Σy2)

Mengatur ulang sedikit kita mendapatkan
r2 = 1 - (Σxy) . (Σxy)
(Σx2) (Σy2)

Tapi Σxy/Σx2 = b1 , maka r2 = b1. (Σxy/Σy2)
Dalam ringkasan, r2 dapat dihitung dengan berbagai cara
r2 = (Σxy)2
(Σx2) (Σy2)

r2 = 1 - Σe2 or r2 = b1. Σxy or r2 = b21. Σx2
Σy2 y2 Σy2

5.2. UJI SIGNIFIKANSI PARAMETER YANG PERKIRAAN
Sejak b0 dan b1 adalah sampel estimasi parameter b0 dan b1 kita harus uji reliabilitas statistik mereka. Dalam rangka menerapkan standar tes yang signifikan kita harus, antara lain, mengetahui mean dan varians. Kami pertama-tama akan mengembangkan merumuskan untuk perhitungan mean dan varians dari perkiraan kuadrat terkecil. Kami selanjutnya akan menjelaskan prosedur tes standard error dan uji 'r' untuk menilai signifikansi statistik dari perkiraan. Akhirnya, kami akan menjelaskan pembangunan interval kepercayaan untuk perkiraan b0 dan b1

5.2.1 MEAN DAN VARIANSI DARI ESTIMASI KUADRAT TERKECIL PARAMETER
Pada bagian ini kita akan menetapkan hasil sebagai berikut
(1) Mean dari b0 : E(bo)= bo
(2) Perbedaan dari bo :
var(bo) = E[bo – bo]2 = o2u Σx21
nΣx 21

(3) Mean dari b1 : E(b1) = b1
(4) Perbedaan dari b1 :
var(b1) = E[b1 – b1]2 = o2u 1
Σx 21

(5) Estimasi varian dari u :
o2u = Σe21
n - K

dimana K = jumlah parameter estimasi dari regresi.


5.2.2 MEAN DARI b
Kami berasumsi bahwa kami mengambil contoh diulang n ukuran dari populasi Y dan X, dan untuk setiap contoh kita estimasi parameter b0 dan b1. Ini dikenal sebagai prosedur sampling hipotetis diulang. Jika semua sampel yang mungkin diambil, maka nilai rata-rata b1 akan nilai yang diharapkan: (berarti b1) = Σ (b1). Untuk mencari nilai dari mean dalam hal pengamatan sampel kami dari Y dan X kami bekerja sebagai berikut.
Kami menetapkan bahwa
b1 = Σx1y1
Σx21


5.2.3 VARIANSI DARI b1
Dapat dibuktikan bahwa
var(b1) = E[b1 – E(b1)]2 = E[b1 – b1]2 = o2u 1
Σx 21

5.2.4 MEAN DARI b0
Dapat dibuktikan bahwa
E(bo) = bo

5.2.5 VARIANSI DARI b0
Dapat dibuktikan bahwa
var(b0) = E[b0 – E(b0)]2 = E[b0 – b0]2 = o2u ΣX2
nΣx 2

5.2.6 YANG VARIANS DARI u VARIABLE RANDOM
Rumus varians dari b0 dan b1 melibatkan varians dari istilah acak u. Namun, yang benar berbeda dari ui tidak dapat dihitung karena nilai-nilai ui tidak diamati. Tetapi kita dapat memperoleh estimasi tidak bias dari ekspresi.
o2u = Σe21
n - 2

Dimana ei = Yi – Yi = Yi – b0 – b1Xi

5.2.7 DISTRIBUSI SAMPLING KUADRAT TERKECIL DARI PERKIRAAN
Kami telah menemukan ekspresi untuk mean dan varians dari perkiraan kuadrat terkecil. Mengingat bahwa dengan Asumsi 4 u variabel acak terdistribusi normal, maka dapat dibuktikan bahwa distribusi dari perkiraan b0 dan b1 juga normal (lihat RL Anderson dan TA Bancroft, Statistik Teori dalam Penelitian, New York: McGraw-Hill, 1952 , hal 63-4)

5.2.8 UJI STANDAR DARI ERROR KUADRAT TERKECIL PERKIRAAN
Kotak sedikit perkiraan b0 dan b1, diperoleh dari sampel pengamatan pada Y dan X. Karena kesalahan sampling tidak dapat dihindari dalam semua perkiraan, perlu untuk menerapkan uji signifikansi untuk mengukur ukuran kesalahan dan menentukan derajat kepercayaan keabsahan perkiraan.
Ada beberapa tes untuk tujuan ini. Pada bagian ini kita akan memeriksa hanya satu dari mereka, yaitu tes standard error yang populer dalam penelitian ekonometrik diterapkan. Tes ini membantu kita untuk memutuskan apakah perkiraan b0 dan b1, secara signifikan berbeda dari nol, yaitu apakah sampel dari mana mereka telah diperkirakan mungkin berasal dari populasi yang benar parameter adalah nol b0 = 0 dan / atau b1 = 0). Secara resmi kita menguji hipotesis nol
Ho : bi = 0
melawan hipotesis alternatif
H1 : bi ≠ 0
Kami selanjutnya membandingkan deviasi standar dengan nilai numerik dari b0 dan b1 jika standard error lebih kecil dari setengah nilai numerik dari estimasi parameter, kita menyimpulkan bahwa perkiraan ini secara statistik signifikan. Ini berarti bahwa kita menolak hipotesis nol, yang setara dengan menerima bahwa parameter populasi yang sebenarnya bi berbeda dari nol. Jika, di sisi lain, standard error estimasi parameter lebih besar dari setengah nilai numerik, kami menyimpulkan bahwa estimasi kuadrat terkecil secara statistik tidak signifikan. Ini berarti bahwa kita menerima hipotesis nol bahwa parameter benar = bi 0. Dalam tiba pada kesimpulan tentang makna atau arti non b kami telah menggunakan tes dua ekor pada 5 persen per tingkat signifikansi.

Ekonomi penafsiran dari 'uji standar-kesalahan'
Prosedur yang diuraikan di atas memberikan aturan praktis untuk menentukan apakah perkiraan b0 dan b1 secara statistik dapat diandalkan. Penerimaan atau penolakan hipotesis nol memiliki makna ekonomi pasti. Yaitu penerimaan hipotesis nol b1 = 0 menunjukkan bahwa variabel penjelas yang perkiraan ini tidak berkaitan dalam kenyataannya mempengaruhi variabel dependen Y dan tidak harus dimasukkan dalam fungsi tersebut, karena tes dilakukan memberikan bukti bahwa perubahan X meninggalkan Y terpengaruh. Dengan kata lain penerimaan H0 menyiratkan bahwa hubungan antara menyiratkan bahwa hubungan antara Y dan X pada kenyataannya Y = bo + (0) (X) = b0, yaitu tidak ada hubungan antara Y dan X.

Interpretasi geometris dari 'uji standar-kesalahan'
Kami mengatakan bo yang merupakan mencegat dari garis regresi pada sumbu Y, dan b1 mengukur kemiringan garis regresi.
(1) Jika, ketika melakukan pengujian diatas, kita menemukan bahwa (b0) > b0 / 2 dan menerima b0 hipotesis nol = 0, maka garis regresi melewati asal kapak, karena hubungan antara Y dan X sebenarnya.

5.2.9 UJI Z DARI-KUADRAT TERKECIL PERKIRAAN
Tes ini didasarkan pada Distribusi Normal Standar (atau Gauss Standard Normal Curve). Hal ini berlaku hanya jika (a) varians populasi diketahui, atau (b) varians populasi tidak diketahui, dan diberikan bahwa sampel dengan mana kita bekerja cukup besar (n > 30). Jika kondisi tersebut tidak dapat dipenuhi kami menerapkan tes siswa t, yang akan dijelaskan pada bagian berikutnya.
Dalam aplikasi ekonometrik varians populasi Y adalah varians dari u, yang tidak diketahui. Namun, jika kita memiliki sebuah contoh besar (n > 30) kita masih dapat menggunakan Distribusi Normal Standar dan melaksanakan uji Z (sekitar) sejak perkiraan sampel dari varians s2, adalah pendekatan memuaskan varians populasi tidak diketahui, o2, untuk besar n.
Uji Z bisa diuraikan sebagai berikut. kita ingin menguji hipotesis nol.
Ho : bi = 0
melawan hipotesis alternatif
H1 : bi ≠ 0

5.2.10 ATAS MAHASISWA t TEST
Kami mengatakan bahwa uji Z dapat diterapkan dalam kasus-kasus berikut hanya. Pertama, jika varians populasi yang sebenarnya diketahui, terlepas dari ukuran sampel. Kedua, jika yang benar berbeda dari perkiraan tidak diketahui, asalkan ukuran sampel cukup besar (n> 30), karena dalam hal ini estimasi varians sampel adalah pendekatan memuaskan dari varians populasi yang tidak diketahui.



5.3 KEPERCAYAAN INTERVAL UNTUK B0 DAN b1
Dalam rangka untuk menentukan seberapa dekat estimasi parameter benar terletak, kita harus membangun interval kepercayaan untuk parameter yang benar, dengan kata lain kita harus menetapkan nilai batas sekitar perkiraan di mana parameter yang benar diharapkan untuk berbohong dengan tingkat kepercayaan tertentu . Dalam hal ini kita katakan bahwa dengan probabilitas diberi parameter populasi akan berada dalam interval kepercayaan ditentukan atau batas-batas kepercayaan.
Kami memilih probabilitas di muka dan menyebutnya sebagai tingkat keyakinan. Ini adalah adat dalam ekonometri untuk memilih tingkat keyakinan 95 persen. Ini berarti bahwa dalam sampling diulang batas kepercayaan, dihitung dari sampel, akan mencakup parameter populasi yang sebenarnya di 95 persen dari kasus. Dalam 5 persen lainnya dari kasus parameter populasi akan jatuh di luar batas-batas kepercayaan.

5.3.1 PERCAYA DIRI INTERVAL DARI DISTRIBUSI NORMAL STANDAR
Ini telah disebutkan bahwa distribusi Z dapat digunakan baik jika kita mengetahui standar deviasi benar atau ketika kita memiliki sampel besar (n> 30), karena untuk sampel besar, deviasi standar sampel, s, merupakan perkiraan yang cukup baik dari deviasi standar populasi tidak diketahui.

5.3.2 PERCAYA DIRI INTERVAL DARI DISTRIBUSI t MAHASISWA
Prosedur untuk membangun selang kepercayaan dengan distribusi t adalah serupa dengan yang dijelaskan sebelumnya dengan perbedaan utama yang dalam hal ini kita harus memperhitungkan derajat kebebasan.

5.4 UJI SIGNIFIKANSI UNTUK SAMPEL KOEFISIEN KORELASI
Koefisien korelasi linear formula yang telah diturunkan dalam bab 3 adsalah perkiraan koefisien korelasi yang benar yang mengukur tingkat keterkaitan populasi nilai X dan Y. karena r adalah contoh perkiraan, kita harus uji reliabilitas statistic dengan melakukan beberapa uji signifikansi. Pengujian seperti itu memerlukan pengetahuan dari distribusi sampling r.

5.4.1 UJI SIGNIFIKANSI r KETIKA PENDUDUK YANG BENAR ρ = 0

5.4.2 UJI SIGNIFIKANSI r KETIKA BENAR PENDUDUK ρ ≠ 0
Jika distribusi ρ ≠ 0 sampling sejati r adalah tidak simetris, tapi miring: semakin tinggi ρ distribusi lebih condong sampling dari r.dalam hal ini kasus nelayan telah menyarankan uji berikut (Lihat M. Spiegel, Statistik, hal 247).

5.4.3 UJI SIGNIFIKANSI DARI RANK KOEFISIEN KORELASI r '
Signifikansi statistik koefisien korelasi peringkat Spearman dapat diuji dengan prosedur berikut :
Jika ρ populasi adalah nol, distribusi r 'dapat didekati dengan kurva normal memiliki 0 mean dan deviasi standar.
Hipotesis nol dan alternatif
Ho : ρ = 0 dan H1 : ρ ≠ 0
Mengingat bentuk hipotesis alternatif, kami menerapkan uji dua kor. Z statistik dapat digunakan dalam tes ini asalkan sampel besar.

5.5 CATATAN TENTANG PENTINGNYA DARI SIGNIFIKANSI PENGUJIAN STATISTIK
Tidak ada kesepakatan umum antara econometricians sebagai mana dari dua kriteria statistik yang lebih penting: sebuah r2 tinggi, atau kesalahan standar rendah dari perkiraan.
Kriteria statistik memperoleh sangat penting ketika seseorang mengikuti pendekatan eksperimental dalam menyelidiki masalah tertentu. Kami mengatakan bahwa dalam pendekatan penelitian ini mengambil bentuk proses komputasi berbagai model dengan berbagai kombinasi variabel yang relevan, dan kemudian mencoba untuk memutuskan mana yang lebih baik. Pilihan tidak akan sulit jika salah satu model menghasilkan kesalahan standar yang lebih tinggi dan lebih rendah r2. Namun, hal ini tidak biasanya terjadi. Dalam sebagian besar aplikasi kami memperoleh r2 tinggi, sedangkan beberapa parameter memiliki kesalahan standar yang tinggi. Dalam hal ini beberapa econometricians cenderung atribut yang sangat penting bagi r2, dan untuk menerima estimasi parameter, meskipun fakta bahwa beberapa dari mereka secara statistik tidak signifikan. Lain menyarankan bahwa penerimaan atau penolakan dari perkiraan yang tidak signifikan secara statistik tergantung pada tujuan model dalam situasi tertentu.
Mayoritas penulis tampaknya setuju bahwa r2 adalah kriteria yang lebih penting ketika model akan digunakan untuk peramalan, sedangkan galat standar memperoleh kepentingan yang lebih besar bilamana tujuan dari penelitian ini adalah penjelasan (analisis) fenomena ekonomi dan estimasi nilai-nilai yang dapat diandalkan parameter ekonomi tertentu.
Sebuah r2 tinggi memiliki manfaat jelas hanya bila dikombinasikan dengan estimasi signifikan (kesalahan standar rendah). Ketika r2 tinggi dan rendah standar kesalahan tidak ditemukan sementara dalam studi tertentu peneliti harus sangat berhati-hati dalam interpretasi dan penerimaan hasil. Prioritas harus selalu diberikan kepada pemenuhan kriteria a priori ekonomi (tanda dan ukuran perkiraan). Hanya ketika kriteria ekonomi puas orang harus melanjutkan dengan penerapan orde pertama dan tes kedua-order signifikansi.

Tidak ada komentar:

Posting Komentar