terjemahan ark

33
Regresi linier dengan One predictor Variabel Analisis regresi adalah metodologi statistik yang memanfaatkan hubungan antara dua atau variabel yang lebih kuantitatif sehingga variabel respon atau hasil dapat diprediksi dari yang lain , atau orang lain . Metodologi ini banyak digunakan dalam bisnis , sosial dan perilaku ilmu , ilmu biologi , dan disiplin ilmu lainnya . Beberapa contoh aplikasi adalah: 1 . Penjualan produk dapat diprediksi dengan memanfaatkan hubungan antara penjualan dan jumlah pengeluaran iklan . 2 Kinerja karyawan pada pekerjaan dapat diprediksi dengan memanfaatkan hubungan antara kinerja dan baterai tes bakat . 3 . Ukuran dari kosakata anak dapat diprediksi dengan memanfaatkan hubungan antara ukuran kosakata dan usia anak dan jumlah pendidikan orang tua . 4 . Lama tinggal di rumah sakit seorang pasien bedah dapat diprediksi dengan memanfaatkan hubungan antara waktu di rumah sakit dan tingkat keparahan operasi . Dalam Bagian I kita mengambil analisis regresi ketika variabel prediktor tunggal digunakan untuk memprediksi respon atau variabel hasil bunga. Dalam Bagian II dan III , kami mempertimbangkan analisis regresi ketika dua atau lebih variabel yang digunakan untuk membuat prediksi . dalam hal ini bab , kami mempertimbangkan ide-ide dasar analisis regresi dan

description

semoga

Transcript of terjemahan ark

Regresi linier dengan One predictor VariabelAnalisis regresi adalah metodologi statistik yang memanfaatkan hubungan antara dua atauvariabel yang lebih kuantitatif sehingga variabel respon atau hasil dapat diprediksi dariyang lain , atau orang lain . Metodologi ini banyak digunakan dalam bisnis , sosial dan perilaku ilmu , ilmu biologi , dan disiplin ilmu lainnya . Beberapa contoh aplikasi adalah:1 . Penjualan produk dapat diprediksi dengan memanfaatkan hubungan antara penjualan dan jumlah pengeluaran iklan .2 Kinerja karyawan pada pekerjaan dapat diprediksi dengan memanfaatkan hubunganantara kinerja dan baterai tes bakat .3 . Ukuran dari kosakata anak dapat diprediksi dengan memanfaatkan hubunganantara ukuran kosakata dan usia anak dan jumlah pendidikan orang tua .4 . Lama tinggal di rumah sakit seorang pasien bedah dapat diprediksi dengan memanfaatkan hubungan antara waktu di rumah sakit dan tingkat keparahan operasi .Dalam Bagian I kita mengambil analisis regresi ketika variabel prediktor tunggal digunakan untuk memprediksi respon atau variabel hasil bunga. Dalam Bagian II dan III , kami mempertimbangkan analisis regresi ketika dua atau lebih variabel yang digunakan untuk membuat prediksi . dalam hal ini bab , kami mempertimbangkan ide-ide dasar analisis regresi dan mendiskusikan estimasi parameter model regresi yang mengandung variabel prediktor tunggal.1.1 Hubungan antara Variabel1.2 Konsep hubungan antara dua variabel, seperti antara pendapatan keluarga dan keluargapengeluaran untuk perumahan, adalah satu akrab. Kami membedakan antara hubungan afunctional dan hubungan statistik, dan mempertimbangkan masing-masing di tum.

Hubungan fungsional antara Dua Variabel

Sebuah hubungan fungsional antara dua variabel dinyatakan oleh rumus matematika. Jika X2 menunjukkan variabel bebas dan Y variabel dependen, hubungan fungsional adalah ... Y = f (X) Mengingat nilai tertentu dari X, fungsi f menunjukkan nilai yang sesuai Y.Pertimbangkan hubungan antara penjualan Douar (Y) dari produk yang dijual dengan harga tetap dan nomor unit yang terjual (X). Jika harga jual adalah $ 2 per unit, relasi dinyatakan dengan persamaan: Y = 2X Hubungan fungsional ini ditunjukkan pada Gambar 1.1. Jumlah unit yang terjual dan penjualan dolar selama tiga periode terakhir (sementara harga satuan tetap konstan pada $ 2) adalah sebagai berikut:Jumlah DollarPeriode Unit Terjual Penjualan1 75 150 $2 25 503 130 260Pengamatan ini juga diplot pada Gambar 1.1. Perhatikan bahwa AU Fau langsung pada garishubungan fungsional. Ini adalah karakteristik dari hubungan fungsional AU

Hubungan statistik antara Dua Variabelcontoh 1Sebuah hubungan statistik, tidak seperti hubungan fungsional, bukan yang sempurna. Secara umum, pengamatan untuk hubungan statistik tidak Fau langsung di-kurva hubungan.Evaluasi performansi bisnis selama 10 karyawan diperoleh pada pertengahan tahun dan akhir tahun.Data ini diplot pada Gambar 1.2a. Evaluasi akhir tahun diambil sebagai dependen atauvariabel respon Y, dan pertengahan tahun evaluasi sebagai independen, jelas, atau prediktor

Variabel X. merencanakan dilakukan seperti sebelumnya . Misalnya , kinerja pertengahan tahun dan akhir tahun evaluasi untuk karyawan pertama diplot di X = 90 , Y = 94 .Gambar l.2a jelas menunjukkan bahwa ada hubungan antara pertengahan tahun dan akhir tahun evaluasi , dalam arti bahwa semakin tinggi evaluasi pertengahan tahun , cenderung lebih tinggi untuk akhir tahun evaluasi. Namun, hubungan ini tidak sempurna . Ada hamburan poin , menunjukkan bahwa beberapa variasi dalam evaluasi akhir tahun tidak dicatat dengan pertengahan tahun penilaian kinerja . Misalnya , dua karyawan memiliki evaluasi pertengahan tahun X = 80 , namun mereka menerima agak berbeda evaluasi akhir tahun. Karena hamburan poin dalam hubungan statistik, Gambar 1.2a disebut diagram pencar atau plot pencar . di statistik terminologi , setiap titik dalam diagram pencar merupakan trial atau kasus .Pada Gambar 1.2b , kami telah diplot garis hubungan yang menggambarkan hubungan statistik antara pertengahan tahun dan akhir tahun evaluasi . Hal ini menunjukkan kecenderungan umum dimana akhir tahun evaluasi bervariasi dengan tingkat evaluasi kinerja tengah tahun . Perhatikan bahwa sebagian besar poin tidak jatuh langsung pada garis hubungan statistik . Ini hamburan poin sekitar garis mewakili variasi dalam evaluasi akhir tahun yang tidak terkait dengan evaluasi kinerja pertengahan tahun dan yang biasanya dianggap bersifat acak.Hubungan statistik dapat sangat berguna , meskipun mereka tidak memiliki ketepatan darihubungan fungsional .

Contoh 2Gambar 1.3 menyajikan data tentang usia dan tingkat steroid dalam plasma selama 27 perempuan sehat antara 8 dan 25 tahun. Data sangat menyarankan bahwa hubungan statistik adalah lengkung (tidak linier). Kurva hubungan juga telah ditarik pada Gambar 1.3. itumenyiratkan bahwa, seiring dengan meningkatnya usia, tingkat steroid meningkat sampai titik tertentu dan kemudian mulai tingkat off. Perhatikan lagi hamburan poin sekitar kurva hubungan statistik, khas dari semua hubungan statistik.

1.3 Model Regresi dan Penggunaan merekaOrigins sejarahAnalisis regresi pertama kali dikembangkan oleh Sir Francis Galton di bagian akhirAbad ke-19 . Galton telah mempelajari hubungan antara tinggi orang tua dan anak-anak danmencatat bahwa ketinggian anak orang tua keduanya tinggi dan pendek tampaknya " kembali " atau" kemunduran " dengan rata-rata kelompok . Ia menganggap kecenderungan ini menjadi regresi untuk" biasa-biasa saja . " Galton mengembangkan deskripsi matematis regresi ini kecenderungan itu,prekursor model regresi hari ini .Regresi Istilah berlanjut sampai hari ini untuk menggambarkan hubungan statistik betwe ! N variabel .Konsep dasarcontohSebuah model regresi adalah cara formal untuk mengekspresikan dua unsur penting darihubungan statistik :1 . Sebuah kecenderungan variabel respon Y bervariasi dengan prediktor variabel X secara sistematisfashion.2 . Sebuah hamburan poin di sekitar kurva hubungan statistik .Kedua karakteristik yang diwujudkan dalam model regresi dengan mendalilkan bahwa:1 . Ada disfiibution probabilitas Y untuk setiap tingkat X.2 . Cara-cara ini distribusi probabilitas bervariasi dalam beberapa cara sistematis dengan X.Pertimbangkan lagi contoh evaluasi kinerja FiglU " e 1.2 . Akhir tahun evaluasi Ydiperlakukan dengan model regresi sebagai variabel acak . Untuk setiap tingkat kinerja pertengahan tahunevaluasi, ada mendalilkan distribusi probabilitas Y. Gambar 1.4 menunjukkan sepertidistribusi probabilitas untuk X = 90 , yang merupakan evaluasi pertengahan tahun untuk karyawan pertama .Sebenarnya evaluasi akhir tahun karyawan ini , Y = 94 , kemudian dipandang sebagai acakseleksi dari distribusi probabilitas .Gambar 1.4 juga menunjukkan distribusi probabilitas Y untuk tingkat evaluasi pertengahan tahun X = 50dan X = 70 . Perhatikan bahwa sarana distribusi probabilitas memiliki hubungan sistematiske level X. Hubungan sistematis disebut fungsi regresi Y berdasarkan X.Grafik fungsi regresi disebut kurva regresi . Perhatikan bahwa dalam Gambar 1.4fungsi regresi sedikit lengkung . Ini akan berarti misalnya kita bahwa peningkatandi diharapkan (mean ) evaluasi akhir tahun dengan peningkatan kinerja pertengahan tahunevaluasi terhambat pada tingkat yang lebih tinggi kinerja pertengahan tahun.Model regresi mungkin berbeda dalam bentuk fungsi regresi ( linier , lengkung ) ,dalam bentuk distribusi probabilitas Y ( simetris , miring ) , dan dengan cara lain .Apapun variasi , konsep distribusi probabilitas Y untuk setiap X yang diberikan adalahmitra resmi kepada pencar empiris dalam hubungan statistik. Demikian pula , regresikurva , yang menggambarkan hubungan antara sarana distribusi probabilitasY dan tingkat X , adalah mitra untuk kecenderungan umum Y bervariasi dengan Xsistematis dalam suatu hubungan statistik.Model regresi dengan Lebih dari Satu Prediktor Variabel . Model regresi dapatmengandung lebih dari satu variabel prediktor . Tiga contoh berikut .1 . Dalam sebuah studi efisiensi 67 kantor cabang dari rantai pembiayaan konsumen , responvariabel adalah biaya operasi langsung untuk tahun yang baru saja berakhir . Ada empat variabel prediktor :ukuran rata-rata outstanding pinjaman selama tahun , rata-rata jumlah pinjaman , jumlahjumlah aplikasi kredit baru diproses , dan indeks gaji kantor .2 . Dalam studi pembelian traktor , variabel respon adalah Volume ( tenaga kuda ) daripembelian traktor di wilayah penjualan perusahaan peralatan pertanian . Ada sembilan prediktorvariabel , termasuk usia rata-rata traktor di lahan pertanian di wilayah itu , jumlah peternakan diwilayah , dan indeks kuantitas produksi tanaman di wilayah itu .3 . Dalam sebuah penelitian medis anak-anak pendek , variabel respon adalah pertumbuhan plasma puncaktingkat hormon . Ada 14 variabel prediktor , termasuk usia , jenis kelamin , tinggi badan, berat badan ,dan 10 pengukuran lipatan kulit .Model fitur diwakili dalam Gambar 1.4 harus diperluas ke dimensi lebih lanjutketika ada lebih dari satu variabel prediktor . Dengan dua prediktor variabel Xl dan X2misalnya, distribusi probabilitas Y untuk setiap ( X " X2 ) kombinasi diasumsikanoleh model regresi . Hubungan sistematis antara sarana probabilitas inidistribusi dan variabel prediktor Xl dan X2 kemudian diberikan oleh permukaan regresi .

Konstruksi Model RegresiPemilihan Variabel Predictor . Karena kenyataan harus dikurangi dengan proporsi dikelolasetiap kali kita membangun model , hanya sejumlah terbatas dari penjelasan atau prediksivariabel dapat - atau harus - dimasukkan dalam model regresi untuk setiap situasi yang menarik .Oleh karena Masalah sentral dalam banyak studi eksplorasi adalah bahwa memilih , untuk regresiModel , satu set variabel prediktor yang "baik" dalam arti tertentu untuk tujuananalisis. Pertimbangan utama dalam membuat pilihan ini adalah sejauh mana memilihvariabel memberikan kontribusi untuk mengurangi variasi yang tersisa di penyisihan Yafter dibuat untukkontribusi variabel prediktor lain yang sementara dimasukkan dalammodel regresi . Pertimbangan lainnya termasuk pentingnya variabel ks kausalagen dalam proses di bawah analisis , sejauh mana pengamatan pada variabel dapatdiperoleh lebih akurat, atau cepat , atau ekonomis dari pada variabel bersaing , dansejauh mana variabel dapat dikendalikan . Dalam Bab 9 , kita akan membahas prosedurdan masalah dalam memilih variabel prediktor untuk dimasukkan dalam model regresi .

Bentuk Fungsional Regresi Hubungan . Pemilihan bentuk fungsional darihubungan regresi terkait dengan pemilihan variabel prediktor . Kadang-kadang , teori yang relevanmungkin menunjukkan bentuk fungsional yang sesuai . Teori belajar , misalnya, mungkin menunjukkanbahwa regresi fungsi terkait biaya unit produksi untuk jumlah kali sebelumnyaitem telah diproduksi harus memiliki bentuk tertentu dengan sifat asimtotik tertentu.Lebih sering , bagaimanapun , bentuk fungsional dari relasi regresi tidak dikenal dimaju dan harus diputuskan secara empiris setelah data telah dikumpulkan . linearatau fungsi regresi kuadrat sering digunakan sebagai memuaskan pertama perkiraan untukfungsi regresi alam diketahui . Memang , jenis sederhana fungsi regresidapat digunakan bahkan ketika teori memberikan bentuk fungsional yang relevan , terutama ketikabentuk yang dikenal sangat kompleks, namun dapat diperkirakan oleh linear atau kuadratfungsi regresi . Gambar l.5a mengilustrasikan kasus di mana fungsi regresi kompleksmungkin cukup didekati dengan fungsi regresi linier . Gambar l.5b memberikancontoh di mana dua fungsi regresi linier dapat digunakan " piecewise " untuk perkiraanfungsi regresi yang kompleks .Lingkup Model . Dalam merumuskan model regresi , biasanya kita perlu membatasi cakupandari model untuk beberapa interval atau wilayah nilai-nilai dari variabel prediktor ( s ) . itucakupannya ditentukan baik oleh desain penyelidikan atau dengan kisaran data di tangan .Sebagai contoh, sebuah perusahaan mempelajari pengaruh harga pada volume penjualan diselidiki enam hargatingkatan, mulai dari $ 4,95 sampai $ 6,95. Di sini , ruang lingkup model terbatas pada tingkat hargamulai dari mendekati US $ 5 sampai mendekati US $ 7. Bentuk fungsi regresi substansial luarkisaran ini akan berada dalam keraguan yang serius karena penyelidikan tidak memberikan bukti untuksifat hubungan statistik di bawah $ 4,95 atau di atas $ 6,95.

Penggunaan Analisis RegresiAnalisis regresi menyajikan tiga tujuan utama: ( I) deskripsi , ( 2 ) kontrol, dan ( 3 ) prediksi .Tujuan ini diilustrasikan oleh tiga contoh dikutip sebelumnya . Pembelian traktorStudi melayani tujuan deskriptif . Dalam studi cabang biaya operasional kantor , utamatujuannya adalah kontrol administratif , dengan mengembangkan hubungan statistik yang dapat digunakan antara biayadan variabel prediktor , manajemen bisa menetapkan standar biaya untuk setiap kantor cabangdalam rantai perusahaan . Dalam studi medis anak pendek , tujuannya adalah prediksi .Dokter dapat menggunakan hubungan statistik untuk memprediksi kekurangan hormon pertumbuhanpada anak pendek dengan menggunakan pengukuran sederhana dari anak-anak .Yang beberapa tujuan analisis regresi sering tumpang-tindih dalam praktek . cabangMisalnya kantor adalah kasus di titik . Pengetahuan tentang hubungan antara biaya operasional dankarakteristik kantor cabang tidak hanya memungkinkan manajemen untuk menetapkan standar biaya untuksetiap kantor tetapi manajemen juga bisa memprediksi biaya , dan pada akhir tahun fiskal itubisa membandingkan biaya aktual cabang terhadap biaya yang diharapkan .

Regresi dan KausalitasAdanya hubungan statistik antara variabel respon Y dan penjelasan atauvariabel prediktor X tidak berarti dengan cara apapun bahwa Y tergantung kausal pada X. Tidak peduli seberapakuat adalah hubungan statistik antara X dan Y , ada pola sebab- akibat adalah selaluditunjukkan oleh model regresi . Misalnya , data pada ukuran kosakata ( X ) dan menuliskecepatan ( Y ) untuk sampel anak-anak berusia 5-10 akan menunjukkan hubungan regresi positif .Hubungan ini tidak berarti , bagaimanapun, bahwa peningkatan kosakata menyebabkan menulis lebih cepatkecepatan . Di sini , variabel penjelas lainnya, seperti usia anak dan jumlah pendidikan,mempengaruhi baik kosakata ( X ) dan kecepatan menulis ( Y ) . Anak yang lebih tua memiliki lebih besarkosakata dan kecepatan menulis lebih cepat .Bahkan ketika hubungan statistik yang kuat mencerminkan kondisi kausal , kondisi kausaldapat bertindak dalam arah yang berlawanan , dari Y ke X. Perhatikan, misalnya , kalibrasitermometer . Di sini , pembacaan termometer yang diambil pada suhu yang dikenal berbeda ,dan hubungan regresi dipelajari sehingga akurasi prediksi yang dibuat dengan menggunakanpembacaan termometer dapat dinilai . Untuk tujuan ini , pembacaan termometer adalahvariabel prediktor X , dan suhu aktual adalah variabel respon Y untuk diprediksi .Namun, pola kausal sini tidak pergi dari X ke Y , tapi ke arah sebaliknya:suhu aktual ( Y ) mempengaruhi pembacaan termometer ( X ) .Contoh-contoh ini menunjukkan perlunya perawatan dalam menarik kesimpulan tentang penyebabhubungan dari analisis regresi . Analisis regresi dengan sendirinya tidak memberikan informasitentang pola kausal dan harus dilengkapi dengan analisis tambahan untuk mendapatkan wawasantentang hubungan sebab akibat .

Penggunaan KomputerKarena analisis regresi sering memerlukan perhitungan panjang dan membosankan , komputerbiasanya digunakan untuk melakukan perhitungan yang diperlukan . Hampir setiap paket statistik untukkomputer mengandung komponen regresi . Sedangkan paket berbeda dalam banyak detail , merekaOutput regresi dasar cenderung sangat mirip .Mter penjelasan awal perhitungan regresi yang dibutuhkan , kita akan bergantung pada komputerperhitungan untuk semua contoh berikutnya . Kami menggambarkan output komputer dengan menghadirkan keluarandan grafis dari BMDP ( Ref. 1,1 ) , MINITAB ( Ref. 1,2 ) , SAS ( Ref. 1,3 ) , SPSS ( Ref. 1,4 ) ,SYSTAT ( Ref. 1,5 ) , JMP ( Ref. 1,6 ) , S -Plus ( Ref. 1,7 ) , dan MATLAB ( Ref. 1,8 ) ; , .

1.3 Model Regresi Linear Sederhana dengan DistribusiKetentuan Unspecified ErrorPernyataan Formal ModelDalam Bagian I kita mempertimbangkan model regresi dasar di mana hanya ada satu variabel prediktordan fungsi regresi linier . Model ini dapat dinyatakan sebagai berikut :Y ; = F30 + f31X ; + 10; ( 1.1 )di mana :Y , adalah nilai variabel respon dalam sidang enganF30 dan F31 adalah parameterX , adalah sebuah konstanta yang dikenal , yaitu nilai dari variabel prediktor dalam sidang engan10 , adalah kesalahan istilah acak dengan mean E { Cd = 0 dan varians u 2 { Cd = u 2; 10 , dan Cj adalahberkorelasi sehingga kovarians mereka adalah nol (yaitu , u { c; , Cj } = 0 untuk semua i , j; i = 1 = j )i = _1 , ... , nModel regresi ( 1.1 ) dikatakan sederhana , linear dalam parameter , dan linier dalamvariabel prediktor . Ini adalah " sederhana " dalam bahwa hanya ada satu variabel prediktor , " linear dalamparameter , " karena tidak ada parameter muncul sebagai eksponen atau dikalikan atau dibagi denganparameter lain , dan " linear dalam variabel prediktor , " karena variabel ini hanya munculpada kekuatan pertama. Sebuah model yang linear dalam parameter dan dalam variabie prediktor adalahdisebut juga model ajirst -order .

Fitur penting dari Model1 . Respon Y , dalam sidang i adalah jumlah dari dua komponen : ( 1 ) istilah konstanF30 + F31 Xi dan ( 2 ) istilah acak .. c ; . Oleh karena itu , Yi adalah variabel rando ... m .2 . Karena E { c; } = 0 , maka dari ( A.13c ) dalam Lampiran A bahwa:E { Y ;} = { E f3o + F31 X , + cd = F30 + fhX ; + E { Cd = F30 + f31X ;Perhatikan bahwa F30 + f31X , memainkan peran tersebut yang konstan dalam ( A. 13c )

Dengan demikian , respon Vi , ketika tingkat X dalam sidang i adalah Xi , berasal dari probabilitasdistribusi yang rata-rata adalah :( 1.2 )Oleh karena itu kita tahu bahwa fungsi regresi untuk model ( 1.1 ) adalah :( 1.3 )karena fungsi regresi berkaitan sarana distribusi probabilitas Y untuk diberikanX untuk tingkat X.3 . Tanggapan Yi dalam sidang engan melebihi atau jatuh pendek dari nilai regresifungsi dengan kesalahan istilah jumlah Ci .4 . Istilah kesalahan Ci diasumsikan memiliki varians konstan 0-2 karena Hal berikut bahwatanggapan Yi memiliki varian konstan yang sama :( 1.4 )karena, dengan menggunakan ( A.I6a ) , kita memiliki:0-2 { , 80 + , 81 + Xi cd = 0-2 { c; } = 0-2Dengan demikian , model regresi ( 1.1 ) mengasumsikan bahwa distribusi probabilitas dari Y memiliki samavarians 0 - 2 , terlepas dari tingkat prediktor variabel X.5 . Istilah kesalahan diasumsikan tidak berkorelasi . Karena istilah kesalahan Ci dan Cj adalahberkorelasi , demikian pula respon Yi dan Yj 6 . Singkatnya , model regresi ( 1.1 ) menunjukkan bahwa tanggapan Yi berasal dari probabilitasdistribusi yang berarti adalah E { Y ;} = , 80 + , 81Xi dan yang varians adalah 0-2 , yangsama untuk semua tingkat X. Selanjutnya, setiap dua tanggapan Yi dan Yj tidak berkorelasi .Seorang konsultan untuk distributor listrik adalah mempelajari hubungan antara nomortawaran yang diminta oleh kontraktor konstruksi untuk peralatan pencahayaan dasar selama seminggudan waktu yang diperlukan untuk menyiapkan tawaran . Misalkan model regresi ( 1.1 ) berlakudan adalah sebagai berikut :Yi = 9,5 + + 2.IXi Cidimana X adalah jumlah tawaran disiapkan dalam seminggu dan Y adalah jumlah waktu yang dibutuhkan untukmenyiapkan tawaran . Gambar 1.6 berisi presentasi dari fungsi regresi :E { Y } = 9,5 + 2.IXMisalkan pada minggu engan , Xi = 45 tawaran dipersiapkan dan jumlah sebenarnya jamyang diperlukan Yi = 108 . Dalam hal ini, nilai error term adalah Ci = 4 , karena kita memilikiE { Y ;} = 9,5 + 2,1 ( 45 ) = 104danYi = 108 = 104 + 4Gambar 1.6 menampilkan distribusi probabilitas dari Y untuk X = 45 dan menunjukkan daridi mana dalam distribusi ini pengamatan Yi = 108 datang . Perhatikan lagi bahwa istilah kesalahan Cihanyalah penyimpangan Yi dari nilai rata-ratanya E { Y ; } .Gambar 1.6 juga menunjukkan distribusi probabilitas Y saat X = 25 . Perhatikan bahwa inidistribusi menunjukkan variabilitas yang sama sebagai distribusi probabilitas ketika X = 45 , dikesesuaian dengan persyaratan model regresi ( 1.1 ) .

Arti Regresi ParametercontohParameter F30 dan f3 , dalam model regresi ( 1.1 ) disebut koefisien regresi . f3 ,adalah kemiringan garis regresi . Hal ini menunjukkan perubahan dalam rata-rata probabilitasdistribusi Y per unit kenaikan X. Parameter F30 adalah intercept Y dari regresiline. Ketika lingkup model termasuk X = 0 , F30 memberikan rata-rata probabilitasdistribusi Y pada X = O. Ketika lingkup model tidak mencakup X = 0 , F30 tidaktidak memiliki makna tertentu sebagai sebagai ~ jangka parate dalam model regresi .Gambar 1.7 menunjukkan fungsi regresi :E { Y } = 9,5 + 2.1xuntuk distributor misalnya listrik . Kemiringan f3 , = 2.1 i- ndicates bahwa persiapansatu tawaran tambahan dalam seminggu menyebabkan peningkatan rata-rata distribusi probabilitasY dari 2 . Aku jam.Mencegat F30 = 9,5 menunjukkan nilai dari fungsi regresi di X = O. Namun ,karena model regresi linier dirumuskan untuk diterapkan ke minggu di mana jumlah12 Bagian Satu Regresi Linier Sederhanatawaran disiapkan berkisar 20-80 , F30 tidak memiliki arti intrinsik sendiridi sini . Jika lingkup dari model itu harus diperluas ke tingkat X mendekati nol , model denganfungsi regresi lengkung dan beberapa nilai F30 berbeda untuk linierfungsi regresi mungkin juga diperlukan.

Versi Alternatif Model RegresiKadang-kadang akan lebih mudah untuk menulis model regresi linier sederhana ( 1.1 ) dalam sedikitberbeda , meskipun sama , bentuk. Biarkan Xo berupa sebuah konstanta identik sama dengan 1 . Kemudian, kitadapat menulis ( 1.1 ) sebagai berikut :Y ; = f3oXo + f3 , X , + 8i mana Xo == 1 ( 1.5 )Ini versi dari model asosiasi variabel X dengan masing-masing koefisien regresi .Sebuah modifikasi alternatif adalah dengan menggunakan untuk variabel prediktor penyimpangan Xi - Xdaripada Xi . Untuk meninggalkan Model ( 1.1 ) tidak berubah , kita perlu menulis :Ii = F30 + f3 , ( X , - X ) + f3 , X + 8 ;= ( F3o + f3 , X ) + f3 , ( X , - X ) + 8i= F3 ~ + F31 ( Xi - X ) + 8 ;Dengan demikian , ini alternatif model versi adalah :Yi = f3 ~ + f3 , ( Xi - X ) + 8 ;di mana :f3 ~ = F30 + f3 , XKami menggunakan model ( 1.1 ) , ( 1,5 ) , dan ( 1,6 ) secara bergantian sebagai mendikte kenyamanan .

1.4 Data Analisis Regresi( 1.6 )( 1.6a )Biasanya , kita tidak tahu nilai-nilai parameter regresi F30 dan f3 , dalam regresiModel ( 1.1 ) , dan kita harus memperkirakan mereka dari data yang relevan . Memang , seperti yang kita catat sebelumnya , kamisering tidak memiliki cukup pengetahuan apriori dari variabel prediktor yang sesuaidan bentuk fungsional hubungan regresi ( misalnya , linear atau lengkung ) , dan kamiperlu bergantung pada analisis data untuk mengembangkan model regresi yang sesuai .Data untuk analisis regresi dapat diperoleh dari nonexperimental atau eksperimentalstudi . Kami menganggap masing-masing di tum .data observasionalData pengamatan adalah data yang diperoleh dari studi nonexperimental . Studi tersebut tidakmengontrol penjelasan atau prediksi variabel ( s ) dari bunga. Misalnya , pejabat perusahaaningin mempelajari hubungan antara usia karyawan ( X ) dan jumlah hari sakittahun lalu ( Y ) . Data yang diperlukan untuk digunakan dalam analisis regresi diperoleh dari personilcatatan . Data tersebut merupakan data pengamatan sejak variabel penjelas , usia, tidakdikontrol .Analisis regresi sering didasarkan pada data pengamatan , karena seringkali tidaklayak untuk melakukan eksperimen terkontrol . Dalam personil contoh perusahaan hanyadisebutkan , misalnya, tidak akan mungkin untuk mengontrol usia dengan menetapkan usia untuk orang .

Keterbatasan besar data pengamatan adalah bahwa mereka sering tidak memberikan informasi yang memadaitentang hubungan sebab -akibat . Misalnya, hubungan positif antara usiakaryawan dan jumlah hari sakit pada personil contoh perusahaan mungkin tidak menyiratkanbahwa jumlah hari sakit adalah akibat langsung dari usia. Mungkin bahwa karyawan mudaperusahaan terutama bekerja di dalam ruangan sementara karyawan yang lebih tua biasanya bekerja di luar rumah , danbahwa lokasi kerja lebih langsung bertanggung jawab untuk jumlah hari sakit dari usia .Setiap kali analisis regresi dilakukan untuk tujuan deskripsi berdasarkan pengamatandata, orang harus menyelidiki apakah variabel penjelas selain mereka yang dianggapdalam model regresi mungkin lebih langsung menjelaskan hubungan sebab -akibat .

data eksperimentalSering , adalah mungkin untuk melakukan percobaan terkontrol untuk menyediakan data dari manaparameter regresi dapat diperkirakan . Perhatikan, misalnya , perusahaan asuransi yangkeinginan untuk mempelajari hubungan antara produktivitas analis dalam pemrosesan ) ( laims danLama pelatihan . Sembilan analis yang akan digunakan dalam penelitian ini . Tiga dari mereka akan dipilihsecara acak dan dilatih selama dua minggu , tiga selama tiga minggu , dan tiga selama lima minggu .Para analis ofthe produktivitas selama 10 minggu berikutnya kemudian akan diamati . Datasehingga diperoleh akan data eksperimen karena kontrol dilaksanakan atas jelasvariabel , panjang pelatihan .Ketika kontrol atas variabel penjelas ( s ) dilaksanakan melalui penugasan acak ,seperti dalam studi contoh produktivitas, data yang dihasilkan eksperimen memberikan lebih kuatinformasi tentang penyebab - dan-efek hubungan daripada data pengamatan . Alasannya adalahyang pengacakan cenderung untuk mengimbangi efek dari setiap variabel lain yang mungkin mempengaruhivariabel respon , seperti pengaruh bakat dari karyawan terhadap produktivitas .Dalam terminologi desain eksperimental , panjang pelatihan ditugaskan seorang analis distudi contoh produktivitas disebut pengobatan . Para analis untuk dimasukkan dalam penelitian inidisebut unit eksperimental . Kontrol atas variabel penjelas ( s ) kemudian terdiri darimenugaskan pengobatan untuk masing-masing unit eksperimen dengan cara pengacakan .

Rancangan Acak LengkapJenis yang paling dasar dari desain statistik untuk membuat tugas acak perawatan untukunit percobaan ( atau sebaliknya ) adalah rancangan acak lengkap . Dengan desain ini,tugas yang dibuat benar-benar acak . Ini pengacakan lengkap menyatakan bahwa semuakombinasi unit eksperimental ditugaskan untuk perlakuan yang berbeda sama-sama mungkin ,yang berarti bahwa setiap unit percobaan memiliki kesempatan yang sama untuk menerima siapa pun dariperawatan .Sebuah rancangan acak lengkap ini sangat berguna ketika unit eksperimencukup homogen . Desain ini VEI ) , fleksibel, mengakomodasi sejumlah perawatandan memungkinkan sampel yang berbeda ~ izes untuk perawatan yang berbeda . Kepala merugikan adalah bahwa ,ketika unit percobaan yang heterogen , desain ini tidak seefisien beberapa lainnyadesain statistik.

1.5 Ikhtisar Langkah-langkah dalam Analisis RegresiModel regresi yang dipertimbangkan dalam hal ini dan selanjutnya bab dapat dimanfaatkan baikuntuk data pengamatan atau data eksperimen dari rancangan acak lengkap .( Analisis regresi juga dapat memanfaatkan data dari jenis lain desain eksperimental, namunmodel regresi yang disajikan di sini akan perlu diubah . ) Apakah data yangobservasional atau eksperimental , adalah penting bahwa kondisi model regresi menjadisesuai untuk data di tangan untuk model dapat diterapkan .Kita mulai diskusi kita analisis regresi dengan mempertimbangkan kesimpulan tentang regresiparameter untuk model regresi linier sederhana ( 1.1 ) . Untuk kesempatan langkamana pengetahuan sebelumnya atau teori saja memungkinkan kita untuk menentukan regresi yang tepatModel . kesimpulan berdasarkan pada model regresi adalah langkah pertama dalam analisis regresi .Dalam situasi yang biasa , namun, di mana kita tidak memiliki pengetahuan yang memadai untuk menentukanmodel regresi yang tepat di muka, langkah pertama adalah studi eksplorasi dari data ,seperti yang ditunjukkan dalam diagram alur pada Gambar 1.8 . Atas dasar ini analisis eksplorasi awal,satu atau lebih model regresi awal dikembangkan . Model regresi inikemudian diperiksa untuk kesesuaian mereka untuk data di tangan dan direvisi , atau model baru

bagan alirdikembangkan , sampai penyidik merasa puas dengan kesesuaian regresi tertentuModel . Hanya kemudian adalah kesimpulan yang dibuat berdasarkan model regresi ini , sepertikesimpulan tentang parameter regresi dari model atau prediksi pengamatan baru .Kita mulai , untuk alasan pedagogik , dengan kesimpulan berdasarkan model regresi yangakhirnya dianggap sesuai . Seseorang harus memiliki pemahaman tentang model regresidan bagaimana mereka dapat dimanfaatkan sebelum masalah invol ved dalam pengembangan yang sesuaimodel regresi dapat sepenuhnya dijelaskan .

1.6 Estimasi Regresi FungsicontohThe observasional atau eksperimental data yang akan digunakan untuk memperkirakan parameterfungsi regresi terdiri dari pengamatan pada penjelasan atau prediksi variabel X danpengamatan yang sesuai pada variabel respon Y. Untuk setiap percobaan , ada Xobservasi dan pengamatan Y . Kami melambangkan ( X , Y ) pengamatan untuk t \ rst persidangan sebagai( X " YI ) , untuk sidang kedua sebagai ( X2 , Y2 ) , dan secara umum untuk percobaan i sebagai ( Xi , Vi ) , di manai = 1 , ... , n .Dalam sebuah penelitian kecil - skala ketekunan, suatu percobaan memberi tiga mata pelajaran yang sangat sulittugas . Data mengenai usia subjek ( X ) dan jumlah usaha untuk mencapaitugas sebelum menyerah ( Y ) berikut:Tunduk i:Umur Xi :Jumlah upaya Yi :12052551233010Dalam hal notasi yang akan digunakan , ada n = 3 subjek dalam penelitian ini,pengamatan untuk subyek pertama ( X " YI ) = ( 20 , 5 ) , dan juga untuk yang lainsubyek .

Metode paling - SquaresUntuk menemukan "baik" estimator dari parameter regresi F30 dan F31 , kami mempekerjakan metodekuadrat terkecil . Untuk pengamatan ( Xi > Vi ) untuk setiap kasus , metode kuadrat terkecilmenganggap penyimpangan Yi dari nilai yang diharapkan :( 1.7 )Secara khusus , metode kuadrat terkecil mengharuskan kita mempertimbangkan jumlah dari n kuadratpenyimpangan . Kriteria ini dinotasikan dengan Q :nQ ~ : L ( Yi - F30 - f3IXi ) ~ ( 1.8 )i = 1Menurut metode kuadrat terkecil , estimator dari F30 dan F31 adalah nilai-nilaibo dan b " masing-masing, yang meminimalkan kriteria Q untuk pengamatan sampel yang diberikan( X " YI ) , ( X2 , Y2 ) , ... , ( X , , , Yn ) .garis regresi yang terjadi ketika kita menggunakan rata-rata dari respon ( 9,0 ) sebagai prediktordan mengabaikan X :Y = 9,0 + O ( X )Perhatikan bahwa garis regresi ini menggunakan perkiraan bo = 9.0 dan bl = 0 , dan menandakan Yordinat dari garis regresi estimasi . Jelas , garis regresi ini tidak baikcocok, sebagaimana dibuktikan oleh deviasi vertikal besar dua pengamatan Y darisesuai koordinat Y dari garis regresi . Penyimpangan untuk subjek pertama , untukyang ( X " YI ) = ( 20,5 ) , adalah :YI - ( bo + Pixi ) = 5 - [ 9.0 + 0 ( 20 ) ] = 5-9,0 = -4Jumlah kuadrat penyimpangan untuk tiga kasus adalah :Q = ( 5-9,0 ) 2 + (12 - 9,0) 2 + (10 - 9,0) 2 = 26,0Gambar 1.9b menunjukkan data yang sama dengan garis regresi :Y = 2.81 + 0,177 XFit dari garis regresi ini jelas jauh lebih baik . Penyimpangan vertikal untuk kasus pertamasekarang adalah :YI - ( bo + Pixi ) = 5 - [ 2.81 + 0,177 ( 20 ) ] = 5-6,35 = -1.35dan kriteria Q jauh berkurang :Q = ( 5-6,35 ) 2 + ( 12-12,55 ) 2 + ( 10-8,12 ) 2 = 5.7Dengan demikian , lebih cocok dari garis regresi untuk data sesuai dengan jumlah yang lebih kecil Q.Tujuan dari metode kuadrat terkecil adalah untuk menemukan perkiraan bo dan bl untuk F30 dan F31 ,masing-masing, yang Q adalah minimum . Dalam arti tertentu , yang akan dibahas segera , ini

perkiraan akan memberikan " baik " fit dari fungsi regresi linier . Garis regresi diGambar 1.9b adalah, pada kenyataannya, setidaknya garis regresi kuadrat .Kuadrat Terkecil estimator . Estimator bo dan bl yang memenuhi kriteria kuadrat terkecildapat ditemukan dalam dua cara dasar :1 . Prosedur pencarian numerik dapat digunakan yang mengevaluasi secara sistematis yang palingkuadrat kriteria Q untuk perkiraan yang berbeda bo dan bl sampai orang-orang yang meminimalkan Qditemukan . Pendekatan ini diilustrasikan pada Gambar 1.9 untuk studi misalnya ketekunan.2 . Prosedur analitis sering dapat digunakan untuk menemukan nilai-nilai bo dan bl yang meminimalkanQ. pendekatan analitis layak ketika model regresi tidak matematiskompleks.Model forregression menggunakan pendekatan analitis , dapat ditunjukkan ( 1.1 ) bahwa nilai-nilaibo dan bl yang meminimalkan Q untuk setiap set data tertentu sampel diberikan oleh berikut. , ~ Persamaan simultan :2 : Yi = NBO + bl 2 : Xi2 : Xi Yi = bo 2 : Xi + bl 2 : xi( 1.9a )( 1.9b )Persamaan ( 1.9a ) dan ( 1.9b ) disebut persamaan normal, bo dan bl disebut estimator titikdari F30 dan F31 , masing-masing.Persamaan normal ( 1.9 ) dapat diselesaikan secara simultan untuk bo dan bl :b _ L : ( Xi - X ) ( Yi - Y )1 - L : ( X ; _ X ) 2 ( l.lOa )bo = ~ ( 2 : Yi - bl 2 : Xi ) = Y - bl X ( l.lOb )di mana X dan Y adalah sarana Xi dan Yi pengamatan , masing-masing. komputerperhitungan umumnya didasarkan pada banyak digit untuk memperoleh nilai yang akurat untuk bo dan bl komentarPersamaan normal ( 1,9 ) dapat diturunkan dengan kalkulus . Untuk pengamatan sampel yang diberikan ( Xi , Yi ) , yangkuantitas Q di ( 1,8 ) adalah fungsi dari F30 dan f3 , . Nilai-nilai F30 dan f3 , yang meminimalkan Q dapat mengikat diturunkandengan membedakan ( 1,8 ) sehubungan dengan F30 dan f3 , . Kami memperoleh :Kami kemudian menetapkan ini derivatif parsial sama dengan nol , menggunakan bo dan bI untuk menunjukkan nilai-nilai tertentuF30 dan f3 , yang meminimalkan Q :-22 : ( Y; - bo - Pixi ) = 0-22 : Xi ( Yi - bo - b , Xi ) = 0

enyederhanakan , kita memperoleh :Memperluas , kita memiliki:"2 : ( Yi - bo - b , Xi ) = 0; = 12 " : Xi ( Yi - bo - b , Xi ) = 0; = 12 : Y ; - NBO - b , 2 : Xi = 02 : X , Y , - bo 2 : X , - b , 2 : X ; = 0dari mana persamaan normal ( 1,9 ) diperoleh dengan istilah menata ulang .Sebuah tes dari derivatif parsial kedua akan menunjukkan bahwa minimum diperoleh dengan kuadratestimator bo dan bl Sifat Kuadrat Terkecil estimator . Teorema penting , yang disebut GaussMarkovteorema , menyatakan :Dalam kondisi model regresi ( 1.1 ) , kuadrat terkecilestimator bo dan bl dalam ( 1.10 ) yang berisi dan memiliki minimalvarians antara semua estimator linier tidak bias.( 1.11 )Teorema ini , terbukti dalam bab berikutnya , menyatakan bahwa pertama bo dan bl yang berisi estimator .Oleh karena itu :E { } bo = F30 E { br } = F31sehingga estimator tidak cenderung melebih-lebihkan atau meremehkan sistematis .Kedua , negara-negara teorema bahwa estimator bo dan bl lebih tepat (yaitu , merekadistribusi sampling kurang bervariasi ) daripada estimator lain milik kelasberisi estimator yang fungsi linear dari pengamatan YI , , Y " . Estimatorsbo dan bl adalah fungsi linear seperti Yi Perhatikan, misalnya , bl Kami memiliki dari ( 1.1Oa ) :b _ L : ( Xi - X ) ( Yi - Y )1 - L : ( Xi _X ) 2Ini akan ditampilkan dalam Bab 2 bahwa ungkapan ini adalah sama dengan :di mana :Karena ki adalah konstanta yang dikenal ( konstanta karena Xi diketahui ) , bl adalah linierkombinasi dari Yi dan karenanya merupakan estimator linier

Dalam cara yang sama , dapat ditunjukkan bahwa bo adalah estimator linier . Di antara semua linierestimator yang berisi kemudian , bo dan bl memiliki variabilitas terkecil dalam sampel diulangdi mana tingkat X tetap tidak berubah .The Toluca Perusahaan memproduksi peralatan pendingin serta banyak penggantibagian. Di masa lalu , salah satu bagian pengganti telah diproduksi secara berkala dalam banyakberbagai ukuran . Ketika program peningkatan biaya dilakukan , pejabat perusahaan berharapuntuk menentukan ukuran lot optimal untuk memproduksi bagian ini . Produksi Bagian ini melibatkanmenyiapkan proses produksi (yang harus dilakukan tidak peduli apa ukuran lot ) danmesin dan operasi perakitan . Salah satu masukan penting bagi model untuk memastikan optimalukuran lot adalah hubungan antara ukuran lot dan jam kerja yang dibutuhkan untuk menghasilkan parkirUntuk menentukan hubungan ini , data pada ukuran lot dan jam kerja selama 25 produksi baru-baru iniberjalan dipergunakan . Kondisi produksi yang stabil selama periode enam bulanyang 25 berjalan dibuat dan diharapkan untuk terus menjadi sama selamatiga tahun ke depan , periode perencanaan yang biaya perbaikan prograrrr . , sedangdilakukan .Tabel 1.1 berisi sebagian dari data pada ukuran lot dan jam kerja dalam kolom 1 dan2 . Perhatikan bahwa semua ukuran banyak merupakan kelipatan dari 10 , hasil dari kebijakan perusahaan untuk memfasilitasiadministrasi bagian produksi . Gambar 1.1Oa menunjukkan SYSTAT pencar plotdata. Kami melihat bahwa banyak ukuran berkisar 20-120 unit dan bahwa tidak ada produksiberjalan adalah terpencil dalam arti yang baik luar biasa kecil atau besar . The plot pencar jugamenunjukkan bahwa hubungan antara ukuran lot dan jam kerja cukup linier . Kami jugamelihat bahwa tidak ada pengamatan pada jam kerja yang luar biasa kecil atau besar , dengan mengacu padahubungan antara ukuran lot dan jam kerja .Untuk menghitung kuadrat memperkirakan bo dan bl dalam ( 1.10 ) , kita memerlukan penyimpanganXi - X dan Yi - Y. ini diberikan dalam kolom 3 dan 4 dari Tabel 1.1 . Kami juga membutuhkanistilah cross- produk ( Xi - X ) ( Yi - Y ) dan deviasi kuadrat ( Xi - X ) 2 ; iniditunjukkan pada kolom 5 dan 6 . Deviasi kuadrat ( Yi - y ) 2 pada kolom 7 adalah untuk,,,,,Kita melihat dari Tabel 1.1 bahwa jumlah dasar yang dibutuhkan untuk menghitung kuadrat terkecilperkiraan adalah sebagai berikut:2 :: (Xi - X) (Yi - Y) = 70.690'L ") X i - X-) 2 = 19.800X = 70,0Y = 312,28Menggunakan (1.10) kita memperoleh:L: (Xi - X) (Yi - Y) 70.690bl = L: (Xi_ X) 2 = 19,800 = 3,5702bo = Y - BLX = 312,28-3,5702 (70,0) = 62,37Dengan demikian, kami memperkirakan bahwa rata-rata jumlah jam kerja meningkat sebesar 3,57 jam untuk masing-masingunit tambahan diproduksi dalam banyak. Perkiraan ini berlaku untuk berbagai ukuran banyak dalamData dari mana estimasi berasal, yaitu ukuran banyak mulai dari sekitar 20 sampaisekitar 120.Gambar 1.11 berisi sebagian dari output regresi MINITAB untuk Perusahaan Tolucacontoh. Estimasi bo dan bl ditunjukkan dalam kolom berlabel Koefisien, sesuai denganBab 1 Regresi Linear dengan Satu Variabel Predictor 21garis Konstan dan X, masing-masing. Penambahan informasilpengetahuan ditunjukkan pada Gambar 1.11akan dijelaskan nanti.Titik Estimasi Mean ResponsecontohEstimasi Regresi Fungsi . Mengingat sampel estimator bo dan bl dari parameterdalam fungsi regresi ( 1.3 ) :E { Y } = F30 + f3IXkami memperkirakan fungsi regresi sebagai berikut :V = bo + BLX ( 1.12 )dimana V (baca Y topi ) adalah nilai fungsi regresi estimasi pada tingkat X darivariabel prediktor .Kami menyebutnya nilai variabel respon respon dan E { Y } yang respttnse berarti . Dengan demikian ,respon rata-rata singkatan mean dari distribusi probabilitas dari Y yang sesuaike tingkat X dari variabel prediktor . V kemudian adalah estimator titik respon rata-rataketika tingkat variabel prediktor adalah X. Hal ini dapat ditunjukkan sebagai perpanjangan dari GaussMarkovTeorema ( 1.11 ) bahwa V merupakan penduga yang tidak bias dari E { Y } , dengan varians minimumdi kelas estimator linier tidak bias.Untuk kasus-kasus dalam penelitian ini , kami akan memanggil Vi :i = 1 , . .. , n ( 1.13 )nilai thejitted untuk kasus engan . Dengan demikian, nilai Vi dipasang adalah yang dapat dilihat dalam perbedaan dengannilai yang diamati Yi Untuk Perusahaan Toluca contoh, kami menemukan bahwa kuadrat perkiraan regresikoefisien adalah:bo = 62,37 bl = 3,5702Oleh karena itu , fungsi regresi estimasi adalah :V = 62,37 + 3.5702XFungsi ini diperkirakan regresi diplot pada Gambar 1.1Ob . Tampaknya be.a baikdeskripsi hubungan statistik antara ukuran lot dan jam kerja .Untuk memperkirakan respon rata-rata untuk setiap tingkat X dari variabel prediktor , kita hanyagantikan bahwa nilai X dalam fungsi regresi estimasi . Misalkan kita tertarikdalam jumlah rata-rata jam kerja yang dibutuhkan ketika ukuran lot adalah X = 65; estimasi titik kita adalah :saya~ = 62,37 + 3,5702 ( 65 ) = 294,4Dengan demikian , kami memperkirakan bahwa rata-rata jumlah jam kerja yang dibutuhkan untuk produksi berjalanX = 65 unit adalah 294,4 jam . Kami ! Nterpret ini berarti tlIat jika banyak banyak 65 unitdiproduksi di bawah kondisi 25 berjalan di mana fungsi regresi diperkirakan adalahberdasarkan , waktu kerja rata-rata untuk banyak ini adalah sekitar 294 jam . Tentu saja, waktu kerja untukorang banyak ukuran 65 kemungkinan jatuh di atas atau di bawah rata-rata respon karena melekatvariabilitas dalam sistem produksi , yang diwakili oleh kesalahan tenn dalam model.