c Lyk Math Gen Statistikh Drougas

58
ΣΤΑΤΙΣΤΙΚΗ Στατιστική είναι η επιστήμη που προσπαθεί να ερμηνεύσει φαινόμενα του πραγ- ματικού κόσμου που εμπεριέχουν μεταβλητότητα και αβεβαιότητα. Εφαρμόζει μεθό- δους συλλογής και ανάλυσης αριθμητικών, κατά βάση, δεδομένων και χρησιμοποιείται σε όλους τους κλάδους της επιστήμης. Η στατιστική ονομάζεται επαγωγική επιστήμη , γιατί μελετώντας ένα μέρος του πληθυσμού μπορεί να βγάλει συμπεράσματα για όλο τον πληθυσμό. Ορισμός: 1 Την ανάλυση και εξαγωγή συμπερασμάτων Περιγραφική Στατιστική είναι ο κλάδος της Στατιστικής που ασχολείται με τη συγκέντρωση στοιχείων, την ταξινόμησή τους, την περιγραφή και την παρουσία- σή τους σε κατάλληλη μορφή, ώστε να μπορούν να αναλυθούν και να ερμηνευ- θούν για την εξυπηρέτηση διαφόρων σκοπών. Τη συνοπτική και αποτελεσματική παρουσίασή τους Στατιστική είναι ο κλάδος των Μαθηματικών που έχει ως αντικείμενο: Το σχεδιασμό της διαδικασίας συλλογής δεδομένων Βασικές έννοιες και ορισμοί Πληθυσμός είναι το σύνολο των μετρήσεων ή παρατηρήσεων που αναφέρονται σε κάποιο χαρακτηριστικό ή σε κάποια ιδιότητα των μονάδων του συνόλου που εξετάζου- με. Κάθε στοιχείο του πληθυσμού ονομάζεται άτομο. Το πλήθος των ατόμων ενός πληθυσμού λέγεται μέγεθος του πληθυσμού, και συμβο- λίζεται με το γράμμα ν. Παράδειγμα (1) Αν μας ενδιαφέρει να εξετάσουμε την επίδοση των μαθητών της Αθήνας στα Μαθημα- τικά, τότε ο πληθυσμός είναι όλοι οι μαθητές που πηγαίνουν σχολείο στην πόλη της Αθήνας. Κάθε μαθητής αποτελεί ένα άτομο. Το πλήθος όλων των μαθητών είναι το μέγεθος του πληθυσμού. Δείγμα είναι κάθε υποσύνολο δεδομένων του πληθυσμού που έχουμε πάρει τυχαία με κανόνες και κριτήρια που στοχεύουν στην πληρέστερη αντιπροσώπευση του πληθυ- σμού. (Ένα δείγμα θεωρείται αντιπροσωπευτικό του πληθυσμού, αν έχει επιλεγεί κατά τέτοιο τρόπο, ώστε κάθε μονάδα του πληθυσμού να έχει την ίδια δυνατότητα να επιλεγεί)

Transcript of c Lyk Math Gen Statistikh Drougas

Page 1: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ Στατιστική είναι η επιστήμη που προσπαθεί να ερμηνεύσει φαινόμενα του πραγ-

ματικού κόσμου που εμπεριέχουν μεταβλητότητα και αβεβαιότητα. Εφαρμόζει μεθό-δους συλλογής και ανάλυσης αριθμητικών, κατά βάση, δεδομένων και χρησιμοποιείται σε όλους τους κλάδους της επιστήμης. Η στατιστική ονομάζεται επαγωγική επιστήμη , γιατί μελετώντας ένα μέρος του

πληθυσμού μπορεί να βγάλει συμπεράσματα για όλο τον πληθυσμό. Ορισμός:

1

• Την ανάλυση και εξαγωγή συμπερασμάτων

Περιγραφική Στατιστική είναι ο κλάδος της Στατιστικής που ασχολείται με τη

συγκέντρωση στοιχείων, την ταξινόμησή τους, την περιγραφή και την παρουσία-

σή τους σε κατάλληλη μορφή, ώστε να μπορούν να αναλυθούν και να ερμηνευ-

θούν για την εξυπηρέτηση διαφόρων σκοπών.

• Τη συνοπτική και αποτελεσματική παρουσίασή τους

Στατιστική είναι ο κλάδος των Μαθηματικών που έχει ως αντικείμενο:

• Το σχεδιασμό της διαδικασίας συλλογής δεδομένων

Βασικές έννοιες και ορισμοί Πληθυσμός είναι το σύνολο των μετρήσεων ή παρατηρήσεων που αναφέρονται σε

κάποιο χαρακτηριστικό ή σε κάποια ιδιότητα των μονάδων του συνόλου που εξετάζου-με. Κάθε στοιχείο του πληθυσμού ονομάζεται άτομο. Το πλήθος των ατόμων ενός πληθυσμού λέγεται μέγεθος του πληθυσμού, και συμβο-λίζεται με το γράμμα ν.

Παράδειγμα (1) Αν μας ενδιαφέρει να εξετάσουμε την επίδοση των μαθητών της Αθήνας στα Μαθημα-τικά, τότε ο πληθυσμός είναι όλοι οι μαθητές που πηγαίνουν σχολείο στην πόλη της Αθήνας. Κάθε μαθητής αποτελεί ένα άτομο. Το πλήθος όλων των μαθητών είναι το μέγεθος του πληθυσμού.

Δείγμα είναι κάθε υποσύνολο δεδομένων του πληθυσμού που έχουμε πάρει τυχαία

με κανόνες και κριτήρια που στοχεύουν στην πληρέστερη αντιπροσώπευση του πληθυ-σμού. (Ένα δείγμα θεωρείται αντιπροσωπευτικό του πληθυσμού, αν έχει επιλεγεί κατά τέτοιο τρόπο, ώστε κάθε μονάδα του πληθυσμού να έχει την ίδια δυνατότητα να επιλεγεί)

Page 2: c Lyk Math Gen Statistikh Drougas

2

Παράδειγμα (2) Στην περίπτωση που ελέγχουμε τη διάρκεια ζωής των τηλεοράσεων, δεν θα εξετάσου-με όλες τις τηλεοράσεις της βιομηχανίας αλλά έναν μικρό αριθμό από αυτές, τις οποίες θα θέσουμε σε λειτουργία μέχρι να χαλάσουν και θα χρονομετρήσουμε το χρόνο ζωής τους. Μεταβλητή (ή τυχαία μεταβλητή) είναι ένα χαρακτηριστικό του πληθυσμού, ως

προς το οποίο εξετάζεται ο πληθυσμός. Συνήθως συμβολίζονται με κεφαλαία γράμμα-τα Χ, Υ, Ζ... Από τη μελέτη των ατόμων ενός πληθυσμού ως προς κάποιο χαρακτηριστικό τους, προ-κύπτουν παρατηρήσεις που λέγονται στατιστικά δεδομένα και είναι κατάλληλα για επικοινωνία, ερμηνεία και επεξεργασία

Παράδειγμα (3) Το φύλο ενός ατόμου (με τιμές αγόρι ή κορίτσι) Ο αριθμός των παιδιών σε μια οικογένεια (με τιμές 0, 1, 2, 3, 4...) Οι τιμές της θερμοκρασίας στην Αθήνα (με τιμές -10....45) Τιμές της μεταβλητής Χ λέγονται όλες οι τιμές που μπορεί να πάρει μια μεταβλητή

Χ, και συμβολίζονται με χ1, χ2, χ3...χκ. Οι τιμές μιας μεταβλητής δεν είναι, αναγκαία, αριθμητικές τιμές. Έτσι, διακρίνονται σε:

1. Ποιοτικές μεταβλητές: είναι εκείνες των οποίων οι τιμές δεν μπορούν να μετρη-θούν (δεν είναι αριθμοί) Παράδειγμα

Η κατάσταση της υγείας των κατοίκων μιας πόλης με τιμές «πολύ καλή», «κα-λή», «μέτρια» και «κακή»)

2. Ποσοτικές μεταβλητές: είναι εκείνες, των οποίων οι τιμές μπορούν να μετρη-θούν (είναι αριθμοί) Παράδειγμα Η βαθμολογία των μαθητών της Γ΄ τάξης στα Μαθηματικά

Οι ποσοτικές μεταβλητές διακρίνονται σε:

• Διακριτές μεταβλητές στις οποίες κάθε άτομο του πληθυσμού μπορεί να πάρει μόνο διακεκριμένες (μεμονωμένες) τιμές.

Για παράδειγμα «ο αριθμός των παιδιών που έχει μια οικογένεια»

• Συνεχείς μεταβλητές στις οποίες κάθε άτομο του πληθυσμού μπορεί να πάρει οποιαδήποτε πραγματική τιμή που ανήκει σε διάστημα πραγματικών αριθμών

Για παράδειγμα «το ύψος των μαθητών της Γ΄ τάξης».

Page 3: c Lyk Math Gen Statistikh Drougas

Παρουσίαση Στατιστικών Δεδομένων

Ορισμός

Στατιστικοί πίνακες είναι ο τρόπος με τον οποίο παρουσιάζουμε τα στα-

τιστικά δεδομένα μετά τη συλλογή τους, ώστε να είναι εύκολη η κατανόη-

σή τους και η εξαγωγή σωστών συμπερασμάτων

Οι πίνακες διακρίνονται σε 1. Γενικούς πίνακες, οι οποίοι περιέχουν κάθε πληροφορία που μας έχει δώσει μια με-γάλη στατιστική έρευνα, είναι μεγάλου μεγέθους, περιλαμβάνουν πολλά λεπτομε-ρειακά στοιχεία και αποτελούν πηγές στατιστικών πληροφοριών.

2. Ειδικούς πίνακες, οι οποίοι είναι συνοπτικοί και σαφείς. Τα στοιχεία τους προέρχο-νται συνήθως από τους γενικούς πίνακες. Κάθε πίνακας που έχει κατασκευαστεί σωστά, πρέπει να περιέχει

3

• Τον τίτλο, που γράφεται στο πάνω μέρος του πίνακα και πρέπει με σαφήνεια να δηλώνει το περιεχόμενο του πίνακα και να είναι περιληπτικός.

• Τις επικεφαλίδες των στηλών και των γραμμών, που δείχνουν συνοπτικά τη φύση και τη μονάδα μέτρησης των δεδομένων μας

• Την πηγή, που γράφεται στο κάτω μέρος του πίνακα και δείχνει την προέλευση των στατιστικών δεδομένων μας.

• Το κύριο σώμα (κορμό), που περιέχει διαχωρισμένα μέσα στις γραμμές και στις στήλες τα στατιστικά δεδομένα.

Συχνότητα Παρατηρήσεων Θεωρούμε τη μεταβλητή Χ με τιμές χ1, χ2, χ3...χκ που αφορούν τα άτομα (στοιχεία)

ενός δείγματος μεγέθους ν, με κ ν. Ονομάζουμε: ≤• Συχνότητα (απόλυτη) της τιμής χi της μεταβλητής Χ, τον αριθμό νi, που δείχνει πόσες φορές εμφανίζεται η τιμή χi της μεταβλητής Χ στο σύνολο των παρατηρή-σεων.

Ισχύει 0 ν≤ i ≤ ν και ν1 + ν2 + ν3 + ... + νκ = ν

• Σχετική συχνότητα της τιμής χi της μεταβλητής Χ, τον αριθμό fi που είναι ίσος με το πηλίκο της απόλυτης συχνότητας της τιμής χi προς το μέγεθος ω του δείγματος. Δηλαδή

fi = vvi

Ισχύει ότι 0≤ fi ≤ 1 και ότι f1 +f2 + f3 +….+ fi = 1 διότι

f1 +f2 + f3 +….+ fi = 1...

.... 321321 ==+++

=++++vv

vvvvv

vv

vv

vv

vv ii .

Page 4: c Lyk Math Gen Statistikh Drougas

• Σχετική συχνότητα επί τις 100 είναι το γινόμενο 100 fi . Συμβολίζεται με fi % = 100 f⋅ i

• Όταν έχουμε ποσοτικές μεταβλητές, εκτός των συχνοτήτων, χρησιμοποιούμε και τις αθροιστικές συχνότητες. Αθροιστική συχνότητα Νi μιας τιμής xi λέγεται το άθροισμα των συχνοτήτων νi των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή, δηλαδή Νi = ν1 + ν2 + ν3 + ... +νλ

• Όταν έχουμε ποσοτικές μεταβλητές, εκτός των σχετικών συχνοτήτων, χρησιμο-ποιούμε και τις αθροιστικές σχετικές συχνότητες. Αθροιστική σχετική συχνότητα Fi μιας τιμής xi λέγεται το άθροισμα των σχετικών συχνοτήτων fi των τιμών που είναι μικρότερες ή ίσες με την τιμή αυτή, δηλαδή

Fi = f1 + f2 + f3 + ... +fλ

Παράδειγμα (4)

4

Από τους μαθητές μιας τάξης πήραμε 30 και τους εξετάζουμε ως προς τον χαρα-κτηρισμό του βαθμού τους : μέτριο (Μ) , καλά (Κ) , πολύ καλά(Π), άριστα (Α). Προέκυψαν τα παρακάτω αποτελέσματα: Κ Μ Μ Κ Κ Π Κ Α Μ Κ Μ Κ Π Μ Μ Μ Π Κ Κ Α Μ Π Α Κ Κ Μ Α Π Μ Πα) Να βρεθεί το μέγεθος ν του δείγματος . β) Να βρεθεί η συχνότητα εμφάνισης του κάθε χαρακτηρισμού. γ) Να βρεθεί η σχετική συχνότητα εμφάνισης του κάθε χαρακτηρισμού.

Λύση α) Το μέγεθος του δείγματος εκφράζεται από τους 30 μαθητές , άρα ν=30. β)Το χαρακτηρισμό (Μ) έχουν 10 μαθητές , άρα η συχνότητα εμφάνισης νi του χαρα-κτηρισμού (Μ) είναι ίση με 10 , δηλαδή ν1 =10. Αντίστοιχα ο χαρακτηρισμός (Κ) έχει συχνότητα ν2=10 , ο χαρακτηρισμός (Π) έχει συ-χνότητα ν3 =6 και ο χαρακτηρισμός (Α) έχει συχνότητα ν4= 4 γ) Η σχετική συχνότητα εμφάνισης του χαρακτηρισμού (Μ) στο δείγμα , είναι:

f1=vv1 =

3010

=0,333=33,3 ο/ο

Αντίστοιχα η σχετική συχνότητα του χαρακτηρισμού (Κ) είναι:

f2=vv2 =

3010

=0,333=33,3 ο/ο

του χαρακτηρισμού (Π) είναι:

f3=vv3 =

306

=0,2=20 ο/ο

Page 5: c Lyk Math Gen Statistikh Drougas

και του χαρακτηρισμού (Α) είναι:

f4=vv4 =

304

=0,133=13,3 ο/ο

Οι πληροφορίες που αφορούν τις συχνότητες και τις σχετικές συχνότητες μπορούν να

παρασταθούν σε ένα πίνακα που λέγεται πίνακας συχνοτήτων και αθροιστικών συ-

χνοτήτων. Η απεικόνιση των πληροφοριών αυτών αποτελεί μια κατανομή συχνοτή-

των ( σχετικών συχνοτήτων).

5

Χαρακτηρισμός Συχνότητες Σχετικές συ-χνότητες fi

Σχετικές συχνό-τητες fi ο/ο

(Μ) μέτρια 10 0,333 33,3 ο/ο

(Κ) Καλά 10 0,333 33,3 ο/ο

(Π) Πολύ καλά 6 0,2 20 ο/ο(Α) Άριστα 4 0,133 13,3 ο/οΣύνολο 30 1 100 ο/ο

Παράδειγμα (5) Οι μηνιαίες αποδοχές ενός δείγματος μεγέθους 24, από τους εργάτες ενός εργο-στασίου, είναι 200 175 160 175 180 190 170 160 160 175 190 190 180 200 170 200 190 200 160 175 190 170 160 170 Σε έναν πίνακα να παρουσιαστούν οι συχνότητες, οι σχετικές συχνότητες, οι α-θροιστικές συχνότητες και οι σχετικές αθροιστικές συχνότητες.

Λύση

Μισθός σε €

Σχετικές συχνότητες

Συχνότητεςiν

if ix

ΑθροιστικέςΣυχνότητες

Σχετικές Αθροιστικές

Συχνότητες iF %

160 5 20,83 5 20,83

170 4 16,66 9 37.49

175 4 16,66 13 54,15

180 2 8.3 15 62.45

190 5 20,83 20 83,28

Page 6: c Lyk Math Gen Statistikh Drougas

www.praxisgroup.gr 6 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

200 4 16,66 24 100.00

Σύνολο 24 100

Σημείωση Για την κατασκευή του πίνακα που περιέχει τις αθροιστικές συχνότητες, είναι απαραί-τητο οι τιμές της μεταβλητής να έχουν διαταχθεί σε αύξουσα σειρά: (160, 170, 175, 180,...) Παράδειγμα (6) Στον παρακάτω πίνακα δίνεται η κατανομή συχνοτήτων 40 οικογενειών ως προς τον αριθμό των παιδιών τους Αριθμός Παιδιών χi Αριθμός οικογενειών vi 0 8 1 11 2 9 3 6 4 3 5 2 6 1 Να βρείτε το ποσοστό και το πλήθος των οικογενειών που έχουν

i) πάνω από τρία παιδιά ii) από 3 έως και 5 παιδιά iii) το πολύ 6 παιδιά iv) ακριβώς 2 παιδιά v) τουλάχιστον 1 παιδί

Λύση

i) πάνω από 3 παιδιά έχουν 3+2+1=6 οικογένειες , ποσοστό 6 0.15% 15%40

= =

ii) από 3 έως και 5 παιδιά 6+3+2=11 οικογένειες , ποσοστό 11 0.275% 27.5%40

= =

iii) το πολύ 6 παιδιά έχουν 40 οικογένειες ,ποσοστό 40 1 100%40

= =

iv) ακριβώς 2 παιδιά έχουν 9 οικογένειες , ποσοστό 9 0.225 22.5%40

= =

v) τουλάχιστον 1 παιδί έχουν 32 οικογένειες (11+9+6+3+2+1) , ποσοστό 32 0.80 80%40

= =

Page 7: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

ΓΡΑΦΙΚΗ ΠΑΡΑΣΤΑΣΗ ΚΑΤΑΝΟΜΗΣ ΣΥΧΝΟΤΗΤΩΝ Τα στατιστικά δεδομένα παρουσιάζονται και με τη μορφή γραφικών παραστάσεων

ή διαγραμμάτων. Η χρησιμότητα των διαγραμμάτων είναι μεγάλη διότι παρέχουν πιο σαφή εικόνα ενός φαινομένου σε σχέση με τους πίνακες, προκαλούν την προσοχή μας, διατηρούνται σχετικά εύκολα στη μνήμη μας. Σε ένα διάγραμμα κατανομής συχνοτήτων, στον οριζόντιο άξονα τοποθετούμε τις τι-μές της μεταβλητής χι , ενώ στον κατακόρυφο άξονα τοποθετούμε τις αντίστοιχες συ-χνότητες. Τα κυριότερα είδη στατιστικών διαγραμμάτων είναι:

1. Ραβδόγραμμα

7 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Χρησιμοποιείται για τη γραφική παράσταση των τιμών μιας ποιοτικής μεταβλητής. Αποτελείται από ορθογώνιες στήλες ίσου πλάτους που οι βάσεις τους βρίσκονται πάνω στον οριζόντιο άξονα (οριζόντιο ραβδόγραμμα) ή στον κατακόρυφο άξονα (κατακόρυφο ραβδόγραμμα). Το ύψος των ορθογώνιων στηλών είναι ίσο με τη συχνότητα ή τη σχετική συχνότητα της μεταβλητής στην οποία αντιστοιχεί η ορθογώ-νια στήλη. Η απόσταση μεταξύ των ορθογώνιων στηλών καθορίζεται αυθόρμητα.

2. Διάγραμμα συχνοτήτων Χρησιμοποιείται αντί του ραβδογράμματος,

όταν έχουμε ποσοτική μεταβλητή. Το διάγραμμα συχνοτήτων αποτελείται από κάθετες γραμμές που υψώνεται σε κάθε χi . Τα χi έχουν τοποθετηθεί από το μικρότερο στο μεγαλύτερο, δηλαδή χ1 < χ2 < χ3 <..... <χκπου έχουν ύψος ίσο με την αντίστοιχη συχνότητα.

3. Κυκλικό διάγραμμα Το κυκλικό διάγραμμα

χρησιμοποιείται τόσο για ποιοτικές όσο και για ποσοτικές μεταβλητές. Είναι εύχρηστο όταν οι διαφορετικές τιμές της μεταβλητής είναι σχετικά λίγες. Το κυκλικό διάγραμμα είναι ένας

Page 8: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 8 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

κυκλικός δίσκος χωρισμένος σε κυκλικούς τομείς, που ο καθένας αντιστοιχεί σε τιμές χi της μεταβλητής. Το μήκος των τόξων των κυκλικών τομέων (ή τα εμβαδά τους) είναι ανάλογα με τις συχνότητες νi ή τις σχετικές συχνότητες fi των τιμών χi της μεταβλητής. Αν υποθέσουμε αi το μήκος του τόξου του κυκλικού τομέα που αντιστοιχεί στην τιμή χi

, τότε:

αi = νi v

0360⋅ = i

i fvv

⋅=⋅ 00 360360

4. Εικονόγραμμα Χρησιμοποιείται, συνήθως, στη μελέτη μεγάλων δειγμάτων

5. Σημειόγραμμα Εάν έχουμε λίγες παρατηρήσεις, η κατανομή τους μπορεί να

περιγραφεί με το σημειόγραμμα, στο οποίο οι τιμές παριστάνονται γραφικά σαν σημεία πάνω από έναν οριζόντιο άξονα.

6. Χρονόγραμμα Το χρονόγραμμα ή χρονολογικό διάγραμμα χρησιμοποιείται για την παρουσίαση της δια-χρονικής εξέλιξης ενός μεγέθους (συνήθως οικονομικού). Ο οριζόντιος άξονας χρησιμοποιείται ως άξονας χρόνου και ο κατακόρυφος ως άξονας των τιμών της εξεταζόμενης μεταβλητής. Παράδειγμα (7) Στον παρακάτω πίνακα, δίνεται ο αριθμός των 400 υπαλλήλων ενός Υπουργείου που έχουν συγκεκριμένο χρόνο υπηρεσίας: Έτη υπηρεσί-

ας Αρ. υπαλλή-

λων 5 100 6 80 7 130 8 30 9 40 10 20

α) Να συμπληρωθεί ο πίνακας, με τις σχετικές συχνότητες.

Page 9: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

β) Να παρασταθούν με όλους τους δυνατούς τρόπους, η κατανομή συχνοτήτων και σχετικών συχνοτήτων. Λύση α) Ο πίνακας με τις σχετικές συχνότητες, γίνεται: Έτη υπη-ρεσίας

Αριθμός υπαλλή-λων ix

9 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Σχετικές συχνότητες

if

Σχετικές Αθροιστικές

Συχνότητες if %

5 100 0,25 25

6 80 0,2 20

7 130 0,325 32,5

8 30 0,075 7,5

9 40 0,10 10

10 20 0,05 5

Σύνολο 400 1 100

Παράδειγμα (8) Να συμπληρωθεί ο παρακάτω πίνακας iχ iv if iN iF if % iF %

1 8 0.4 2 10 3 5 0.25 15 4 18 5 10 Σύνολο 100 Λύση

1 1 8N v= =

2 2 1 10 8 2v N N= − = − =

33 3

3

5 200.25

fv v f v vv

= ⋅ ⇔ = ⇔ = =

2

2 22 0.120

vf fv

= ⇔ = =

4 4 3 18 15 3v N N= − = − =

5 1 2 3 4( )v v v v v 2ν= − + + + =

44 4

3 0.1520

vf fv

= ⇔ = =

Page 10: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 10 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

55 5

2 0.120

vf fv

= ⇔ = =

5 20N v= = .

Η συμπλήρωση των στηλών ,iF if %, % γίνεται πλέον εύκολα. iF

iχ iv if iN iF if % iF % 1 8 0.4 8 0.4 40 40 2 2 0.1 10 0.5 10 50 3 5 0.25 15 0.75 25 75 4 3 0.15 18 0.90 15 90 5 2 0.1 20 1 10 100 Σύνολο 20 100 β) Γραφική παράσταση κατανομής συχνοτήτων και σχετικών συχνοτήτων Γραφική παράσταση Γραφική παράσταση κατανομής συχνοτήτων κατανομής σχετικών συχνοτήτων

Ραβδόγραμμα κατανομής Ραβδόγραμμα κατανομής συχνοτήτων (κατακόρυφο) σχετικών συχνοτήτων (κατακόρυφο)

Ραβδόγραμμα κατανομής Ραβδόγραμμα κατανομής συχνοτήτων (οριζόντιο) σχετικών συχνοτήτων (οριζόντιο)

Page 11: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Κυκλικό διάγραμμα Στην τιμή "5 χρόνια υπηρεσίας" αντιστοιχεί κυκλικός τομέας:

02 360f ⋅ =25% .360° =90°. Στην τιμή "6 χρόνια υπηρεσίας" αντιστοιχεί κυκλικός τομέας:

02 360f ⋅ 3=20% .360° =72°. Στην τιμή "7 χρόνια υπηρεσίας" αντιστοιχεί κυκλικός

τομέας:

11 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

=32, 5% .360° =117°. 03 360f ⋅

Στην τιμή "8 χρόνια υπηρεσίας" αντιστοιχεί κυκλικός τομέας: 0

4 360f ⋅ = 7, 5% .360° =27°. Στην τιμή "9 χρόνια υπηρεσίας" αντιστοιχεί κυκλικός τομέας:

05 360f ⋅ = 10% .360° =36°. Στην τιμή "10 χρόνια υπηρεσίας" αντιστοιχεί κυκλικός τομέας:

06 360f ⋅

0

= 5% .360° =18°. Παράδειγμα (9) Σε κυκλικό διάγραμμα παρουσιάζονται οι προτιμήσεις των ψηφοφόρων του Δή-μου Αγρινίου ως εξής : Η επικεντρη γωνία που αντιστοιχεί στον υποψήφιο κ. Μαυρογιαλουρο είναι 5χ+2ψ για τον υποψήφιο κ. Φαφλατα είναι 2χ+2ψ και για τον τρίτο υποψήφιο κ. Καλοχαιρετα είναι χ. Αν ισχύει χ+4ψ=108ο να υπολογίσετε τα ποσοστά των τριών υποψηφίων . Λύση Έχουμε

0 0

0

5 2 2 2 360 8 4 360 2 9090 2

χ ψ χ ψ χ χ ψ χ ψ

ψ χ

+ + + + = ⇔ + = ⇔ + = ⇔

= −

Αλλά

090 2

0 0 0 0

0 0 0 0

4 108 4(90 2 ) 108 360 8 1087 360 108 7 252 36

ψ χ

χ ψ χ χ χ χ

χ χ χ

= −

+ = ⇔ + − = ⇔ + − = ⇔

− = − + ⇔ − = − ⇔ =

0

00 0 0 0 090 2 90 2 36 90 72 18ψ χ ψ ψ ψ= − ⇔ = − ⋅ ⇔ = − ⇔ = Άρα ο υποψήφιος κ.Μαυρογιαλουρος έχει επικεντρη γωνία . 0 05 36 2 18 216⋅ + ⋅ = 0

Page 12: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Ο υποψήφιος κ. Φαφλατας έχει επικεντρη γωνία . 0 02 36 2 18 108⋅ + ⋅ = 0

Ο υποψήφιος κ.Καλοχαιρετας έχει επικεντρη γωνία . 036Το ποσοστό του κ.Μαυρογιαλουρου είναι :

00 0

1 1 0

216216 360 0.60 60360

f f= ⋅ ⇔ = = = 0

Το ποσοστό του κ. Φαφλατα είναι : 0

0 02 2 0

108108 360 0.30 30360

f f= ⋅ ⇔ = = = 0

Το ποσοστό του κ. Καλοχαιρετα είναι : 0

0 03 3 0

3636 360 0.10 10360

f f= ⋅ ⇔ = = = 0

Παράδειγμα ( 10) Η βαθμολογία μιας ομάδας μαθητών σε ένα τεστ είναι 4,5,6,7,8.Το 80% έχει βαθμό τουλάχιστον 5 , οι μαθητές που έχουν βαθμό 4 είναι διπλάσιοι αυτών που έχουν 8, είκοσι ένας μαθητές έχουν βαθμό κάτω από 6 , το 55% έχει βαθμό 6 η 7 .Να κάνετε τον πίνακα κατανομής συχνοτήτων , ,iv iN if %, % . iFΛύση

12 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Έχουμε το 80% των μαθητών έχει βαθμό τουλάχιστον 5 άρα το 20% των μαθητών έχει βαθμό 4 οπότε 1% 20F = 1% 20f = ,οι μαθητές με βαθμό 4 είναι διπλάσιοι αυτών

που έχουν 8 άρα 1 2v v5= οπότε 1 5% 2 %f f= άρα 520% 12

f 0= = 5% 10f =

5 5

.

2 21N = , 5% 10f =

3 4% % 5f f+ = οπότε άρα 1 2% % 100 55 10 3f f+ = − − = 2 % 35F =

άρα 221 21% 35% 21 60

0.35F ν ν ν

ν= ⇔ ⋅ = ⇔ = ⇔ = .

Οπότε 1 120% 60 12

100fν ν= = =

15

12 62 2νν = = = και 1 1 12νΝ = = , οπότε 2 21Ν = 2 2 1 21 12 9ν ν= Ν − = − =

4 24 6 18ν = − = οπότε 3 1 2 4 5( ) 60 (12 9 18 6) 15ν ν ν ν ν ν= − + + + = − + + + = .

Page 13: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

ΟΜΑΔΟΠΟΙΗΣΗ ΤΩΝ ΠΑΡΑΤΗΡΗΣΕΩΝ Όταν έχουμε διακριτή μεταβλητή και το πλήθος των παρατηρήσεων είναι μεγάλο,

αλλά πολύ περισσότερο αν έχουμε συνεχή μεταβλητή που μπορεί να πάρει οποιαδήπο-τε τιμή στο διάστημα ορισμού της, ταξινομούμε τα δεδομένα σε μικρό πλήθος ομάδων που ονομάζονται κλάσεις, έτσι ώστε κάθε τιμή να ανήκει σε μια μόνο κλάση. Τα άκρα των κλάσεων ονομάζονται όρια των κλάσεων. Συνήθως χρησιμοποιούμε την περίπτωση που μια κλάση περιέχει το κάτω άκρο της αλλά όχι το άνω. Δηλαδή, είναι της μορφής [ , ). Οι παρατηρήσεις κάθε κλάσης θεωρούνται όμοιες, οπότε μπορούν να αντιπροσωπευ-θούν από τις κεντρικές τιμές των κλάσεων (δηλαδή τα κέντρα κάθε κλάσης). Αν έχουμε την κλάση [ακ-1, ακ), τότε η κεντρική της τιμή είναι:

13 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

χκ = 2

1 kk aa +−

Αν έχουμε την κλάση [ακ-1, ακ), τότε η διαφορά: c = ακ – ακ-1 (ανώτερο όριο – κατώτερο όριο) ονομάζεται πλάτος της κλάσης Μέθοδος ομαδοποίησης παρατηρήσεωνΓια την ομαδοποίηση των παρατηρήσεων ακολουθούμε τα παρακάτω βήματα: 1) Βρίσκουμε τον αριθμό κ των κλάσεων που θα χρησιμοποιήσουμε. Για την επιλογή του κατάλληλου αριθμού μπορεί να χρησιμοποιηθεί ο παρακάτω πίνακας. Μέγεθος δείγμα-τος ν

Αριθμός κλάσεων κ

<20

5

20-50

6

50-100

7

100-200

8

200-400

9

400-700

10

700-1000

11

Page 14: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 14 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

> 1000 12 2) Προσδιορίζουμε το πλάτος των κλάσεων χρησιμοποιώντας τον τύπο

c =kR , όπου R είναι το εύρος του δείγματος, δηλαδή η διαφορά της

μικρότερης παρατήρησης από τη μεγαλύτερη του συνολικού δείγματος. Σημειώνουμε ότι αν ο αριθμός c που προκύπτει από τη διαίρεση δεν είναι ακέραιος, τότε στρογγυλο-ποιούμε πάντα προς τα πάνω. 3) Κατασκευάζουμε τις κλάσεις. Ξεκινάμε από τη μικρότερη παρατήρηση ή για πρακτι-κούς λόγους λίγο πιο κάτω από τη μικρότερη παρατήρηση και προσθέτοντας κάθε φο-ρά τον αριθμό c δημιουργούμε τις κ κλάσεις. 4) Κάνουμε τη διαλογή των παρατηρήσεων. Ονομάζουμε νi τη συχνότητα της κλάσης i, Xi την κεντρική τιμή της κάθε κλάσης και νi το πλήθος των παρατηρήσεων που προ-κύπτουν από τη διαλογή για την κλάση ί. Παράδειγμα (11) Ζυγίστηκαν 30 αθλητές και τα βάρη τους (σε kg) που προέκυψαν ήταν:

55

70

69

73

72

59

54

71

67

62

60

54

63

52

80

73

74

70

63

64

65

58

53

45

56

50

48

57

60

62

Να ομαδοποιηθούν οι παραπάνω παρατηρήσεις. i) Πόσες κλάσεις θα χρησιμοποιηθούν; ii) Ποιο είναι το πλάτος κάθε κλάσης; iii) Να κατασκευαστεί πίνακας συχνοτήτων με στήλες για τη συχνότητα, την α-θροιστική συχνότητα, τη σχετική συχνότητα επί τοις εκατό, την αθροιστική σχετική συχνότητα επί τοις εκατό και την κεντρική τιμή κάθε κλάσης.

iv) Ποιο ποσοστό των αθλητών έχει βάρος μικρότερο από 57kg και ποιο μεγαλύτε-ρο ή ίσο από 57kg;

v) Ο προπονητής της ομάδας, βλέποντας τα αποτελέσματα της μέτρησης, συμπέ-ρανε ότι το 26,66 % των αθλητών είναι «υπέρβαροι». Πόσοι σε πλήθος είναι οι υπέρβαροι αθλητές;

Λύση i) To πλήθος των παρατηρήσεων είναι 30, οπότε θα τις χωρίσουμε σε κ = 6 κλάσεις. ίί) Η μεγαλύτερη παρατήρηση είναι η 80 και η μικρότερη η 45, οπότε το πλάτος της κάθε κλάσης είναι ίσο με R = 80 - 45 = 35. iii) Ο ζητούμενος πίνακας είναι

Page 15: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 15 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Κλάσεις

[ , )

Κεντρικές τιμές

Xi

Συχνότη-τα νi

Αθροιστική συχνότητα

Νi

Σχετική συχνότητα

Αθροιστική σχετική

συχνότητα

Fi%

45-51

48

3

3

10

10

51-57

54

6

9

20

30

57-63

60

8

17

26,67

56,67

63-69

66

5

22

16,67

73,34

69-75

72

7

29

23,33

96,67

75-81

78

1

30

3,33

100

Σύνολο

30

-

100

ίν) Παρατηρώντας τη στήλη των αθροιστικών σχετικών συχνοτήτων προκύπτει ότι το 30% των αθλητών έχει βάρος μικρότερο από 57 kg και το 70% μεγαλύτερο ή ίσο από 57kg. ν) Παρατηρούμε ότι το 26,66% αντιστοιχεί στις δύο τελευταίες κλάσεις. Άρα το πλήθος των υπέρβαρων αθλητών είναι ίσο με 7 + 1=8. Παράδειγμα ( 12 ) Δίνεται ο επόμενος πίνακας των ομαδοποιημένων παρατηρήσεων της μεταβλητής χ .Μηνιαία αμοιβή υπαλλήλων μιας επιχείρησης σε ευρώ Αμοιβή υπαλλήλων Συχνότητα 1000-1100 7 1100-1200 10 1200-1300 11 1300-1400 14 1400-1500 16 1500-1600 6 1600-1700 3

Page 16: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

1700-1800 1 Σύνολο 68

i) Ποια είναι τα όρια της τρίτης κλάσης ; ii) Ποια είναι η κεντρική τιμή της έκτης κλάσης iii) Ποια είναι η συχνότητα της πέμπτης κλάσης ; iv) Ποια είναι η σχετική συχνότητα 4 %f της τέταρτης κλάσης ; v) Πόσοι υπάλληλοι παίρνουν τουλάχιστον 1400 ευρώ ; vi) Πόσοι υπάλληλοι παίρνουν από 1150 ευρώ έως 1450 ευρώ ; vii) πόσοι υπάλληλοι παίρνουν το πολύ 1600 ευρώ αλλά τουλάχιστον 1200 ευ-

ρώ; Λύση i)Τα όρια της τρίτης κλάσης είναι : κάτω όριο 1200 ευρώ .Άνω όριο 1300 ευρώ.

ii) Η κεντρική τιμή της έκτης κλάσης είναι1500 1600 15502+

= ευρώ.

iii) Η συχνότητα της πέμπτης κλάσης είναι 5 16v = .

16 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

iv) Η σχετική συχνότητα 44

16% 100 100 21%68

vfv

= ⋅ = ⋅ = .

vi) Τουλάχιστον 1400 ευρώ παίρνουν 16+6+3+1=26 υπάλληλοι vii) Από 1150 ευρώ έως και 1450 ευρώ παίρνουν 5+11+14+8=38 υπάλληλοι viii) Τουλάχιστον 1200 ευρώ και το πολύ 1600 ευρώ παίρνουν 11+14+16+6=47. Σχόλια στη θεωρία1. Το πλήθος των κλάσεων ορίζεται συνήθως από τον κάθε ερευνητή. Επειδή όμως το πλήθος των κλάσεων είναι ανάλογο του μεγέθους του δείγματος, χρησιμοποιούμε ως οδηγό τον πίνακα που αναφέραμε. 2. Στις περισσότερες πρακτικές εφαρμογές οι κλάσεις έχουν το ίδιο πλάτος (ισοπλατείς κλάσεις), εκτός από τις περιπτώσεις που επιβάλλεται από τα δεδομένα να έχουν άνισο πλάτος. 3. Καμία παρατήρηση δεν μπορεί να μείνει έξω από κάποια κλάση. Η μεγαλύτερη τιμή του δείγματος θα πρέπει να ανήκει οπωσδήποτε στην τελευταία κλάση. 4. Οι κεντρικές τιμές διαφέρουν μεταξύ τους στις κλάσεις που έχουν το ίδιο πλάτος και στο πλάτος των κλάσεων. Κάθε παρατήρηση που συμπίπτει με το άνω άκρο μιας κλάσης θα τοποθετηθεί κατά τη διαλογή στην αμέσως επόμενη κλάση.

Page 17: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Ιστόγραμμα συχνοτήτων Η γραφική απεικόνιση ενός πίνακα συχνοτήτων με ομαδοποιημένα δεδομένα, γίνε-

ται με το ιστόγραμμα συχνοτήτων. Στον οριζόντιο άξονα ενός ορθογωνίου συστήματος σημειώνουμε, με κατάλληλη κλί-μακα, τα όρια των κλάσεων. Κατόπιν δημιουργούμε διαδοχικά ορθογώνια, τα οποία έ-χουν βάση ίση με το πλάτος των κλάσεων c και ύψος τέτοιο ώστε το εμβαδόν του ορθο-γωνίου να ισούται με τη συχνότητα της κλάσης αυτής. Έτσι, το ύψος κάθε ορθογωνίου πρέπει να είναι αντιστρόφως ανάλογο του πλάτους της κλάσης. Στην περίπτωση που έ-χουμε ισοπλατείς κλάσεις, το ύψος των ορθογωνίων είναι ίσο με την αντίστοιχη συχνό-τητα της κάθε κλάσης. Με παρόμοιο τρόπο κατασκευάζεται και το ιστόγραμμα σχετικών συχνοτήτων. Ομοίως, επίσης, κατασκευάζεται το ιστόγραμμα αθροιστικών συχνοτήτων και το πολύγωνο α-θροιστικών σχετικών συχνοτήτων, ενώνοντας τα δεξιά άκρα των άνω βάσεων των ορ-θογωνίων.

1. Κλάσεις ίσου πλάτους Στις κλάσεις ίσου πλάτους συνήθως θεωρούμε το πλά-τος c ως μονάδα μέτρησης. Αποτέλεσμα αυτού, είναι το ύψος των ορθογωνίων στο ιστόγραμμα να είναι ίδιο με τη συχνότητα της κλάσης και το εμβαδόν του ορθογω-νίου. Αν θεωρήσουμε άλλη μονάδα μέτρησης του χαρα-κτηριστικού που βρίσκεται στον οριζόντιο άξονα, τότε το ύψος των ορθογωνίων είναι διαφορετικό από τη συχνότητα.

Κλάσεις άνισου πλάτους Όταν οι κλάσεις δεν έχουν ίσο πλάτος, τότε για να κατασκευάσουμε το ιστόγραμμα συχνοτήτων, πρέπει να επιλέξουμε μια μονάδα μέτρησης του χαρακτηριστικού που θα μετρηθεί στον οριζόντιο άξονα. Η επιλογή της μονάδας μέτρησης γίνεται αυθαίρετα.

Πολύγωνο συχνοτήτων

17 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Αν θεωρήσουμε δυο επιπλέον κλάσεις με συχνότητα μηδέν, μια στην αρχή και μια στο τέλος, και ενώσουμε τα μέσα των πάνω βάσεων των ορθογωνίων, τότε σχηματίζεται το πολύγωνο συχνοτήτων.

Page 18: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Με παρόμοιο τρόπο κατασκευάζεται και το πολύγωνο σχετικών συχνοτήτων, θεωρώ-ντας στον κάθετο άξονα τις σχετικές συχνότητες. Για το πολύγωνο αθροιστικών συχνοτήτων και το πολύγωνο αθροιστικών σχετικών συχνοτήτων ενώνουμε τα δεξιά άκρα των άνω βάσεων των ορθογωνίων στα αντίστοιχα ιστογράμματα. To εμβαδόν του χωρίου που ορίζεται από το πολύγωνο συχνοτήτων και τον οριζόντιο άξονα είναι ίσο με το άθροισμα των συχνοτήτων, δηλαδή είναι ίσο με το μέγεθος του δείγματος ν. Ανάλογα, το εμβαδόν του χωρίου που ορίζεται από το πολύγωνο των σχετικών συχνο-τήτων και τον οριζόντιο άξονα είναι ίσο με το άθροισμα των σχετικών συχνοτήτων, δη-λαδή ίσο με 1 (ή ίσο με 100 αν πρόκειται για σχετικές συχνότητες επί τοις εκατό).

18 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Το εμβαδόν του χωριού που ορίζεται από το πολύγωνο συχνοτήτων (ή σχετικών συχνο-τήτων) είναι ίσο με το εμβαδόν του χωρίου που ορίζεται από το ιστόγραμμα των συχνο-τήτων ( ή των σχετικών συχνοτήτων). Παράδειγμα (13) Από τους μαθητές ενός ΕΠΑΛ πήραμε δείγμα μεγέθους 150 και τους μελετήσαμε ως προς το βάρος τους .Τα αποτελέσματα της μελέτης αυτής φαίνονται στον πα-ρακάτω πίνακα: Βάρος σε

kgr [ )50,55 [ )55,60 [ )60,65 [ )65,70 [ )70,75 [ )75,80

Αριθμός μαθητών

15 24 30 45 27 9

α)Να γίνει πίνακας αθροιστικών συχνοτήτων και σχετικών αθροιστικών συχνο-τήτων. β)Να κατασκευαστεί το πολύγωνο των συχνοτήτων και των σχετικών συχνοτή-των.

γ)Να κατασκευαστεί το πολύγωνο των αθροιστικών και των σχετικών αθροιστι-κών συχνοτήτων.

Λύση

Page 19: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

α) Ο πίνακας συμπληρωμένος με τις σχετικές συχνότητες fi , τις αθροιστικές συχνότη-τες και τις σχετικές αθροιστικές συχνότητες γίνεται: Βάρος σε kgr

Αριθμός μα-θητών νi

Σχετικές συχνότητες

f i

Αθροιστικές συ-χνότητες

Ni

Αθροιστική σχετική συχνότητα

Fi

[ )50,55 15 0.1

15

0.1

[ )55,60 24 0.16 39

0.26

19 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

[ )60,65 30

0.2

69

0.46

[ )65,70 45

0.3

114

0.76

[ )70,75 27

0.18 141

0.94

[ )75,80 9

0.016

150

1

Σύνολο 150 1

β) Για να κατασκευάσουμε το πολύγωνο συχνοτήτων (ή σχετικών συχνοτήτων), κατα-σκευάζουμε πρώτα το αντίστοιχο ιστόγραμμα

Πολύγωνο σχετικών συχνοτήτων Πολύγωνο συχνοτήτων

γ) Το πολύγωνο των αθροιστικών συχνοτήτων και των σχετικών αθροιστικών συχνοτή-των κατα-

σκευάζεται τα αντίστοιχα

ιστογράμματα από

Page 20: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

20 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Παράδειγμα ( 14Δίνεται ο παρακάτω πίνακας κατανομής συχνοτήτων της μεταβσης εντρικές τι-

ές

Πολύγωνο αθσυχνοτήτων

ροιστικών σχετικών υχνοτή-

)

λητής χ. Κλά Κ

μ iχ Συχνότητα χετική συ-

νότητα iv Σ

χ if Αθροιστική

τική συ-τητα %

σχεχνό iF

1-5 20 5-9 50 9-13 85 13-17 95 17- 2 21 Σύ 1 νολο

Να συμπληρωθεί ο πίνακας

Κεντρικές τιμές Λύση

1 5 6 32 2+

= = , 5 9 14 72 2+ , 9 13 22 11

2 2+

= = ,13 17 30 152 2+

= == = ,

17 21 38 192 2+

= =

1 1 120% 100 0.20

100F F F= ⋅ ⇔ = = οπότε 1 1f F=

2 2 2% 100 .50F F F= ⋅ ⇔ = οπ50 0100

= ότε 1 2 2 20.50 0.50 0.20 0.30f f f f= ⇔ = − ⇔ = +

3 3 385% 100 0.85

100F F F= ⋅ ⇔ = = οπότε 1 2 3 30.85 0.85 (0.20 0.30) 0.35f f f f+ + = ⇔ = − + =

Ομοίως βρίσκουμε και4 0.1f = 5 0.05f =

5 55f v

v v= ⇔ =

2 400.05

v f v v⇔ = ⇔ =

44 4 4 4 440 0.01 4vf v f v v v

v= ⇔ = ⋅ ⇔ = ⋅ ⇔ = ομοίως βρίσκουμε και τις υπόλοιπες .

Πα δειγΟι χρόνο για να λύσουν μια άσκηση είναι από 10 έως 20 sec χωρισμένοι σε 5 κλάσης ίσου πλάτους .Ισχύουν

ρά μα (15 ) ι τους οποίους έκαναν μια ομάδα φοιτητών

Page 21: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

i) Το πολύγωνο συχνοτήτων του δείγματος των φοιτητών με μεταβλητή χρόνο λύσης της άσκησης έχει εμβαδό 40.

το

την κ ντρική τιμή το 19 είναι 0.1 ii) Το ύψους του ορθογωνίου στο διάγραμμα σχετικών συχνοτήτων που

αντιστοιχεί σ λάση με κεiii) Η γωνία του κυκλικού τομές στο κυκλικό διάγραμμα που αντιστοιχεί

στην κλάση [ )14,16 είναι 72ο . iv) Οι φοιτητές που έκαναν από 16 έως 18 sec είναι διπλάσιοι από τους

φοιτητές που έκαναν χρόνο από 10 έως 12 sec χρ ν

να κάνετε τον πίνακα συχνοτήτων

v) Εικοσιτεσσερεις φοιτητές έκαναν ό ο κάτω από 16 sec . τότε iv , iN , if , , if %, % , το ιστόγραμμα συ-

των, το πολύγωνο αθροιστικών σχετικών συχνοτήτων . Λύ

iFχνοτή

ση Το εύρος του δείγματος είναι 20 10 10R = − =

21 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Το πλάτος κάθε κλάσης είναι 10 25= .

Επειδή το πολύγωνο συχνοτήτων έχει εμβαδό 40 τότε το μέγεθος του δείγματος εί-

ς είναι [ναι ν=40. Οι κλάση [ [ [ [) ) ) ) )10,12 , 12,14 , 14,16 , 16,18 , 18, 20

έχουμε: 55 5 5 50.1 0.1 0.1 40 0.1 4f ν ν ν ν ν

ν= ⇔ = ⇔ = ⋅ ⇔ = ⋅ ⇔ =

0 03 33 0

3

40 7272 360 72 360 7240 360

8

ο

3ο ο ον να ν

νν

⋅= ⇔ = ⇔ = ⇔ =

⇔ =

έχουμε : 4 12ν ν=

3 1 2 324 24ν ν νΝ = ⇔ + + = . Ακόμη

24 4 12 1 2

403 4 5 4 5 4 5

4 4

40 24 40 40 24ν ν ν ν ν ν ν ν νν

+ + + + = ⇔ + + = ⇔ = − − ⇔− − ⇔ =

41 1

12 62 2νοπότε ν ν= = ⇔ =

κόμηΑ 2 1 324 24 6 8 10ν ν ν= − − = − − = .

Κλάσης iχ iv iΝ if if % iF %

[ )10,12 11 6 6 0.15 15 15

[ )12,14 13 10 16 0.25 25 40

[ )14,16 15 8 24 0.20 20 60

[ )16,18 17 12 36 0.30 30 90

Page 22: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

[18, 2 )0 9 0 0 1 4 4 0.1 10 100 40 1 100

22 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Ιστόγραμμα συχνοτήτων , πολύγωνο αθροιστικών σχετικών συχνοτητων

τητών

στο μάθημα της Ανάλυσης και από το

τικών % συχνοτήτων

Παράδειγμα ( 16 ) Δίνεται το ιστόγραμμα συχνοτήτων και το ιστόγραμμα αθροιστικών σχετικών %συχνοτήτων της ιδίας μεταβλητής που αναφέρεται στους βαθμούς 50 φοι

οποίο λείπουν κάποια ορθογώνια.

i) Να συμπληρωθούν τα ορθογώνια των ιστογραμμάτων. ii) Να κατασκευαστεί το πολύγωνο αθροιστικών σχε

Page 23: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

iii) πόσοι φοιτητές πέρασαν το μάθημα (βάση το 5);

i)Από τα ι τογράμματα έχουμε : v v

Λύση

σ 1v 3 45, 20, 5= = =

1% 10%F = , 2 % 30%F = , 5 % 100%F = ,

11 1

% 10 0.10100 100Ff F= = = =

2

2% 30 0.30

100 100FF = = =

1 11

1

5 500.10

v vf v vv f

= ⇔ = ⇔ = = 1 2 2 2 2 1 2 0.30 0.10 0.20f f F f F f f+ = ⇔ = − ⇔ = − =

22 2 2 2 2 1 2 250( ) 50(0.30 0.10) 10vf v v f v F F v v

v= ⇔ = ⋅ ⇔ = − ⇔ = − ⇔ =

33f f

v= ⇔ 3

20 0.4050

v= =

οπότε άρα3 1 2 2 0.10 0.20 0.40 070F f f f= + + = + + = 3% 0.70 100 70%F = ⋅ =

44 4

5 0.1050

vf fv

= ⇔ = =

4 3 4 0.70 0.10 0.80F F f= + = + = 4 4% 100 80 100 80%F F= ⋅ = ⋅ = 20 5) 10v v v v v v= − + + + = + + =

0.

5 1 2 3 4( ) 50 (5 10− +

55f = =5

10 0.2050

v fv⇔ = οπότε 5 4 5 0.80 0.20 1F F f= + = + =

ρα

)

ά 5 % 100%F = ii

23 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Page 24: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

iv

24 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

) Το μάθημα το πέρασαν 10 +5+10=25 φοιτητές

ίνεται το παρακάτω ιστόγραμμα σχετικών συχνοτήτων

Ναi)

Παράδειγμα (17) Δ

υπολογισθεί H σχετική συχνότητα της κλάσης [ )162,168 όταν το 25% των παρατηρή-

ii) σηςσεων έχει τιμή μικρότερη από 168. Η σχετική συχνότητα της κλά [ )168,174 όταν το 35% των παρατηρή-σεων έχει τιμή μέχρι και 170,

Λύση f F= =

αι Β(170,0.35) ορίζουν ευθεία πολυγώνου συχνοτήτων που διέρ- το (1

Έστω

1 1 0.05

2 0.25F = οπότε 2 1 2 2 2 1 2 20.25 0.05 0.20F f f f F f f f= + ⇔ = − ⇔ = − ⇔ = Τα σημεία Α(168,0.25) κχεται από 44, 3F ) .

y ax β= + η ευθεία τότε έχουμε : 0.25 168a β

β0.35 170a= ⋅ +

Λύνω το σύστημαa

= ⋅ + οπού και έχω:

8.15β0.05=

= −

ία είναι διέρχεται και από το (144, ) = ⋅ − ⇔ =

πότε

0.05 8.15y x= − 3FΗ ευθεοπότε F F3 30.05 174 8.15 0.55

3 1 2 3 3 30.55 (0.05 0.20) 0.30F f f f f f= + + ⇔ = − + ⇔ = ο

Page 25: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 25 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Γενικά, για την καλύτερη κατανόηση των στατιστικών δεδομένων, χρησιμοποιούμε: • ητές

1 συχνότητας

ατα

• βλητές

υχνότητας ή σχετικής συχνότητας 2.

σχετικής συχνότητας ματα

6. να συχνοτήτων

αθροιστικής σχετικής συχνότητας

Στα

Για ποιοτικές μεταβλ. Ραβδογράμματα απόλυτης συχνότητας ή σχετικής

2. Κυκλικά διαγράμμ3. Σημειογράμματα Για ποσοτικές μετα1. Διαγράμματα απόλυτης σΠολύγωνα απόλυτης συχνότητας ή

3. Κυκλικά διαγράμ4. Χρονογράμματα 5. Σημειογράμματα Ιστογράμματα και πολύγωαπόλυτης συχνότητας ήσχετικής συχνότητας ή αθροιστικής συχνότητας ή

τιστικά περιγραφικά μέσα Στη Στατιστική, εκτός από τους στατιστικούς πίνακες και τα διαγράμματα, υπάρ-

χουν και τα στατιστικά περιγραφικά μέσα, με τα οποία μπορούμε να περιγράψουμε με συντομία μια κατανομή συχνοτήτων Με τον όρο στατιστικό περιγραφικό μέτρο εννοούμε τον αριθμό που συνοψίζει βασικά χαρακτηριστικά των παρατηρήσεων του συνόλου των δεδομένων που εξετάζουμε. Σκοπός των στατιστικών μέτρων είναι η αντικατάσταση μιας μεγάλης μάζας αριθμη-τικών δεδομένων από ένα ή δυο αριθμούς, που από κοινού μεταφέρουν το μεγαλύτερο ποσοστό της βασικής πληροφορίας που περιέχεται στα δεδομένα. Τα αφικά μέτρα, χωρίζονται σε δυο κατηγορίες:

• Μέτρα διασποράς ή μέτρα μεταβλητότητας

Μέ

στατιστικά περιγρ• Μέτρα θέσης

τρα θέσης Τα στατιστικά μέτρα θέσης δίνουν πληροφορίες για τη θέση του κέντρου των παρα-

τηρήσεων στον οριζόντιο άξονα και για το μέγεθος των τιμών των δεδομένων. Στατι-στικά μέτρα θέσης είναι τα ακόλουθα: 1. Επικρατούσα τιμή Μ0

Page 26: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Επικρατούσα τιμή Μ0 μιας μεταβλητής ονομάζεται η τιμή με τη μεγαλύτερη συχνό-τητα. Αν δυο ή περισσότερες τιμές έχουν τη μέγιστη συχνότητα, τότε υπάρχουν πε-ρισσότερες από μια επικρατούσες τιμές.

Είναι προφανές ότι η επικρατούσα τιμή μπορεί να οριστεί τόσο σε ποσοτικές όσο και σε ποιοτικές μεταβλητές

Παράδειγμα (18) Για να προσδιορίσουμε την επικρατούσα τιμή των παρακάτω δειγμάτων:

1, 2, 3, 2, 2, 3, 1, 2, 4, 2, 1, 3, 2, 1, 4, 4, 1, 2, 2 κατασκευάζουμε τον πίνακα συχνοτήτων

26 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Μεταβλητή χi Συχνότητα vi

1 5 2 8 3 3 4 3

Σύνολο 19 Η επικρατούσα τιμή είναι Μ0 = 2, γιατί είναι η παρατήρηση με τη μεγαλύτερη συχνότη-τα

Επικρατούσα τιμή σε ομαδοποιημένα δεδομένα Αν έχουμε ομαδοποιημένα (ποσοτικά) δεδομένα, αρχικά βρίσκουμε την επικρατού-

σα κλάση i, δηλαδή την κλάση με τη μεγαλύτερη συχνότητα. Ο προσδιορισμός της επι-κρατούσας τιμής γίνεται από το ιστόγραμμα συχνοτήτων

Βρίσκουμε την επικρατούσα κλάση. Φέρνουμε τα ευθύγραμμα τμήματα ΑΓ και ΒΔ, και έστω Ε το σημείο τομής τους. Από το Ε φέρνουμε κάθετη στον άξονα Οχ. Στο σημείο που η κάθετη αυτή τέμνει τον Οχ, προσδιορίζεται η επικρατούσα τιμή Μ0. Επομένως, η επικρατούσα τιμή είναι η τετμημένη του σημείου τομής των τμημάτων ΑΓ και ΒΔ του σχήματος .

Παρατήρηση Αποδεικνύεται ότι η επικρατούσα τιμή Μ0 σε ομαδοποιημένα γεγονότα είναι:

Μ0 = Li + 21

1

DDDc+⋅

όπου Li : το κάτω άκρο της επικρατούσας κλάσης

Page 27: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

c : το πλάτος της κλάσης D1 = vi – vi-1 η διαφορά των συχνοτήτων της επικρατούσας κλάσης από την προηγού-μενή της D2 = vi – vi+1 η διαφορά των συχνοτήτων της επικρατούσας κλάσης από την επόμενή της

2. Μέση τιμή x−

Η μέση τιμή ενός συνόλου ν παρατηρήσεων αποτελεί το πιο σημαντικό και συχνά χρησιμοποιούμενο στην πράξη στατιστικό μέτρο.

Ορίζεται ως το άθροισμα των τιμών χ1, χ2, ....χν που παίρνει μια μεταβλητή χ, προς το πλήθος των τιμών της

∑∑

=

= ==+++

ν

ν

ννν 1

121 1...i

ii

i

tt

tttx

Η μέση τιμή ορίζεται μόνο σε ποσοτικές μεταβλητές. Αν όμως, η μεταβλητή παρουσιάζει τιμές χ1, χ2, ....χν με αντίστοιχες συχνότητες ν1, ν2, ....νν τότε, για να υπολογίσουμε εύκολα την μέση τιμή, δημιουργούμε μια νέα στήλη στην οποία υπολογίζουμε τα χiνi και κατόπιν το άθροισμα τους . Έτσι, η μέση τιμή της μεταβλητής δίνεται από τον τύπο:

∑∑

∑=

=

= ==++++++

κ

κ

κ

κκ ννν

ν

νννννν

1

1

1

21

2211 1......

iii

ii

iii

xx

xxxx

Η παραπάνω σχέση ισοδύναμα γράφεται:

27 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

όπου οι σχετικές συχνότητες.

if1 1

ii i

i iix x x

κ κνν= =

= =∑ ∑ f

Παράδειγμα (19) Σε δέκα αγώνες σε ένα πρωτάθλημα ποδοσφαίρου, σημειώθηκαν τα παρακάτω τέρματα: 3, 1, 3, 2, 5, 6, 3, 5, 1, 3. Η μέση επίτευξη γκολ ανά αγώνα είναι:

= 2.31032

103153652313

==+++++++++ x

Page 28: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Παράδειγμα (20) ii)Να βρεθεί η μέση τιμή των παρατηρήσεων που αντιστοιχούν στον παρακάτω πίνακα: Παρατηρήσεις

χi

Συχνότητες νi

1 6 2 7 3 2 4 8 5 13

Σύνολο 36

Λύση

28 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Στον υπάρχον πίνακα δημιουργούμε την στήλη των χiνi και ο πίνακας γίνεται: Παρατηρήσεις

χi

Συχνότητες νi

χiνi

1 6 6 2 7 14 3 2 6 4 8 32 5 13 65

Σύνολο 36 123

Η μέση τιμή είναι : 1 1 2 2

1 2 3 4 5

....... 123 3, 4136

X κ κν χ ν χ ν χν ν ν ν ν+ + +

= = =+ + + +

Παράδειγμα ( 21) Ένας ιδιοκτήτης ενοικιάζει 4 διαμερίσματα με μέσο ενοίκιο 500 ευρώ τον μηνά . i) Ενοικιάζει και ένα πέμπτο διαμέρισμα στην τιμή των 300 ευρώ .Ποιο είναι το μέ-σο ενοίκιο τώρα ; ii) Αν επιθυμούσε το μέσο ενοίκιο να γίνει 480 ευρώ, πόσο έπρεπε να είναι το πέ-μπτο διαμέρισμα; Λύση

i) 4 500 1 300 2000 300 4604 1 5

⋅ + ⋅ +=

+= Ευρώ

ii)Έστω ω το ενοίκιο του πέμπτου διαμερίσματος τότε:

Page 29: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 29 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

4 500 1 480 ... 4004 1

ω ω⋅ + ⋅= ⇔ ⇔ =

+ ευρώ .

Παράδειγμα ( 22 ) Ένας αγρότης απασχολεί αλλοδαπούς εργάτες για τρεις διαφορετικές εργασίες Συγκεκριμένα απασχολεί 10 εργάτες για το μάζεμα της ελιάς 15 εργάτες για σκάψιμο και κλάδεμα και 30 εργάτες για φόρτωμα καρπού. Πληρώνει κατά μέσο ορό 30 ευρώ την ημέρα τον κάθε εργάτη. Να βρεθεί ποσό πληρώνει για την κάθε εργασία ημερησίως αν από το μάζεμα της ελιάς κοστολογείται το ίδιο με το σκά-ψιμο αλλά ακριβότερο κατά 6 ευρώ από το φόρτωμα Λύση Έστω χ: το ημερομίσθιο για το μάζεμα της ελιάς y: το ημερομίσθιο για το σκάψιμο z : το ημερομίσθιο για το φόρτωμα οπότε χ = y και χ = z+6

10 15 30( 6) 10 15 30( 6)30 30 ... 33.2710 15 30 10 15 30

x yy x x xχ χ χ=+ + − + + −

= ⇔ = ⇔ =+ + + +

άρα χ = y = 33.27 και z = 33.27-6 = 27.27

Page 30: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Σταθμικός Μέσος Στις περιπτώσεις που δίνεται διαφορετική βαρύτητα (έμφαση) στις τιμές ενός συνόλου δεδομένων, τότε αντί του αριθμητικού μέσου χρησιμοποιούμε τον σταθμισμέ-νο αριθμητικό μέσο ή σταθμικό μέσο (weighted mean). Εάν σε κάθε τιμή δώσουμε διαφορετική βαρύτητα, που εκφράζεται με τους λεγόμενους συντελεστές στάθμισης (βαρύτητας) , τότε ο σταθμικός μέσος βρίσκεται από τον τύπο:

νxxx ,...,, 21

νxxx ,...,, 21

νwww ,...,, 21

=

==++++++

= ν

ii

ν

iii

ν

νν

w

wx

wwwwxwxwxx

1

1

21

2211

......

. Για παράδειγμα, με το νέο σύστημα, για την εισαγωγή ενός μαθητή στην τριτοβάθμια

εκπαίδευση θα συνυπολογίζονται ο βαθμός του απολυτηρίου του Ενιαίου Λυκείου με συντελεστή (βάρος)

1x

71 =w ,5, ο βαθμός στο τεστ δεξιοτήτων με συντελεστή 2x 12 =w , ο βαθμός στο 1ο βασικό μάθημα με συντελεστή 3x 13 =w

5,04 =w και ο βαθμός στο 2ο βασικό

μάθημα με συντελεστή . Εάν ένας μαθητής πάρει τους βαθμούς ,

4x

5,161 =x 182 =x , και , τότε ο σταθμικός μέσος της επίδοσης του θα είναι: 173 =x 6,164 =x

7,16

10167

5,0115,75,06,161171185,75,16

==+++

×+×+×+×=x

.

Μέση τιμή σε ομαδοποιημένα δεδομένα Αν έχουμε ομαδοποιημένες κατά κλάσεις παρατηρήσεις, βρίσκουμε την κεντρική

τιμή κάθε κλάσης, δηλαδή το μέσο κάθε διαστήματος, και την πολλαπλασιάζουμε με τη συχνότητα της κλάσης. Στη συνέχεια, υπολογίζουμε το άθροισμά τους και το διαι-ρούμε με το μέγεθος του δείγματος ν. Όπως και στην προηγούμενη περίπτωση, για να βρεθεί εύκολα η μέση τιμή δημιουρ-

γούνται δυο νέες στήλες , μια με τα κέντρα των κλάσεων και μια με τα γινόμενα ixi ix ν⋅ .Στην συνεχεία υπολογίζεται το άθροισμα των i ix ν⋅ .

Παράδειγμα (23) Τα κέρδη (σε χιλιάδες ευρώ) 50 καταστημάτων την προηγούμενη 10ετία ήταν: 51 53 57 56 54 56 55 53 54 50 60 61 63 63 62 67 66 67 65 67 71 73 76 74 75 79 78 81 81 83

30 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Page 31: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

88 86 85 94 95 95 96 93 92 95 100 107 106 109 105 112 113 113 112 119 Θέλουμε να υπολογίσουμε το μέσο κέρδος των καταστημάτων Δημιουργούμε 7 κλάσεις, όπου το πλάτος κάθε κλάσης είναι c = 10. Ο πίνακας συχνοτήτων είναι:

31 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Διάστημα κερδών

Κεντρική τιμή xi Συχνότητα vi

ii vx ⋅

50-60 55 10 550 60-70 65 10 650 70-80 75 7 525 80-90 85 6 510 90-100 95 7 665 100-110 105 5 525 110-120 115 5 575 Σύνολο 50 4000

Άρα η μέση τιμή είναι:

= v

xvxvxv vv ⋅++⋅+⋅ ......2211 = x−

8050

400050

575525665510525650550==

++++++

Παρατήρηση • Αν δεν κάνουμε ομαδοποίηση των παρατηρήσεων, τότε βρίσκουμε μέση τιμή ε-λαφρώς διαφορετική από αυτή που προσδιορίσαμε με την ομαδοποίηση. Φυσικά, η δεύτερη είναι πιο ακριβής αλλά αρκετά δύσκολη και χρονοβόρα στον υπολογισμό της. Αυτή είναι η αιτία που προτιμούμε την ομαδοποίηση. Χάνουμε λίγο ως προς την ακρίβεια, αλλά κερδίζουμε χρόνο. • Στην ομαδοποίηση των παρατηρήσεων δεχόμαστε ότι αυτές είναι ομοιόμορφα κατανεμημένες στις κλάσεις και ότι οι τιμές της μεταβλητής σε κάθε κλάση αντι-προσωπεύονται από την αντίστοιχη κεντρική τιμή xi. • Αν έχουμε πληροφορίες ότι οι παρατηρήσεις δεν είναι ομοιόμορφα κατανεμημέ-νες σε κάθε κλάση, τότε δεν μπορούμε να υπολογίσουμε τη μέση τιμή κάνοντας χρήση των κεντρικών τιμών κάθε κλάσης. Η αιτία είναι ότι θα προσδιορίσουμε μέση τιμή αρκετά διαφορετική από την πραγματική.

3. Διάμεσος δ

Page 32: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Διάμεσος δ ενός δείγματος ν παρατηρήσεων, οι οποίες έχουν διαταχθεί σε αύ-ξουσα σειρά, ορίζεται ως:

• Η μεσαία παρατήρηση, όταν το πλήθος ν των παρατηρήσεων είναι περιττός α-ριθμός • Το ημιάθροισμα των δυο μεσαίων παρατηρήσεων, όταν το πλήθος ν των παρα-τηρήσεων είναι άρτιος αριθμός

Παράδειγμα (24) Αν θέλουμε να βρούμε τη διάμεσο των αριθμών (οι οποίοι έχουν ήδη διαταχθεί σε αύξουσα σειρά)

1 1 3 5 7 8 8 9 9 τότε αυτή θα ισούται με τη μεσαία παρατήρηση (δηλαδή την 5η), γιατί το πλήθος των δεδομένων είναι περιττός αριθμός (ν=9). Άρα δ = 7 Αν θέλουμε να βρούμε τη διάμεσο των παρατηρήσεων: 200 300 500 500 500 700 1.000 1.000 1.000 40.000

32 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

τότε αυτή θα ισούται με το ημιάθροισμα των δυο μεσαίων παρατηρήσεων (δηλαδή της 5ης και της 6ης παρατήρησης), γιατί το πλήθος των παρατηρήσεων είναι άρτιος αριθμός

(ν=10). Άρα δ = 6002

700500=

+ .

Παράδειγμα (25 ) Οκτώ διαδοχικοί περιττοί αριθμοί έχουν μέση τιμή 20. Να βρεθούν οι αριθμοί και η διάμεσος τους Λύση Έστω 2 1,2 3,2 5,2 7,2 9,2 11,2 13,2 15κ κ κ κ κ κ κ κ+ + + + + + + +οι ζητούμενοι αριθμοί τότε : 2 1 2 3 2 5 2 7 2 9 2 11 2 13 2 15 20

816 64 160 6

κ κ κ κ κ κ κ κ

κ κ

+ + + + + + + + + + + + + + += ⇔

+ = ⇔ =

Άρα οι αριθμοί είναι : 13 ,15,17,19,21,23,25,27

Η διάμεσος δ είναι 19 21 40 202 2

δ += = =

Παρατήρηση Η διάμεσος δ είναι η τιμή που χωρίζει το δείγμα έτσι ώστε το 50% των παρατηρήσεων να είναι μικρότερες ή ίσες από το δ, και το 50% των παρατηρήσεων να είναι μεγαλύτε-ρες ή ίσες από το δ.

Διάμεσος σε ομαδοποιημένα δεδομένα Για να υπολογίσουμε τη διάμεσο σε ομαδοποιημένα δεδομένα, δημιουργούμε το

ιστόγραμμα αθροιστικών συχνοτήτων ή αθροιστι-αθροιστικών σχετικών συχνοτήτων και τις αντίστοιχες πολυγωνικές γραμμές. Σύμφωνα με ντίστοιχες πολυγωνικές γραμμές. Σύμφωνα με την

Page 33: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 33 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

προηγούμενη παρατήρηση, η διάμεσος θα είναι η τιμή δ της μεταβλητής Χ στον οριζό-ντιο άξονα έτσι ώστε το 50% των παρατηρήσεων να έχουν τιμές μικρότερες ή ίσες του δ. Η διάμεσος δ έχει αθροιστική συχνότητα 0,5 και σχετική αθροιστική συχνότητα 50%. Από το σημείο Α (50%) φέρνουμε την ΑΒ//Οχ και από το σημείο Β τη ΒΓ//Οψ. Ο αριθμός που αντιστοιχεί στο Γ είναι η διάμεσος δ.

Παρατήρηση Αποδεικνύεται ότι η διάμεσος δ σε ομαδοποιημένα δεδομένα είναι:

δ = cv

Nv

Li

i

i ⋅−

+−12

όπου: Li : το κατώτερο όριο της κλάσης που περιέχει τη διάμεσο vi : η συχνότητα της κλάσης που περιέχει τη διάμεσο c : το πλάτος της κλάσης (αναφερόμαστε σε κλάσεις ίσου πλάτους) Ni-1 : Η αθροιστική συχνότητα της προηγούμενης κλάσης V : το πλήθος των παρατηρήσεων

Παράδειγμα (26) Να βρεθεί η διάμεσος των παρατηρήσεων για τις ομαδοποιημένες τιμές της με-ταβλητής χ, που φαίνονται στον πίνακα: Ομάδες Συχνότητες

νi

[ )10, 20 2

[ )20,30 8

[ )30, 40 10

[ )40,50 12

[ )50,60 8 Σύνολο 40 Λύση Συμπληρώνουμε τον πίνακα με τις σχετικές συχνότητες και τις σχετικές αθροιστικές συχνότητες : Ομάδες Συχνότητες

νi

Σχετικές συχνό-τητες fi

Σχετικές αθροιστι-κές συχνότητες fi%

[ )10, 20 2 0.05 0.05

[ )20,30 8 0.2 0.25

[ )30, 40 10 0.25 0.5

[ )40,50 12 0.3 0.8

[ )50,60 8 0.2 1

Page 34: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Σύνολο 40 1

Η διάμεσος είναι: δ=40

34 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Page 35: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 35 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Σύγκριση παραμέτρων θέσης

Επικρατούσα τιμή Πλεονεκτήματα Μειονεκτήματα

• Ο υπολογισμός της είναι εύκο-λος, όταν δεν έχουμε ομαδο-ποιημένες τιμές

• Υπολογίζεται και από ελλιπή στοιχεία

• Δεν επηρεάζεται από ακραίες τιμές

• Εφαρμόζεται και σε ποιοτικές μεταβλητές

• Σε ομαδοποιημένα δεδομένα, χρειάζεται γραφικό προσδιο-ρισμό

• Δεν χρησιμοποιούνται όλες οι τιμές

• Είναι ακατάλληλη για περαι-τέρω μαθηματική ανάλυση

• Μπορεί να μην ορίζεται μονο-σήμαντα (πολυκόρυφη κατα-νομή)

Μέση τιμή

Πλεονεκτήματα Μειονεκτήματα • Ο υπολογισμός της είναι εύκο-λα κατανοητός

• Ο υπολογισμός της δεν είναι δύσκολος

• Χρησιμοποιούνται τα μεγέθη όλων των τιμών

• Δεν χρειάζεται γραφικό προσ-διορισμό

• Είναι πολύ χρήσιμη σε περαι-τέρω ανάλυση

• Επηρεάζεται από ακραίες τι-μές, μεγάλες ή μικρές

• Μπορεί να μην αντιστοιχεί σε συγκεκριμένη τιμή της μετα-βλητής (πχ 2,76 παιδιά)

Διάμεσος Πλεονεκτήματα Μειονεκτήματα

• Ο υπολογισμός της είναι εύκο-λα κατανοητός

• Ο υπολογισμός της είναι α-πλός

• Μπορεί να υπολογιστεί και από ελλιπή στοιχεία

• Δεν επηρεάζεται από ακραίες τιμές

• Δεν χρησιμοποιούνται όλες οι τιμές της μεταβλητής

• Μπορεί να χρειάζεται γραφικό προσδιορισμό

• Δεν χρησιμοποιείται για πε-ραιτέρω μαθηματική ανάλυση

Page 36: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Μέτρα διασποράς Τα μέτρα διασποράς εκφράζουν τις αποκλίσεις των τιμών μιας μεταβλητής γύρω

από τα μέτρα θέσης, και συνήθως γύρω από τη μέση τιμή. Τα σπουδαιότερα μέτρα δια-σποράς είναι:

• Το εύρος • Η μέση απόλυτη απόκλιση • Η διακύμανση • Η τυπική απόκλιση

1. Εύρος Εύρος ή κύμανση ορίζεται ως η διαφορά της ελάχιστης παρατήρησης από τη

μέγιστη. Εάν έχουμε ομαδοποιημένα δεδομένα, το εύρος ισούται με τη διαφορά του κατώτερου ορίου της πρώτης κλάσης από το ανώτερο όριο της τελευταίας κλάσης

Παράδειγμα (27) Για τις τιμές : 2,7,4,8,3,0,2,7,6,9,5

36 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

να βρεθεί το εύρος τους . Λύση Η μικρότερη από τις τιμές είναι το 0 και η μεγαλύτερη το 9 , άρα το εύρος είναι ίσο με 9-0=9

Παρατήρηση • Το εύρος σε ομαδοποιημένα δεδομένα μπορεί να διαφέρει λίγο από το εύρος των δεδομένων πριν αυτά ομαδοποιηθούν. • Το εύρος είναι απλό μέτρο και δεν θεωρείται αξιόπιστο, γιατί βασίζεται μόνο στις δυο ακραίες παρατηρήσεις

2.Μέση απόλυτη απόκλιση

Αν μια μεταβλητή παίρνει τις ν τιμές t1, t2, t3…tv που έχουν μέση τιμή , τότε μέση x−

απόλυτη απόκλιση της μεταβλητής ονομάζεται το πηλίκο:

v

ttt vxxx −++−+−−−−

.....21

Αν οι τιμές t1, t2, t3…tv έχουν αντίστοιχες συχνότητες ν1, ν2, ν3...νν τότε η μέση απόλυτη απόκλιση της μεταβλητής, γίνεται:

v

tvtvtv vv xxx −⋅++−⋅+−⋅−−−

.....2211

Page 37: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

3. Διακύμανση Η χρήση των απολύτων τιμών στον τύπο της μέσης απόλυτης απόκλισης δυσκολεύ-

ει τον υπολογισμό της. Για το λόγο αυτό, για τη διασπορά των τιμών της μεταβλητής

γύρω από τη μέση τιμή χρησιμοποιούμε την ποσότητα ( . 2)ixx−−

Αν μια μεταβλητή παίρνει τις ν τιμές χ1, χ2, χ3…χv που έχουν μέση τιμή , τότε διακύ-x−

μανση της μεταβλητής ονομάζεται το πηλίκο:

v

xxxxxx v

22

2

2

1 ... ⎟⎠⎞

⎜⎝⎛ −++⎟

⎠⎞

⎜⎝⎛ −+⎟

⎠⎞

⎜⎝⎛ −

−−−

Αν οι τιμές x1, x2, x3…xv έχουν αντίστοιχες συχνότητες ν1, ν2, ν3...νν τότε η μέση απόλυ-τη απόκλιση της μεταβλητής, γίνεται:

=2s

2 2 2

1 1 2 22 2

1

...1 ( )

v v

ii

v x x v x x v x xs t x

v

ν

ν

− − −

=

⎛ ⎞ ⎛ ⎞ ⎛ ⎞⋅ − + ⋅ − + + ⋅ −⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠= = ∑ −

37 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Για τον υπολογισμό της διακύμανσης ενός δείγματος, προσθέτουμε στον πίνακα συ-

χνοτήτων μια στήλη με τα στοιχεία , υπολογίζουμε το άθροισμά τους και το 2

⎟⎠⎞

⎜⎝⎛ −⋅−

ii xxv

διαιρούμε με το πλήθος ν των παρατηρήσεων. Ο παραπανω τύπος αποδεικνύεται ότι μπορεί να πάρει την ισοδύναμη μορφή

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

⎧⎟⎠⎞

⎜⎝⎛

−= ∑∑

=

i

ν

ii

i ν

tt

νs

1

2

122 1

η οποία διευκολύνει σημαντικά τους υπολογισμούς κυρίως όταν η μέση τιμή x δεν εί-ναι ακέραιος αριθμός.

Όταν έχουμε πίνακα συχνοτήτων ή ομαδοποιημένα δεδομένα, η διακύμανση ορίζε-

ται από τη σχέση: ∑=

−=κ

iii νxx

νs

1

22 )(1

ή την ισοδύναμη μορφή:

Page 38: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

.11

2

122

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

⎧⎟⎠⎞

⎜⎝⎛

−= ∑∑

=

i

κ

iii

ii v

vxvx

vs

όπου οι τιμές της μεταβλητής (ή τα κέντρα των κλάσεων) με αντίστοιχες συ-χνότητες .

κxxx ,...,, 21

κννν ,...,, 21

4. Τυπική απόκλιση Ως τυπική απόκλιση ορίζουμε το τετράγωνο της διακύμανσης

2 22 1 2( ) ( ) ... ( )X X Xs s νχ χ

ν− + − + + −

= =2χ

Ενώ στην περίπτωση που οι τιμές x1, x2, x3…xv έχουν συχνότητες ν1, ν2, ν3...νν, τότε

2 22 1 1 2 2( ) ( ) ... ( )X X Xs κ κν χ ν χ ν χ

ν− + − + + −

=2

Αξίζει να σημειωθεί ότι αν η καμπύλη συχνοτήτων για το χαρακτηριστικό που εξετά-ζουμε είναι κανονική ή περίπου κανονική, τότε η τυπική απόκλιση s έχει τις παρα-κάτω ιδιότητες:

x s x s x s x x s x s x s− − − + + +3 2 2 3

99,7%95%68%

s s

i) το 68% περίπου των παρατηρήσεων βρίσκεται στο διά-στημα

),( sxsx +−

ii) το 95% περίπου των παρατηρήσεων βρίσκεται στο διά-στημα

)2,2( sxsx +−

iii) το 99,7% περίπου των παρατη-ρήσεων βρίσκεται στο διά-στημα

)3,3( sxsx +−

iv) το εύρος ισούται περίπου με έξι τυπικές αποκλίσεις, δηλαδή sR 6≈ .(Βλεπε παρ 19)

38 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Page 39: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Παράδειγμα (28) Για τους βαθμούς στο μάθημα Β: 7, 8, 9, 10, 11, 12, 13 έχουμε

10=−

bx , οπότε ( ) ( ) ( ) ( ) ( ) ( ) ( )

4728

79410149

71310121011101010910810710 2222222

2

==++++++

=−+−+−+−+−+−+−

=bsΟπότε

24 ==bsΓια τους βαθμούς στο μάθημα C : 4, 6, 8, 10, 12, 14, 16 έχουμε

10=−

cx , οπότε ( ) ( ) ( ) ( ) ( ) ( ) ( )

167

1127

361640416367

1610141012101010810610410 22222222

==++++++

=−+−+−+−+−+−+−

=csΟπότε

416 ==cs

39 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Παρατηρούμε ότι οι βαθμοί στο μάθημα C παρουσιάζουν μεγαλύτερη τυπική απόκλι-ση, πράγμα που αντικατοπτρίζει το μεγαλύτερο άπλωμα των τιμών γύρω από τη μέση τιμή. Πρέπει να τονίσουμε ότι σημαντικότερο μέγεθος είναι η τυπική απόκλιση. Η δια-κύμανση χρησιμοποιείται βοηθητικά.

Παράδειγμα (29) Δίνεται ο παρακάτω πίνακας συχνοτήτων των ομαδοποιημένων τιμών μιας μεταβλητής : Κλάσεις [ )10, 20 [ )20,30 [ )30, 40 [ )40,50 [ )50,60 [ )60,70

Συχνότητες νi

8 2 1 9 6 4

α)Να βρεθεί η μέση τιμή X των τιμών. β)Να βρεθεί η διακύμανση και η τυπική απόκλιση των τιμών. Λύση Για να βρούμε την μέση τιμή , την διακύμανση και την τυπική απόκλιση των τιμών, θα ενισχύσουμε τον πίνακα συχνοτήτων με τα στοιχεία: κέντρο χi των κλάσεων, 2 2, , ( ) , (i i i )x X x X x X xν ν⋅ − − −

Page 40: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Κλάσεις Συχνότητες

νi

Κέντρα Xi

i ix ν⋅ X x− 2( )X x− 2( )i X xν −

[ )10, 20 8 15 120 25 625 5000

[ )20,30 2 25 50 15 225 450

[ )30, 40 1 35 35 5 25 25

[ )40,50 9 45 405 5 25 225

[ )50,60 6 55 330 15 225 1350

[ )60,70 4 65 260 25 625 2500

Σύνολο 30 1200 9550

α)Η μέση τιμή είναι : 1 1 2 2 6 6....... 1200 4030

x x xX ν ν νν

+ + += = =

β)Η διακύμανση s2 είναι ίση με: 2 2 2

2 1 1 2 2 6 6( ) ( ) ... ( ) 9550 318,3330

X X Xs ν χ ν χ ν χν

− + − + + −= = =

40 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

και η τυπική απόκλιση s είναι ίση με : 2 318,33 17,84s s= =

ΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΛΗΤΟΤΗΤΑΣ CV Όταν γνωρίζουμε μόνο τη μέση τιμή και την τυπική απόκλιση δυο διαφορετικών δειγ-μάτων, τότε χρειαζόμαστε ένα μέτρο μεταβλητότητας για να μπορούμε να συγκρίνου-με τα δυο δείγματα. Ορίζουμε συντελεστή μεταβλητότητας το πηλίκο

CV= (τυπική απόκλιση) / (μέση τιμή) = −

x

s ή CV = −

x

s 100%

Ο CV χρησιμοποιείται, επομένως, σαν ένα μέτρο σύγκρισης της διασποράς των τιμών ενός δείγματος γύρω από τις μέσες τιμές τους, στην περίπτωση που είτε οι μέσες τιμές διαφέρουν σημαντικά μεταξύ τους είτε οι τιμές του δείγματος έχουν διαφορετικές μο-νάδες μέτρησης (ο CV είναι ανεξάρτητος από τις μονάδες μετρήσεις). Γενικά: όταν ο συντελεστής μεταβλητότητας είναι κάτω από 10%, τότε ο πληθυσμός του δείγματος θεωρείται ομοιογενής, δηλαδή παρουσιάζει μικρή διασπορά τιμών. Σχόλια 1. Αν οι μεταβλητές Χ και Υ συνδέονται με τη γραμμική σχέση Υ = α + βΧ, όπου α και β

πραγματικοί αριθμοί, και , yχ αντίστοιχα η μέση τιμή των Χ και Y τότε ισχύει

y aχ β= + οσο για τις διακυμάνσεις 2xs , 2

ys των Χ και Υ αντιστοίχως, αποδει-

κνύεται ότι συνδέονται με τη σχέση 2 2x ys sβ= ⋅ και οι τυπικές αποκλίσεις με τη σχέση

.

sy xsβ= ⋅

Page 41: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 41 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

2. Ένα δείγμα τιμών μιας μεταβλητής θα είναι ομοιογενές, όταν ο συντελεστής με-ταβολής CV δεν ξεπερνά το 10%. 3. Ο συντελεστής μεταβολής CV δεν ενδείκνυται στην περίπτωση που η μέση τιμή εί-ναι κοντά στο μηδέν. Παρατηρήσεις 1. Οι τρεις δείκτες κεντρικής τάσης, μέση τιμή, διάμεσος και επικρατούσα τιμή δεν είναι τελείως άσχετες μεταξύ τους αλλά βρίσκονται σε στενή αλληλεξάρτηση. Η σχέση αυτή καθορίζεται αναλόγως με τη μορφή της κατανομής. Αν η κατανομή είναι συμμετρική (σχήμα α) οι τρεις δείκτες συμπίπτουν. Αν η καμπύλη έχει τη μορφή του διαγράμματος (β) παρουσιάζει ουρά προς τα δεξιά, ή είναι ασύμμε-τρη αριστερά, τότε η μέση τιμή απομακρύνεται από το κέντρο της κατανομής με κα-τεύθυνση την ουρά της κατανομής. Τέλος, αν η καμπύλη έχει τη μορφή του δια-γράμματος (γ) παρουσιάζει ουρά προς τα αριστερά ή είναι ασύμμετρη δεξιά, τότε η μέ-ση τιμή απομακρύνεται από το κέντρο της κατανομής με κατεύθυνση την ουρά της κα-τανομής. Συμπερασματικά, η κατανομή είναι ασύμμετρη προς τα δεξιά, αν η μέση τιμή εί-ναι μικρότερη από τη διάμεσο, ενώ είναι ασύμμετρη αριστερά, αν η μέση τιμή εί-ναι μεγαλύτερη από τη διάμεσο. 2. Από τους δείκτες, επικρατούσα τιμή Μο, διάμεσος δ και μέση τιμή x που περιγράψαμε παραπάνω ο καθένας τους δίνει διαφορετικές πληροφορίες. Έτσι αν ο ερευνητής επιθυμεί να καταδείξει την πιθανότερη τιμή της κατανομής θα προτιμήσει την επικρατούσα τιμή Μο, αν θέλει να αναφέρει την κεντρικότερη τιμή της κατανομής θα πρέπει να πάρει τη διάμεσο δ, ενώ αν θέλει να αναφέρει το σημείο ισορ-ροπίας της κατανομής καταλληλότερος είναι ο δείκτης της μέσης τιμής χ . Επειδή λοι-πόν οι τρεις αυτοί ομοειδείς δείκτες καταδεικνύουν την εικόνα της κεντρικής τάσης των τιμών μιας ομάδας δεδομένων, υπολογίζονται από τον ερευνητή και οι τρεις και ανα-λόγως χρησιμοποιείται ο δείκτης που αποδίδει πιο πιστά τα δεδομένα. Για παράδειγμα, έστω ότι η βαθμολογία δύο μαθητών στα 14 μαθήματα της τάξης τους έδωσε τους εξής κεντρικούς δείκτες:

Page 42: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Μάθημα Μαθητής Α Μαθητής Β Μέση τιμή χ 15 15 Διάμεσος δ 15 13 Επικρατούσα τιμή Μο

15 11

Επειδή οι μαθητές Α και Β έχουν τον ίδιο μέσο όρο βαθμολογίας δεν σημαίνει ότι έχουν και την ίδια μαθησιακή απόδοση. Για το μαθητή Β, όπως φαίνεται η κατανομή είναι ασύμμετρη και η μέση επίδοση του εκφράζεται καλύτερα από τη διάμεσο δ = 13.

Παράδειγμα (30) Δυο δείγματα παρουσιάζουν μέση τιμή 5X = και 8X ′ = και τυπικές αποκλίσεις

120s = και . Ποιο δείγμα παρουσιάζει την μεγαλύτερη ομοιογένεια; 120s′ = Λύση Για το 1ο δείγμα , ο συντελεστής μεταβλητότητας είναι ίσος με:

CV 120 100% 24%5

sX

= = ⋅ =

42 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

ενώ για το 2ο δείγμα, είναι ίσος με :

CV΄ 150 100% 18.75%8

sX′

= = ⋅ =′

Επειδή CV΄<CV,το 2ο δείγμα παρουσιάζει μεγαλύτερη ομοιογένεια.

Παράδειγμα (31)

Σε μια ερεύνα που έγινε στους μαθητές μιας πόλης για το χρόνο που χρειάζονται να πάνε από το σπίτι στο σχολείο διαπιστώθηκε ότι το 16% περίπου των μαθητών χρειάζεται λιγότερο από 6 λεπτά , ενώ το 2,5% περίπου χρειάζεται περισσότερο από 12 λεπτά .Υποθέτουμε άτι η κατανομή του χρόνου είναι κατά προσέγγιση κανονική. α. Να βρεθεί ο μέσος χρόνος διαδρομής των μαθητών καθώς και η τυπική από-κλιση του χρόνου. β. Να εξετάσει αν το δείγμα είναι ομοιογενές . γ. Αν οι μαθητές της πόλης είναι 3500 , πόσοι μαθητές χρειάζονται χρόνο από 6 έως 10 λεπτά; δ. Μια μέρα , λογά έργων στον κεντρικό δρόμο της πόλης , κάθε μαθητής καθυ-στέρησε κατά 3 λεπτά .Να βρεθεί πόσο μεταβάλλεται ο συντελεστής μεταβολής CV.

Page 43: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr 43 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Λύση α. Είναι γνωστό ότι το 68% περίπου των παρατηρήσεων βρί-σκεται στο διάστημα : ),( sxsx +− Επειδή το 16% των μαθητών χρειάζεται χρόνο λιγότερο από 6 λεπτά είναι : 6(1)x s− = Επίσης το 95 % των παρατηρήσεων βρίσκεται στο διάστημα )2,2( sxsx +− αφού το 2.5% χρειάζε-ται χρόνο περισσότερο από 12 λεπτά θα ισχύει: 2 12(2)x s+ = Λύνοντας το σύστημα των (1) , (2)

2 126

x sx s+ =− =

βρίσκουμε ότι s=2 και 8x =

β. Είναι : CV 2100 100 25%8

sX

= = ⋅ =

Άρα το δείγμα δεν είναι ομοιογενές . γ. Επειδή :

8 2 6x s− = − = και 8 2 10x s+ = + = οι μαθητές που χρειάζονται χρόνο από 6 έως 10 λεπτά είναι περίπου το 68% του συ-νόλου των μαθητών Δηλαδή:

683500 2380100

= μαθητές .

δ. Αν 1 2, ,.....,y y yν είναι οι παρατηρήσεις που προκύπτουν αν προσθέσουμε σε κάθε μια από τις 1 2, ,....., νχ χ χ την σταθερά 3 τότε :

3 8 3 11y x= + = + = και 2x yS S= =

Άρα ο νέος συντελεστής μεταβολής είναι : CV΄ 2 100 18.18%11

sX′

= = ⋅′

δηλαδή ο συντελεστής μειώθηκε κατά 25 – 18,18=6,82% περίπου . Παράδειγμα (32) Μια εταιρεία πετρελαιοειδών αύξησε την τιμή του λίτρου της βενζίνης , που πλη-ρώνουν οι καταναλωτές της κατά την διάρκεια των 10 τελευταίων ημερών .Στον παρακάτω πίνακα φαίνεται η τιμή του λίτρου της βενζίνης σε ευρώ καθώς και ο αριθμός των αγοραστών Τιμή σε ευρώ 0.68-0.70 0.70-0.72 0.72-0.74 0.74-0.76 0.76-0.78 Καταναλωτές 41 65 72 51 28 Να βρεθούν α) το ποσοστό των καταναλωτών που πληρώνουν το λίτρο βενζίνης λιγότερο από 0.74 ευρώ

x s x s x s x x s x s x s− − − + + +3 2 2 3

99,7%95%68%

s s

Page 44: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

β) την μέση τιμή της βενζίνης γ) την διάμεσο τιμή δ.Το ποσοστό των καταναλωτών που πληρώνουν την βενζίνη πάνω από 0.762 ευ-ρώ Λύση Από τον παραπάνω πίνακα , προκύπτει ο πίνακας συχνοτήτων Κλάσης Κέντρο κλάσης iν %if %iF

[ )0.68,0.70 0.69 41 16 16

[ )0.70,0.72 0.71 65 25 41

[ )0.72,0.74 0.73 72 28 69

[ )0.74,0.76 0.75 51 20 89

[ ]0.76,0.78 0.77 28 11 100 Σύνολο 257 α. Από τον πίνακα συχνοτήτων και συγκεκριμένα από την σχετική αθροιστική συχνό-τητα , έχουμε ότι το ποσοστό των καταναλωτών με τιμή μικρότερη των 0.74 ευρώ είναι 69%. β. Η μέση τιμή είναι :

41 0.69 65 0.71 72 0.73 51 0.75 28 0.77 186.81 0.73257 257

x ⋅ + ⋅ + ⋅ + ⋅ + ⋅= =

γ. Κατασκευάζουμε το διπλανό ιστόγραμμα αθροιστικών συχνοτήτων .Από τα τρίγω-να ΑΔΕ και ΑΒΓ , αν ΔΕ=χ , έχουμε:

9 28 0.18 0.0060.02 28χ χ χΔΕ ΑΔ

= ⇔ = ⇔ = ⇔ΒΓ ΑΒ

Άρα η διάμεσος είναι : δ=0.72 + 0.006 = 0.726 δ. Πάνω από 0.762 ευρώ , το ποσοστό των καταναλωτών είναι : 18 11 0.198%

100⋅ =

αφού το πλάτος της κλάσης είναι 0.02 και θέλου-με από 0.762 έως 0.780.

44 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Page 45: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Παράδειγμα (33) Σε ένα δείγμα μεγέθους 20 μιας μεταβλητής Χ έχουμε :

100it =∑ και 2 1000it =∑Έστω δείγμα του ιδίου μεγέθους μιας μεταβλητής Y , που συνδέεσαι με το Χ με την σχέση .Να υπολογιστεί η μέση τιμή και η τυπική απόκλιση κάθε μεταβλητής .

2Y X= + 5

Λύση

Έχουμε : 100 520 20

itx = = =∑

45 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Είναι:

2

12 2

1

1 1 10000100020 20 20

1 5001000 500 2520 20

ii

x ii

tS t

ν

ν

ν=

=

⎧ ⎫⎛ ⎞⎪ ⎪⎜ ⎟⎪ ⎪ ⎧ ⎫⎝ ⎠= − = − =⎨ ⎬ ⎨ ⎬

⎩ ⎭⎪ ⎪⎪ ⎪⎩ ⎭

− = =

∑∑

5= +

Οπότε 5xS =

Επειδή Y X . έχουμε : 2 2 5 10 5 1y x= + = + = 5

0

Για την τυπική απόκλιση 2 2 5 1y xS S= = ⋅ =

ΛΥΜΕΝΕΣ ΑΣΚΗΣΕΙΣ 1. Στο παρακάτω κυκλικό διάγραμμα φαίνεται το ποσοστό των μαθητών που έρ-χεται στο σχολείο με το συγκεκριμένο μεταφορικό μέσο. Αν το δείγμα αφορά 720 μαθητές, να βρεθεί:

i. Αν το χαρακτηριστικό που μελετάμε αποτελεί ποιοτική ή ποσοτική μεταβλητή

ii. Οι συχνότητες εμφάνισης του κάθε μεταφορικού μέσου

Λύση

i. Ο τρόπος μεταβίβασης στο σχολείο αποτελεί ποιοτική μεταβλητή ii. Είναι γνωστό ότι οι συχνότητες vi και οι σχετικές συχνότητες fi συνδέονται με τη

σχέση 100%iivfv

= ⋅ , όπου ν το πλήθος των στοιχείων του δείγματος.

Αν Y aX β= + , τότε : y xα β= + και

y xS Sα=

Page 46: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Με αυτοκίνητο μετακινούνται ν1 μαθητές, για τους οποίους ισχύει 1 1

1 125100% 720 180

100 100v ff v vv

= ⋅ ⇔ = ⋅ = ⋅ = μαθητές.

Με μοτοσικλέτα μετακινούνται ν2 μαθητές, για τους οποίους ισχύει 2 2

2 215100% 720 108

100 100v ff v vv

= ⋅ ⇔ = ⋅ = ⋅ = μαθητές.

Με ποδήλατο μετακινούνται ν3 μαθητές, για τους οποίους ισχύει 3 3

3 330100% 720 216

100 100v ff v vv

= ⋅ ⇔ = ⋅ = ⋅ = μαθητές.

Πεζοί μετακινούνται ν4 μαθητές, για τους οποίους ισχύει: =720-180-108-216=216 μαθητές

4 1 2v v v v v= − − − 3

2. Δίνεται ο παρακάτω πίνακας τιμών της μεταβλητής Χ.

46 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

i xi vi i ix v⋅ 1 210 2 20 60 3 4 4 40 6

Σύνολο 100 20 Να συμπληρώσετε τον πίνακα και να βρείτε τη μέση τιμή των xi

Λύση Είναι 2 2 2 260 20 60 3x v v v⋅ = ⇔ ⋅ = ⇔ =

1 2 3 4 120 3 4 6 20v v v v v+ + + = ⇔ + + + =Επίσης 1 113 60 20 13v v⇔ + = ⇔ = − 1 7v⇔ =

Όμως 1 1 1 1 1210210 7 210 307

x v x x x⋅ = ⇔ ⋅ = ⇔ = ⇔ =

Δίνεται ακόμα ότι 1 2 3 4 3100 30 20 40 100x x x x x+ + + = ⇔ + + + =

3 3 390 100 100 90 10x x x⇔ + = ⇔ = − ⇔ = Επομένως, ο πίνακας γίνεται:

i xi vi i ix v⋅ 1 30 7 210 2 20 3 60 3 10 4 40 4 40 6 240

Σύνολο 100 20 550

Η μέση τιμή είναι 1 1 2 2 3 3 4 4 210 60 40 24020

x v x v x v x vXv

⋅ + ⋅ + ⋅ + ⋅ + + += = =

= 550 27,520

=

Page 47: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

3. Οι επιδόσεις 50 υποψηφίων για την εγγραφή τους σε μια ιδιωτική σχολή ήταν:

6, 7, 8, 9, 5, 1, 4, 7, 3, 9, 2, 5, 3, 8, 6, 7, 7, 6, 8, 1 3, 0, 1, 4, 9, 0, 9, 7, 8, 6, 1, 2, 3, 4, 5, 4, 6, 6, 4, 3 2, 8, 8, 7, 7, 6, 5, 5, 9, 2 I.Κατασκευάστε τον πίνακα με vi, Ni, fi%, Fi%

II.Πόσοι μαθητές έγραψαν α) το πολύ 5; β) κάτω από 5; γ) τουλάχιστον5;

III.Υπολογίστε τις παραμέτρους θέσης IV.Η σχολή αποφάσισε να πάρει το 36% των υποψηφίων. Τι βαθμό πρέπει να έχει γράψει κάποιος για να περάσει;

Λύση

I. Ο πίνακας κατασκευάζεται κατά τα γνωστά

47 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Βαθμός xi

Συχνότητα vi

Αθροιστική Συχνότητα Ni

Σχετική Συ-χνότητα fi%

Σχετ. Αθροιστ. Συχνότητα Fi%

0 2 2 4 4 1 4 6 8 12 2 4 10 8 20 3 5 15 10 30 4 5 20 10 40 5 5 25 10 50 6 7 32 14 64 7 7 39 14 78 8 6 45 12 90 9 5 50 10 100

Άθροισμα 50 100

II. Η έκφραση «το πολύ 5» σημαίνει «από 0 ως 5 μαθητές». Επειδή χ6=5 και Ν6=25, η απάντηση είναι 25 μαθητές «Κάτω από 5» σημαίνει «από 0 ως και 4». Επειδή χ5=5 και Ν5=20, η απάντηση εί-ναι 20 μαθητές «Τουλάχιστον 5» σημαίνει «5 και παραπάνω». Επειδή

6 7 8 9 10 5 7 7 6 5 30,v v v v v+ + + + = + + + + = , η απάντηση είναι 30 μαθητές

III. Για τη μέση τιμή έχουμε: = x−

vxvxvxv vv ⋅++⋅+⋅ ......2211

= 0 4 8 15 20 25 42 49 48 45 256 5,1250 50

+ + + + + + + + += =

Page 48: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Από τον πίνακα προκύπτει ότι υπάρχουν 2 επικρατούσες τιμές, το 6 και το 7 (έχουν τη μεγαλύτερη συχνότητα)

Για τη διάμεσο έχουμε 225 262

ηδ+

= παρατήρηση, δηλαδή 5 6 5,52

δ += =

IV. Προφανώς, η σχολή θα δεχθεί τους μαθητές με τις καλύτερες επιδόσεις. Το 10% έγραψε 9, το 12% έγραψε 8 και το 14% έγραψε 7.

V. Έτσι, το 10+12+14=36% έγραψε 7 και περισσότερο, οπότε για να εγγραφεί κάποιος στη σχολή πρέπει να έχει βαθμό τουλάχιστον 7.

4. Να αποδειχθεί ότι η μέση τιμή των τιμών χ1, χ2, …χκ μιας μεταβλητής χ, με συ-χνότητες ν1, ν2,… νκ και σχετικές συχνότητες f1, f2,… fκ αντίστοιχα, είναι ίση με το άθροισμα των γινομένων των τιμών της μεταβλητής επί τις αντίστοιχες σχε-τικές συχνότητες Ο παρακάτω πίνακας δίνει τη σχετική συχνότητα fi% των τιμών xi μιας μετα-βλητής Χ με μέση τιμή 5,06.

xi 2 4 6 8 fi% 15 22 a) Να συμπληρωθεί ο πίνακας b) Να βρεθεί η επικρατούσα τιμή και το εύρος των τιμών χι

Λύση Αν χ1, χ2, …χκ οι τιμές της μεταβλητής χ, ν1, ν2,… νκ οι συχνότητες και f1, f2,… fκ

1 1 2 2

1 2 3 4 5

.......X κ κν χ ν χ ν χν ν ν ν ν+ + +

=+ + + +

Οι σχετικές συχνότητές τους, τότε είναι: =

48 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

1 1 2 2 1 21 2

....... ... kkvv vx x x

v vκ κν

vχ ν χ ν χ

ν+ + +

= + + + 1 1 2 2 ... k k= x f x f x f+ + +

Επομένως, η μέση τιμή είναι ίση με το άθροισμα των γινομένων των τιμών της με-ταβλητής επί τις αντίστοιχες σχετικές συχνότητες.

a) Έστω χ,y οι ζητούμενες σχετικές συχνότητες. Τότε ισχύει (1) 0,15 0,22 1 1 0,15 0,22 0,63x y x y x y+ + + = ⇔ + = − − ⇔ + =

Επιπλέον, για τη μέση τιμή θα ισχύει 1 1 2 2 ... k kX x f x f x f= + + + 2 0,15 4 6 0,22 8 5,06 0,3 4 1,32 8X x y x⇔ = ⋅ + + ⋅ + ⇔ = + + + y

(2) 4 8 5,06 0,3 1,32 4 8 3,44 2 0,86x y x y x y⇔ + = − − ⇔ + = ⇔ + = Οι (1), (2) δίνουν το σύστημα:

και με πρόσθεση κατά μέλη, έχουμε: 0,63 0,63

2 0,86 2 0,86x y x yx y x y+ = − − = −⎧ ⎧

⇔⎨ ⎨+ = + =⎩ ⎩

0,63 0,4

0,23 0,23x y xy y+ = =⎧ ⎧

⇔⎨ ⎨= =⎩ ⎩ Επομένως, ο πίνακας γίνεται

xi 2 4 6 8 fi% 15 40 22 23

Page 49: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

b) Όπως φαίνεται από τον πίνακα, επικρατούσα τιμή είναι το χ=4 γιατί παρου-σιάζει τη μεγαλύτερη σχετική συχνότητα fi%, άρα θα παρουσιάζει και τη με-γαλύτερη απόκλιση Το εύρος των τιμών είναι 8 2 6R = − =

5. Μια ομάδα μπάσκετ διαθέτει 9 παίκτες με μέσο ύψος 1,90m.

i. Για να «ψηλώσει» την ομάδα ο προπονητής πήρε έναν ακόμα παίκτη με ύψος 2,10m. Ποιο είναι τώρα το μέσο ύψος της ομάδας;

ii. Αν ήθελε να ψηλώσει την ομάδα στα 1,93m, πόσο ύψος έπρεπε να είχε ο παί-κτης που πήρε;

iii. Αν ο προπονητής διατηρούσε σε 9 τον αριθμό των παικτών και έδιωχνε δυο παίκτες με ύψος 1,85m ενώ έπαιρνε δυο παίκτες με ύψη 2m και 2,08m αντίστοι-χα, ποιο θα γινόταν τότε το μέσο ύψος της ομάδας;

Λύση

i. Επειδή με τους 9 παίκτες η ομάδα έχει μέσο ύψος 1,90m, θα είναι 1,90X m= 1 2 9

1 2 9.... 1,90 ... 17,1

9x x x x x x+ + +

⇔ = ⇔ + + + = (1)

49 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Όταν προστεθεί ένας ακόμα παίκτης με ύψος 2,10m το μέσο ύψος της ομάδας θα

γίνει 1 2 9.... 2,10 17,1 2,10 19,2 1,929 1 10 10

x x xX + + + + += = = =

+

ii. Για να ψηλώσει η ομάδα στα 1,93m, θα έπρεπε ο νέος παίκτης να έχει ύψος χ τέ-τοιο ώστε η νέα μέση τιμή να γίνει 1,93X m= . Έτσι, έχουμε

1 2 9.... 17,11,93 19,3 17,19 1 10

x x x x xX x+ + + + += ⇔ = ⇔

+19,3 17,1 2,2x x= + ⇔ = − ⇔ =

Δηλαδή, ο νέος παίκτης θα έπρεπε να είχε ύψος 2,20m iii. Όταν φύγουν 2 παίκτες με ύψος 1,85m και έρθουν δυο νέοι παίκτες με ύψος 2m

και 2,08m αντίστοιχα, τότε οι παίκτες θα παραμείνουν 9 και το άθροισμα των υψών τους θα είναι ίσο με 1 2 9.... 2 1,85 2 2,08 17,1 3,7 4,08x x x+ + + − ⋅ + + = − + =17,48

Τότε, το μέσο ύψος της ομάδας, γίνεται 17,48 1,949

X m= =

Page 50: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

6. Ποια παράμετρος θέσης περιγράφει πιο αξιόπιστα τις τιμές της μεταβλητής, με ιστόγραμμα συχνοτήτων καθένα από τα παρακάτω ιστογράμματα;

Λύση

50 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

α) Στο ιστόγραμμα (I), η διάμεσος περιγράφει πιο αξιόπιστα τις τιμές της μεταβλητής , αφού η κατανομή παρουσιάζει ακραίες τιμές , χωρίς να υπάρχει επιπλέον μια μόνο τιμή που να επικρατεί απόλυτα . β) Στο ιστόγραμμα (I I), η μέση τιμή περιγράφει πιο αξιόπιστα τις τιμές της μεταβλη-τής, μιας και παρουσιάζεται μια συγκέντρωση των τιμών γύρω από την μεσαία τιμή. γ)Στο ιστόγραμμα (I I I), η επικρατούσα τιμή περιγράφει πιο αξιόπιστα τις τιμές της μεταβλητής , εφόσον η επικρατούσα τιμή χ7 επικρατεί με διάφορα όλων των άλλων τι-μών. 7. Οι εργάτες του εργοστασίου μιας εταιρίας, έχουν τις παρακάτω ηλικίες:

30 21 32 18 35 43 47 48 22 28 46 25 58 25 34 43 52 56 55 48 30 32 33 32 38 28 27 27 35 34 35 36 40 42 41 35 31 40 41 39 50 37 51 34 51 29 54 37 20 43

i. Να ομαδοποιηθούν οι ηλικίες των εργατών σε 5 ομάδες ii. Να κατασκευαστεί το ιστόγραμμα συχνοτήτων

iii. Να βρεθεί η μέση τιμή των ηλικιών των εργατών του εργοστασίου iv. Την επόμενη χρονιά 8 από τους εργάτες μετατίθενται σε ένα άλλο εργοστάσιο

της εταιρίας. Οι ηλικίες των εργατών αυτών είναι: 35, 43, 47μ 48, 50, 51, 54 και 55. Για την αναπλήρωση της θέσης προσλαμβάνονται 5 νέοι εργάτες με ηλικί-ες: 32, 38, 39, 41, 42.

a. Να κατασκευαστεί το νέο ιστόγραμμα συχνοτήτων που προέκυψε μετά την αποχώρηση των 8 παλαιών εργατών και την πρόσληψη των 5 νέων εργατών

b. Να βρεθεί η νέα μέση τιμή των ηλικιών των εργατών και να εξεταστεί αν η μέση ηλικία των εργατών έχει μειωθεί ή έχει αυξηθεί

Page 51: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Λύση i. Η μικρότερη ηλικία είναι 18 και η μεγαλύτερη 58. Επειδή θέλουμε να δημιουργή-

σουμε 5 ομάδες, το πλάτος της κάθε μιας θα είναι: 58 18 40 85 5−

= = . Επομένως, οι

ομάδες είναι οι: [18,26), [26,34), [34,42), [42,50), [50,58]. ii. Ο πίνακας συχνοτήτων είναι ο παρακάτω:

Ηλικία Συχνότητα vi

[18,26) 6 [26,34) 12 [34,42) 16 [42,50) 8 [50,58] 8 Σύνολο 50

Το ιστόγραμμα συχνοτήτων είναι:

51 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

iii. Για να βρούμε τη μέση τιμή, χρειαζόμαστε την κεντρική τιμή της κάθε κλάσης χi και τα γινόμενα i ix v⋅

Ηλικία Κεντρική τιμή κλάσης xi

Συχνότητα vi

i ix v⋅

[18,26) 22 6 132 [26,34) 30 12 360 [34,42) 38 16 608 [42,50) 46 8 368 [50,58] 54 8 432 Σύνολο 50 1900

Η μέση τιμή των ηλικιών είναι: 1 1 2 2 3 3 4 4 5 5x v x v x v x v x vXv

⋅ + ⋅ + ⋅ + ⋅ + ⋅= =

132 360 608 368 432 1900 3850 50

+ + + += =

iv. Μετά την αποχώρηση των 8 εργατών και την πρόσληψη των 5 νέων, μεταβάλλεται η συχνότητα της κάθε ομάδας

Page 52: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

a. Η νέα κατανομή συχνοτήτων φαίνεται στον πίνακα: Ηλικία Κεντρική τιμή

κλάσης xi

Συχνότητα vi

i ix v⋅

[18,26) 22 6 132 [26,34) 30 13 390 [34,42) 38 18 684 [42,50) 46 6 276 [50,58] 54 4 216 Σύνολο 47 1698

b. Η νέα μέση τιμή είναι: ' 1698 36,1247

X = =

Επειδή ισχύει: 'X X< , συμπεραίνουμε ότι η μέση ηλικία των εργατών έχει μει-ωθεί

8. Στο παρακάτω σχήμα δίνεται το πολύγωνο των αθροιστικών συχνοτήτων των μισθών σε € των 80 υπαλλήλων μιας εταιρίας

52 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

i. Να συμπληρωθεί ένας πίνακας συχνοτήτων, σχετικών συχνοτήτων και αθροιστικών σχετικών συχνοτήτων

ii. Να σχεδιαστεί το ιστόγραμμα και το πολύγωνο αθροιστικών σχετικών συχνοτήτων

iii. Να βρεθεί η διάμεσος των παρατηρήσεων και να συγκριθεί με τη μέση τιμή τους

Λύση

i. Σύμφωνα με το πολύγωνο αθροιστικών συχνοτήτων έχουμε: • Από 1500 μέχρι 1700€ παίρνουν 10 υπάλληλοι • Από 1700 μέχρι 1900€ παίρνουν 30-10=20 υπάλληλοι • Από 1900 μέχρι 2100€ παίρνουν 40-30=10 υπάλληλοι • Από 2100 μέχρι 2300€ παίρνουν 60-40=20 υπάλληλοι • Από 2300 μέχρι 2500€ παίρνουν 70-60=10 υπάλληλοι • Από 2500 μέχρι 2700€ παίρνουν 80-70=10 υπάλληλοι

Μισθοί € Συχνότητα

vi

Σχετική Συ-χνότητα fi

Αθροιστική Σχε-τική Συχνότητα

Fi

[1500,1700) 10 0,125 0,125 [1700,1900) 20 0,25 0,375 [1900,2100) 10 0,125 0,5 [2100,2300) 20 0,25 0,75 [2300,2500) 10 0,125 0,875 [2500,2700) 10 0,125 1

Page 53: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Σύνολο 80 1

ii. Το ιστόγραμμα και το πολύγωνο αθροιστικών σχετικών συχνοτήτων είναι:

iii. Όπως φαίνεται και από το πολύγωνο των αθροιστικών σχετικών συχνοτήτων, η

διάμεσος των παρατηρήσεων είναι δ=2100.

53 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Για να βρούμε τη μέση τιμή των παρατηρήσεων, πρέπει να υπολογίσουμε την κεντρική τιμή xi της κάθε κλάσης και το γινόμενο i ix v⋅ . Τότε ο πίνακας γίνεται: Μισθοί € Κεντρική

τιμή χi

Συχνότητα vi i ix v⋅

[1500,1700) 1600 10 16000 [1700,1900) 1800 20 36000 [1900,2100) 2000 10 20000 [2100,2300) 2200 20 44000 [2300,2500) 2400 10 24000 [2500,2700) 2600 10 26000 Σύνολο 80 166000

Η μέση τιμή των παρατηρήσεων είναι 166000 207580

X = = .

Επομένως, έχουμε Xδ >

Page 54: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

9. Οι βαθμοί 11 μαθητών μιας τάξης ενός ΤΕΕ στα Μαθηματικά είναι:

12, 12, 09, 15, 12, 16, 17, 07, 19, 18, 17 i. Να κατασκευάσετε τον πίνακα συχνοτήτων

ii. Να βρείτε τη μέση τιμή iii. Να βρείτε την επικρατούσα τιμή iv. Να βρείτε τη διάμεσο v. Να βρείτε την τυπική απόκλιση

Λύση i.

xi vi i ix v⋅ 7 1 7 9 1 9 12 3 36 15 1 15 16 1 16 17 2 34 18 1 18 19 1 19

Σύνολο 11 154

54 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

ii. Είναι 1 1 2 2 ...... 154 1411

k kx v x v x vXv

⋅ + ⋅ + ⋅= = =

iii. Η επικρατούσα τιμή είναι Μ0=12 iv. Η διάμεσος είναι η 6η παρατήρηση. Από τον πίνακα των αθροιστικών συχνοτή-

των Νi φαίνεται ότι η 6η παρατήρηση αντιστοιχεί στην τιμή 15. Άρα η διάμεσος είναι δ=15

v. Είναι

s=2 2

2 1 1 2 2( ) ( ) ... ( )X X Xs κ κν χ ν χ ν χν

− + − + + −=

2

=

( ) ( ) ( )2 2 22 2 21 (14 7) 1 (14 9) 3 14 12 1 14 15 ..... 1 14 18 1 (14 19)11

⋅ − + ⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ −=

13,64 3,7

Page 55: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

10. Ο παρακάτω πίνακας παρουσιάζει την κατανομή των ηλικιών των 100 κατοί-κων μιας μικρής κοινότητας

Ηλικία [0,10) [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) [70,80)

Συχνότητα 14 18 …. ….. 10 8 4 7 Αν η μέση ηλικία των κατοίκων είναι 33 χρόνια, να βρείτε:

i. Τις συχνότητες που έχουν σβηστεί ii. Την τυπική απόκλιση των ηλικιών

Λύση

i. Έστω α, β οι συχνότητες που δεν ξέρουμε. Τότε Ηλικία

(κέντρο κλά-σης)

5 15 25 35 45 55 65 75

Συχνότητα 14 18 α β 10 8 4 7 • Το άθροισμα των συχνοτήτων είναι: 14+18+α+β+10+8+4+7=100, οπότε α+β=39 (1)

• Η μέση τιμή των ηλικιών είναι 1 1 2 2 ...... k kx v x v x vXv

⋅ + ⋅ + ⋅=

55 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

14 5 18 15 25 35 10 45 8 55 4 65 7 7533100

α β⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅⇔ =

3300 2015 25 35 25 35 1285 5 7 257a aβ β α β⇔ = + + ⇔ + = ⇔ + = (2) Από το σύστημα των (1) και (2), βρίσκουμέ ότια=8 και β=31

ii. Έχουμε, τώρα, τον πίνακα: Ηλικία

xi

5 15 25 35 45 55 65 75

Συχνότητα 14 18 8 31 10 8 4 7

Η διακύμανση είναι s2 = v

xxvxxvxxv vv

22

22

2

11 ... ⎟⎠⎞

⎜⎝⎛ −⋅++⎟

⎠⎞

⎜⎝⎛ −⋅+⎟

⎠⎞

⎜⎝⎛ −⋅

−−−

( ) ( ) ( ) ( ) ( )2 2 2 22 14 33 5 18 33 15 13 33 25 .... 4 33 65 7 33 75

100s

⋅ − + ⋅ − + ⋅ − + + ⋅ − + ⋅ −=

2

=

14 784 18 324 13 64 26 4 10 144 8 484 4 1024 7 1764100

⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ + ⋅ = 39448100

=394,48

Η τυπική απόκλιση είναι 2 394,48 19,9s s= = χρόνια

Page 56: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

ΧΡΗΣΙΜΟΙ ΤΥΠΟΙ

56 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Τιμές : 1 2, ,...., kx x x :

1 1 2 2 ....x x xx κ κν ν νν

+ + +=

1

k

i iix

ν==∑

Σχετικές συχνότητες : 1 2, ,...., kf f f :

1

k

i ii

x x f=

=∑

Παρατηρήσεις : 1 2, ,....,t t tν :

1 2 ....t t tx ν

ν+ + +

=

1i

it

x

ν

ν=∑

=

Σταθμικός μέσος : 1 2, ,....,t t tν :

1 1 2 2

1 2

........

x w x w x wxw w w

ν ν

ν

+ + += + + +

1

1

i ii

ii

x wx

w

ν

ν=

=

∑= 1 2, ,....,x x xν : Τιμές

1 2, ,....,w w wν : Συντελεστές Στάθμισης

Τυπική απόκλιση 2ss =

Παρατηρήσεις : t t1 2, ,....,

Όταν έχουμε πίνακα συχνοτήτων η ομαδοποιημένα δεδομένα τότε :

∑=

−=κ

iii νxx

νs

1

22 )(1

.11

2

122

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

⎧⎟⎠⎞

⎜⎝⎛

−= ∑∑

=

i

κ

iii

ii v

vxvx

vs

tν τότε η δι-ακύμανση είναι : 2s

2 2 22 1 2 1

(( ) ( ) ... ( )

v

iv i

t xt x t x t xs

v v=

−− + − + + −

= =∑

∑=

−=ν

ii xt

νs

1

22 )(1

⎪⎪⎭

⎪⎪⎬

⎪⎪⎩

⎪⎪⎨

⎧⎟⎠⎞

⎜⎝⎛

−= ∑∑

=

i

ν

ii

i ν

tt

νs

1

2

122 1 Συντελεστής μεταβολής

sCVx

=

Page 57: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

Αξίζει να σημειωθεί ότι αν η καμπύλη συχνοτήτων για το χαρακτηριστικό που εξετάζουμε είναι κανονική ή περίπου κανονική, τότε η τυπική απόκλιση s έχει τις παρακάτω ιδιότητες: i) το 68% περίπου των παρατηρήσεων βρίσκεται στο διάστημα

x s x s x s x x s x s x s− − − + + +3 2 2 3

99,7% 95% 68%

s s

),( sxsx +−

ii) το 95% περίπου των παρατηρήσεων βρίσκεται στο διάστημα

)2,2( sxsx +−

iii) το 99,7% περίπου των παρατηρήσεων βρίσκεται στο διάστημα )3,3( sxsx +−

iv) το εύρος ισούται περίπου με έξι τυπικές αποκλίσεις, δηλαδή sR 6≈ .

57 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

ΧΡΗΣΙΜΟΙ ΜΕΤΑΣΧΗΜΑΤΙΣΜΟΙ ΒΑΣΙΚΩΝ ΜΕΤΡΩΝ

Έστω 1 2, ,...... νχ χ χ οι παρατηρήσεις ενός δείγματος με μέση τιμή x , διάμεσο χδ , επικρατούσα τιμή

χΜ ,τυπική απόκλιση Sχ και συντελεστή μεταβολής xCV .Αν πολλαπλασιάσουμε καθεμιά από τις

παραπάνω παρατηρήσεις με τον μη μηδενικό αριθμό α και στην συνεχεία προσθέσουμε τον σταθε-ρό αριθμό β , προκύπτουν οι παρατηρήσεις , 1, 2,3,....i iy a iχ β ν= + = .Ο παρακάτω πίνακας μας πλη-

ροφορεί για την μέση τιμή y , διάμεσο yδ , επικρατούσα τιμή yΜ ,τυπική απόκλιση και συντε-

λεστή μεταβολής . των τιμών

yS

yCV , 1, 2,3,....iy i ν= ως συνάρτηση των x , χδ , χΜ , Sχ , xCV .

ΜΕΤΡΑ iχ i iy aχ β= +

ΜΕΣΗ ΤΙΜΗ x y aχ β= + ΔΙΑΜΕΣΟΣ

χδ y xaδ δ β= +

ΕΠΙΚΡΑΤΟΥΣΑ ΤΙΜΗ y xM aM β= + χΜ

ΤΥΠΙΚΗ ΑΠΟΚΛΙΣΗ Sχ y xS a S=

y xy

S a SCV

y aχ β= =

+xCVΣΥΝΤΕΛΕΣΤΗΣ ΜΕΤΑΒΟ-

ΛΗΣ

Page 58: c Lyk Math Gen Statistikh Drougas

ΣΤΑΤΙΣΤΙΚΗ

www.praxisgroup.gr

ΒΙΒΛΙΟΓΡΑΦΙΑ Μαθηματικά Γενικής Παιδείας Στεργιου – Νακης Μαθηματικά Γενικής Παιδείας Τζουβαρας –Τζιρωνης Μαθηματικά Γενικής Παιδείας Α.Χ.Μπαρλας Μαθηματικά Γενικής Παιδείας Ξενος .Θ Μαθηματικά Γενικής Παιδείας Κωστογιαννος –Μπακος Μαθηματικά Γενικής Παιδείας Τραγανιτης Μαθηματικά Γενικής Παιδείας Μετης –Καβαδιας –Ευσταθοπουλος Στατιστική Γεωργακουδης –Γιαλαμας -Δικαρος -Κοκλα Γενικά θέματα Αθανασοπουλος Θέματα εξετάσεων Μπακαλακος Θέματα Μαθηματικών Τουμασης –Τσαπακιδης Θέματα Μαθηματικών Γκατζουλης –Ζανταριδης Επαναληπτικά θέματα Μαθηματικών Μουταφιδης –Χαλίφης Πιθανότητες Καζαντζης Πιθανότητες Κουνιας – Μωυσιαδης Περιοδική έκδοση το φ Περιοδική έκδοση Ευκλείδης

58 ΔΡΟΥΓΑΣ ΑΘΑΝΑΣΙΟΣ

Το σπασμένο ζάρι Ivar Ekeland Η φύση του τυχαίοι Beltrami To 4 θέμα Μπαιλακης Excursions in mathematics Ogilvy What is mathematics Courant- Robbins Concepts of modern mathematics Stewart The Moscow puzzles Kordemski The Universal Book of Mathematics David Darling Probability Demystified McGraw-Hill