Presentation Diploma Thesis

36
Μελέτη και μοντελοποίηση της Μελέτη και μοντελοποίηση της μεταφοράς δεδομένων σε δίκτυα μεταφοράς δεδομένων σε δίκτυα επεξεργαστών επεξεργαστών Διπλωματική εργασία του Νίκου Μπιτσακίδη Επιβλέπων καθηγητής κ. Γεώργιος Συρακούλης

description

An improved cellular ants algorithm for clustering data sets, and further identification, separation and sorting of emerged clusters (in Greek)

Transcript of Presentation Diploma Thesis

Page 1: Presentation Diploma Thesis

Μελέτη και μοντελοποίηση της Μελέτη και μοντελοποίηση της μεταφοράς δεδομένων σε δίκτυα μεταφοράς δεδομένων σε δίκτυα

επεξεργαστών επεξεργαστών

Διπλωματική εργασία του Νίκου Μπιτσακίδη

Επιβλέπων καθηγητής κ. Γεώργιος Συρακούλης

Page 2: Presentation Diploma Thesis

Μεταφορά δεδομένων σε Μεταφορά δεδομένων σε δίκτυα επεξεργαστώνδίκτυα επεξεργαστών

(NoC)(NoC)

ΠΡΟΒΛΗΜΑΜοντελοποίηση και εξαγωγή χρήσιμης πληροφορίας μέσα από το σωρό των φαινομενικά ασύνδετων δεδομένων που διακινούνται

μέσα στο δίκτυο

ΛΥΣΗΕξόρυξη δεδομένων (Data Mining): “Εξόρυξη Δεδομένων (Data Mining) είναι η ανάλυση – συνήθως τεράστιων – παρατηρούμενων συνόλων δεδομένων, έτσι ώστε να βρεθούν μη παρατηρηθείσες σχέσεις και να συνοψιστούν τα δεδομένα με καινοφανείς τρόπους οι οποίοι να είναι κατανοητοί και χρήσιμοι στον κάτοχο των δεδομένων”

Βασικοί στόχοι της εξόρυξης δεδομένων είναι η Περιγραφή και η Πρόβλεψη.

Page 3: Presentation Diploma Thesis

Συσταδοποίηση Συσταδοποίηση ((Clustering)Clustering)

H μεθοδολογία ανακάλυψης συστάδων και κατανομών ή προτύπων που παρουσιάζουν ενδιαφέρον στα υπό μελέτη δεδομένα. Ως συστάδα ορίζεται μια συλλογή αντικειμένων από τα δεδομένα, με βάση τη μεταξύ τους ομοιότητα. Η διαδικασία της συσταδοποίησης μπορεί να οδηγήσει σε διαφορετικές τμηματοποιήσεις ενός συνόλου δεδομένων, ανάλογα με το κριτήριο συσταδοποίησης που χρησιμοποιείται.

Βασικά βήματα της διαδικασίας:Επιλογή των κατάλληλων γνωρισμάτων (attributes) στα οποία πρόκειται να εφαρμοστεί η συσταδοποίησηΗ επιλογή ενός αλγορίθμου που οδηγεί στον καθορισμό ενός καλού σχήματος συσταδοποίησηςΗ επίκυρωση των αποτελεσμάτων και η εν τέλει ερμηνεία τους

Ο αλγόριθμος που επιλέγεται καθορίζεται από το μέτρο εγγύτητας που προσδιορίζει πόσο «όμοια» είναι δύο αντικείμενα. Χρησιμοποιώντας το μέτρο ομοιότητας, η συσταδοποίηση είναι σε θέση να οργανώσει τα δεδομένα / πρότυπα σε ενδιαφέρουσες ομάδες, χωρίς να έχει σχετική εκ των προτέρων πληροφορία.

Page 4: Presentation Diploma Thesis

Κυψελιδωτά αυτόματα Κυψελιδωτά αυτόματα ((Cellular Ants)Cellular Ants)

Τα Κυψελιδωτά Αυτόματα (Κ.Α.) [Cellular Automata, (C.A.)] αποτελούν μοντέλα φυσικών συστημάτων, στα οποία ο χώρος και ο χρόνος είναι διακριτοί και τα φυσικά μεγέθη μπορούν να λάβουν τιμές από ένα πεπερασμένο σύνολο τιμών. Η πρώτη στην ιστορία εμφάνιση των κυψελιδωτών αυτομάτων έγινε με το τρίγωνο του Pascal, την σύγχρονη εκδοχή τους όμως εισηγήθηκε ο von Neumann.

Ο von Neumann προσπαθούσε να μιμηθεί τη συμπεριφορά του ανθρώπινου εγκεφάλου, προκειμένου να κατασκευάσει μία μηχανή ικανή να επιλύει εξαιρετικά πολύπλοκα προβλήματα. Ωστόσο, τα κίνητρά του ήταν περισσότερο φιλόδοξα από την απλή αύξηση της απόδοσης των υπολογιστών της εποχής του. Είχε υπόψη του μία μηχανή τέτοιας πολυπλοκότητας, ίδιας με αυτής του ανθρώπινου εγκεφάλου, που θα περιείχε μηχανισμούς ίδιου ελέγχου και ίδιας επισκευής.

Page 5: Presentation Diploma Thesis

Ένας κόσμος από Ένας κόσμος από κυψελίδεςκυψελίδες

Ακολουθώντας τις προτάσεις του S. Ulam ο von Neumann επαναπροσδιόρισε τον παραπάνω προβληματισμό του στο πλαίσιο ενός πλήρως διακριτού κόσμου αποτελούμενου από κυψελίδες (cells).

Κάθε κυψελίδα (cell) χαρακτηρίζεται από μία εσωτερική κατάσταση (internal state), που συμβολίζεται από ένα πεπερασμένο αριθμό δυαδικών ψηφίων (bits) πληροφορίας. Ο von Neumann πρότεινε αυτό το σύστημα των κυψελίδων να εξελίσσεται σε διακριτά χρονικά βήματα, όπως τα απλά αυτόματα που χρησιμοποιούν μόνον έναν απλό τρόπο για τον υπολογισμό της επομένης εσωτερικής τους κατάστασης.

Ο κανόνας (rule) που προσδιορίζει την εξέλιξη του συγκεκριμένου συστήματος είναι ίδιος για όλες τις κυψελίδες και είναι συνάρτηση των καταστάσεων των γειτονικών κυψελίδων. Όπως συμβαίνει και σε κάθε βιολογικό σύστημα, η δραστηριότητα των κυψελίδων λαμβάνει χώρα ταυτόχρονα. Ωστόσο, το ίδιο ρολόι οδηγεί την εξέλιξη σε κάθε κυψελίδα και η ανανέωση της εσωτερικής κατάστασης της κάθε κυψελίδας γίνεται ταυτόχρονα. Αυτά τα πλήρως διακριτά δυναμικά συστήματα που εφευρέθηκαν από τον von Neumann αναφέρονται τώρα ως Κ.Α.

Page 6: Presentation Diploma Thesis

Δύο συνήθεις γειτονιές Δύο συνήθεις γειτονιές αλληλεπίδρασης ενός αλληλεπίδρασης ενός

κυψελιδωτού αυτόματουκυψελιδωτού αυτόματου Γειτονιά von Neumann Γειτονιά Moore

Page 7: Presentation Diploma Thesis

Παιχνίδι της ζωήςΠαιχνίδι της ζωήςΤα Κ.Α. αποτελούν μία πρώιμη προσπάθεια για την κατανόηση της αληθινής ζωής και της συμπεριφοράς των ζωντανών οργανισμών, με τη βοήθεια υπολογιστικών μοντέλων (τεχνητή ζωή), και μπορούν να συνεχίσουν να προσφέρουν στο συγκεκριμένο ερευνητικό αντικείμενο. Ένα πολύ γνωστό παράδειγμα εξομοίωσης τεχνητής ζωής είναι το παιχνίδι της ζωής που προτάθηκε από τον Conway.

Page 8: Presentation Diploma Thesis

Εφαρμογή κανόνα Εφαρμογή κανόνα OR OR σε ένα σε ένα δισδιάστατο κυψελιδωτό δισδιάστατο κυψελιδωτό

αυτόματοαυτόματο

Page 9: Presentation Diploma Thesis

Αποικίες ΜυρμηγκιώνΑποικίες Μυρμηγκιών((Ant Colonies)Ant Colonies)

Στις δεκαετίες του ’40 και ’50 του εικοστού αιώνα, ο Γάλλος εντομολόγος Pierre-Paul Grassé παρατήρησε ότι κάποια είδη τερμιτών αντιδρούσαν σ’ αυτό που ονόμαζε «σημαντικό ερέθισμα». Παρατήρησε ότι τα αποτελέσματα αυτών των αντιδράσεων μπορούν να δράσουν σαν νέο «σημαντικό ερέθισμα» τόσο για το έντομο που τις παρήγαγε όσο και για τα άλλα έντομα της αποικίας. Ο Grassé χρησιμοποίησε τον όρο στιμεργία (stimergy) για να περιγράψει αυτόν τον συγκεκριμένο τρόπο επικοινωνίας στον οποίο «οι εργάτες ερεθίζονται από τις αποδόσεις που έχουν πετύχει».

Page 10: Presentation Diploma Thesis

ΣτιμεργίαΣτιμεργία

Τα δύο κύρια χαρακτηριστικά της στιμεργίας που την διαφοροποιούν από άλλους τρόπους επικοινωνίας είναι:

Η στιμεργία είναι μια έμμεση, μη-συμβολική μορφή επικοινωνίας που διαμεσολαβείται από το περιβάλλον: τα έντομα ανταλλάσσουν πληροφορία τροποποιώντας το περιβάλλον τους.

Η στιμεργική πληροφορία είναι τοπική: μπορεί να προσβάσιμη μόνο από τα αυτά τα έντομα που επισκέπτονται τον γεωμετρικό τόπο στον οποίο απελευθερώθηκε (ή στην στενή γειτονιά του).

Σε πολλά είδη μυρμηγκιών, τα μυρμήγκια που περπατάν προς και από μια πηγή τροφής, αφήνουν στο έδαφος μια ουσία που λέγεται φερομόνη.

Τα άλλα μυρμήγκια που αντιλαμβάνονται την παρουσία της φερομόνης τείνουν να ακολουθούν τα μονοπάτια στα οποία η συγκέντρωση φερομόνης είναι μεγαλύτερη. Μέσω αυτού του μηχανισμού, τα μυρμήγκια είναι σε θέση να μεταφέρουν τροφή στις φωλιές τους με έναν αξιοπρόσεκτα αποτελεσματικό τρόπο.

Page 11: Presentation Diploma Thesis

Διαδικασία επιλογής Διαδικασία επιλογής βέλτιστου μονοπατιού από βέλτιστου μονοπατιού από

την αποικίατην αποικία

Page 12: Presentation Diploma Thesis

Τεχνητές προσομειώσεις Τεχνητές προσομειώσεις αποικιών μυρμηγκιώναποικιών μυρμηγκιών

Ομοιότητες των τεχνητών μυρμηγκιών με τα φυσικά: Αποικία, Φερομόνη, Απόφαση

Επιπλέον χαρακτηριστικά: Μνήμη, Όραση, Διακριτοποίηση του χώρου και του χρόνου, Εναπόθεση φερομόνης σε διαφορετικές χρονικές στιγμές,

Χρησιμοποίηση αλγορίθμων για την βελτίωση της απόδοσης του συστήματος

Επίλυση TSP με βελτιστοποίηση αποικιών μυρμηγκιών

Page 13: Presentation Diploma Thesis

Αλγόριθμος Κυψελιδωτών Αλγόριθμος Κυψελιδωτών Μυρμηγκιών Μυρμηγκιών (Cellular (Cellular

Ants)Ants)

Ο αλγόριθμος “κυψελιδωτών μυρμηγκιών” (Cellular Ants) των Andrew Vand Moere και Justin James Clayden, συνδυάζει αρχές των κυψελιδωτών αυτομάτων με αλγορίθμους βελτιστοποίησης αποικίας μυρμηγκιών για να συσταδοποιήσει μέσα σ’ ένα δυσδιάστατο πλέγμα, παρόμοια αντικείμενα τα οποία περιέχουν πολυδιάστατα δεδομένα.

Η προτεινόμενη μέθοδος αντιστοιχίζει τα αντικείμενα δεδομένων σε ξεχωριστά μυρμήγκια, τα οποία γυρνούν γύρω γύρω στο πλέγμα, εναποθέτουν φερομόνες και ακολουθούν τα μονοπάτια φερομόνης παρόμοιων μυρμηγκιών.

Page 14: Presentation Diploma Thesis

Η γειτονιά ενός Η γειτονιά ενός κυψελιδωτού μυρμηγκιούκυψελιδωτού μυρμηγκιού

Page 15: Presentation Diploma Thesis

Κριτήριο ομοιότητας δύο Κριτήριο ομοιότητας δύο κυψελιδωτών μυρμηγκιώνκυψελιδωτών μυρμηγκιώνΔιακριτή Ανοχή Δεδομένων. Τα μυρμήγια παίρνουν υπόψη μόνο (και έτσι ‘μετρούν’) άλλα μυρμήγκια που είναι ‘παρόμοια’, κάτι που συμβαίνει όταν η απόσταση μεταξύ των τιμών δεδομένων τους στο διάστημα των παραμέτρων είναι μικρότερη από μια διακριτή, προκαθορισμένη τιμή κατωφλιού ανοχής ομοιότητας t. Η ομοιότητα δεδομένων μεταξύ ένα ζευγαριού μυρμηγκιών υπολογίζεται ως εξής:

datai = (z i1,z i2 ,...,zip )∈Rp ,p ∈ Z+

dij = d(datai − dataj ) = datai − dataj p

dij < t ⇒ similar(anti ,antj ) = true

Page 16: Presentation Diploma Thesis

Κανόνες κίνησηςΚανόνες κίνησης1) Δημιουργία Μονοπατιών Φερομόνης. Ένα μυρμήγκι θα

ακολουθήσει το μονοπάτι του α) πιο παρόμοιου μυρμηγκιού, που β) είναι το πιο φρέσκο, έτσι ώστε τα μυρμήγκια να βρίσκουν παρόμοια μυρμήγκια γρήγορα (επιρροή από αποικίες μυρμηγκιών).

2) Ένταση Επιφάνειας. Ένα μυρμήγκι με λιγότερους από 4 παρόμοιους γείτονες θα πρέπει να μετακινηθεί σε ένα μη-άδειο κελί στην γειτονιά του που α) δεν έχει μη-παρόμοιους γείτονες, και β) είναι δίπλα στο πιο παρόμοιο μυρμήγκι. Αυτός ο κανόνας θα προκαλέσει τα μυρμήγκια στο να σχηματίσουν μεγάλες, σταθερές συστάδες (κανόνας κυψελιδωτών αυτομάτων).

3) Απώθηση Πλευρών. Τα μυρμήγκια σε μια επιθυμητή ρύθμιση, δηλαδή με 6 ή περισσότερους παρόμοιους γείτονες, θα πρέπει να προσπαθήσουν πάλι να απομακρυνθούν όταν υπάρχουν ένα ή περισσότερα μη-παρόμοια μυρμήγκια στην γειτονιά τους (κανόνας κυψελιδωτών αυτομάτων).

4) Η Εναλλαγή Θέσεων βάζει σε τάξη τα μυρμήγκια που είναι μέσα στο εσωτερικό συστάδων, χρησιμοποιώντας την ομοιότητα των δεδομένων τους, επιτρέποντας στα μυρμήγκια να ‘πηδήξουν΄ το ένα πάνω απ’ το άλλο για να φτάσουν σε πιο ιδανικές θέσεις μέσα σε μια συστάδα (κανόνας κυψελιδωτών αυτομάτων).

Page 17: Presentation Diploma Thesis

Αποτελέσματα στο Αποτελέσματα στο IRIS data IRIS data set set σύμφωνα με σύμφωνα με Moere Moere και και ClaydenClayden

Page 18: Presentation Diploma Thesis

Αποτελέσματα δικής μας υλοποίησης Αποτελέσματα δικής μας υλοποίησης στον αρχικό αλγόριθμο στο στον αρχικό αλγόριθμο στο IRIS data IRIS data set (set (ιδιαίτερα άσχημα)ιδιαίτερα άσχημα)

Page 19: Presentation Diploma Thesis

Πρόβλημα Ι - Υπερβολική Πρόβλημα Ι - Υπερβολική κινητικότητα των κυψελιδωτών κινητικότητα των κυψελιδωτών

μυρμηγκιών – Οπτικά μη μυρμηγκιών – Οπτικά μη κατανοητή απεικόνισηκατανοητή απεικόνιση

Μια από τις αιτίες για τα μη προσδοκώμενα αποτελέσματα, είναι η υπερβολική κινητικότητα των κυψελιδωτών μυρμηγκιών που μεταπηδούν από την μια πλευρά του πλέγματος στην αντιδιαμετρική του εύκολα, όμως αυτό τα εμποδίζει να «εγκλωβιστούν» και να μείνουν στην γειτονιά παρόμοιων σ’ αυτά μυρμηγκιών, βοηθώντας την διαδικασία της συσταδοποίησης. Ένα επιπλέον πρόβλημα είναι ότι ο παρατηρούμενος διαχωρισμός συστάδων σε δύο πλευρές ή - ακόμα χειρότερα για την περίπτωση μέσων που βρίσκονται στις γωνίες του πλέγματος - σε τέσσερις αντιδιαμετρικές γωνίες του πλέγματος, κάτι που καθιστά την απεικόνιση σε δύο διαστάσεις μη κατανοητή.

Εγκαταλείποντας την ιδέα της αναδίπλωσης και του σπειροειδούς πλέγματος, υιοθετήθηκε ένα τετραγωνικό πλέγμα χωρίς αναδίπλωση. Το τετραγωνικό πλέγμα χρησιμοποιήθηκε σε όλες τις περαιτέρω δοκιμές και βελτιώσεις που έγιναν στον αρχικό αλγόριθμο.

Page 20: Presentation Diploma Thesis

Αποτελέσματα αρχικού αλγόριθμου Αποτελέσματα αρχικού αλγόριθμου με υιοθέτηση τετραγωνικού με υιοθέτηση τετραγωνικού

πλέγματος στο πλέγματος στο IRIS data set (IRIS data set (μια μια σαφής βελτίωση)σαφής βελτίωση)

Page 21: Presentation Diploma Thesis

Πρόβλημα ΙΙ – Τα όρια της Πρόβλημα ΙΙ – Τα όρια της προτεινόμενης μεθόδου διακριτής προτεινόμενης μεθόδου διακριτής

ανοχής δεδομένωνανοχής δεδομένων

Υπάρχει διαφορετικό βάρος στον υπολογισμό της απόστασης δεδομένων, της διαφοράς των τιμών μιας διάστασης δεδομένων σε σχέση με μιας άλλης, όταν π.χ. η μια διάσταση έχει όρια τιμών από 1-500 και η άλλη από 0.005-0.995. Επίσης υπάρχει δυσκολία, στο πειραματικό επίπεδο, της εύρεσης του ιδανικού και κατάλληλου κατωφλίου ανοχής. Η λύση βρέθηκε με την επινόηση ενός διαφορετικού τρόπου υπολογισμού απόστασης, όπου υπολογίζεται ο μ.ο. της αναλογίας της τιμής του ενός μέσου σε σχέση με το άλλο, για κάθε διάσταση. Πλέον η ποσοτική διαφορά δεν παίζει ρόλο, ενώ ένα κατώφλι π.χ. +-20% αρκεί για να διαχωρίσει δύο ανόμοιους αντιπρόσωπους.

dist(AB) = 2

100*bi

ai + bii=1

i=j

∑j

− 50

Page 22: Presentation Diploma Thesis

Αποτελέσματα με υιοθέτηση Αποτελέσματα με υιοθέτηση αναλογικής απόστασης στο αναλογικής απόστασης στο IRIS IRIS data set (data set (ελαφρώς χειρότερα)ελαφρώς χειρότερα)

Page 23: Presentation Diploma Thesis

Υιοθέτηση βαρών στις Υιοθέτηση βαρών στις διαστάσεις των διαστάσεις των δεδομένωνδεδομένωνΟ αλγόριθμος κυψελιδωτών μυρμηγκιών δεν έχει προβλέψει την ανάγκη της προσθήκης της δυνατότητας διαφορετικών προκαθορισμένων βαρών για κάθε διάσταση δεδομένων στον υπολογισμό της απόστασης δεδομένων ή την προοπτική να μην πάρουμε υπόψη μια ή περισσότερες διαστάσεις, ώστε να χρησιμοποιηθεί το ίδιο σετ δεδομένων για διάφορες μορφές συσταδοποίησης.

Ο υπολογισμός διαφορετικών βαρών για κάθε διάσταση δεδομένων ή ακόμα και η μη συνυπολογισμός κάποιου (θέτοντας το βάρος του μηδέν) γίνεται με κάποιες μικρές αλλαγές στον προτεινόμενο κανόνα μέτρησης αναλογικής απόστασης.

dist(AB) = 2

100*bi

ai + bi* weighti

i=1

i=j

weightii=1

i=j

∑− 50

Page 24: Presentation Diploma Thesis

Πρόβλημα ΙΙΙ –Οι πρακτικές Πρόβλημα ΙΙΙ –Οι πρακτικές αδυναμίες του μικρού μεγέθους αδυναμίες του μικρού μεγέθους του πλέγματος του πλέγματος Το μικρό μέγεθος του πλέγματος (μόνο 15%-20% των κελιών θα πρέπει να είναι κενά, σύμφωνα με τις προτάσεις των εμπνευστών του αλγορίθμου) βοηθάει τα κυψελιδωτά μυρμήγκια να βρουν παρόμοια μυρμήγκια στην γειτονιά τους για να σχηματίσουν συστάδες ή μονοπάτια φερομόνης για να κινηθούν στην γειτονιά ενός παρόμοιου μυρμηγκιού.

Αλλά αυτή η σύλληψη έχει επίσης προβλήματα:

Δεν βοηθάει τα κυψελιδωτά μυρμήγκια να κινηθούν ελεύθερα. Τα μυρμήγκια έχουν πολύ λίγα ελεύθερα κελιά για να μετακινηθούν, κάτι που μπορεί να επιβραδύνει την διαδικασία σχηματισμού των σωστών συστάδων.

Οι αναδυόμενες συστάδες δεν μπορούν να διαχωριστούν πραγματικά. Η σύλληψη της απώθησης πλευράς δουλεύει καλά στο να σπρώχνει μυρμήγκια μακριά από μια μη ταιριαστή συστάδα, ώστε να βρουν τα παρόμοια σ’ αυτά, αλλά δεν μπορούν πραγματικά να μετακινηθούν μακριά της εξαιτίας της έλλειψης άδειου χώρου, κι έτσι οι αναδυόμενες συστάδες κολλούν η μία δίπλα στην άλλη.

Το μικρό μέγεθος του άδειου χώρου έχει σαν αποτέλεσμα το γεγονός ότι πολύ συχνά, κυψελιδωτά μυρμήγκια βρίσκονται στις πλευρές του πλέγματος. Μια άμεση θεώρηση Moore γειτονιάς ακτίνας 1 είναι τότε αδύνατη – μία (αν το κυψελιδωτό μυρμήγκι είναι σε πλευρά) ή δύο (αν είναι στις άκρες του πλέγματος) πλευρές της γειτονιάς Moore είναι εκτός του πλέγματος. Μερικοί κανόνες δεν μπορούν να εφαρμοστούν σε μια τόσο μικρή γειτονιά.

Page 25: Presentation Diploma Thesis

Λύση – Προοδευτικά Λύση – Προοδευτικά Επεκτεινόμενο ΠλέγμαΕπεκτεινόμενο ΠλέγμαΗ δεύτερη προσέγγιση ήταν να μείνει το αρχικό πλέγμα όπως έχει και να αφήσουμε τα κυψελιδωτά μυρμήγκια να καταλήξουν σε μια αρχική μορφή συσταδοποίησης μετά από 500 επαναλήψεις (ο αριθμός είναι αυθαίρετος), και κατόπιν να αυξηθεί το μέγεθος του πλέγματος, προσθέτοντας άδεια κελιά στις πλευρές του.

Η ιδέα αυτή λειτούργησε αρκετά καλά στο πειραματικό επίπεδο, οι ήδη αναδυόμενες συστάδες βρήκαν χώρο να μετακινηθούν και να επεκταθούν. Μια δεύτερη επέκταση, λειτούργησε επίσης καλά στο Iris Data Set. Η σύλληψη αυτή δουλεύει εφόσον κρατηθεί σε λογικά πλαίσια με την επέκταση του πλέγματος, αφού από ένα σημείο και πέρα δεν υπάρχει κάποια χρησιμότητα στην συσταδοποίηση, παρά προστίθενται άδεια κελιά που μικραίνουν τον οπτικά χρήσιμο χώρο της οθόνης.

Page 26: Presentation Diploma Thesis

Πρόβλημα Πρόβλημα IV –IV – Κυψελιδωτά μυρμήγκια Κυψελιδωτά μυρμήγκια παγιδευμένα σε ανόμοιες ή άδειες παγιδευμένα σε ανόμοιες ή άδειες γειτονιές, χωρίς την δυνατότητα γειτονιές, χωρίς την δυνατότητα διαφυγήςδιαφυγήςΛύση: Κάνονας μακρινής αλληλεπίδρασης (η εκδοχή που δοκιμάστηκε)

1) Υιοθετείται η ιδέα μιας συνεχούς επεκτεινόμενης γειτονιάς, στο οποίο υπάρχει η δυνατότητα όρασης και αλληλεπίδρασης (υπερ-κυψελιδωτό μυρμήγκι). Η γειτονιά, διευρύνεται, η αλληλεπίδραση γίνεται με τις άκρες της.2) Αν κάποια κελιά της νέας γειτονιάς. είναι έξω από τον χάρτη, δεν χρησιμοποιούνται. Στη συνέχεια συγκρίνεται το υπερ-κυψελιδωτό μυρμήγκι με τα επιλεγμένα κελιά της επεκταμένης γειτονιάς του. 3) Κατόπιν εξετάζονται τα κελιά ένα ένα με τη σειρά που βρίσκονται στην επεκταμένη γειτονιά . Αν βρεθεί κάποιο άδειο κελί, που έχει γειτονικά κελιά, παρόμοια μυρμήγκια, τότε σημειώνεται. Γίνεται στο τέλος της εξέτασης, μετακίνηση του υπερ-κυψελιδωτού μυρμηγκιού στο άδειο κελί που έχει τους γείτονες με το μικρότερο μέσο όρο διαφοράς δεδομένων από αυτό.4) Αν δεν βρεθεί κάποιο άδεια κελί που να εκπληρώνει την προηγούμενη προϋπόθεση, τότε η γειτονιά επεκτείνεται ξανά και ξαναγίνεται η ίδια αναζήτηση απ’ την αρχή. Αν πάλι δεν βρεθεί το άδειο κελί στο οποίο μπορεί να μετακινηθεί το μυρμήγκι, τότε επεκτείνεται και άλλο η γειτονιά, μέχρι είτε όλη η γειτονιά να βρίσκεται εκτός χάρτη είτε να φτάσει το μέγεθος της σε ένα προκαθορισμένο από πριν όριο επέκτασης.

Page 27: Presentation Diploma Thesis

Η επεκταμένη γειτονιά Η επεκταμένη γειτονιά αλληλεπίδρασης του υπερ-αλληλεπίδρασης του υπερ-

κυψελιδωτού μυρμηγκιού (ακτίνας 2)κυψελιδωτού μυρμηγκιού (ακτίνας 2)

C C C C C

C C

C X C

C C

C C C C C

Page 28: Presentation Diploma Thesis

Αποτελέσματα με υιοθέτηση Αποτελέσματα με υιοθέτηση κανόνα μακρινής αλληλεπίδρασης κανόνα μακρινής αλληλεπίδρασης στο στο IRIS data set (IRIS data set (μεγάλη μεγάλη βελτίωση)βελτίωση)

Page 29: Presentation Diploma Thesis

Αποτελέσματα με υιοθέτηση Αποτελέσματα με υιοθέτηση κανόνα μακρινής αλληλεπίδρασης κανόνα μακρινής αλληλεπίδρασης και μέτρησης αναλογικής και μέτρησης αναλογικής απόστασης στο απόστασης στο IRIS data set IRIS data set ((γρήγορη σύγκλιση, εικόνα από 200 γρήγορη σύγκλιση, εικόνα από 200 επαν.)επαν.)

Page 30: Presentation Diploma Thesis

Σύγκριση επιδόσεων του αρχικού Σύγκριση επιδόσεων του αρχικού αλγόριθμου και των δοκιμών αλγόριθμου και των δοκιμών

βελτίωσης τουβελτίωσης του

Page 31: Presentation Diploma Thesis

Διαδικασία αναγνώρισης Διαδικασία αναγνώρισης και διαχωρισμού και διαχωρισμού συστάδων Ισυστάδων Ι

Για να βρεθούν οι συστάδες που απεικονίστηκαν απλώς με τον αυθεντικό αλγόριθμο, χρησιμοποιείται ο προτεινόμενος αλγόριθμος αναγνώρισης. Κάθε συστάδα αποτελείται από αντιπροσώπους που είναι πολύ κοντά (+-1% κατώφλι ομοιότητας) στο διάστημα των δεδομένων σε σχέση με έναν τυχαία επιλεγμένο αντιπρόσωπο. Χρησιμοποιείται ένα πολύ μικρό κατώφλι, ώστε η τυχαιότητα των αποτελεσμάτων να είναι όσο το δυνατόν περιορισμένη.

Page 32: Presentation Diploma Thesis

Διαδικασία αναγνώρισης Διαδικασία αναγνώρισης και διαχωρισμού και διαχωρισμού συστάδων ΙΙσυστάδων ΙΙ

Το επόμενο βήμα είναι η ένωση των συστάδες που είναι πολύ κοντά στο διάστημα των δεδομένων. Χρησιμοποιείται ένα μεγαλύτερο κατώφλι ομοιότητας (σ’ αυτό το παράδειγμα +-3.9%) για να συγκριθούν τα κοινά σύνορα των γειτονικών συστάδων. Αν πάνω από 90% των κοινών συνόρων μεταξύ δύο συστάδων είναι παρόμοιο, τότε οι συστάδες ενώνονται. Σ’ αυτό το σχήμα απαριθμούνται οι συστάδες που πρόκειται να ενωθούν σε μια συστάδα.

Page 33: Presentation Diploma Thesis

Διαδικασία αναγνώρισης Διαδικασία αναγνώρισης και διαχωρισμού και διαχωρισμού συστάδων ΙΙΙσυστάδων ΙΙΙ

Η τελική συστάδα παίρνει τον αριθμό μιας από τις παρόμοιες, αλλά μέχρι πριν διαχωρισμένες συστάδες.

Page 34: Presentation Diploma Thesis

Διαδικασία αναγνώρισης Διαδικασία αναγνώρισης και διαχωρισμού και διαχωρισμού συστάδων Ισυστάδων ΙVV

Το αποτέλεσμα της ενοποίησης όλων των παρόμοιων συστάδων – οι αντιπρόσωποι κάθε συστάδας αναγνωρίζονται και η συσταδοποίηση τελείωνει. Η όλη σύλληψη της αναγνώρισης, ενοποίησης και διαχωρισμού κατέληξε σ’ ένα αποτέλεσμα που όχι μόνο οπτικοποίησε τις συστάδες – όπως προσπαθεί ο αυθεντικός αλγόριθμος κυψελιδωτών μυρμηγκιών – αλλά επίσης αναγνώρισε, χωρίς επίβλεψη, τους αντιπροσώπους που είναι μέλη κάθε συστάδας.

Page 35: Presentation Diploma Thesis

Ταξινόμηση των Ταξινόμηση των συστάδωνσυστάδωνΜε τον αλγόριθμο αναγνώρισης, συνένωσης και διαχωρισμού οι συστάδες διαχωρίστηκαν. Αν όμως υπάρχει η ανάγκη ταξινομήσης, ο τρόπος που προτείνεται είναι με την εύρεση της μέσης κάθε συστάδας και την ταξινόμηση των συστάδων σύμφωνα με την σειρά του κάθε μέσου.

Η μέση κάθε συστάδας είναι το (μεσαίο) κυψελιδωτό μυρμήγκι με το μικρότερο άθροισμα των διαφορών απόστασης σε σχέση με τα άλλα μυρμήγκια της συστάδας.

Στο τέλος το αποτέλεσμα της ταξινόμησης είναι κάπως έτσι:

Συστάδα Πληθυσμός Μεσαία τιμή

2 12 10

3 15 22

1 12 25

4 4 28

Page 36: Presentation Diploma Thesis

Περαιτέρω βελτιώσειςΠεραιτέρω βελτιώσεις- Υλοποίηση σε compiled υπολογιστικό περιβάλλον- Δοκιμή αναγνώρισης & διαχωρισμού με χρήση κανονικής (Ευκλείδιας) απόστασης δεδομένων- Βελτίωση κανόνα μακρινής αλληλεπίδρασης- Βελτίωση απεικόνισης με χρήση σφαιροειδούς πλέγματος- Βελτίωση απόδοσης συσταδοποίησης με χρήση προοδευτικά επεκτεινόμενου χάρτη και προσθήκη εμβόλιμων κενών- Χρήση με δυναμικά δεδομένα- Υλοποίηση σε VLSI σε μορφή NoC