ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ...

14
D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 1 ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ, ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ΠΤΥΧΙΑΚΩΝ ΕΡΓΑΣΙΩΝ ΓΙΑ ΤΟ ΑΚ. ΕΤΟΣ 2019- 2020 Π. ΒΑΣΙΛΕΙΑΔΗΣ 2020-02-05 Εδώ εμφανίζεται ένα σύνολο εργασιών για το Φλεβάρη του 2020. Οι εργασίες είναι όλες στην περιοχή της τεχνολογίας λογισμικού και κυρίως στο χώρο της κατασκευής νέων / της επέκτασης ή αναμόρφωσης υπαρχόντων εργαλείων. Ο βαθμός σημαντικότητας μιας εργασίας φαίνεται με επισημειώσεις με ‘!’ Υπάρχει και η επεκτεταμένη εκδοχή του παρόντος και με άλλες ιδέες. Αλλά θα ξεκινήσουμε από εδώ για το εαρινό εξάμηνο του 2020.

Transcript of ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ...

Page 1: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 1

ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ, ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ΠΤΥΧΙΑΚΩΝ ΕΡΓΑΣΙΩΝ

ΓΙΑ ΤΟ ΑΚ. ΕΤΟΣ 2019- 2020

Π. ΒΑΣΙΛΕΙΑΔΗΣ – 2020-02-05

Εδώ εμφανίζεται ένα

σύνολο εργασιών για το Φλεβάρη του 2020.

Οι εργασίες είναι όλες στην περιοχή της τεχνολογίας λογισμικού και κυρίως στο χώρο της κατασκευής νέων / της επέκτασης ή αναμόρφωσης υπαρχόντων εργαλείων.

Ο βαθμός σημαντικότητας μιας εργασίας φαίνεται

με επισημειώσεις με ‘!’

Υπάρχει και η επεκτεταμένη εκδοχή του παρόντος και με άλλες ιδέες. Αλλά θα ξεκινήσουμε από εδώ για το εαρινό

εξάμηνο του 2020.

Page 2: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 2

ΠΙΝΑΚΑΣ ΠΕΡΙΕΧΟΜΕΝΩΝ

1. ΜΕΛΕΤΗ ΤΗΣ ΕΞΕΛΙΞΗΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ 3

1.1. ΘΑΡΡΑΛΕΑ ΒΗΜΑΤΑ ΣΤΟ ΣΚΟΤΑΔΙ ΓΙΑ MSC / PHD 6

1.2. [!!!] ΕΡΓΑΛΕΙΟ ΜΑΖΙΚΗΣ ΕΞΑΓΩΓΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ 7

1.3. [!!] ΕΡΓΑΛΕΙΟ ΜΑΖΙΚΗΣ ΟΠΤΙΚΟΠΟΙΗΣΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ 8

1.4. [!] ΑΝΑΜΟΡΦΩΣΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΕΡΓΑΛΕΙΟ ΟΠΤΙΚΗΣ ΑΝΑΠΑΡΑΣΤΑΣΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΕΣΙΑΚΩΝ

ΠΙΝΑΚΩΝ (ΠΛΟΥΤΑΡΧΟΥ ΒΙΟΙ ΠΑΡΑΛΛΗΛΟΙ) 9

1.5. [!!!] ΚΑΤΑΣΚΕΥΗ ΝΕΩΝ Ή ΑΝΑΜΟΡΦΩΣΗ ΥΠΑΡΧΟΝΤΩΝ ΕΡΓΑΛΕΙΩΝ ΓΙΑ ΤΗΝ ΟΠΤΙΚΟΠΟΙΗΣΗ ΤΗΣ

ΜΕΛΕΤΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ 10

1.6. [!] MULTI-DATASET CLASSIFICATION FOR SCHEMA EVOLUTION DATASETS 12

2. ΔΙΑΧΕΙΡΙΣΗ ΧΡΟΝΟΣΕΙΡΩΝ 13

2.1. DATA ANALYTICS FOR TIME-SERIES 13

Page 3: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 3

1. ΜΕΛΕΤΗ ΤΗΣ ΕΞΕΛΙΞΗΣ ΒΑΣΕΩΝ ΔΕΔΟΜΕΝΩΝ Μια βάση δεδομένων, από τη στιγμή που θα δημιουργηθεί, αλλάζει εσωτερική δομή με το

πέρασμα του χρόνου: νέοι πίνακες δημιουργούνται, παλαιοί καταστρέφονται, πεδία

διαγράφονται, μετονομάζονται κλπ. Η διαδικασία αυτή ονομάζεται «εξέλιξη του

σχήματος της βάσης δεδομένων» (schema evolution). Το εργαλείο Hecate

[https://github.com/DAINTINESS-Group/Hecate ] μπορεί να συγκρίνει δύο σχήματα και

να βρει τις διαφορές τους (κίτρινο: updated attributes, red: deletions, green: insertions).

Επιπλέον, υπάρχουν αρκετές συλλογές από εκδόσεις του σχήματος της ιδίας βάσης

(παρακάτω ένα screenshot από τη βάση της Wikimedia).

H Εκάτη μπορεί να ταξινομήσει τις επί μέρους εκδοχές του σχήματος και να τις συγκρίνει

διαδοχικά.

Page 4: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 4

Έχουμε ήδη χρησιμοποιήσει την Εκάτη για να επεξεργαστούμε την εξέλιξη σχήματος

διαφόρων βάσεων δεδομένων ανοιχτού λογισμικού, όπως για παράδειγμα, της βάσης της

Wikimedia (της βάσης δεδομένων πίσω από τη Wikipedia), της βάσης του Atlas Trigger

(του εργαλείου που διαχειρίζεται τα δεδομένα από το πείραμα Atlas για την ανεύρεση

του μποζονίου του Χιγκς), της Ensembl (του εργαλείου για τη διαχείριση των δεδομένων

του ανθρώπινου γονιδιώματος) και πολλών CMS’s (opencart, coppermine, phpBB, typo3,

…). Έχουμε επίσης συλλέξει την ιστορία από πολλά συστήματα ανοιχτού κώδικα που

περιλαμβάνουν βάσεις δεδομένων και καταγράφουν και τις εκδοχές τους σε δημόσια

αποθετήρια (κυρίως github, αλλά και svn) αλλά δεν την έχουμε επεξεργαστεί ακόμα.

Στο παραπάνω σχήμα βλέπετε (α) το πώς εξελίχθηκε το μέγεθος του σχήματος της βάσης

στο χρόνο και (β) τον παλμό των αλλαγών (το πώς διαρθρώθηκαν οι αλλαγές σε κάθε

monitored version) για τη βάση Ensembl.

Το εργαλείο ROSES από τη Μ. Ζέρβα είναι ένα εργαλείο βασισμένο σε μια βάση

δεδομένων, όπου έχουμε περάσει την εξαχθείσα πληροφορία, για να μπορούμε να

απομονώνουμε εύκολα υποσύνολα πινάκων που μας ενδιαφέρουν και να οπτικοποιούμε

γραφικές παραστάσεις. Το εργαλείο MUSES από τον Α. Παππά μας επιτρέπει να εξάγουμε

πρότυπα συχνών υποακολουθιών από τα δεδομένα μας.

Page 5: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 5

Το εργαλείο «Πλουτάρχου Βίοι Παράλληλοι» [https://github.com/DAINTINESS-

Group/Plutarch_Parallel_Lives] είναι ένα εργαλείο από τον Θ. Γιάχο και το οποίο

απεικονίζει την εξέλιξη των πινάκων μιας βάσης δεδομένων σε παράλληλες γραμμές.

Κάθε version αναπαριστάται από 3 κολώνες για εισαγωγές, διαγραφές και ενημερώσεις

πινάκων. Οι γεννήσεις πινάκων και πεδίων φαίνονται με πράσινο και οι διαγραφές με

κόκκινο χρώμα.

Το εργαλείο «Παρμενίδεια Αλήθεια» [https://github.com/DAINTINESS-

Group/ParmenidianTruth] είναι ένα εργαλείο από τον Μ. Κολοζώφ που αναπαριστά το

σχήμα μιας βάσης δεδομένων με ένα διαχρονικό γράφημα και φροντίζει να οπτικοποιεί

κάθε version και τις εκδοχές της σε ένα slide μιας Powerpoint παρουσίασης (πρακτικά

φτιάχνει μια ταινία για το πώς αλλάζει το σχήμα της βάση δεδομένων).

Η έρευνα στην περιοχή αυτή είναι θεμελιώδους φύσεως και αφορά στο να

κατανοήσουμε την ύπαρξη προτύπων (ή ακόμα καλύτερα νόμων) για το πώς

εξελίσσονται οι βάσεις δεδομένων με την πάροδο του χρόνου .

http://www.cs.uoi.gr/~pvassil/projects/schemaBiographies/

Page 6: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 6

1.1. ΘΑΡΡΑΛΕΑ ΒΗΜΑΤΑ ΣΤΟ ΣΚΟΤΑΔΙ ΓΙΑ MSC / PHD

Μέχρι στιγμής έχουμε μια καλή κατανόηση των πιο βασικών νόμων της εξέλιξης.

Δείτε π.χ., τα άρθρα στα

http://www.cs.uoi.gr/~pvassil/publications/2015_ER/index.html

http://www.cs.uoi.gr/~pvassil/publications/2017_CAiSE_Electrolysis/index.html

καθώς και συνόψεις και videos στο

http://www.cs.uoi.gr/~pvassil/projects/schemaBiographies/publications.html

καθώς και στις διπλανές σελίδες. Έχουμε να εμβαθύνουμε κι άλλο όμως, στο να

απαντήσουμε θεμελιώδη επιστημονικά ερωτήματα. Κάθε ένα από τα παρακάτω

πρακτικώς οδηγεί και σε μια επιστημονική εργασία αν ολοκληρωθεί σωστά (οπότε είναι

κατάλληλο για MSc ή ως μέρος ενός PhD):

1. Γιατί η εξέλιξη ακολουθεί τους κανόνες που ακολουθεί? Ο Θάνος Παππάς στο MSc

του συγκέντρωσε διάφορα δεδομένα από σχόλια των developers @ commit time.

Μπορούμε να τα αξιοποιήσουμε, μαζί με τα σχόλια εντός του κώδικα, για να

δούμε για ποιους λόγους η εξέλιξη γίνεται με τον τρόπο αυτό?

2. Υπάρχουν θεμελιώδεις φάσεις στις ζωές των βάσεων δεδομένων? Μπορούμε να

μελετήσουμε τη σειρά και το είδος των αλλαγών στο σχήμα μιας βάσης

δεδομένων και να εξάγουμε φάσεις στη ζωή της? Μια πρώτη υπερπροσπάθεια θα

βρείτε στο MSc της Μαρίας Ζέρβα. Όμως, το ζήτημα δεν έχει απαντηθεί ακόμα.

3. Μπορούμε να πούμε με λόγια και εικόνες την ιστορία ενός σχήματος? Πώς

μπορούμε να συνοψίσουμε σε μια μικρή σύνοψη κειμένου/εικόνων την ιστορία

ενός σχήματος?

Page 7: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 7

1.2. [!!!] ΕΡΓΑΛΕΙΟ ΜΑΖΙΚΗΣ ΕΞΑΓΩΓΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ

ΠΕΡΙΛΗΨΗ: Ο σκοπός της παρούσας διπλωματικής είναι η εμπεριστατωμένη,

οργανωμένη και ελεγχόμενη εξαγωγή της εξέλιξης ενός σχήματος μιας βάσης δεδομένων

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Ο στόχος είναι να επεκταθεί το υπάρχον εργαλείο ΕΚΑΤΗ, με το

οποίο εξάγουμε τα στοιχεία από την εξέλιξη του σχήματος μιας βάσης δεδομένων.:

Το παρόν εργαλείο εκτιμά με αρκετή ακρίβεια την εξέλιξη των πινάκων ενός σχήματος.

Όμως, υπάρχουν ελλείψεις τις οποίες προοδευτικά θα προσπαθήσουμε να καλύψουμε. Η

παρούσα διπλωματική εργασία καλείται να υλοποιήσει ένα υποσύνολο από τα

παρακάτω:

1. Interactive highlighting of problematic parts of a DDL file, such that the analyst

can comment them out and exclude them from the analysis

2. Εξαγωγή της εξέλιξης των foreign keys

3. Εντοπισμός attribute and table renaming, splitting and merging

4. Εντοπισμός πράξεων που αλληλοαναιρούνται σε σύντομο χρονικό διάστημα

Πρακτικά, κάθε ένα από τα παραπάνω μπορεί να φτάσει να αποτελεί μια διπλωματική

μόνο του. Αλλά αυτό θα φανεί στην πορεία.

ΑΤΟΜΑ: 1

ΕΠΙΠΕΔΟ: Διπλωματική για Μηχανικούς

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java

ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ:

Η δυσκολία έγκειται στο κομμάτι της τεχνολογίας λογισμικού, ώστε να φτιαχτεί το

λογισμικό ως μια μηχανή υψηλής ποιότητας και στο κομμάτι της σχεδίασης του σχετικού

αλγορίθμου επεξεργασίας των parsed αρχείων για τα μη-διαδραστικά κομμάτια. Τα

οφέλη για ένα φοιτητή είναι: (α) τεχνογνωσία σε θέματα πρακτικής εφαρμογής απλών

αλγοριθμικών λύσεων, (β) τεχνογνωσία σε θέματα εξέλιξης του σχήματος βάσεων

δεδομένων, και (γ) πρακτική εμπειρία σε θέματα σχεδίασης και υλοποίησης αλγορίθμων,

API σε Java και GUI σε ένα (1) συγκροτημένο σύνολο.

Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο στον προγραμματισμό και

ενδιαφέροντα στις βάσεις δεδομένων και την τεχνολογία λογισμικού.

Απαιτούμενα προσόντα είναι η πολύ καλή γνώση Java και η δεδηλωμένη δέσμευση να

ολοκληρωθεί η εργασία αυστηρά εντός ενός έτους από την ανάληψή της

Κωστούδας

Page 8: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 8

1.3. [!!] ΕΡΓΑΛΕΙΟ ΜΑΖΙΚΗΣ ΟΠΤΙΚΟΠΟΙΗΣΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ

ΠΕΡΙΛΗΨΗ: Ο σκοπός της παρούσας διπλωματικής είναι η εμπεριστατωμένη,

οργανωμένη και ελεγχόμενη οπτικοποίηση της εξέλιξης πολλών σχημάτων μέσω ενός

εργαλείου.

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Ο στόχος είναι να κατασκευαστεί εργαλείο, με το οποίο:

(α) κάνουμε register είτε ένα, είτε πολλά σχήματα (μαζικά)

(β) αν δεν υπάρχουν ήδη τα στατιστικά, γίνεται κλήση της Εκάτης και εξάγονται

αυτόματα οι αλλαγές και οι μετρικές ως csv files

(γ) παράγεται μια (html) οπτική αναπαράσταση, για κάθε data set, η οποία

περιλαμβάνει στατιστικά, patterns και γραφικές αναπαραστάσεις (εδώ υπάρχει

σημαντικό πεδίο για αυτοσχεδιασμό, καθώς θέλουμε η οπτικοποίηση να μπορεί να λάβει

χώρα ΚΑΙ locally, χωρίς να χρειάζεται η φόρτωση σε web server, άρα θέλουμε

οποιοδήποτε library που μπορεί να δώσει stand-alone οπτικοποιήσεις)

H εσωτερική κατασκευή επιτάσσει την επεκτασιμότητα ως προς τα συστατικά της

παραγόμενης αναφοράς.

ΑΤΟΜΑ: 1

ΕΠΙΠΕΔΟ: Διπλωματική για Μηχανικούς

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java for the mass process και όποια τεχνολογία οπτικοποίησης

ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ:

Η δυσκολία έγκειται στο κομμάτι της τεχνολογίας λογισμικού, ώστε να φτιαχτεί το

λογισμικό ως μια μηχανή υψηλής ποιότητας. Τα οφέλη για ένα φοιτητή είναι: (α)

τεχνογνωσία σε θέματα οπτικοποίησης δεδομένων, (β) τεχνογνωσία σε θέματα

εξέλιξης του σχήματος βάσεων δεδομένων, και (γ) πρακτική εμπειρία σε θέματα

υλοποίησης αλγορίθμων, API σε Java και GUI με τεχνολογίες παγκόσμιου ιστού.

Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο στον προγραμματισμό και

ενδιαφέροντα στις βάσεις δεδομένων και την τεχνολογία λογισμικού.

Απαιτούμενα προσόντα είναι η πολύ καλή γνώση Java και η δεδηλωμένη δέσμευση να

ολοκληρωθεί η εργασία αυστηρά εντός ενός έτους από την ανάληψή της

Βούλγαρης:

εξετάζεται

ΦΕΒ’20

Θα υπάρξει

συνέχεια!

Page 9: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 9

1.4. [!] ΑΝΑΜΟΡΦΩΣΗ ΛΟΓΙΣΜΙΚΟΥ ΓΙΑ ΕΡΓΑΛΕΙΟ ΟΠΤΙΚΗΣ ΑΝΑΠΑΡΑΣΤΑΣΗΣ ΤΗΣ

ΕΞΕΛΙΞΗΣ ΣΧΕΣΙΑΚΩΝ ΠΙΝΑΚΩΝ (ΠΛΟΥΤΑΡΧΟΥ ΒΙΟΙ ΠΑΡΑΛΛΗΛΟΙ)

ΠΕΡΙΛΗΨΗ: Αναμόρφωση του εργαλείου Πλουτάρχου Βίοι Παράλληλοι

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Το εργαλείο Πλουτάρχου Βίοι Παράλληλοι απεικονίζει οπτικά

την εξέλιξη ενός σχεσιακού σχήματος.

Ο στόχος της πτυχιακής εργασίας είναι:

1. Να οριοθετηθούν σωστά έλεγχοι ορθής συμπεριφοράς του εργαλείου

2. Αναμόρφωση του κώδικα ώστε να καθαριστεί από μικρά προβλήματα

(ονοματοδοσία μεταβλητών, νεκρός κώδικας, copy-paste κώδικα κλπ) και να

οργανωθεί σε καλά διαχωρισμένα υποσυστήματα (front-end, logic, domain) που

συνδέονται μέσω interfaces

3. Να επεκταθεί το εργαλείο με την παραγωγή μιας εσωτερικής αναπαράστασης για

το παρουσιαζόμενο αποτέλεσμα, καθώς και να χρησιμοποιηθεί το εργαλείο για

να μελετηθούν οι ομοιότητες της αναπαράστασης αυτής σε μεγάλο αριθμό από

σχήματα.

ΕΠΙΠΕΔΟ: Διπλωματική για Μηχανικούς (τα δύο πρώτα bullets) ή MSc (όλα)

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java

ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ: Το θέμα βρίσκεται καθαρά στο χώρο της Τεχνολογίας

Λογισμικού, με έμφαση στις πτυχές του refactoring & testing. Η δυσκολία έγκειται

στο ρίσκο της ανεύρεσης γενικών κανόνων ομαδοποίησης των οπτικών

αναπαραστάσεων και στην εισαγωγή μιας μεθόδου που θα παράγει ένα καλό

αποτέλεσμα. Μια δεύτερη πρόκληση αφορά την εσωτερική αναμόρφωση του κώδικα,

ώστε να επιτρέπει την επιζητούμενη επέκταση. Έχει υπάρξει ήδη μια προεργασία για τα

θέματα αναμόρφωσης.

Τα οφέλη για ένα φοιτητή είναι:

(α) τεχνογνωσία σε μια προχωρημένη περιοχή, αυτή της εξόρυξης πληροφορίας (data

mining), η οποία όλο και αποκτά νέα δυναμική (όσο τα δεδομένα αυξάνονται),

(β) τεχνογνωσία σε θέματα εξέλιξης του σχήματος βάσεων δεδομένων, και

(γ) πρακτική εμπειρία σε θέματα υλοποίησης data-intensive συστημάτων σε Java.

Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο στην εξόρυξη πληροφορίας

και ενδιαφέροντα στις βάσεις δεδομένων, τον προγραμματισμό και την τεχνολογία

λογισμικού.

Απαιτούμενα προσόντα είναι η πολύ καλή γνώση Java και η δεδηλωμένη δέσμευση να

ολοκληρωθεί η εργασία αυστηρά εντός ενός έτους από την ανάληψή της

Page 10: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 10

1.5. [!!!] ΚΑΤΑΣΚΕΥΗ ΝΕΩΝ Ή ΑΝΑΜΟΡΦΩΣΗ ΥΠΑΡΧΟΝΤΩΝ ΕΡΓΑΛΕΙΩΝ ΓΙΑ ΤΗΝ

ΟΠΤΙΚΟΠΟΙΗΣΗ ΤΗΣ ΜΕΛΕΤΗΣ ΤΗΣ ΕΞΕΛΙΞΗΣ ΣΧΗΜΑΤΩΝ

ΠΕΡΙΛΗΨΗ: Κατασκευή εκ του μηδενός ή Αναμόρφωση λογισμικού (refactoring)

για τα εργαλεία Πλουτάρχου Βίοι Παράλληλοι και Παρμενίδεια Αλήθεια

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Το εργαλείο Πλουτάρχου Βίοι Παράλληλοι απεικονίζει οπτικά

την εξέλιξη ενός σχεσιακού σχήματος. Το εργαλείο Παρμενίδεια Αλήθεια φτιάχνει ένα

γράφημα με όλους τους πίνακες που υπήρξαν ποτέ σε ένα σχήμα και τα εξωτερικά

κλειδιά τους. Ο στόχος είναι τα εργαλεία να γενικευθούν και να μπορούν να

χρησιμοποιηθούν σε οποιοδήποτε εξελισσόμενο σύνολο δεδομένων που έχει ένα σύνολο

βασικών οντοτήτων, που αλλάζει στο χρόνο, με συμβάντα αλλαγών.

Ο στόχος κάθε τέτοιας πτυχιακής εργασίας είναι:

1. Να μελετηθεί και να σχεδιαστεί σωστά το εργαλείο

2. Να οριοθετηθούν σωστά έλεγχοι ορθής συμπεριφοράς του εργαλείου

3. Να υπάρχει παραγωγή μιας εσωτερικής αναπαράστασης και για την εισερχόμενη

είσοδο και για το παρουσιαζόμενο αποτέλεσμα

4. Να υλοποιηθεί και να ελεγχθεί ένα ικανό υποσύνολο της λειτουργίας του

υπάρχοντος αντίστοιχου εργαλείου και στο front-end και στο back-end

Ιδέες Parmenidian Truth Ploutarch’s Parallel Lives

Γλώσσα περιγραφής Graphml/gml + will need a translation from input (e.g., Hecate) + customized labeling

Ad-hoc description of actors and lives

Εντοπισμός αλλαγών Ins/Del/Upd of nodes/edges Annotation of cells PLD[time,actor] with events Reporting Report on the events & delta’s, diachronic stuff,

etc Reporting of community-level macro + micro stuff

Για τον Παρμενίδη, θέλουμε να εξελιχθεί σε γενικό εργαλείο διαχείρισης εξελισσόμενων

γραφημάτων:

(α) μετάφραση του input (από snaphsots of the input graph) σε μια generic

representation language (e.g., graphml or gml) που περιγράφει και επισημειώνει τα

στοιχεία του Input στη δικιά της αναπαράσταση

(β) εξαγωγή αφενός των διαχρονικών χαρακτηριστικών εξέλιξης όλου του πληθυσμού

nodes/edges του Input και αφετέρου των αλλαγών και στατιστικών μεταξύ των

snaphsots

(γ) υπολογισμός φάσεων και ομάδων από ομοειδείς agents

(δ) reporting on the results of (β)

(ε) οπτική αναπαράσταση και εξαγωγή των ίδιων περιγραφών (pptx, possibly movie too)

με το υπάρχον εργαλείο

ΠΑΝΤΕΛΙΔΗΣ:

from scratch

ΠΛΟΥΤΑΡΧΟΣ

Page 11: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 11

Για τον Πλούταρχο, θέλουμε κατ’ αντιστοιχία

(α) επίσης περιγραφή του Input σε μια δικιά μας γλώσσα περιγραφής. Εδώ, αντί για

εξελισσόμενο γράφημα έχουμε ένα διδιάστατο χώρο agents (e.g., tables) X time periods

και μέσα στα σημεία του χώρου τη λίστα με τα γεγονότα που συνέβησαν.

(β) εξαγωγή των χαρακτηριστικών εξέλιξης του συνόλου του πληθυσμού, αλλά και

χαρακτηρισμοί για επί μέρους agents ή περιόδους

(γ) - (ε) κατ’ αντιστοιχία με Παρμενίδη

ΕΠΙΠΕΔΟ: Σειρά διπλωματικών για Μηχανικούς

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java

ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ: Τα θέματα βρίσκονται καθαρά στο χώρο της

Τεχνολογίας Λογισμικού, με έμφαση στις πτυχές του principled design /

refactoring & του testing.

Η δυσκολία έγκειται στην διεκπεραίωση της εργασίας εντός ενός εύλογου χρονικού

πλαισίου. Κατά τα λοιπά, πρόκειται για ένα τυπικό έργο τεχνολογίας λογισμικού.

Η δυσκολία βρίσκεται κυρίως στη σωστή σχεδίαση του λογισμικού, την κατανόηση και

εκμάθηση των τεχνολογιών οπτικής αναπαράστασης και διαδραστικών γραφικών

διαπροσωπειών. Τα οφέλη για ένα φοιτητή είναι: (α) τεχνογνωσία σε ζητήματα

σχεδίασης, ελέγχου, και hands-on σε ένα ευμέγεθες κομμάτι λογισμικού, και (β), εμπλοκή

στο χώρο του προγραμματισμού διαδραστικών γραφικών διαπροσωπειών.

Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο σε προγραμματιστικά θέματα

και σε θέματα διαχείρισης δεδομένων. Πρέπει να μπορείτε να ανταπεξέλθετε και στη

σχεδίαση λογισμικού και στην ανάπτυξη του σχετικού συστήματος.

Απαιτούμενα προσόντα είναι η πολύ καλή γνώση Java και η δεδηλωμένη δέσμευση να

ολοκληρωθεί η εργασία αυστηρά εντός ενός έτους από την ανάληψή της.

Page 12: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 12

1.6. [!] MULTI-DATASET CLASSIFICATION FOR SCHEMA EVOLUTION DATASETS

ΠΕΡΙΛΗΨΗ: Εξαγωγή «πρότυπων νόμων» που χαρακτηρίζουν την εξέλιξη ενός πίνακα

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Σε κάθε ένα από τα σύνολα δεδομένων που έχουμε συλλέξει,

έχουμε στατιστικά για κάθε πίνακα, όπως π.χ., ημ. γέννησης, αρ. πεδίων τη στιγμή της

γέννησής του, ρυθμός αλλαγών, ημερομηνία διαγραφής, κλπ. Μπορούμε να βρούμε

κανόνες που να μας λένε –π.χ., με ένα δέντρο απόφασης- τι θα συμβεί στο μέλλον (α) στη

δραστηριότητα, (β) στην επιβίωση, (γ) στο συνδυασμό δράσης και επιβίωσης ενός

πίνακα, με βάση αυτά τα χαρακτηριστικά?

Το ζήτημα εδώ είναι ότι ένας απλός αλγόριθμος εξαγωγής ενός δέντρου απόφασης θα

εξάγει διαφορετικά δέντρα απόφασης για κάθε βάση δεδομένων, ενώ εμείς θέλουμε ένα

μηχανισμό που να προσπαθεί να γενικεύσει τα παραγόμενα δέντρα από διαφορετικά

σύνολα δεδομένων και να δώσει (α) ένα όσο το δυνατόν πιο γενικό σύνολο κανόνων, το

οποίο, (β) να μπορεί να γίνεται customize με βάση τα εξελικτικά ιδιοχαρακτηριστικά της

κάθε βάσης δεδομένων (π.χ., σε κάποια βάση μπορεί να υπάρχουν πολλές διαγραφές, σε

άλλη λίγες) ώστε να έχουμε ένα απλό και κατανοητό «μηχανισμό» πρόβλεψης.

Ουσιαστικά, θα πρέπει τα εξελικτικά χαρακτηριστικά μιας βάσης δεδομένων να

λειτουργούν ως ένα επιπλέον input του αλγορίθμου.

ΕΠΙΠΕΔΟ: MSc ή Διπλωματική για Μηχανικούς

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java

ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ: Η δυσκολία έγκειται στο ρίσκο της ανεύρεσης γενικών

κανόνων κατηγοριοποίησης και στην εισαγωγή μιας μεθόδου που θα παράγει ένα καλό

αποτέλεσμα. Ιδιαίτερες τεχνικές δυσκολίες στην υλοποίηση δεν υπάρχουν – θα

χρησιμοποιηθούν έτοιμες υλοποιήσεις (τουλάχιστον γι’ αρχή), καθώς ο στόχος δεν είναι

άλλος ένας αλγόριθμος κατηγοριοποίησης αλλά ένας απλός μηχανισμός πρόβλεψης.

Τα οφέλη για ένα φοιτητή είναι:

(α) τεχνογνωσία σε μια προχωρημένη περιοχή, αυτή της εξόρυξης πληροφορίας (data

mining), η οποία όλο και αποκτά νέα δυναμική (όσο τα δεδομένα αυξάνονται),

(β) τεχνογνωσία σε θέματα εξέλιξης του σχήματος βάσεων δεδομένων, και

(γ) πρακτική εμπειρία σε θέματα υλοποίησης data-intensive συστημάτων σε Java.

Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο στην εξόρυξη πληροφορίας

και ενδιαφέροντα στις βάσεις δεδομένων, τον προγραμματισμό και την τεχνολογία

λογισμικού.

Απαιτούμενα προσόντα είναι η πολύ καλή γνώση Java και η δεδηλωμένη δέσμευση να

ολοκληρωθεί η εργασία εντός δύο εξαμήνων το πολύ.

Page 13: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 13

2. ΔΙΑΧΕΙΡΙΣΗ ΧΡΟΝΟΣΕΙΡΩΝ Μια χρονοσειρά είναι μια λίστα από τιμές (που ευλόγως μπορούμε να υποθέσουμε ότι

είναι πραγματικοί αριθμοί). Κάθε μία τιμή έχει λοιπόν την θέση της στη λίστα και

ενδεχομένως και άλλες ιδιότητες, όπως π.χ., κάποιο χρονόσημο.

Δείτε για παράδειγμα την παραπάνω χρονοσειρά (τα δεδομένα είναι από το

http://www.gapminder.org/)

2.1. DATA ANALYTICS FOR TIME-SERIES

ΠΕΡΙΛΗΨΗ: Το ζητούμενο είναι, μέσα από μια σειρά Διπλωματικών Εργασιών, να

φτιαχτεί ένα σύστημα διαχείρισης χρονοσειρών με ένα σύνολο βασικών λειτουργιών και

γραφικών απεικονίσεων.

ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ: Οι χρονοσειρές μπορούν να χρησιμοποιηθούν για διάφορους

σκοπούς. Επίσης, μπορούν να αναπαρασταθούν εσωτερικά με διαφορετικούς τρόπους.

Ο γενικός στόχος για μια σειρά από συμπληρωματικές διπλωματικές είναι

κατασκευασθεί ένα modular σύστημα διαχείρισης χρονοσειρών με τα εξής

χαρακτηριστικά:

- Front-end, separate from the back-end

- Modular expansion of different algorithms (saxification, segmentation,

prediction, motif extraction, outlier detection, …)

- Handling of both multi- and single- measure time-series

Ο μακροπρόθεσμος στόχος είναι να μπορούμε να υποστηρίξουμε την ανάλυση

χαρακτηριστικών χρονοσειρών, μέσα από ένα εργαλείο που υποστηρίζει ροές εργασίας

για χρονοσειρές (π.χ., όλη τη ροή του (α) σπάω σε trend/period/noise, (β) ελέγχω αν το

σφάλμα είναι εντός αποδεκτών ορίων, (γ) αν όχι, λογαριθμίζω, … κ.ο.κ.) με βάση τη

θεωρία από τη σχετική βιβλιογραφία.

Existing java frameworks at Github είναι διάφορα (search for “java + time-series” or “java

+ timeseries”):

- https://github.com/signaflo/java-timeseries (worth checking)

Γκαβαρδίνας:

εξετάζεται

ΦΕΒ’20

Θα υπάρξει

λογικά

συνέχεια

Page 14: ΘΕΜΑΤΑ ΜΕΤΑΠΤΥΧΙΑΚΩΝ ΔΙΠΛΩΜΑΤΙΚΩΝ ΚΑΙ ...pvassil/courses/diplomatikes/2019-2020/...D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx

D:\Users\pvassil\PEOPLE\DIPLOMATIKES\ANNUAL\2019-2020\2019-2020_ThesisTopics_Public_v02_SHORT.docx 14

- https://github.com/patrickzib/SFA (worth checking)

- https://github.com/seninp/HOTSAX (worth checking)

- https://github.com/Workday/timeseries-forecast

- https://github.com/elki-project/elki

Χρειάζεται μια αρχική αξιολόγηση, λοιπόν, αν και ποιο υπάρχον framework μπορεί να

χρησιμοποιηθεί για το σκοπό του συστήματος ή/και αν πρέπει να αναπτυχθεί ένα νέο.

Επιμέρους δουλειές με σημασία: μοντελοποίηση (via SAX), segmentation in

phases(multiple techniques exist), prediction (multiple techniques exist), motif discovery

(e.g., the work of A. Mueen, E. Keogh).

ΕΠΙΠΕΔΟ: Διπλωματικές για Μηχανικούς

ΠΛΑΤΦΟΡΜΑ ΕΡΓΑΣΙΑΣ: Java

ΠΡΟΚΛΗΣΕΙΣ και ΟΦΕΛΗ: Τα οφέλη για ένα φοιτητή είναι: (α) εμπλοκή σε ένα χώρο με

προοπτικές, αυτόν του time series management, που φαίνεται να έχει ιδιαίτερες

προοπτικές στο μέλλον, (β) τεχνογνωσία σε θέματα εξόρυξης δεδομένων και

ενσωμάτωσης αλγορίθμων εξόρυξης δεδομένων σε κώδικα, και (γ) hands-on σε ένα

ευμέγεθες κομμάτι λογισμικού.

Η εργασία είναι πλέον κατάλληλη για φοιτητές με ταλέντο και σε θέματα διαχείρισης

δεδομένων και σε προγραμματιστικά θέματα. Πρέπει να σας αρέσει πολύ η διαχείριση

δεδομένων, η εξόρυξη δεδομένων και η ανάπτυξη λογισμικού.

Απαιτούμενα προσόντα είναι η πολύ καλή γνώση Java και η δεδηλωμένη δέσμευση να

ολοκληρωθεί η εργασία αυστηρά εντός ενός έτους από την ανάληψή της.