Live show

Παρουσίαση της Μεταπτυχιακής Εργασίας του μεταπτυχιακού φοιτητή του Τμήματος Επιστήμης Υπολογιστών κ. Μπουντρογιάννη Κων/νου

Παρουσίαση της Μεταπτυχιακής Εργασίας του μεταπτυχιακού φοιτητή του Τμήματος Επιστήμης Υπολογιστών κ. Μπουντρογιάννη Κωνσταντίνου με θέμα:

“Συμβολικές αναπαραστάσεις βάσει δεδομένων για ανάλυση χρονοσειρών σε υψηλό επίπεδο ”

09 Ιουλίου 2020, 10:00-12:00

Περιγραφή: Η συστηματική συλλογή δεδομένων είναι πλέον μια εγγενής διαδικασία όλων των πτυχών της σύγχρονης ζωής. Από βιομηχανικά μηχανήματα έως μηχανήματα υγειονομικής περίθαλψης και φορητούς αισθητήρες, μια άνευ προηγουμένου ποσότητα δεδομένων διατίθεται για εξόρυξη και ανάκτηση πληροφοριών. Ο συνεχώς αυξανόμενος όγκος και η πολυπλοκότητα των δεδομένων χρονοσειρών απαιτούν αποτελεσματική μείωση των διαστάσεων των δεδομένων για τη διευκόλυνση των εργασιών εξόρυξης δεδομένων. Οι συμβολικές αναπαραστάσεις, ειδικότερα η οικογένεια των συμβολικών συναθροιστικών προσεγγίσεων (SAX), έχουν αποδειχθεί πολύ αποτελεσματικές για τη συμπίεση της πληροφορίας που περιέχεται στις χρονοσειρές, ενώ εκμεταλλεύονται τον πλούτο των αλγορίθμων αναζήτησης που χρησιμοποιούνται στις κοινότητες της βιοπληροφορικής και της εξόρυξης κειμένου. Ωστόσο, οι τυπικές τεχνικές που βασίζονται στην SAX υποθέτουν ότι τα υποκείμενα στατιστικά χαρακτηριστικά των δεδομένων είναι Γκαουσιανά, με αποτέλεσμα συχνά να επιδεινώνεται η απόδοσή τους σε πρακτικές εφαρμογές. Για να ξεπεραστεί αυτός ο περιορισμός, η διατριβή αυτή παρουσιάζει μια μέθοδο που αναιρεί οποιαδήποτε υπόθεση σχετικά με την κατανομή πιθανότητας των χρονοσειρών, μέσω εκτίμησης πυκνότητας με πυρήνα (KDE) και Lloyd-Max βάντισης. Η πειραματική αξιολόγηση σε πραγματικά δεδομένα καταδεικνύει την ανωτερότητα της προτεινόμενης μεθόδου, σε σύγκριση με τη συμβατική SAX και μια εναλλακτική μέθοδο βασιζόμενη στη SAX, που λειτουργεί με απευθείας προσαρμογή στα δεδομένα. Τέλος, στην παρούσα διατριβή, η προτεινόμενη μέθοδος μείωσης διαστάσεων αξιοποιείται για να παρέχει συμπαγείς αναπαραστάσεις χρονοσειρών με στόχο την ανίχνευση ανωμαλιών. Για το σκοπό αυτό, αναπτύσσεται ένα υπολογιστικά αποτελεσματικό, αλλά πολύ ακριβές, πλαίσιο για ανίχνευση ανωμαλιών σε ροές δεδομένων σε χώρους λιγότερων διαστάσεων, ενώ εναλλακτικά σχήματα κβαντισμού διερευνώνται και χρησιμοποιούνται για πιο ακριβή άντληση στατιστικών συμπερασμάτων.

Επιβλέπων: Καθηγητής, Π. Τσακαλίδης
Not enabled

Coverage

Start:
09-07-2020 10:00


End:
09-07-2020 12:00

Connections

Peak:
8