Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΔ)

Permanent URI for this collection


Recent Submissions

Now showing 1 - 20 of 148
  • ItemOpen Access
    Robust techniques of gaze estimation, based on the eye centers localization and tracking and the exploitation of facial features
    (2023-11-01) Πουλόπουλος, Νικόλαος; Poulopoulos, Nikolaos
    Nowadays, there is a growing interest in improving human-computer interaction (HCI) due to the penetration of computer systems in every aspect of everyday life. Eyes constitute the most characteristic features of the human face, as they provide valuable insights into human behavior and cognition. Eye gaze constitutes a revolutionary approach to interact without physical contact fostering a more natural and responsive interaction between humans and computers. The main objective of this thesis is to develop accurate and reliable methods for localizing the positions of the eye centers and estimating the eye gaze, using standard cameras under natural illumination, without the requirement of any dedicated equipment. Despite the active research in this field, precise eye center localization and gaze estimation remain challenging problems due to many limitations related to the great variety in shape and color of human eyes, occlusions from hair or glasses, shadows and illumination variations, facial expression and head pose diversities, etc. and become even more challenging in applications where the need of real-time performance is crucial. The methods developed for the localization of the eye centers aim to deal with the aforementioned degradations by introducing novel approaches and provide accurate results improving the state-of-the-art accuracy. A modified version of the Fast Radial Symmetry Transform, namely MFRST, that emphasizes on the shape of the iris and aims to find shapes with high radial symmetry, was introduced. Moreover, this shape-based transform was combined with a Convolutional Neural Network (CNN) in order to reduce the false detections of the MFRST and thus increase the overall performance. In the sequel, a novel end-to-end eye center localization architecture that performs image to heatmap regression between the eye regions and the corresponding heatmaps was introduced. Finally, a novel framework, dubbed PupilTAN, that tried to solve the eye localization problem in an unsupervised way was also presented, revealing a novel insight on solving the eye localization problem in the case of limited supervision. Moreover, the gaze estimation problem is also extensively examined, providing solutions based on limited supervision by exploiting a large amount of unlabeled data. An unsupervised gaze representation learning approach based on gaze transfer that aims to disentangle the gaze feature, was introduced, and then, a gaze estimator was trained using few calibration samples. All the proposed methods have been extensively evaluated in challenging datasets and compared to the state-of-the-art, revealing enhanced accuracy. This work has also led to novel insights on solving the eye localization and gaze estimation problems especially in the case of limited supervision, while the low complexity of the proposed techniques makes them a reliable solution for real-time applications.
  • ItemOpen Access
    Καινοτόμες τεχνικές αποσαφήνισης κειμένου με οντότητες Wikipedia
    (2023-08-31) Σίμος, Μιχαήλ-Άγγελος; Simos, Michail Angelos
    Οι εδραιωμένες μεθοδολογίες εξόρυξης κειμένου και ανάκτησης πληροφορίας εξαντλούν τα όριά τους όταν εφαρμόζονται σε περιβάλλον δεδομένων μεγάλου όγκου. Αυτές οι προσεγγίσεις, ως επί το πλείστων βασίζονται στην ανάλυση λεξιλογικού περιεχομένου κειμένων, εστιάζοντας σε μια επιφανειακή επεξεργασία, με συνέπεια να αποτυγχάνουν στον προσδιορισμό υποκείμενης πληροφορίας που διατυπώνεται με πολύσημες λέξεις ή φράσεις. Στο πλαίσιο της διδακτορικής διατριβής, πραγματοποιήθηκε έρευνα στο πεδίο της σημασιολογικής αναπαράστασης πληροφορίας, συγκεκριμένα στο πρόβλημα της σημασιολογικής αποσαφήνισης κειμένου με οντότητες Wikipedia. Βασική επιδίωξη αποτέλεσε η διερεύνηση του πεδίου, η μελέτη καινοτόμων μεθοδολογιών και προσεγγίσεων στο πρόβλημα με χρήση κατανεμημένων υπολογιστικών πόρων σε περιβάλλοντα νεφοϋπολογιστικής για εφαρμογές τεχνητής νοημοσύνης και η διερεύνηση τεχνικών για επίτευξη αποδοτικής διαδικασίας αποσαφήνισης σε όρους ακρίβειας και υπολογιστικής πολυπλοκότητας. Παράλληλα, πραγματοποιήθηκε έρευνα σε εφαρμογές που βασίζονται σε σημασιολογική αναπαράσταση πληροφορίας, με αξιοσημείωτες συνεισφορές ελεύθερου λογισμικού/ λογισμικού ανοιχτού κώδικα για αποδοτική σημασιολογική αποσαφήνιση κειμένου με οντότητες Wikipedia. Στόχος της εργασίας ήταν τόσο η βελτίωση αλγορίθμων και συστημάτων, όσο και η διερεύνηση, ανάλυση και αξιολόγηση καινοτόμων προσεγγίσεων.
  • ItemOpen Access
    Εφαρμογές μεθόδων εξόρυξης γνώσης και δομών δεδομένων στα κοινωνικά δίκτυα
    (2023-10-03) Ρόμπολας, Γεράσιμος; Rompolas, Gerasimos
    Η αυξανόμενη ανάγκη των επιχειρήσεων για την αποτελεσματική λήψη επιχειρηματικών αποφάσεων, έχει οδηγήσει τις επιχειρήσεις να στραφούν στην αναζήτηση αποδοτικών μεθόδων αξιοποίησης δεδομένων των μέσων κοινωνικής δικτύωσης. Η συγκεκριμένη έρευνα επικεντρώνεται συνεπώς στην αξιοποίηση αυτών των δεδομένων για την εξαγωγή πολύτιμων πληροφοριών που μπορούν να προωθήσουν την ανάπτυξη των επιχειρήσεων και να βελτιώσουν την ικανοποίηση των πελατών. Αξιοποιώντας καινοτόμες μεθοδολογίες που συνδυάζουν τεχνικές επεξεργασίας φυσικής γλώσσας και μηχανικής μάθησης, οι επιχειρήσεις μπορούν να διαχειρίζονται και να αναλύουν αποτελεσματικά την πληθώρα πληροφοριών που παράγεται από τους χρήστες στα μέσα κοινωνικής δικτύωσης. Παράλληλα, η έρευνα μελετά τα χαρακτηριστικά της συμπεριφοράς και των συναισθημάτων των χρηστών, με σκοπό την μοντελοποίηση των δυναμικών σχέσεων που αναπτύσσονται μεταξύ καταναλωτών και επιχειρήσεων. Επιπλέον, ιδιαίτερη έμφαση δίνεται στη σημασία του χρόνου στη διαχείριση των σχέσεων, η οποία επιτρέπει στις επιχειρήσεις να αξιολογούν εγκαίρως την κατάσταση των πελατειακών τους σχέσεων και να εφαρμόζουν αποτελεσματικές εκστρατείες μάρκετινγκ. Στο πλαίσιο αυτό, παρουσιάζεται επίσης μία καινοτόμα μεθοδολογία για την αποδοτική ταξινόμηση χρονοσειρών των χρηστών σε κατηγορίες ρητορικής μίσους ή μη, με τη χρήση πολυδιάστατων δομών δεδομένων, όπου αξιοποιώντας τις χρονικές πληροφορίες και τη σημαντικότητα των χρηστών στα κοινωνικά δίκτυα, τα αποτελέσματα της ταξινόμησης βελτιώνονται. Επομένως, παρέχοντας μεθοδολογίες με τη χρήση τεχνικών μηχανικής μάθησης και δομών δεδομένων στα μέσα κοινωνικής δικτύωσης, η παρούσα έρευνα συμβάλλει στην προώθηση των δυνατοτήτων λήψης αποφάσεων των επιχειρήσεων, εστιάζοντας στη σημασία της αποτελεσματικής διαχείρισης και ανάλυσης των δεδομένων των μέσων κοινωνικής δικτύωσης για την απόκτηση ανταγωνιστικού πλεονεκτήματος στο σημερινό δυναμικό τοπίο της αγοράς.
  • ItemOpen Access
    Βασικές δομές δεδομένων και η εφαρμογή τους στην υπολογιστική γεωμετρία και στην ανάκτηση πληροφορίας
    (1997-07-07) Μακρής, Χρήστος; Makris, Christos
    Το πρόβλημα της δόμησης δεδομένων συνίσταται στην επιλογή της συγκεκριμένης υλοποίησης ενός αφηρημένου τύπου δεδομένων για την αποτελεσματική αντιμετώπιση αλγοριθμικών προβλημάτων. Ένας αφηρημένος τύπος δεδομένων συνίσταται στον ορισμό ενός συνόλου αντικειμένων και των επιτρεπόμενων λειτουργιών που μπορούν να εφαρμοστούν σε αυτό. Η συγκεκριμένη εργασία αποτελεί μια μελέτη των βασικών δομών δεδομένων στην επιστήμη των υπολογιστών και της εφαρμογής τους στην ανάπτυξη αποτελεσματικών αλγορίθμων για προβλήματα στην κύρια μνήμη (περιοχή της Υπολογιστικής Γεωμετρίας) και στη δευτερεύουσα μνήμη (περιοχή Ανάκτησης Πληροφορίας). Στην περιοχή της υπολογιστικής γεωμετρίας, ασχολείται με προβλήματα τομών για απλά και γενικευμένα αντικείμενα, με το πρόβλημα της διαπέρασης ορθογωνίων και με το πρόβλημα της κυριαρχίας σημείων. Στην περιοχή της Ανάκτησης Πληροφορίας, ασχολείται με την ανάπτυξη μιας νέας δομής δεδομένων για την αποτελεσματική αποθήκευση και ανάκτηση αρχείων υπογραφών. Οι προτεινόμενοι αλγόριθμοι αναλύονται κυρίως θεωρητικά, με εξαίρεση τη μέθοδο αποθήκευσης αρχείων υπογραφών, όπου παρουσιάζονται επίσης πειραματικά αποτελέσματα.
  • ItemOpen Access
    Συστήματα ανίχνευσης χαρακτηριστικών των ασθενειών με τεχνικές μηχανικής μάθησης
    (2022-11-02) Γιάννου, Ολυμπία; Giannou, Olympia
    Μία από τις πιο γοργά αναπτυσσόμενες περιοχές της επιστήμης των υπολογιστών είναι η ανάπτυξη έξυπνων συστημάτων που υποστηρίζουν τις αποφάσεις των χρηστών και παρέχουν ένα ευρύ πεδίο υπηρεσιών. Η εξυπνάδα τους βασίζεται στην παρακολούθηση και αποκωδικοποίηση των δεδομένων και των αναγκών του χρήστη και επιτυγχάνεται με την εφαρμογή τεχνικών μηχανικής μάθησης. Ειδικά η επεξεργασία εικόνας, η ανίχνευση αντικειμένων και η εξαγωγή χαρακτηριστικών/ιδιοτήτων ασθενειών από κάθε είδους δεδομένα εισόδου αποτελούν τις πιο σημαντικές εφαρμογές τεχνικών μηχανικής μάθησης στην Ιατρική. Παλαιότερα, πριν την εποχή της Μηχανικής Μάθησης, η εξαγωγή χαρακτηριστικών ήταν περιορισμένη. Τα νευρωνικά δίκτυα διαθέτουν μεθόδους για την επίτευξη τόσο της εξαγωγής χαρακτηριστικών όσο και της αξιολόγησης χαρακτηριστικών, φτάνοντας έτσι σε αποφάσεις φιλτράροντας τις άσχετες εξαγόμενες πληροφορίες. Τα δεδομένα επεξεργάζονται και αναπαρίστανται μέσω μαθηματικών διαδικασιών και αυτή η αναπαράσταση οδηγεί στην εξαγωγή αναρίθμητων ιδιοτήτων–χαρακτηριστικών που εξάγονται από τις εικόνες εισόδου. Η μηχανική μάθηση εξειδικεύεται σε μη-γραμμικά προβλήματα, γι’ αυτό και η αξιοποίησή τους στον τομέα των ιατρικών εικόνων είναι υποσχόμενη. Το αντικείμενο της παρούσας διατριβής είναι να διερευνήσει τα οφέλη των τεχνικών μηχανικής μάθησης στην ιατρική, όπως η κατηγοριοποίηση εικόνων, η εξαγωγή χαρακτηριστικών ασθενειών μέσω εικόνων, η τμηματοποίηση εικονιζόμενων ανθρώπινων οργάνων και η αξιολόγηση σοβαρότητας ασθενειών και βιοδεικτών. Η ερμηνεία των αποτελεσμάτων γίνεται και από τους δύο τομείς, της ιατρικής και της πληροφορικής. Στόχος είναι η παρουσίαση μοντέλων δυναμικής αξιολόγησης της σοβαρότητας μιας ασθένειας και εξαγωγής σημαντικών χαρακτηριστικών της. Αυτή η εργασία αφορά στο καρκίνο ήπατος, στην κολίτιδα, σε αναπνευστικά προβλήματα όπως το άσθμα. Πιο συγκεκριμένα, τα μοντέλα αυτά θα μπορούσαν να αξιοποιηθούν ως διαγνωστικά εργαλεία σε πραγματικό χρόνο και ως βοηθητικά συστήματα λήψης ιατρικών αποφάσεων σε πραγματικές συνθήκες. Εφαρμόζεται η συστημική προσέγγιση που αρχίζει με τα στοιχεία εισόδου. Τα στοιχεία αυτά αφορούν τον ασθενή: ποντικός ή άνθρωπος (χαρακτηριστικά) και τα χαρακτηριστικά ασθένειας: ηπατικό καρκίνο, κολίτιδα, αναπνευστικό πρόβλημα όπως άσθμα. Συνεχίζουμε με την ευφυή - αλγοριθμική, στατιστική κ.λπ. - επεξεργασία αυτών των στοιχείων (α) για να εκτιμήσουμε την τρέχουσα κατάσταση και σοβαρότητα της ασθένειας, τα χαρακτηριστικά του ασθενή και τις συνθήκες και (β) για να κατανοήσουμε την κατάσταση και να υποστηρίξουμε παθητικά ή ενεργά το γιατρό ή ερευνητή υγείας, με τη σχετική διάγνωση ή πρόγνωση. Η σάρωση των ανθρώπινων οργάνων και τα αποτελέσματα αυτής σε μορφή Magnetic Resonance Imaging (MRI) ή Computed Tomography (CT) παίζει ένα σημαντικό ρόλο στη διάγνωση και στην κατηγοριοποίηση των βλαβών/ασθενειών όπως είναι οι καρκινικοί όγκοι, ή/και στην αξιολόγηση του ποσοστού σοβαρότητας κάποιας ασθένειας. Στόχος της παρούσας διατριβής είναι να προτείνει τις βέλτιστες επιλογές ανάπτυξης και υλοποίησης μοντέλων εκπαίδευσης με τεχνικές μάθησης (machine learning) για πληροφοριακά συστήματα, που αξιοποιούν τις δυνατότητες των κινητών τηλεφώνων / συσκευών και του παγκόσμιου ιστού (web app) ώστε να ανιχνεύουν ασθένειες και τα χαρακτηριστικά τους, το είδος πειραματικού δείγματος. Επίσης, η έρευνα εστιάζει στην ανίχνευση χαρακτηριστικών διάφορων ασθενειών, όπως άσθμα ή ελκώδης κολίτιδα, μέσω αλγορίθμων τεχνικής μάθησης που εφαρμόζονται σε δεδομένα εικόνων Magnetic Resonance Imaging (MRI) / Computed Tomography (CT) ή ιστολογικών εικόνων. Η ανίχνευση και ανάλυση χαρακτηριστικών ασθενειών γίνεται χωρίς απαίτηση προσωπικών στοιχείων από τον εκάστοτε χρήστη της εφαρμογής ή του συστήματος. Η έρευνα περιλαμβάνει στατιστική ανάλυση όλων των αλγορίθμων εκπαίδευσης των προτεινόμενων συστημάτων, στηριγμένη στον υπολογισμό τιμών μια ποικιλίας μετρικών. Προσφέρεται η δυνατότητα ενημέρωσης, παρακολούθησης, επαναξιολόγησης των ασθενειών όπως καρκίνος, κολίτιδα, άσθμα, κλπ., μέσω μιας απλής ως προς τη χρήση εφαρμογής κινητού τηλεφώνου ή web εφαρμογής. Στόχος της έρευνας είναι η ανάπτυξη έξυπνων πληροφοριακών συστημάτων που μπορούν να βοηθήσουν σημαντικά στη διάγνωση και πρόγνωση, άμεσα και με ακρίβεια. Οι προτεινόμενες μέθοδοι θα μπορούσαν να χρησιμοποιηθούν σε πραγματικές συνθήκες από νοσοκομεία και χώρους έρευνας θεμάτων υγείας.
  • ItemOpen Access
    Προχωρημένες τεχνικές επεξεργασίας σήματος για κινητές επικοινωνίες επόμενης γενιάς στο χιλιοστομετρικό φάσμα συχνοτήτων
    (2022-11-01) Τρίγκα, Μαρία; Trigka, Maria
    Η συνεχώς αυξανόμενη ανάγκη για ασύρματη μετάδοση δεδομένων με πολύ υψηλό ρυθμό έχει ως αποτέλεσμα τη μελέτη συστημάτων που μπορούν να εμφανιστούν στα δίκτυα κινητής τηλεφωνίας 5ης και 6ης γεννιάς με συχνότητες έως και πάνω από 60 GHz. Ένα βασικό χαρακτηριστικό των συχνοτήτων στο χιλιοστομετρικό φάσμα είναι ότι, λόγω της σοβαρής απώλειας διαδρομής, το κανάλι είναι πολύ αραιό, όχι μόνο στο χρόνο αλλά στη συχνότητα και στο χώρο των γωνιών, με αποτέλεσμα τα λαμβανόμενα σήματα στις κεραίες να είναι συσχετισμένα. Η υψηλή εξασθένηση και ευαισθησία στο μπλοκάρισμα απαιτούν αρχιτεκτονικές και πρωτόκολλα αντιμετώπισης αυτών των προκλήσεων. Ως εκ τούτου, στη σχετική βιβλιογραφία έχουν προταθεί οι υβριδικές συστοιχίες μαζικών κεραιών για τη μετάδοση αυτών των σημάτων. Η υβριδική δομή φαίνεται να είναι απαραίτητη, δεδομένου ότι μια αμιγώς ψηφιακή δομή έχει υψηλό κόστος υλοποίησης και κατανάλωση ισχύος σε τεράστιες συστοιχίες κεραιών Πολλαπλών Εισόδων-Πολλαπλών Εξόδων. Αυτή η δομή αποτελείται από ένα αναλογικό και ένα ψηφιακό μέρος, το οποίο, στον πομπό, ονομάζεται προκωδικοποιητής και, στον δέκτη, συνδυαστής. Οι βασικές αρχιτεκτονικές για την υλοποίηση του αναλογικού τμήματος των υβριδικών συστημάτων κεραιών χωρίζονται σε πλήρως ή μερικώς συνδεδεμένες και υποσυνδεδεμένες (οι κεραίες είναι οργανωμένες σε μη επικαλυπτόμενες ομάδες), οι οποίες μπορούν να υλοποιηθούν μέσω ολισθητών φάσης ή διακοπτών. Για τον σχεδιασμό αυτών των δομών απαιτείται γνώση καναλιού. Γι 'αυτό το λόγο, αυτή η διατριβή εστιάζει σε τεχνικές εκτίμησης καναλιού για τον εντοπισμό ανοιχτών ζητημάτων και προτείνει νέες προσεγγίσεις. Η εφαρμογή συμβατικών τεχνικών εκτίμησης καναλιών είναι απαγορευτική λόγω του μεγάλου αριθμού κεραιών πομπού-δέκτη και των απαιτούμενων συμβόλων εκπαίδευσης λόγω του υψηλού εύρους ζώνης και του χαμηλού επιπέδου λόγου σήματος προς θόρυβο πριν από την ευθυγράμμιση πομπού-δέκτη. Η εκτίμηση καναλιού στο χιλιοστομετρικό φάσμα μπορεί να επιτευχθεί είτε με σάρωση του χώρου των γωνιών (π.χ. μέσω μιας εξαντλητικής, ιεραρχικής αναζήτησης) για την εύρεση του καλύτερου ζεύγους λοβών μεταξύ πομπού-δέκτη ή διαμορφώνοντας ένα αραιό πρόβλημα ανάκτησης. Το περιβάλλον διάδοσης τυπικά μοντελοποιείται χρησιμοποιώντας το γεωμετρικό μοντέλο καναλιού που περιλαμβάνει την απώλεια διαδρομής και τις γωνίες αναχώρησης και άφιξης στο πλευρά πομπού και δέκτη, αντίστοιχα. Η βασική ιδέα της παραμετρικής μοντελοποίησης είναι να υπολογιστούν οι εμπλεκόμενες γωνίες και οι αντίστοιχες εξασθενήσεις αντί να εκτιμηθεί η κρουστική απόκριση του καναλιού. Στην επεξεργασία σήματος για συστοιχίες κεραιών, έχουν σχεδιαστεί διάφοροι αλγόριθμοι εκτίμησης των γωνιών άφιξης για την κλασσική ομοιομορφή και γραμμική διάταξη κεραιών και παρουσιάζουν ιδιαίτερο ενδιαφέρον για τους ερευνητές εδώ και αρκετές δεκαετίες, π.χ. στα ραντάρ και τις έξυπνες κεραίες. Στο πρώτο μέρος της διατριβής, υποθέτοντας υβριδικής αρχιτεκτονικής διάταξη κεραιών στον δέκτη, προτείνεται ένα νέο σχήμα προεπεξεργασίας που επιτρέπει την πλήρη ανάκτηση του στιγμιότυπου σαν να είχαμε την κλασσιή γραμμική διάταξη, χρησιμοποιώντας μετρήσεις από τις αλυσίδες ραδιοσυχνοτήτων της υβριδικής δομής. Στη συνέχεια, οποιαδήποτε κλασική υψηλής ανάλυσης τεχνική εκτίμησης φάσματος ισχύος μπορεί να χρησιμοποιηθεί για την εκτίμηση των εμπλεκόμενων άφιξης και άρα το κανάλι. Επίσης, μια πληθώρα αποτελεσματικών προσεγγίσεων αραιής κωδικοποίησης έχουν προταθεί για την απευθείας εκτίμηση των γεωμετρικών παραμέτρων οι οποίες εκμεταλλεύονται τις ιδιότητες αραιότητας του χιλιοστομετρικού καναλιού για μείωση του υπολογιστικού κόστους των μεθόδων χωρικής σάρωσης. Επιπλέον, δεδομένου ότι τα δίκτυα 5ης γενιάς θα αποτελούνται από μικρές και πυκνές κυψέλες, η συνεργατική επικοινωνία μεταξύ κοντινών συσκευών που μοιράζονται παρόμοια χαρακτηριστικά καναλιού θα είναι μια πολλά υποσχόμενη τεχνολογία. Στις ασύρματες επικοινωνίες, οι αραιές αναπαραστάσεις έχουν χρησιμοποιηθεί για την αποτελεσματική μοντελοποίηση και εκτίμηση ενός καναλιού μιας συσκευής με τη βοήθεια μεθόδων αραιής κωδικοποίησης, ενισχύοντας τη φασματική και ενεργειακή απόδοση των 5ης γενιάς δικτύων και του Διαδικτύου των Πραγμάτων. Ως εκ τούτου, το δεύτερο μέρος της παρούσας διατριβής εστιάζει σε μοντέλα από κοινού αραιότητας για την αναπαράσταση των καναλιών των γειτονικών συσκευών και κατανεμημένων μεθόδων εκτίμησης που βασίζονται στις αραιές αναπαραστάσεις για τη διαμόρφωση μια προσέγγισης πλήρως κατανεμημένης και συνεργατικής μέσω ψηφοφορίας (με προσαρμοστικά βάρη) κατάλληλη για δίκτυα πολλαπλών εργασιών με μερικώς επικαλυπτόμενες παραμέτρους.
  • ItemOpen Access
    Allergic rhinitis passive detection, assessment, and monitoring using artificial intelligence of things (AIoT) and crowdsensing
    Τζαμαλής, Παντελής; Tzamalis, Pantelis
    Allergy-related respiratory diseases, such as asthma and rhinitis that coexist with the term respiratory allergy, are a major and growing public health problem in Greece and worldwide. Today, 70 million Europeans suffer from chronic asthma and 100 million from allergic rhinitis. Among them, a significant percentage suffer from a severe form of allergic disease, which affects their productivity and quality of life. These numbers are expected to increase in the coming decades, establishing respiratory allergy as a pandemic. It is estimated that the cost of rhinitis in Europe amounts to more than 100 billion euros per year. The main goals of the respective treatment are summarized in the monitoring and control of the symptoms, their treatment, and the effort to prevent future seizures. At the same time, the causal association with allergens is sought, in order to follow a special desensitization treatment in them. However, monitoring patients with allergic respiratory diseases is notably difficult. The aim of this work is to create an integrated, sensor- and crowdsourcing-based, eHealth/mHealth approach that is deployed in wireless environments, which adopts the principles of Healthcare 5.0 for the intelligent, automatic, holistic, effective, and continuous monitoring of allergic rhinitis disease outbreaks. In this paradigm shift into the digital healthcare approach, a study is conducted which is distinguished into two main parts. Initially, a platform is delivered that is capable of the large-scale spatiotemporal detection and monitoring of the disease exacerbation, in real-time. Additionally, the association of the allergens' onset with the allergic disease symptoms and the levels of occurrence of various irritants in a region (humidity, dust) are examined. The data that feeds the platform is generated from multiple and different types of resources in the form of, sensor measurements that are distributed across a region, text data from social media, as well as data that comes from the users’ subjective assessments, combined with geolocation recordings, concerning the intensity of their allergic symptoms. An analysis mechanism is integrated into the platform, which can process the hybrid forms of data that include, sensor measurements analysis, text-mining, and subjective inputs analysis, where the latter is a part of the users’ participatory sensing. Afterward, by the developed visualization mechanisms, the platform’s role is to provide information, in an easy-to-understand way, about the patient's health status and statistical inferences in charts and plots regarding the various forms of allergic symptoms and the people that affect them. Additionally, a notification service is deployed in case of intense symptoms. It is obvious that this approach integrates both human and machine intelligence together with their hybrid interaction. Nevertheless, the real challenge is to provide a complete automated analysis and passive monitoring of the disease, based only on machine intelligence. For that purpose, the work that the second part of the study consists of is the design and development of another platform that aims at the intelligent and automatic evaluation and identification of kinesiological data that is related to an individual’s allergic rhinitis symptoms (such as scratching the nose). Thus, this part of the study is transferred from the large-scale to the individual-scale disease monitoring scenario. In particular, the motion data, in this study, is actually gestures that are retrieved from smart wrist-worn devices. A whole set of algorithmic components is developed for an end-to-end analysis in this phase. In particular, an innovative data processing pipeline is employed in association with the utilization of AI. Specifically, the usage of both statistical learning models and cutting-edge neural network architectures leads to the practical motion data evaluation and pattern recognition of allergic gestures in the users’ daily activities. As a case study, the introduced end-to-end machine learning pipeline is integrated and tested for its efficiency, for the first time, in a real-world scenario, in the context of the development of a national funded project, called Personal Allergy Tracer, where the multidisciplinarity is adopted by collaborating with recognized allergists that validated the whole approach in real patients via a pilot phase. Additionally, as this thesis is a part of the project, another system is deployed, which is related to the individual’s allergic rhinitis status non-invasive monitoring, by utilizing all the data resources that the project owns. In particular, except for the motion data that pertains to the development of this thesis and is obtained by the smart wearables, the rest of the data that is exploited by this system, is retrieved by a smartphone application that is a major component of the project, and corresponds to: a) the analysis of voice alteration of the user that is obtained through the smartphones’ microphone, and, b) the subjective evaluation by the users regarding the intensity of their symptoms. Access to such data takes place through collaboration with established partners in the IT industry, in Greece. This multi-source data is then analyzed in a hybrid manner, and finally, the system induces the automated monitoring of respiratory allergy and acts as a sentinel and disease prevention tool for patients with allergic rhinitis symptoms. However, because AI is a major component in the various tasks of the analysis of this thesis, a framework has been developed capable of handling multi-domain end-to-end machine learning pipelines regarding the motion data evaluation and pattern recognition, as well as the classification of text data that is related to social media posts. The framework automates all the cutting-edge procedures from data processing, model training, fine-tuning, evaluation, and validation of the whole pipeline in the domains of time-series analysis and text-mining, and provides a Prediction Service for automatically deploying the pipeline in production. In conclusion, various benefits can arise from such an analysis of both approaches. For instance, the complementary collected information, from the crowdsourced data which constitutes the individuals’ subjective self-assessment and social media posts, as well as the sensors’ measurements, can lead to the better control and management of seasonal symptoms in cases of allergic diseases, where a medical decision support system can be formulated. The automated, passive, even geolocated, recording of symptoms’ exacerbations in combination with automated notification services can contribute significantly to the control of the disease, reducing morbidity and improving the quality of life of patients with respiratory allergy and their performance. It also has a positive impact on maintaining the productive capacity of patients with respiratory allergies at work or school.
  • ItemOpen Access
    Υπολογιστικές μέθοδοι για σχεδιασμό και ανάπτυξη φαρμάκων πολλαπλών στόχων για σύνθετες ασθένειες
    Μπαλωμένος, Παναγιώτης; Balomenos, Panos
    Ο σχεδιασμός φαρμάκων έχει ακολουθήσει διαχρονικά μια αφαιρετική προσέγγιση η οποία περιλαμβάνει την εύρεση χημικών ενώσεων που προσδένονται σε ένα στόχο, προσέγγιση η οποία βασίζεται σε μια φαινότυπο-κεντρική διαδικασία ανακάλυψης και όχι στον ακριβή τρόπο δράσης του φαρμάκου σε βιολογικό επίπεδο. Παρόλο που η προσέγγιση αυτή ιστορικά υπήρξε εξαιρετικά επιτυχημένη με ζενίθ τη δεκαετία του 1990, από την αρχή του αιώνα παράγει φθίνουσες αποδόσεις. Τα τελευταία χρόνια ωστόσο σημειώνεται μια αλλαγή παραδείγματος προς μια ανακάλυψη βασισμένη σε πολλαπλούς στόχους, η οποία έχει σκοπό να αντιμετωπίσει το εν λόγω κενό παραγωγικότητας, εστιάζοντας τόσο στην αποσαφήνιση των αιτιών εμφάνισης μιας ασθένειας σε μοριακό επίπεδο, όσο και στον ακριβή τρόπο δράσης ενός φαρμάκου, αξιοποιώντας την πρόοδο των γονιδιωματικών τεχνολογιών υψηλής απόδοσης. Η εικόνα εδώ είναι ιδιαίτερα περίπλοκη. Οι μοριακές αλληλεπιδράσεις δημιουργούν περίπλοκα δίκτυα που ρυθμίζουν τις βιολογικές λειτουργίες, οι οποίες έχουν ως αποτέλεσμα συγκεκριμένους φαινότυπους. Τα δίκτυα αυτά είναι γενικά εύρωστα, ωστόσο γενετικοί και περιβαλλοντικοί παράγοντες μπορούν να προκαλέσουν διαταραχές που οδηγούν στην ανάπτυξη μιας ασθένειας. Τα διαταραγμένα δίκτυα είναι και αυτά εύρωστα. Τα φάρμακα με τη σειρά τους δρουν σε μοριακό επίπεδο και έχουν ως αποτέλεσμα νέες διαταραχές που μεταδίδονται στα διάφορα επίπεδα οργάνωσης ώστε να θεραπεύσουν μια ασθένεια ή να ανακουφίσουν τα συμπτώματα της. Η φαρμακολογία συστημάτων φέρνει την υπόσχεση της επανάστασης στη διαδικασία ανακάλυψης φαρμάκων, ενώ ταυτόχρονα δύναται να δράσει ως καταλύτης στη μετάφραση φαρμακογενετικών εφαρμογών σε κλινικό περιβάλλον, η οποία έχει μείνει σχετικά στάσιμη παρά το πρόσφατο κύμα καινοτόμου έρευνας πάνω στις εφαρμογές των γενομικών τεχνολογιών στην ασθένεια. Στόχος της διδακτορικής διατριβής ήταν ο σχεδιασμός και η ανάπτυξη καινοτόμων υπολογιστικών μεθόδων, λογισμικού ανοιχτού κώδικα και οπτικοποιήσεων που μπορούν να χρησιμοποιηθούν στους βασικούς άξονες της φαρμακολογίας συστημάτων: το χαρακτηρισμό του μηχανισμού δράσης φαρμάκων, την ταυτοποίηση νέων φαρμακευτικών στόχων, την επανατοποθέτηση φαρμάκων και την πρόβλεψη παρενεργειών. Στο πρώτο κεφάλαιο, παρουσιάζεται μια εκτενής ανασκόπηση των υπολογιστικών προσεγγίσεων που χρησιμοποιούνται στους βασικούς άξονες της φαρμακολογίας συστημάτων. Στο δεύτερο κεφάλαιο παρουσιάζεται μια μέθοδος για εύρεση διαφορικά εκφρασμένων χρονικά μεταβαλλόμενων υπομονοπατιών. Η μέθοδος έχει την επεξηγηματική ισχύ να προσφέρει εστιασμένα χρονικά στιγμιότυπα των μηχανισμών που διαταράσσονται υπό πειραματικές συνθήκες, προσφέροντας ολιστική οπτική της δυναμικής των γονιδίων που συμμετέχουν σε κάθε μονοπάτι, λαμβάνοντας υπόψιν τόσο τη χρονική διάσταση της ενεργοποίησης ενός υπομονοπατιού όσο και το είδος της ρύθμισης μεταξύ των γονιδίων, καθώς και την τοπολογική διάσταση των ενεργοποιημένων υπομονοπατιών, δηλαδή το δυναμικό που έχει κάθε υπομονοπάτι να διαδώσει το βιολογικό σήμα είτε στην άμεση γειτονιά του είτε σε άλλα υπομονοπάτια. Στο τρίτο κεφάλαιο παρουσιάζεται μια μέθοδος για εύρεση διαφορικά εκφρασμένων υπομονοπατιών σε δίκτυα πολλαπλών μονοπατιών. Ορίζοντας το υπομονοπάτι εντός ενός ενοποιημένου δικτύου πολλαπλών μονοπατιών, η μέθοδος λαμβάνει υπόψιν της τις αλληλεπικαλύψεις μεταξύ μονοπατιών, ένα πεδίο μελέτης που έχει προσελκύσει σημαντικό ενδιαφέρον. Η εξαγωγή διαφορικά εκφρασμένων υπομονοπατιών γίνεται μέσω μιας μεγάλης ποικιλίας βιολογικά σχετικών μεθόδων ανάλυσης δικτύων, ενώ η ανάλυση διαφορικής έκφρασης σε επίπεδο γονίδιου επιτυγχάνεται με χρήση γνωστών μεθόδων ανάλυσης διαφορικής έκφρασης. Επιπλέον, κάθε υπομονοπάτι συσχετίζεται με εν δυνάμει λειτουργικούς και φαρμακολογικούς όρους οι οποίοι χαρακτηρίζουν, ρυθμίζουν ή συνδέονται με την έκφρασή του. Στο τέταρτο κεφάλαιο παρουσιάζεται μια μέθοδος για εύρεση διαφορικά εκφρασμένων υπομονοπατιών μέσω μιας προσέγγισης συναίνεσης. Η μέθοδος εκλεπτύνει ένα συνδυασμένο δίκτυο πολλαπλών μονοπατιών, κάνοντας χρήση τόσο διαφορικά εκφρασμένων γονιδίων όσο και τοπολογικά σημαντικών μη διαφορικά εκφρασμένων γονιδίων, τα οποία εμφανίζουν συσχετισμένα επίπεδα έκφρασης με τους γείτονές τους και διευκολύνουν τη διάδοση του βιολογικού σήματος, με σκοπό τη μείωση της πυκνότητας του συνδυασμένου δικτύου με βιολογικά ορθό τρόπο. Τελικά, το εκλεπτυσμένο δίκτυο ερευνάται για διαφορικά εκφρασμένα υπομονοπάτια χρησιμοποιώντας μια πληθώρα μεθόδων αναγνώρισης υπομονοπατιών και ελέγχεται για εμπλουτισμό σε λειτουργικούς όρους, όπως φάρμακα και ασθένειες. Στο πέμπτο κεφάλαιο παρουσιάζεται μια μέθοδος για εύρεση διαφορικά εκφρασμένων υπομονοπατιών μέσω μιας διεπίπεδης αξιολόγησης συναίνεσης της τοπολογίας δικτύου και της γονιδιακής έκφρασης σε δίκτυα μονών μονοπατιών, συνδυάζοντας τις ενδείξεις διαφορικής έκφρασης γονιδίων και ταξινομώντας τα υπομονοπάτια με βάση τη συνδεσιμότητά τους μέσα σε ένα δίκτυο πολλαπλών μονοπατιών, αποσκοπώντας στην παραγωγή υποψήφιων βιοδεικτών για φαρμακολογική παρέμβαση, ταξινομημένων σύμφωνα με το δυναμικό τους να προκαλέσουν παρενέργειες. Στο έκτο κεφάλαιο παρουσιάζεται ένα σχήμα οπτικοποίησης για τα πολυεπίπεδα υπομονοπάτια τα οποία παράγονται από τις μεθόδους των προηγούμενων κεφαλαίων, αλλά και από άλλες μεθόδους ανάλυσης υπομονοπατιών. Πρόκειται για μια νέα διαδραστική οπτικοποίηση, η οποία συγχωνεύει τη δομή δικτύου με την πληροφοριακά πλούσια οπτική που προσφέρεται από κυκλικές απεικονίσεις συσχετίσεων. Η οπτικοποίηση απεικονίζει μια δομή δικτύου πολλαπλών επιπέδων για ένα υπομονοπάτι με λειτουργικές συσχετίσεις με ένα σύνολο λειτουργικών όρων ενδιαφέροντος και τοπολογικές συσχετίσεις, οι οποίες αποτυπώνονται μέσω ενός συνόλου μετρικών ενδιαφέροντος. Την οπτικοποίηση πλαισιώνει ένα γραφικό περιβάλλον το οποίο μπορεί να επεκτείνει τις επεξηγηματικές δυνατότητες μεθόδων με υλοποιήσεις ως πακέτα της γλώσσας R.
  • ItemOpen Access
    Open learner modeling techniques in a digital educational game and study of motivation mechanisms
    Λεονάρδου, Αγγελική; Leonardou, Angeliki
    The student-centered learning approach known as Digital Game-based Learning (DGBL) uses digital games with educational materials to provoke student interest and to enhance their learning effectiveness. Within the two main DGBL parameters, i.e. learning (education) and gaming (fun, entertainment) the Multiplication Game (MG) was developed. MG is an adaptive digital game for developing and practising multiplication competences, which addresses primary school pupils and aims to develop the necessary multiplication skills in a fun and interactive way, in a safe environment with discreet error management. Through the Open Learner Model (OLM) and Open Social Learner Model (OSLM) techniques, metacognitive skills (e.g. self-assessment, self-organization) are promoted, while the opportunity of comparing pupil performance is offered. At the same time, it is possible for this tool to be used by teachers for easy evaluation and detailed monitoring of pupil performance. The MG supports all the participants involved in the learning process: pupil - teacher - classmates, so that it can be easily incorporated in the classroom. According to the research conducted, it was proved that teachers who have a positive attitude and acceptance for digital games, also have a positive view of MG. The provision of OLM data was also shown to enhance motivation, while gamification motivators were positively correlated with pupils' intrinsic motivation.
  • ItemOpen Access
    Αλγόριθμοι, μηχανισμοί και πρωτόκολλα για σύστημα αναζήτησης και διάσωσης βασισμένο σε φορητές συσκευές
    Παπαχρήστος, Νικόλαος; Papachristos, Nikolaos
    Τα τελευταία χρόνια οι εφαρμογές για έξυπνες συσκευές (smart-applications) λαμβάνουν μία ραγδαία αποδοχή από ένα συνεχώς αυξανόμενο αριθμό πληθυσμού. Αυτό οφείλεται στο γεγονός ότι έχουμε μεγάλη αύξηση των έξυπνων συσκευών και των έξυπνων τηλεφώνων μέσω των οποίων μπορούμε να τις ελέγξουμε. Η σύγχρονη αυτή τεχνολογία που υποστηρίζεται απο ένα μεγάλο σύνολο πλατφορμών θα μπορούσε να προσφέρει ενδιαφέρουσες διευκολύνσεις για διαφόρους τομείς όπως τον εντοπισμό και τη διάσωση ατόμων ιδιαίτερα ευπαθών ομάδων ή εκείνων που ανήκουν σε ομάδες πληθυσμού με μεγάλη πιθανότητα να χαθούν. ∆ιάφορες εταιρίες εστιάζουν σε LPWA (Low - Power Wide - Area) τεχνολογίες που έχουν σχεδιαστεί για τις ανάγκες του Internet of Things (IoT) όπως το LoRa/LoraWAN και το NB-IoT. Το χαρακτηριστικό των δύο παραπάνω τεχνολογιών είναι το χαμηλό κόστος και η μεγάλη εμβέλεια που διαθέτουν σε Line-Of-Site (LoS). Τα παραπάνω πρωτόκολλα στοχεύουν σε αναπτυξιακές εφαρμογές όπου οι τελικές συσκευές έχουν περιορισμένη ενέργεια (για παράδειγμα, μικρής χωρητικότητας μπαταρία) και δεν χρειάζεται να μεταδίδουν περισσότερα από μερικά bytes κάθε φορά, ενώ η κίνηση δεδομένων μπορεί να ξεκινήσει είτε από την τελική συσκευή (όπως όταν η τελική συσκευή είναι αισθητήρας) είτε από μια εξωτερική οντότητα που επιθυμεί να επικοινωνήσει με την τελική συσκευή. Κύριος στόχος της παρούσας διδακτορικής διατριβής είναι η μελέτη των σημαντικότερων υφιστάμενων αλγορίθμων για τον εντοπισμό της θέσης φορητής συσκευής - wearable. Επιπλέον, στόχος είναι η σύγκριση των υφιστάμενων λύσεων με βάση διάφορες μετρικές και η επιλογή των καλύτερων δυνατών αλγορίθμων για αξιοποίηση σε συσκευές ΙοΤ. Τέλος, στόχος της παρούσας διδακτορικής διατριβής είναι η μελέτη εφικτότητας νέων αλγορίθμων για εξοικονόμηση ισχύος wearables βασισμένων σε low power – long range τεχνολογίες, όπως είναι το LoRa/LoRaWAN (π.χ. για το πότε και που ενεργοποιείται η συσκευή, κάθε πότε εκπέμπει σήμα ανίχνευσης) ακόμα και η βελτίωση υπαρχόντων αλγορίθμων μέσω της μελέτης φυσικών χαρακτηριστικών, της αρχιτεκτονικής δικτύου και του πρωτοκόλλου MAC. Μια σειρά προσομοιώσεων που αφορούν την απόδοση των παραπάνω αλγόριθμων εντοπισμού θέσης ώστε να αξιολογηθούν για την ανάδειξη αποδοτικών λύσεων, σε κριτήρια όπως π.χ. ενεργειακή απόδοση και κατανάλωση, δρομολόγηση, διάρκεια ζωής μπαταρίας, QoS, κάλυψη και εμβέλεια του δικτύου καθώς και το μοντέλο ανάπτυξης και το κόστος είναι επιτακτική ανάγκη για την επιβεβαίωση της μελέτης που κάνουμε παραπάνω.
  • ItemOpen Access
    Innovative algorithmic techniques in cloud computing
    Πισπιρίγκος, Γεώργιος; Pispirigkos, Georgios
    In recent years, due to the universal spread of the internet, the amount of digitally available information continuously grows. Indicatively, in 2021 there are 7.83 billion people, 4.66 billions of whom are considered active Internet users 1 . In addition, over 100 million Gigabytes of data have yet been indexed, while approximately 2.5 billion Gigabytes of raw data are generated on daily basis 2 . Thus, as digital information massively grows, the need for compact data representations has never been more immediate. Among the rest data representations, information networks can undoubtedly be considered one of the most prominent, since they manage to harmonically combine different aspects of information in the same data entity. Specifically, this representation model subtly combines different data modalities, so as to conveniently incorporate the intrinsic inference and semantics. Therefore, by presenting each individual entity as a node and by denoting any kind of association with an interconnection edge, information graphs may adeptly formulate any functional system as one of interacting entities. The usage of this general-purpose abstraction has practically been proven beneficial and has widely been adopted in various scientific sectors - such as chemistry, biology, neuroscience, finance, linguistics, social sciences, software engineering, digital marketing, etc., - mostly because of its obvious interpretation. As a result, with the extended application of this hierarchical data representation in various important issues, - such as customer segmentation, epidemiology, political influence evolution, criminal identification, tissue/organ detection, etc.; - graph analysis has attracted significant scientific interest, triggering the conduction of an impressive amount of research. Focusing on social media, where in 2021 more than 4.14 billion people are considered active social media users 1 , it is obvious that the respective information can effectively be structured with information networks. Specifically, each user can compactly be presented as a vertex, while any kind of user interaction - such as “friendship”, “liking”, “following”, “sharing”, “expressing interest”, “re-tweeting”, etc.; - might be expressed with an interconnection edge between the corresponding vertices. From sentiment analysis, expert identification and mood analysis to recommendation systems, digital footprint analysis and viral marketing campaigns, graph theory lies under numerous substantial issues, aiming to introduce efficient information managing and data mining techniques. Undeniably, one of the most important network analysis topic is community detection. This problem principally aims to identify groups of highly similar entities, aka communities, by primarily leveraging the network topology [1-9] of the data graph under study. The necessity of this topic, as plainly explained in [10], concerns the deeper understanding of the subjacent network structure that could lead to the extraction of advantageous insights regarding the underlying dynamic processes. Therefore, with its appropriate generalization and its widespread adoption from numerous fields - such as recommendation systems, targeted market analysis, influence propagation, link prediction, opinion mining etc.; - this NP-hard graph analysis problem [1] has unquestionably become one of the most essential and challenging. In respect of sociology, community detection can alternatively be construed as the expression of the homophily effect [11,12], which reflect the natural human tendency to mostly associate and interact with groups of similar. Concentrating on social media, community detection can be differently interpreted as the identification of social media users’ groups that are, either directly or indirectly, connected with each other and tend to interact more often, comparing to users of different communities [13]. Consequently, by identifying the strongly related groups of individuals, any social network might be naturally decomposed to groups of highly interacting entities, the communities, which plainly disclose the given social graph's inner mechanics. Despite the lack of a broadly accepted definition [1-9], a community can be intuitively perceived considering its graph representation. Specifically, a set of vertices is expected to form a meaningful community, if only its intra-cluster and inter-cluster densities are bigger, and smaller respectively, to the average link density of the original graph [6]. However, as it is strongly underlined in [14], the optimal community hierarchy is generated when the inter-cluster and intra-cluster densities are comparatively better than expected, and not by the optimization of the individuals. In other words, a good graph division would not be the one in which the number of connections between communities is minimized, but the one in which there are fewer inter-connection edges than originally found. Because of this abstraction, community detection has practically become one of the most conceptually challenging and computationally demanding network analysis topics. Due to its profitable application in plenteous scientific areas, a numerous set of community detection algorithms [1-9] has already been published. From methods that are exclusively based on the repetitive calculation of a global network topology criterion, to alternatives inspired by discrete mathematics and physics, the pluralism of classic community detection approaches is indeed remarkable. The great majority of those methods and algorithms are originally designed to be generally applied to any information network. The classic community detection techniques - e.g., the Louvain [15] algorithm, the Girvan–Newman [16] algorithm, the Clauset–Newman–Moore [6] algorithm, the edge centrality optimization method [1], the geodesic edge betweenness [1] approach, etc.; - are basically recursive methods of high polynomial computational complexity aiming to optimize an iteratively modified and repetitively calculated set of global network topology metrics, in order to extract the underlying community hierarchy from any possible network. Nevertheless, those methods’ capacity has practically confirmed [1,4,8] to be profoundly limited in terms of scalability, outcome consistency, and overall reliability. As meticulously described in [1-9,17], the classic community detection solutions are principally static methods that neglect not only the information networks’ topological heterogeneities, but also their significantly variant subjacent community structure. Additionally, apart from the undisputed computational difficulties of global optimization processes, the actual size of today’s real-world social networks also acts as another major inhibitory factor. As plainly explained in [1], with their corresponding computational complexity being at least quadratic, the application of classic community detection algorithms in large-scale information networks, such as contemporary social media graphs, is prohibitive. In this regard, the primary intention of this thesis is the introduction of highly scalable and accurate community detection methodologies that would efficiently extract the underlying community hierarchy of modern, large-scale social information networks regardless of their size and density. Initially, by alternatively interpreting the node-oriented definition of community to its equivalent edge-oriented representation, the introduction of distributed community prediction takes place. The true purpose of these methodologies is to efficiently identify the subjacent community hierarchy of any large-scale social graph through prediction. This is achieved by classifying the imminent graph's edges to either the ones associating nodes of different communities, aka inter-connection edges, or of the same, aka intra-connection edges, solely based on plain network topology characteristics. The promising perspectives of the distributed community prediction have meticulously been analysed in the [18-20] research publications. All different proposed methodologies have thoroughly been examined on numerous real-life social networks and proven superior to various classic community detection methods in terms of performance, stability and accuracy. Furthermore, aiming to enhance the community identification process to further consider different aspects of social networks’ information, such as the intrinsic user profile information, the article [21] has been published. In this article, a distributed, hybrid, community detection methodology has been introduced that ably combined the local topological characteristics of each social media graph under study along with the existing user profile information, in order to unveil the subjacent community structure. The proposed hybrid community detection approach [21] has been extensively tested on various real-world social graphs, roundly compared to other classic divisive community detection algorithms and practically proven highly scalable and adequately accurate. Finally, the research publications [22,23] have plainly presented the beneficial application of community detection in other sectors such as the viral marketing and computational linguistics. Particularly, in case of [22], the Twitter Personality based Communicative Communities Extraction (T-PCCE) system has been introduced. This system [22], given a real-world Twitter social subgraph, aims to identify the communities of high internal information flows, by also considering the users’ personality traits. Regarding the case of [23], a word-sense disambiguation methodology has been introduced. Specifically, by employing classic community detection techniques and establishing the unprecedented concept of community coherence on the Wikipedia Entities’ semantic ontologies graph, this distributed methodology demonstrated impressive precision and general computational performance as regards the Wikification / text annotation problem. [1] Santo Fortunato: Community detection in graphs. CoRR abs/0906.0612 (2009) [2] Schaeffer, Satu. (2007). Graph Clustering. Computer Science Review. 1. 27-64. 10.1016/j.cosrev.2007.05.001. [3] Devi, J. & Eswaran, Poovammal. (2016). An Analysis of Overlapping Community Detection Algorithms in Social Networks. Procedia Computer Science. 89. 349-358. 10.1016/j.procs.2016.06.082. [4] Stavros Souravlas, Angelo Sifaleras, M. Tsintogianni, Stefanos Katsavounis: A classification of community detection methods in social networks: a survey. Int.J. Gen. Syst. 50(1): 63-91 (2021), doi: 10.1080/03081079.2020.1863394 [5] Cai, Q., Ma, L., Gong, M. and Tian, D. (2016) A survey on network community detection based on evolutionary computation, Int. J. Bio-Inspired Computation, Vol. 8, No. 2, pp.84–98, DOI: 10.1504/IJBIC.2016.076329. [6] Bisma S. Khan, Muaz A. Niazi: Network Community Detection: A Review and Visual Survey. CoRR abs/1708.00977 (2017) [7] Michele Coscia, Fosca Giannotti, Dino Pedreschi: A Classification for Community Discovery Methods in Complex Networks. CoRR abs/1206.3552 (2012) [8] Papadopoulos, S., Kompatsiaris, Y., Vakali, A. et al. Community detection in Social Media. Data Min Knowl Disc 24, 515–554 (2012). https://doi.org/10.1007/s10618-011-0224-z [9] Javed, M.A., Younis, M.S., Latif, S., Qadir, J., Baig, A., Community detection in networks: A multidisciplinary review, Journal of Network and Computer Applications (2018), doi: 10.1016/j.jnca.2018.02.011. [10] Andrea Lancichinetti, Mikko Kivelä, Jari Saramäki, Santo Fortunato: Characterizing the community structure of complex networks. CoRR abs/1005.4376 (2010) [11] Khediri, Nourhene & Karoui, Wafa. (2017). Community Detection in Social Network with Node Attributes Based on Formal Concept Analysis, 2017 IEEE/ACS 14th International Conference on Computer Systems and Applications, 1346-1353. 10.1109/AICCSA.2017.200. [12] Yuan Li: Community Detection with Node Attributes and its Generalization. CoRR abs/1604.03601 (2016) [13] P. Held, B. Krause and R. Kruse, "Dynamic Clustering in Social Networks Using Louvain and Infomap Method," 2016 Third European Network Intelligence Conference (ENIC), 2016, pp. 61-68, doi: 10.1109/ENIC.2016.017. [14] Newman MEJ. Modularity and community structure in networks. PNAS June 6, 2006 103 (23) 8577-8582; https://doi.org/10.1073/pnas.0601602103 [15] Vincent D. Blondel, Jean-Loup Guillaume, Renaud Lambiotte, Etienne Lefebvre: Fast unfolding of community hierarchies in large networks. CoRR abs/0803.0476 (2008) [16] E.J. Newman, Mark & Girvan, Michelle. (2004). Finding and Evaluating Community Structure in Networks. Physical review. E, Statistical, nonlinear, and soft matter physics. 69. 026113. 10.1103/PhysRevE.69.026113. [17] Peel, L.; Larremore, D.B.; Clauset, A. The ground truth about metadata and community detection in networks. Sci. Adv. 2017, 3, e1602548, doi:10.1126/sciadv.1602548. [18] Makris, C.; Pettas, D.; Pispirigos, G. Distributed Community Prediction for Social Graphs Based on Louvain Algorithm. In IFIP International Conference on Artificial Intelligence Applications and Innovations; Springer: Cham, Switzerland, 2019; pp. 500–511. DOI: 10.1007/978-3-030-19823-7_42 [19] Makris, C.; Pispirigos, G.; Rizos, I.O. A Distributed Bagging Ensemble Methodology for Community Prediction in Social Networks. Information 2020, 11, 199. https://doi.org/10.3390/info11040199 [20] Makris, C.; Pispirigos, G. Stacked Community Prediction: A Distributed Stacking-Based Community Extraction Methodology for Large Scale Social Networks. Big Data Cogn. Comput. 2021, 5, 14. https://doi.org/10.3390/bdcc5010014 [21] Konstantinos Georgiou, Christos Makris, Georgios Pispirigos: A Distributed Hybrid Community Detection Methodology for Social Networks. Algorithms 12(8): 175 (2019). https://doi.org/10.3390/a12080175 [22] Eleanna Kafeza, Andreas Kanavos, Christos Makris, Georgios Pispirigos, Pantelis Vikatos: T-PCCE: Twitter Personality based Communicative Communities Extraction System for Big Data. IEEE Trans. Knowl. Data Eng. 32(8): 1625-1638 (2020). DOI: 10.1109/TKDE.2019.2906197 [23] Makris, C.; Pispirigos, G.; Simos, M.A. Text Semantic Annotation: A Distributed Methodology Based on Community Coherence. Algorithms 2020, 13, 160. https://doi.org/10.3390/a13070160
  • ItemOpen Access
    Προσαρμοστικοί αλγόριθμοι για την βελτιστοποίηση της διαχείρισης πόρων σε αμιγώς οπτικά δίκτυα
    Δημήτρης, Μονογιός; Demetris, Monoyios
    Κατά τη διάρκεια της τελευταίας δεκαετίας, ο τομέας των δικτύων αναπτύχθηκε σε τεράστιο βαθμό. Η γρήγορη επέκταση του Διαδικτύου και η αυξανόμενη ζήτηση για τις πληροφορίες πολυμέσων συμβάλει στην άμεση ανάγκη για την ανάπτυξη νέων δικτύων μεγάλης χωρητικότητας. Στη παρούσα διδακτορική διατριβή μελετήθηκαν τρόποι και τεχνικές για την βελτιστοποίηση της διαχείριση πόρων σε αμιγώς οπτικά δίκτυα τα οποία είναι ικανά να ανταποκριθούν στις απαιτήσεις για μεταφορά μεγάλου όγκου δεδομένων. Ειδικότερα έχουν μελετηθεί τα δίκτυα οπτικής μεταγωγής ριπής (OBS), τα διαφανή οπτικά δίκτυα ανάθεσης μήκους κύματος, καθώς και τα παθητικά οπτικά δίκτυα. Στα δίκτυα OBS προτείνεται ένα νέο σχήμα δέσμευσης πόρων, που προσομοιώνει τη μονόδρομη (one-way) δέσμευση και το οποίο στηρίζεται σε ένα πρωτόκολλο αμφίδρομης (two-way) δέσμευσης και σε ένα μηχανισμό πρόβλεψης μήκους οπτικής ριπής-μεγέδους δεδομένων αποστολής, με χρήση φίλτρου N-order Normalized LMS (Least Mean Square). Τα αποτελέσματα του προτεινόμενου σχήματος συγκρίνονται με τα συμβατικά πρωτόκολλα δέσμευσης πόρων στα δίκτυα OBS, ενώ παράλληλα στα πλαίσια της διατριβής έγινε αποτίμηση των αποτελεσμάτων με στατικά πειράματα για την μελέτη της ταχύτητας σύγκλισης και της ακρίβειας του φίλτρου πρόβλεψης που προτείνεται, όπως επίσης και αποτίμησης των αποτελεσμάτων σε ένα μεγάλης κλίμακας δίκτυο με έμφαση στην επιτυχή λειτουργία-αποστολή δεδομένων, δηλαδή την χωρίς απώλεια πακέτου. Από τα αποτελέσματα αποδεικνύεται ότι το προτεινόμενο πρωτόκολλο μπορεί να εγγυηθεί μηδενικές απώλειες δεδομένων σε καλύτερους χρόνους μετάδοσης συγκριτικά με το κλασικό πρωτόκολλο της αμφίδρομης (two-way) δέσμευσης. Στη συνέχεια μελετήθηκε η δέσμευση πόρων σε πλήρες οπτικό επίπεδο. και ειδικότερα ο τρόπος αντιμετώπιση του προβλήματος ανάθεσης μήκους κύματος - routing and wavelength assignment (RWA), χρησιμοποιώντας γενετικού αλγορίθμους (GA). Η μελέτη που έγινε, επικεντρώνεται στη βελτίωση της απόδοσης μετάδοσης δεδομένων καθώς και τη μείωση του υπολογιστικού χρόνου επίλυσης του προβλήματος. Ο προτεινόμενος αλγόριθμος βελτιώνει την απόδοση καθώς και τον χρόνο εκτέλεσης, χρησιμοποιώντας πιθανές λύσης του προβλήματος κατά την αρχικοποίηση του πληθυσμού, λαμβάνοντας υπόψη τη μέγιστη ποσότητα Edge Disjoint Paths (EDPs), τα οποία προ-υπολογίζονται κατά την επίλυση του προβλήματος. Η προτεινόμενη προσέγγιση έχει αξιολογηθεί στην τοπολογία δικτύου NSF και είναι συγκρίσιμη με άλλες μεθόδους. Η πιο πάνω έρευνα εμπλουτίστηκε με τη μελέτη του προβλήματος RWA με επίγνωση των εξασθενήσεων (impairment aware RWA - IA-RWA) χρησιμοποιώντας κλασσική στρατηγική βελτιστοποίησης πολλαπλών στόχων (classical multi-objective optimization (MOO) strategy) με σκοπό να λαμβάνονται έμμεσα υπόψη οι αλλοιώσεις-εξασθενήσεις οι οποίες συνυπολογίζονται στο πρόβλημα βελτιστοποίησης, οδηγώντας σε αποτελέσματα που βελτιώνουν σημαντικά τον συντελεστή αποτυχίας μετάδοσης (blocking ratio). Επιπρόσθετα, αποδεικνύεται ότι ο προτεινόμενος MOGA (multi-objective optimization genetic algorithm) συγκλίνει προς μια καθολικά βέλτιστη λύση (Pareto-optimal solution), όταν λαμβάνεται υπόψη ένα επαρκές μέγεθος πληθυσμού στο πρόβλημα βελτιστοποίησης. Προτείνεται επίσης και ένας δεύτερος μονού κριτηρίου (single objective) αλγόριθμος GA για το πρόβλημα IA-RWA,) που χρησιμοποιεί τον συντελεστή εξασθένησης σήματος Q, για να αξιολογήσει την ποιότητα του σήματος. Αν και αυτή η προσέγγιση είναι έντονη υπολογιστικά, είναι επιτυχής τόσο στην επίλυση του στατικού-offline προβλήματος IA-RWA όσο και στην αποτίμηση της ευρετικής-heuristic προσέγγισης MOGA. Επιπρόσθετα, η έρευνα στα διαφανή οπτικά δίκτυα επεκτάθηκε προτείνοντας τη χρήση ενός γενετικού αλγορίθμου ο οποίος επιλύει τα προβλήματα RWA με σκοπό την μείωση της αλληλεπίδρασης των παρεμβολών εμπλοκής εντός και εκτός εύρους (in-band and out-of-band). Ο προτεινόμενος γενετικός αλγόριθμος συγκρίνεται με τη μέθοδο επίλυσης Integer Linear Program (ILP) που σχεδιάστηκε για τον ίδιο σκοπό, όπως επίσης και με ένα παραδοσιακό RWA που έχει ως στόχο μόνο την μείωση των χρησιμοποιούμενων μηκών κύματος. Τα αποτελέσματα της προσομοίωσης δείχνουν ότι ο νέος γενετικός αλγόριθμος που προτείνεται, δίνει λύσεις πολύ κοντινές με τις λύσεις της μεθόδους ILP. Επιπλέων τα αποτελέσματα της προσομοίωσης δείχνουν ότι ο αλγόριθμος RWA που λαμβάνει υπόψη τις παρεμβολές (crosstalk aware) επιτυγχάνει σημαντική μείωση των επιπτώσεων των αλληλεπιδράσεων εντός και εκτός εύρους (in-band and out-of-band interactions) στη περίπτωση των διαφανών δικτύων WDM. Στη συνέχεια, μελετήθηκε η επίλυση του προβλήματος δρομολόγησης με επίγνωση επιθέσεων (attack aware) κατά την ανάθεση μήκους κύματος (wavelength assignment). Για τη μελέτη αυτή, αναπτύχθηκε ένας νέος ILP αλγόριθμος (ILP-MP), ο οποίος κάνει ταυτόχρονη τοποθέτηση εξοπλισμού Παρακολούθησης Οπτικής Απόδοσης - Optical Performance Monitoring (OPM) με σκοπό την ελαχιστοποίηση της επίπτωσης των επιθέσεων εμπλοκής του φυσικού επιπέδου στα οπτικά δίκτυα. Επιπλέον, προτείνεται ένας νέος γενετικός αλγόριθμος (GA-MP) για την επίλυση του ίδιου προβλήματος βελτιστοποίησης, ο οποίος συγκρίνεται με τον προτεινόμενο ILP καθώς επίσης και με έναν απλό αλγόριθμο RWA ο οποίος δεν έχει επίγνωση των επιθέσεων (attack-unaware) και που έχει ως στόχο μόνο την ελαχιστοποίηση του αριθμού των απαιτούμενων μηκών κύματος (GA-simple). Τα αποτελέσματα προσομοίωσης υποδεικνύουν ότι ο προτεινόμενος GA-MP, μειώνει τον αριθμό των αλληλεπιδράσεων μεταξύ οπτικών διαδρομών με απόδοση παρόμοια με αυτή του ILP-MP αλγορίθμου, ενώ ταυτόχρονα η απόδοση σε όρους συνολικού αριθμού χρήσης μηκών κύματος για να δημιουργηθούν οι απαιτούμενες συνδέσεις στο δίκτυο είναι κοντά σε αυτή του απλού GA-simple. Τα αποτελέσματα προσομοίωσης δείχνουν ότι με την χρήση αλγορίθμων RWA που έχουν επίγνωση των εμπλοκών, επιτυγχάνεται σημαντική μείωση στην επίδραση των εντός και εκτός εύρους αλληλεπιδράσεων καναλιών και στον αριθμό των απαιτούμενων μηχανισμών παρακολούθησης σε διαφανή δίκτυα WDM. Τέλος μελετήθηκε η αποδοτικότερη διαχείριση πόρων στα παθητικά οπτικά δίκτυα και ειδικότερα στις τοπολογίες δακτυλίου με πολυπλεξία μήκους κύματος (Ring based WDM-PONs). Στα WDM-PONs όλα τα δικτυακά στοιχεία (ONU) ενώνονται κατά μήκος του δακτυλίου με μία επιπλέον οπτική ίνα για να παρέχεται ενδοεπικοινωνία μεταξύ τους. Προτείνεται ένας νέος αλγόριθμος για δυναμική δέσμευση χωρητικότητας με στόχο την αποδοτικότερη ενδοεπικοινωνία χωρίς επιπλέον κόστος. Η νέα λογική λαμβάνει υπόψη τη τοποθεσία κάθε οπτικού στοιχείου στο δακτύλιο και τα αποτελέσματα αποδεικνύουν ότι ο προτεινόμενος αλγόριθμος μπορεί να χρησιμοποιηθεί για αποτελεσματική ενδοεπικοινωνία μεταξύ των ONU σε δακτυλίους WDM-PON.
  • ItemOpen Access
    Νευρωνικά δίκτυα γράφων και συνελικτικά νευρωνικά δίκτυα γράφων και οι εφαρμογές τους στην βιοϊατρική
    Δελημιχάλης, Αλέξανδρος; Delimichalis, Alexandros
    Τα Νευρωνικά Δίκτυα Γράφων(Graph Neural Networks) (ΝΔΓ)είναι μοντέλα σύνδεσης που χρησιμοποιούν τη μετάδοση μηνυμάτων μεταξύ κόμβων γραφημάτων για να αντικατοπτρίζουν την εξάρτηση γράφου. Τα Νευρωνικά δίκτυα γράφων, σε αντίθεση με τα κανονικά νευρωνικά δίκτυα, διατηρούν μια κατάσταση που τους επιτρέπει να αντιπροσωπεύουν πληροφορίες από το άμεσο περιβάλλον τους με αυθαίρετο βάθος. Παρόλο που πάντα πιστεύαμε ότι η εκπαίδευση ΝΔΓ για ένα σταθερό σημείο ήταν δύσκολη, οι πρόσφατες βελτιώσεις στις τοπολογίες δικτύου, τις τεχνικές βελτιστοποίησης και την παράλληλη επεξεργασία κατέστη-σαν δυνατή την επιτυχή εκπαίδευσή τους. Πολλές εργασίες μηχανικής μάθησης περιλαμβάνουν την εργασία με δεδομένα γράφων ,τα οποία προσφέρουν πληθώρα σχεσιακών πληροφοριών μεταξύ τμημάτων. ́Ενα μοντέλο που μαθαίνει από τις εισόδους γραφημάτων απαιτείται για τη μοντελοποιήση συστημάτων φυσικής, την εκμάθηση μοριακών δακτυλικών αποτυπωμάτων, την πρόβλεψη αλληλεπίδρασης πρωτεϊνών και την κατηγοριοποίηση ασθενειών. Η πολυφαρμακευτική ή η χρήση φαρμακολογικών συνδυασμών για τη θεραπεία ασθενών με σύνθετες ασθένειες ή συνυπάρχουσες ασθένειες, είναι συχνή. Η πολυφαρμακευτική, από την άλλη πλευρά, έχει σημαντικό αντίκτυπο στον κίνδυνο ανεπιθύμητων παρενεργειών του ασθενούς. Οι αλληλεπιδράσεις μεταξύ ναρκωτικών και φαρμάκων δημιουργούν παρενέργειες πολυφαρμακευτικής δράσης, στις οποίες η δραστηριότητα ενός φαρμάκου αλλάζει, είτε ευνοϊκά είτε δυσμενώς, όταν λαμβάνεται με άλλο φάρμακο. Επειδή αυτές οι περίπλοκες συσχετίσεις είναι σπάνιες και συχνά δεν απαντώνται σε σχετικά μικρές κλινικές δοκιμές, η κατανόησή μας σχετικά με τις αλληλεπιδράσεις φαρμάκων είναι συχνά περιορισμένη. Ως αποτέλεσμα, ο προσδιορισμός των παρενεργειών της πολυφαρμακευτικής ουσίας παραμένει ένα τεράστιο ζήτημα με σοβαρές επιπτώσεις στη θνησιμότητα και τη νοσηρότητα των ασθενών. Προκειμένου να μοντελοποιήσει τις παρενέργειες πολυφαρμακευτικής χρησιμοποιώντας νευρωνικά δίκτυα γράφων, τοDecagon,δημιουργεί ένα πολυτροπικό γράφο αλληλεπιδράσεων πρωτεΐνης-πρωτεΐνης, αλληλεπιδράσεων φαρμάκου-στόχου πρωτεΐνης και παρενεργειών πολυφαρμακευτικής αγωγής, οι οποίες αντιπροσωπεύονται ως αλληλεπιδράσεις φαρμάκου-φαρμάκου, με κάθε παρενέργεια να αντιπροσωπεύεται από έναν ξεχωριστό τύπο ακμής. Το Decagon δημιουργήθηκε κυρίως για να χειριστεί πολυτροπικούς γράφους με πολλούς διαφορετικούς τύπους ακμών. Αυτή η μέθοδος δημιουργεί ένα νέο γράφημα συνελικτικού νευρωνικού δικτύου που μπορεί να προβλέψει πολυσχεσιακούς συνδέσμους σε πολυτροπικά δίκτυα. ΤοDecagonμπορεί να προβλέψει την ακριβή παρενέργεια, εάν υπάρχει, με την οποία ένας δεδομένος συνδυασμός φαρμάκων εμφανίζεται κλινικά, σε αντίθεση με τις τεχνικές που περιορίζονται στην πρόβλεψη απλών τιμών αλληλεπίδρασης φαρμάκου-φαρμάκου. Το Decagonπροσομοιώνει τις παρενέργειες της πολυφαρμακευτικής αγωγής με μια ισχυρή μοριακή βάση ιδιαίτερα αποτελεσματικά, ενώ επιτυγχάνει καλές επιδόσεις κυρίως στις μη μοριακές παρενέργειες λόγω της αποτελεσματικής ανταλλαγής παραμέτρων μοντέλου σε όλους τους τύπους ακμών. Το Decagon ανοίγει την πόρτα στη χρήση μεγάλων δεδομένων φάρμακο-γονιδιωματικών και πληθυσμού ασθενών για τον εντοπισμό και την ιεράρχηση των ανεπιθύμητων ενεργειών της πολυφαρμακευτικής αγωγής για περαιτέρω διερεύνηση μέσω επίσημων φαρμακολογικών ερευνών.
  • ItemOpen Access
    IoT systems and wireless power transfer protocols in ad-hoc communication networks
    Κατσιδήμας, Ιωάννης; Katsidimas, Ioannis
    The techniques of energy maintaining and replenishment in wireless communications networks have become particularly popular in recent years. Rapid technological advances in the field of Wireless Power Transmission (Wireless Power Transmission) have a major impact on sensor networks and more generally on energy-restricted communications networks, paving the way for new methods of energy management in wireless systems. Until recently, existing research mainly focused on maximizing network lifetime, improving charging efficiency, minimizing latency during charging, and so on. Most recent research has already begun to examine algorithmic solutions to address the problems that arise. At the same time, both the evolution and the application of ICT systems in very important areas of our lives (industry, smart home, smart cities, etc.) is rapid. IoT devices (devices connected to the internet) must be able to be deployed in any place and access them from everywhere. A large number of these devices perform monitoring and controlling tasks in "smart" applications as well as in difficult-to-access areas. For the successful implementation of these applications, an IoT device should be small and autonomous, while incorporating sensors, data processing and wireless communication capabilities. These simple conditions imply storage and power management limitations for the IoT devices in order to ensure their continued operation, since neither replacing the power cord nor the battery are viable choices under these conditions or simply because of the flexibility (fast installation without cable, no maintenance). Major growth opportunities in the coming years are expected in wireless power transmission and solar harvesting technologies approved for powering IoT devices. This increase is justified by significant advances in material science, engineering and extensive prototyping. Innovative energy storage solutions for IoT have already appeared in the market. In terms of energy management, a range of integrated solutions are available on the market to supply IoT devices that vary from home, up to industrial applications. RF charging, alongside other WPT technologies and ambient energy harvesters are today viable integrated energy sources for small, portable or not, devices. In this thesis, methods of efficient wireless electromagnetic radiation charging have been developed to improve the charging quality of unstructured communication networks and to develop IoT systems that will be able to utilize this technology. In particular, we present novel algorithmic methods based on a new, more realistic and accurate wireless power transfer model, which can efficiently capture constructive and destructive interference of the electromagnetic waves. These methods deal with problems such as i) charger’s power level, phase configuration and deployment towards power maximization, and ii) find low EM radiation paths in WPT systems. Besides the algorithmic perspective, modern energy provisioning approaches aim to combine different technologies that decouple harvesting from the environment and efficiently manage the available energy. Thus, we present novel IoT energy management platforms that integrate both RF-charging and ambient energy harvesting to power sensing and communication devices. Those platforms are utilised in a real application in the context of Smart Roads and are responsible to power a list of sensors and the corresponding communication module in a sufficient way.
  • ItemOpen Access
    Κατηγοριοποίηση ιστοπαθολογικών εικόνων με χρήση μηχανικής μάθησης πολλαπλών στιγμιότυπων
    Βαρέλης, Βασίλειος; Varelis, Vasileios
    Η παρούσα διπλωματική εργασία έχει ως στόχο την κατηγοριοποίηση Ιστοπαθολογικών εικόνων με τη χρήση μηχανικής μάθησης πολλαπλών στιγμιότυπων. Η συγκεκριμένη τεχνική βασίζεται στη χρήση νευρωνικών δικτύων και συγκεκριμένα Συνελικτικών Νευρωνικών δικτύων. Σκοπός της εργασίας είναι η μελέτη της χρήσης της συγκεκριμένης τεχνικής κατηγοριοποίησης, καθώς και ο πειραματισμός πάνω στις παραμέτρους που θα χρησιμοποιήσουμε στο κάθε νευρωνικό δίκτυο, καταγράφοντας τα αντίστοιχα αποτελέσματα. Για την εκπαίδευση και τον έλεγχο των συστημάτων, ως ιατρικά δεδομένα, χρησιμοποιήθηκαν ιστοπαθολογικές εικόνες καρκίνου του μαστού.
  • ItemOpen Access
    Αξιολόγηση πιστοληπτικής ικανότητας επιχειρήσεων και λήψη επιχειρηματικών αποφάσεων των ελληνικών τραπεζών με τη χρήση της μεθόδου AHP
    Κατσιμπέρης, Βαλεντίνος; Katsimperis, Valentinos
    Οι τράπεζες, προκειμένου να αποφασίσουν για την έγκριση ή την απόρριψη μιας αίτησης επιχειρηματικού δανείου, ακολουθούν μια διαδικασία αξιολόγησης. Σε ένα άκρως ανταγωνιστικό οικονομικό και επιχειρηματικό περιβάλλον επιδιώκουν συνεχώς να βρίσκουν ευέλικτες και απλούστερες μεθόδους αξιολόγησης, ώστε να είναι ευρέως εφαρμόσιμες, κατανοητές και εύκολα τροποποιήσιμες από τους αναλυτές τους. Η μελέτη αυτή παρουσιάζει ένα μοντέλο μαζικής αξιολόγησης επιχειρήσεων με τη χρήση της πολυκριτήριας ανάλυσης και άλλων μεθόδων λήψης αποφάσεων. Το εν λόγω μοντέλο αποτελείται από τρεις φάσεις που θα αναλυθούν μέσω δυο σεναρίων καταδεικνύοντας τη σταθερότητα και την ευελιξία του. Με τον τρόπο αυτό, εξοικονομούνται χρόνος και πόροι με ταυτόχρονη εξασφάλιση της ποιότητας των παραγόμενων αποτελεσμάτων. Η απόδοση του μετρείται μέσω της προσέγγισης εξόρυξης δεδομένων (καμπύλες ROC) καταδεικνύοντας τις δυνατότητές του. Στο τέλος της διαδικασίας θα προκύψει μια λίστα με αξιολογημένες και ταξινομημένες επιχειρήσεις οι οποίες, ανάλογα με τη βαθμολογία που επιτυγχάνουν, εγκρίνονται ή απορρίπτονται από την τράπεζα όσον αφορά τη λήψη ενός επιχειρηματικού δανείου.
  • ItemOpen Access
    Σχεδιασμός, ανάπτυξη και πειραματική αξιολόγηση κατανεμημένων αλγορίθμων διαχείρισης έξυπνων δικτύων ενέργειας
    Τσαμπάσης, Ελευθέριος; Tsampasis, Eleftherios
    H ολοένα αυξανόμενη ενεργειακή ζήτηση τις τελευταίες δεκαετίες έχει οδηγήσει στην αναζήτηση καινοτόμων τεχνικών παραγωγής, διαχείρισης και πρόβλεψης ενέργειας. Στο πλαίσιο αυτό, η έννοια του ευφυούς δικτύου αναφέρεται στην αποκεντρωμένη παραγωγή ενέργειας, με κύριο γνώμονα την βελτιστοποίηση της απόδοσης των ενεργειακών συστημάτων. Σκοπός της παρούσας διδακτορικής διατριβής είναι η μελέτη και η ανάλυση ευφυών δικτύων ηλεκτρικής ενέργειας. Στο πρώτο κεφάλαιο, πραγματοποιείται μια σύντομη εισαγωγή, αναλύονται οι βασικότερες έννοιες ενός «έξυπνου δικτύου» (smartgrid): Ως μια νέα ιδέα για το σύστημα παροχής ενέργειας, το έξυπνο δίκτυο περιλαμβάνει πολλές προηγμένες τεχνολογίες, μεθοδολογίες, νέους αλγόριθμους και δημιουργικές αρχιτεκτονικές ως υπηρεσία αλλά και για την λειτουργία των επιχειρήσεων, την επίλυση προβλημάτων, όπως μείωση εκπομπών άνθρακα, βελτιστοποίηση κατανομής πόρων, ασφάλεια δικτύου και βελτίωση αξιοπιστίας και παροχής ενέργειας κατά τον καλύτερο δυνατό τρόπο. Εν συνεχεία, το Δεύτερο κεφάλαιο εστιάζεται στη διερεύνηση των αναγκών και στην αναγνώριση καινοτόμων ιδεών που θα συμβάλουν στην έρευνα και στην ανάπτυξη της πρωτοβουλίας 5G ΡΡΡ / 5G για την υλοποίηση της χρήσης ευφυών δικτύων με τεχνολογίες 5G. Στο Τρίτο κεφάλαιο, αναλύεται μια τοπολογία διασύνδεσης ενός έξυπνου κτιρίου με ευφυές δίκτυο. Μελετώνται αποδοτικές τεχνικές ασύρματης μετάδοσης δεδομένων, σε θεωρητικό οικοδόμημα τριών ορόφων. Στο Τέταρτο κεφάλαιο, πραγματοποιείται μια ανασκόπηση σε όλες τις τεχνολογίες κατασκευής και φόρτισης ηλεκτρικών αυτοκινήτων. Τα ηλεκτρικά αυτοκίνητα συνιστούν ένα νέο είδος φορτίου για το έξυπνο δίκτυο. Για το σκοπό αυτό παρουσιάζονται και αναλύονται τα κύρια χαρακτηριστικά και οι απαιτήσεις των επικοινωνιών μεταξύ οχημάτων – δικτύου (VehicletoGrid- V2G) , καθώς και οι μελλοντικές εξελίξεις και τα σενάρια σε θέματα εξηλεκτρισμού. Επιπλέον, επισημαίνονται ζητήματα ενσωμάτωσης με τα δίκτυα κινητής τηλεφωνίας πέμπτης γενιάς (5G) που αναπτύσσονται επί του παρόντος, ώστε να διασφαλιστεί η άριστη ποιότητα μετάδοσης και λήψης στην επικοινωνία οχημάτων – δικτύου για την βελτίωση της εμπειρίας του χρήστη. Η εν λόγω ενσωμάτωση επεκτείνεται και στην τεχνολογία αυτόνομων οχημάτων (AutonomousVehicles - AVs) δεδομένου ότι απαιτείται βελτιστοποιημένη επεξεργασία πληροφοριών από διαφορετικές πηγές, προκειμένου να εξασφαλιστεί η προηγμένη διαχείριση της κυκλοφορίας σε όλες τις πτυχές της. Το Πέμπτο κεφάλαιο επεξεργάζεται πώς μπορεί να διαμορφωθεί η συμπεριφορά των χρηστών έτσι ώστε να μπορούν να ελεγχθούν διαφορετικές συμπεριφορές. Στη συνέχεια, αναθεωρούνται τα εργαλεία προσομοίωσης,οι υποδομές διασύνδεσης καθώς και οι αρχές που μπορούν να επεκταθούν προκειμένου να παρασχεθεί μια πλατφόρμα στην οποία η μοντελοποίηση και η προσομοίωση συμπεριφοράς κτιρίων, ελέγχου και συμπεριφοράς των χρηστών αποσυνδέονται από εξομοιωτές ισχύος ή δικτύου και υλοποιούνται ως συνιστώσες. Η κύρια συμβολή του είναι η παρουσίαση της βασικής λειτουργικότητας ενός τέτοιου εργαλείου προσομοίωσης έξυπνου δικτύου το οποίο επιτρέπει την ανεξάρτητη ανάπτυξη των στοιχείων και την αξιοποίηση των καλύτερων εργαλείων σε επίπεδο τομέα για γρήγορη εξέταση υπό μορφή πρωτοτύπου. Η κύρια συμβολή του Έκτου κεφαλαίου είναι η παρουσίαση της βασικής λειτουργικότητας ενός εργαλείου προσομοίωσης έξυπνου δικτύου, το οποίο επιτρέπει την ανεξάρτητη ανάπτυξη των στοιχείων και την αξιοποίηση των καλύτερων εργαλείων σε επίπεδο τομέα για γρήγορη εξέταση υπό μορφή πρωτοτύπου. Τέλος, στο Έβδομο κεφάλαιο αναλύονται τα βασικότερα συμπεράσματα της διατριβής, τα οποία θα συμβάλουν στην ήδη κεκτημένη γνώση και εμπειρία, την οποία αποκόμισαν άλλοι ερευνητές, αλλά κατατίθενται και προτάσεις για μελλοντική έρευνα.
  • ItemOpen Access
    Εξόρυξη γνώσης από δεδομένα ηλεκτρονικής διακυβέρνησης και μελέτη των επιδράσεων στην Κοινωνία των Πολιτών
    Στύλιος, Γεώργιος; Stylios, George
    Οι κυβερνήσεις οδεύουν προς νέα μοντέλα Διακυβέρνησης, «eGovernment 2.0» ή Διακυβέρνηση 2.0, OpenGov ή Ανοιχτή Διακυβέρνηση, όπου ο Πολίτης εμπλέκεται ενεργά, ελέγχοντας και βελτιώνοντας το έργο τους. Οι δυνατότητες του Web 2.0 χρησιμοποιούνται ολοένα και περισσότερο για το σκοπό αυτό. Συνεπώς προσφέρονται χρήσιμες πληροφορίες ανάδρασης. Ο όγκος της συλλογικής αυτής πληροφορίας αυξάνεται με εκθετικούς ρυθμούς. Προκειμένου να είναι δυνατή η εκτίμηση των πληροφοριών ανάδρασης είναι απαραίτητη η χρήση τεχνικών εξόρυξης δεδομένων. Η παρούσα έρευνα προσπαθεί να συμβάλει στην αντιμετώπιση του παραπάνω θέματος. Προτείνεται ο σχεδιασμός, η υλοποίηση, η αξιολόγηση μιας μεθοδολογίας, εφαρμογών λογισμικού και υπηρεσιών που υποστηρίζουν την αποδοτική εξόρυξη, ανάλυση και εκτίμηση της άποψης των πολιτών. Βασικά στοιχεία καινοτομίας της παρούσης διατριβής αποτελούν: i) Ο σχεδιασμός η υλοποίηση και ο έλεγχος (με πραγματικά δεδομένα) της μεθοδολογίας με πεδίο εφαρμογής την Ελληνική γλώσσα καλύπτοντας ένα σημαντικό κενό στο χώρο, ii) Ο συνδυασμός χρήσης τεχνικών σημασιολογικής ανάλυσης και εξόρυξης δεδομένων, iii) Η χρήση state of the art τεχνικών στη διαδικασία της κατηγοριοποίησης των post ως προς τη σημαντικότητά τους, iv) Η μεταφορά της μεθοδολογίας σε ολοκληρωμένο σύστημα ικανό να εξάγει την πολικότητα και την αξιοπιστία φράσεων που περιέχονται σε κείμενα που θα «αλιεύονται» από το διαδίκτυο. Η Διατριβή αποτελείται από 5 Κεφάλαια. Στο Κεφάλαιο 1 περιγράφονται οι βασικές έννοιες, οι στρατηγικές των κρατών, οι τάσεις και οι δυσκολίες στην εφαρμογή της Ηλεκτρονικής Διακυβέρνησης. Το Κεφάλαιο 2 αναφέρεται στη βιβλιογραφική ανασκόπηση, για την εξόρυξη γνώμης (Opinion Mining). Στο Κεφάλαιο 3 περιγράφεται η μεθοδολογία ενώ η πειραματική αξιολόγησή της λαμβάνει χώρα στο Κεφάλαιο 4. Στο Κεφάλαιο 5 συνοψίζονται τα συμπεράσματα και οι μελλοντικές κατευθύνσεις της έρευνας. Τέλος, στο παράρτημα περιέχονται ενδεικτικά σχόλια (posts) χρηστών, τα οποία έχουν αλιευθεί από διαλόγους στο διαδίκτυο για συγκεκριμένο θέμα.
  • ItemOpen Access
    Αποδοτικές μέθοδοι κινητικότητας σε σύγχρονα συγκοινωνιακά δίκτυα
    Παρασκευόπουλος, Ανδρέας; Ζαρολιάγκης, Χρήστος; Ζαρολιάγκης, Χρήστος; Γαλλόπουλος, Ευστράτιος; Καραγιάννης, Ιωάννης; Κοντογιάννης, Σπυρίδων; Μακρής, Χρήστος; Νικολετσέας, Σωτήριος; Σιούτας, Σπυρίδων; Paraskevopoulos, Andreas
    Η παρούσα Διδακτορική Διατριβή πραγματεύεται τη σχεδίαση, την ανάπτυξη, και την πειραματική αξιολόγηση μιας αλγοριθμικής εργαλειοθήκης για την επίλυση σημαντικών προβλημάτων βέλτιστης δρομολόγησης επί των συγκοινωνιακών δικτύων. Στο πλαίσιο αυτό, βασικό ζητούμενο αποτελεί η εύρεση χρονο-εξαρτώμενων λύσεων ταξιδιού κωδι-κοποιώντας μέσω διαδρομών τις ζητούμενες αποφάσεις μετακίνησης. Τα προβλήματα που εξετάζονται αφορούν ειδικότερα την εύρεση και τον υπολογι-σμό: i) μιας ή περισσότερων (εναλλακτικών) χρονο-εξαρτώμενων βέλτιστων διαδρο-μών, με σταθερό άνω-οριοθετημένο λόγο προσέγγισης, αναπαριστώντας λύσεις ταξιδιού υπό ελεύθερη αναχώρηση με αυτοκίνητο στο οδικό δίκτυο, και ii) μιας ή περισσότερων (Pareto) βέλτιστων χρονο-εξαρτώμενων πολυτροπικών διαδρομών, αναπαριστώντας λύσεις ταξιδιού με πολλαπλά μέσα (π.χ. αυτοκίνητο, τρένο, λεωφορείο, τραμ) και πολ-λαπλούς τρόπους μεταφοράς (π.χ. οδήγηση, περπάτημα, επιβίβαση), με ένα συνδυασμό οδικών, πεζών και επιβατικών μετακινήσεων, αντίστοιχα, στο οδικό δίκτυο, στο δίκτυο των πεζοδρομίων και στο δίκτυο δρομολογίων των Μέσων Μαζικής Μεταφοράς (ΜΜΜ). Περαιτέρω, εξετάζεται ο υπολογισμός των ζητούμενων διαδρομών: α) από μια αφετηρία προς έναν προορισμό, β) σε οποιαδήποτε χρονική στιγμή αναχώρησης από την αφετηρία σε ένα περιοδικό χρονικό διάστημα διάρκειας τουλάχιστον μιας μέρας, γ) με χρονο-εξαρτώμενους ως προς την αναχώρηση χρόνους ταξιδιού, δ) με στόχο την ελαχι-στοποίηση του κόστους ταξιδιού μέχρι δυο το πολύ κριτήρια (π.χ. χρονική διάρκεια, α-ριθμό μετεπιβιβάσεων, αργότερη αναχώρηση), και ε) λαμβάνοντας υπόψη σημαντικούς περιορισμούς στις μετακινήσεις (π.χ. τον χρόνο αναμονής του επιβάτη για την άφιξη ενός οχήματος της δημόσιας συγκοινωνίας, τον απαιτούμενο χρόνο μετεπιβίβασης ενός επι-βάτη σε διαφορετικά μέσα μεταφοράς). Οι αλγόριθμοι που σχεδιάστηκαν για την επίλυ-ση των ανωτέρω προβλημάτων υλοποιήθηκαν σε πηγαίο κώδικα C++. Συνοπτικά, τα αποτελέσματα της Διδακτορικής Διατριβής περιλαμβάνουν: 1. Δυο καινοτόμες και αποδοτικές μεθόδους, καλούμενες ως CFLAT και OFLAT, με σκοπό την εύρεση χρονο-εξαρτώμενων βέλτιστων διαδρομών με σταθερό άνω-οριοθετημένο λόγο προσέγγισης όσον αφορά τις οδικές μετακινήσεις με ελεύθερη αναχώρηση στα οδικά δίκτυα. Οι μέθοδοι περιλαμβάνουν μια φάση προεπεξεργασίας με την οποία εκτελείται μια κατά σφάλμα οδηγούμενη δειγματοληψία των συναρτή-σεων ελάχιστου χρόνου ταξιδιού στα οδικά τμήματα του δικτύου παράγοντας ένα σύ-νολο χρονικών στιγμιότυπων δένδρων συντομότερων διαδρομών, των οποίων οι ρί-ζες ονομάζονται ορόσημα (landmarks). Το εν λόγω σύνολο δένδρων υπολογίζεται κατά τέτοιο τρόπο ώστε μέσω αυτού να προσδιορίζεται ένα παραμετροποιήσιμο άνω φράγμα πάνω στις συναρτήσεις ελάχιστου χρόνου ταξιδιού προς κάθε προορισμό σε όλη τη διάρκεια της χρονικής περιόδου. Η φάση αιτημάτων εύρεσης βέλτιστων δια-δρομών νωρίτερης άφιξης περιλαμβάνει ανά αίτημα μια σε περιορισμένο βαθμό ο-μοιόμορφη ανάπτυξη ενός δένδρου από τη ζητούμενη αφετηρία έως να προσαρτη-θούν σε αυτό ένα πλήθος ορόσημων, και στη συνέχεια μια στοχευμένη επέκτασή του έως το ζητούμενο προορισμό με την προσθήκη προεπεξεργασμένων διασυνδετικών υποδένδρων. Ενδεικτικά, σε σχέση με το οδικό δίκτυο της Γερμανίας (4,692,091 κόμβοι και 11,183,060 ακμές), ο μέσος χρόνος προεπεξεργασίας - δειγματοληψίας με 1000 έως 2000 ορόσημα μέσω της μεθόδου CFLAT κυμαίνεται από 126 έως 246 mins και μέσω της μεθόδου OFLAT από 96 έως 186 mins, ενώ ένα ομοιόμορφα τυ-χαίο αίτημα εύρεσης μιας χρονο-εξαρτώμενης βέλτιστης διαδρομής εκτελείται κατά μέσο όρο σε χρόνο έως 0.5 ms με σχετικό σφάλμα έως 1.04%. 2. Ένα καινοτόμο αποδοτικό αλγόριθμο εύρεσης χρονο-εξαρτώμενων βέλτιστων εναλ-λακτικών διαδρομών για το ίδιο ζεύγος αφετηρίας και προορισμού, καλούμενο ως TDAG. Ο εν λόγω αλγόριθμος περιλαμβάνει μια φάση συλλογής στην οποία χρησι-μοποιώντας μια παραλλαγή της μεθόδου CFLAT / OFLAT οριοθετείται και παράγε-ται ένα εν μέρει ακατέργαστο αρχικό σύνολο με τις υποψήφιες εναλλακτικές διαδρο-μές - λύσεις, και μια φάση «κλαδέματος» στην οποία το σύνολο που προέκυψε μειώ-νεται σε μέγεθος αφαιρώντας συνιστώσες - υποδιαδρομές μέσω χρονο-εξαρτώμενων παραλλαγών των κλασικών μεθόδων plateau και penalty και μέσω μιας ειδικά δια-μορφωμένης διαδικασίας βαθμολόγησης. Κατά τη διάρκεια εκτέλεσης των φάσεων, η επεξεργασία και η αποθήκευση των εναλλακτικών διαδρομών πραγματοποιείται στο πλαίσιο ενός γραφήματος εναλλακτικών (AG). Η αξιολόγηση του AG πραγματο-ποιείται σε σχέση με την ελάχιστη επικάλυψη και το μέσο χρόνο ταξιδιού των περιε-χόμενων εναλλακτικών διαδρομών. Επιπρόσθετα ως περιορισμός στην κατασκευή του AG ορίζεται ένα μέγιστο όριο στη μέση τιμή του χρόνου ταξιδιού και του αριθ-μού των διακλαδώσεων εντός του γραφήματος. Ενδεικτικά, σε σχέση με το οδικό δί-κτυο της Γερμανίας (4,692,091 κόμβοι και 11,183,060 ακμές), ο αλγόριθμος TDAG δύναται να υπολογίζει κατά μέσο όρο 3.5 (διακριτές) χρονο-εξαρτώμενες βέλτιστες εναλλακτικές διαδρομές σε 50 ms. 3. Μια ευρεία ποικιλία καινοτόμων αποδοτικών αλγορίθμων όσον αφορά την πολυτρο-πική (με οδήγηση, περπάτημα, επιβίβαση, αποβίβαση, και χρησιμοποιώντας πολλα-πλά μέσα μεταφοράς: λεωφορείο, τρένο, μετρό κ.ά.) μονο-κριτηριακή και πολυ-κριτηριακή βέλτιστη δρομολόγηση, υποστηρίζοντας τον υπολογισμό λύσεων ταξι-διού χωρίς περιορισμό στη διάρκεια των πεζών μετακινήσεων (ως προς το πλήρες δίκτυο των πεζοδρομίων), και επιτρέποντας την ενημέρωση των δρομολογίων των οχημάτων της δημόσιας συγκοινωνίας σε καθυστερήσεις. Σε μια κοινή γραμμή, οι αλγόριθμοι περιλαμβάνουν μια φάση προεπεξεργασίας μέσω της οποίας πραγματο-ποιείται η ομαδοποίηση και η ταξινόμηση των χρονικών γεγονότων επιβίβασης και η κάτω-οριοθέτηση στους βέλτιστους χρόνους ταξιδιού προκειμένου να εφαρμοστεί ένα ταχύτερο και μεγαλύτερης έκτασης κλάδεμα στις μη-έγκυρες ή/και μη-βέλτιστες λύσεις ταξιδιού. Στο πλαίσιο αυτό και υπό τη διασύνδεση διαφορετικών τύπων συ-γκοινωνιακών δικτύων, ο αλγόριθμος MDTM-QH-ALT υπολογίζει λύσεις ταξιδιού νωρίτερης άφιξης, ο αλγόριθμος McMDTM-QH-ALT υπολογίζει Pareto-βέλτιστες λύσεις ταξιδιού ελαχιστοποιώντας το χρόνο ταξιδιού και τον αριθμό μετεπιβιβάσεων έως ένα επιλεγόμενο όριο, ο αλγόριθμος PrMDTM-QH-ALT υπολογίζει Pareto-βέλτιστες λύσεις ταξιδιού αποδίδοντας τις νωρίτερες χρονικές αφίξεις από τις αργότε-ρες αναχωρήσεις εντός ενός ζητούμενου χρονικού διαστήματος, και ο αλγόριθμος MDTM-U ενημερώνει τα δρομολόγια των ΜΜΜ σε περιπτώσεις καθυστερήσεων. Ενδεικτικά, στο συγκοινωνιακό δίκτυο του Λονδίνου (14,085,810 κόμβοι και 41,856,048 ακμές με χρονο-εκτεταμένη μοντελοποίηση), η προεπεξεργασία για τη μέθοδο ALT πραγματοποιείται σε λιγότερο από 2 λεπτά, κατά μέσο όρο ένα ομοιό-μορφα τυχαίο αίτημα εύρεσης μιας πολυτροπικής λύσης ταξιδιού νωρίτερης άφιξης εκτελείται σε 5.1 ms, και η ενημέρωση για μια τυχαία ομοιόμορφα από 1 λεπτό έως 6 ώρες καθυστέρηση στο δρομολόγιο ενός οχήματος της δημόσιας συγκοινωνίας πραγματοποιείται κατά μέσο όρο σε 163.1 μs.
  • ItemOpen Access
    Efficient algorithms for big data management
    Δρίτσας, Ηλίας; Dritsas, Elias
    In the context of the doctoral research, I dealt with data management problems by developing methods and techniques that, on the one hand, maintain or improve the privacy and anonymity of users and, on the other hand, are efficient in terms of time and storage space for large volumes of databases. The research results of the work focus on the following: Evaluate the performance of queries in a large volume database using or not the Bloom Filter structure. Evaluate workload time, memory and disk usage of the Privacy Preserving Record Linkage (PPRL) problem in Hadoop MapReduce Framework. Methods of answering queries of nearest neighbors to spatio-temporal data (moving users trajectories) in order to preserve anonymity, where queries are applied to clustered or non-clustered data. The k anonymity method was used, where, the set of anonymity with which each moving object of the space-time database is being camouflaged, consists of its k nearest neighbors. The robustness of the method was quantified with a probability of 1/k and the effect of dimensionality and correlation of the data on the preservation of anonymity and privacy was studied. The above method was improved in terms of efficient storage of spatio-temporal data by applying queries of nearest neighbors to Hough transformed nonlinear trajectories of moving objects. The application of secure k-NN queries was evaluated in the GeoSpark environment. Sentiment Analysis on Twitter Data and Tourist Forecasting at Apache Spark