Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/12326
Title: Λογισμικό υποδομής για κατανεμημένες εφαρμογές Παγκόσμιου Ιστού με χαρακτηριστικά Web 2.0 και σημασιακό υπόβαθρο
Other Titles: Infrastructure software for distributed web applications with Web 2.0 characteristics and semantic back-end
Authors: Καλού, Αικατερίνη
Keywords: Σημασιολογικός Ιστός
Μεγάλα δεδομένα
Διασυνδεδεμένα δεδομένα
Σημασιολογικά mashups
Οντολογίες
Σημασιολογικοί κανόνες
Μηχανισμοί συμπερασμού
Εξατομίκευση
Keywords (translated): Semantic Web
Web 2.0
Web 3.0
Big data
Linked data
Semantic mashups
Ontology
Semantic rules
Reasoning
Personalization
Web CMS
Abstract: Κατά τη διάρκεια της προηγούμενης δεκαετίας, έκανε την εμφάνισή της η δεύτερη γενιά του Παγκόσμιου Ιστού, το Web 2.0. Δίχως αμφιβολία, αποτελεί τη γενιά ορόσημο στην εξελικτική πορεία του Ιστού διαμορφώνοντας μία νέα πραγματικότητα στην καθημερινότητα των ανθρώπων. Οι εφαρμογές και οι τεχνολογίες της γενιάς αυτής δημιούργησαν μία δυναμική διαδικτυακή πλατφόρμα με επίκεντρο τους χρήστες και απώτερο σκοπό την αλληλεπίδραση μεταξύ τους. Η ευρεία αποδοχή του Web 2.0 ανέδειξε τις έννοιες της διαδραστικότητας, του δυναμικού περιεχομένου, της συνεργασίας, της συνεισφοράς και της κοινότητας. Στο πλαίσιο του Web 2.0, οι χρήστες δίχως ιδιαίτερη τεχνική κατάρτιση συμβάλλουν ενεργά και μαζικά στη διαμόρφωση του περιεχομένου του Ιστού, καθιστώντας τον έτσι μία ανεξάντλητη πηγή δεδομένων με υψηλό ρυθμό παραγωγής και ετερογένεια. Στον εταιρικό χώρο έγινε άμεσα αντιληπτό ότι αυτός ο τεράστιος όγκος δεδομένων αποτελεί βάση για νέες ευκαιρίες και χρήζει αποδοτικής διαχείρισης και αξιοποίησης. Με γνώμονα την παραπάνω ανάγκη και τη δεδομένη αδυναμία των παραδοσιακών συστημάτων να ανταποκριθούν σε αυτήν, σημειώθηκε σημαντική πρόοδος στο τομέα των Μεγάλων Δεδομένων (Big Data), ο οποίος περιλαμβάνει όλες τις τεχνολογικές πλατφόρμες και τεχνικές με τα εξής χαρακτηριστικά, Όγκος, Ποικιλομορφία, Ταχύτητα, Μεταβλητότητα, Εγκυρότητα και Αξία. Παράλληλα με την καθιέρωση του Web 2.0 και των Μεγάλων Δεδομένων, ο Παγκόσμιος Ιστός φαίνεται να εισέρχεται σε μία νέα φάση ανάπτυξης και εξέλιξης, η οποία αποκαλείται Web 3.0. Τόσο οι βασικές αρχές και τεχνολογίες του Web 2.0 όσο και αυτές του Σημασιολογικού Ιστού φαίνεται να αποτελούν τους δύο βασικούς πυλώνες αυτής της νέας φάσης του Ιστού. Συγκεκριμένα, ο Σημασιολογικός Ιστός αποτελεί μία προέκταση του σημερινού, στον οποίο οι πληροφορίες διατίθενται με σαφώς ορισμένο νόημα και συσχετίζονται με άμμεσο τρόπο μεταξύ τους, επιτρέποντας τη δυνατότητα συνδιαλλαγής/ διαπραγμάτευσης πληροφοριών μεταξύ συστημάτων, και στοχεύοντας στην ανακάλυψη νέας γνώσης. Τα Διασυνδεδεμένα Δεδομένα και το LOD νέφος αποτελούν το πρώτο βήμα πραγμάτωσης του Σημασιολογικού Ιστού. Τα παραπάνω χαρακτηριστικά του Σημασιολογικού Ιστού φαίνεται να μπορούν να συνεισφέρουν σημαντικά στις Web 2.0 εφαρμογές και στο πεδίο των Μεγάλων Δεδομένων, περιορίζοντας τις αδυναμίες αυτών ως προς την ενοποίηση, επαναχρησιμοποίηση και διαχείριση δεδομένων από διαφορετικές πηγές, την αυτοματοποιημένη εξαγωγή γνώσης, και την αναζήτηση. Παρόλα τα οφέλη του Σημασιολογικού Ιστού, υπάρχει αρκετός δρόμος μέχρι να εδραιωθεί στην υποδομή του Ιστού. Η παρούσα διδακτορική διατριβή πραγματεύεται την προοπτική της αποδοτικής και αρμονικής συνέργειας των τριών αυτών τάσεων με στόχο τον εντοπισμό και τη διευθέτηση όλων των τενχικών ζητημάτων που προκύπτουν. Στο πλαίσιο αυτό, αρχικά, εξετάζουμε τη δυνατότητα αναβάθμισης υφιστάμενων εφαρμογών του Web 2.0 αξιοποιώντας σημασιολογικές τεχνολογίες. Εστιάζουμε στο σχεδιασμό και την ανάπτυξη Σημασιολογικών Mashups με πρόσθετα χαρακτηριστικά όπως η αναζήτηση, η μοντελοποίηση χρηστών και η εξατομίκευση. Όσον αφορά το σημασιολογικό υπόβαθρο των υβριδικών αυτών εφαρμογών, διερευνούμε διαφορετικές τεχνικές αποθήκευσης οντολογικών δεδομένων και εναλλακτικούς μηχανισμούς εξαγωγής συμπερασμού με απώτερο στόχο την ανάδειξη των ιδιοτήτων της υψηλής απόδοσης και της κλιμάκωσης των εφαρμογών. Για την εμπεριστατωμένη τεκμηρίωση του προτεινόμενου είδους εφαρμογών, αναπτύσσουμε ένα πλαίσιο αξιολόγησης με πρακτική εφαρμογή σε πραγματικούς χρήστες. Η ενσωμάτωση χαρακτηριστικών σημασιολογίας και συλλογιστικής σε Web 2.0 εφαρμογές δίνει τη δυνατότητα μιας ομαλής και απρόσκοπτης ολοκληρωσής τους με το LOD νέφος. Προς αυτή την κατεύθυνση, υιοθετούμε τις βασικές αρχές των Διασυνδεδεμένων Δεδομένων στο στάδιο διαχείρισης και αναπαράστασης των δεδομένων των εν λόγω εφαρμογών. Για λόγους διαλειτουργικότητας, εξετάζουμε επίσης τη δυνατότητα διάθεσης των σημασιολογικών εφαρμογών ως διαδικτυακές υπηρεσίες ενσωματώνοντας τις βασικές αρχές της REST αρχιτεκτονικής. Επιπλέον, μελετούμε τις τεχνικές και μεθόδους του Web Engineering και πως θα μπορούσαν να συμβάλλουν στην επίλυση των σχεδιαστικών ζητημάτων, ειδικά στην περίπτωση των σημασιολογικών εφαρμογών. Πιο συγκεκριμένα, επικεντρωνόμαστε στα Web CMSs, που εγγενώς εμπεριέχουν καλές πρακτικές του Web Engineering, και στην προοπτική επέκτασης της υποδομής τους για την υποστήριξη της ανάπτυξης σημασιολογικών εφαρμογών, όπως τα σημασιολογικά mashups. Ολοκληρώνοντας, μεταβαίνουμε στη διερεύνηση της εφαρμογής των σημασιολογικών τεχνολογιών για την αντιμετώπιση των βασικών περιορισμών των Μεγάλων Δεδομένων ως προς την Ποικιλομορφία και την Αξία. Ειδικότερα, ερευνούμε τη δυνατότητα ανάπτυξης οντολογικών υποδομών πάνω από υφιστάμενα, παραδοσιακά συστήματα βάσεων δεδομένων με απώτερο στόχο τη θεμελίωση ενός αποτελεσματικού τρόπου on-the-fly πρόσβασης στα δεδομένα και την εξαγωγή νέας γνώσης από αυτά.
Abstract (translated): The second-generation of the Web, “Web 2.0”, is beginning to appear in the past decade. Without a doubt, Web 2.0 constitutes a landmark moment in the evolution of the Web, shaping a new reality in our everyday lives. The applications and technologies of this generation have defined a dynamic online platform that focuses on users and ultimately aims to promote active users' interaction and participation. The widespread acceptance of Web 2.0 has enabled the emergence of concepts such as interactivity, dynamic content, collaboration, contribution, and community. In the context of Web 2.0, non-technical users contribute actively and massively to the Web content, making it an inexhaustible data source with high production rates and heterogeneity. In corporate environments, it was immediately realized that this vast amount of data is the basis for new opportunities and requires more advanced processes for efficient management and exploitation. In the light of the aforementioned need and the failure of traditional systems to tackle it, significant progress has been made in the Big Data field, including all technological platforms and techniques having the following features: Volume, Variety, Velocity, Variability, Veracity and Value. Along with the establishment of Web 2.0 and Big Data, the Web seems to be entering a new phase of growth and development, called “Web 3.0”. Both the basic principles and technologies of Web 2.0 and such of the Semantic Web are two main pillars of this new phase of the Web. In particular, the Semantic Web is an extension of the current Web, in which data are more easily machine-understandable, meaning that machines can better process, “understand” and integrate the information that they simply display at present. Information is made available having a clearly defined sense and directly correlated with each other, allowing the possibility of information negotiation between systems, and aiming at the discovery of new knowledge. Linked Data and LOD Cloud are the means for realizing the vision of Semantic Web. The aforementioned features of the Semantic Web can make a significant contribution to Web 2.0 applications and Big Data field by limiting their weaknesses in integrating, reusing and managing data from different sources, enhancing the automated knowledge extraction and searching. Despite the benefits of the Semantic Web, there is plenty of room for being established within the Web infrastructure. This doctoral dissertation focuses on the prospect of efficiently and seamlessly combining these three trends (Web 2.0, Big Data and Semantic Web) with ultimate goal to identify and settle all the emerging, technical issues. In this context, the first step is towards the investigation of the capability of enriching the existing Web 2.0 applications using semantic technologies. To this end, this thesis studies the design and development of Semantic Mashups with additional features such as search, user modeling and personalization. Regarding the semantic backend of these hybrid applications, several different ontology-based data storage techniques and alternative reasoning mechanisms have been explored in order to highlight the high performance and scalability of this kind of applications. We also propose a framework for assessing the system’s efficiency and performance by capturing the activity of real users within such applications. The integration of semantic and reasoning features into Web 2.0 applications enables a smooth and seamless integration with LOD cloud. Towards this direction, we adopt the basic principles of Linked Data at the stage of data management and representation of these applications. For advancing the level of interoperability, we also investigate the possibility of making these applications available as Web Services by incorporating the basic principles of REST architecture. Furthermore, we examine the techniques and methods of Web Engineering and how they could help solve issues relevant to the design of semantic applications. In detail, we focus on Web CMSs, which inherently incorporate Web Engineering good practices, and the prospect of expanding their infrastructure to support the development of semantic applications like Semantic Mashups. Even though the concept of Big Data provides the needed infrastructure for efficient data management, especially in terms of storage and processing, the aspects of Value and Variety still remain a topic for further investigation. In conclusion, we explore the possibility of leveraging the benefits of Semantic Technologies in order to address the aforementioned restrictions of Big Data. To this end, we propose an infrastructure that can be deployed on top of the legacy databases of insurance companies (and not only). Finally, this thesis aims at providing an efficient manner to access data on-the-fly and derive new value.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΔ)

Files in This Item:
File Description SizeFormat 
phd_aikaterini_kalou_am_519.pdf7.03 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons