Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/12645
Title: Μελέτη κρυπτογραφικών τεχνικών για τη διατύπωση ασφαλών ερωτημάτων σε μια βάση μεγάλου όγκου δεδομένων
Other Titles: Cryptographic techniques for secure queries in big data database
Authors: Γκορίτσας, Βασίλειος
Keywords: Ανωνυμία
Ερωτήματα κΝΝ
Ασφάλεια
Βάσεις μεγάλου όγκου δεδομένων
Keywords (translated): Anonymity
Queries kNN
Security
Big data database
Abstract: Η ραγδαία ανάπτυξη της τεχνολογίας στον τομέα των κοινωνικών δικτύων και των έξυπνων κινητών συσκευών, σε συνδυασμό με τον μεγάλο αριθμό χρηστών, έχει σαν αποτέλεσμα την αύξηση του όγκου των ψηφιακών δεδομένων. Εκτός από το διαδίκτυο υπάρχουν και άλλες σημαντικές πηγές μεγάλου όγκου δεδομένων, όπως επιστημονικά, τηλεπικοινωνιακά, τραπεζικά, επιχειρηματικά δεδομένα, των οποίων η ανάλυση και διαχείριση είναι σημαντική για τη λήψη κρίσιμων αποφάσεων. Ο μεγάλος όγκος δεδομένων (Big Data) εγείρει ζητήματα που σχετίζονται όχι μόνο με τον τρόπο αποθήκευσης, επεξεργασίας και ανάκτησης τους αλλά και διατήρησης της ασφάλειας και ιδιωτικότητάς τους έναντι επιθέσεων. Τα σύγχρονα συστήματα βάσεων δεδομένων ασχολούνται συχνά με τη διαχείριση μεγάλου όγκου χωρικών δεδομένων τα οποία συνδέονται με τη θέση ενός κινούμενου χρήστη ο οποίος δίνει πληροφορίες για τη θέση του μέσω κατάλληλης εφαρμογής που τρέχει στην έξυπνη κινητή συσκευή του. Τα δεδομένα αυτά αποθηκεύονται σε μία βάση δεδομένων την οποία διαχειρίζεται ένας Location-based Service Provider. Οι παραδοσιακές μέθοδοι κρυπτογράφησης που στοχεύουν στην παροχή προστασίας συχνά δεν επαρκούν επειδή δεν υποστηρίζουν την εκτέλεση ερωτημάτων σε κρυπτογραφημένα δεδομένα. Σε αυτή την εργασία θα συζητήσουμε στο Κεφ.1 την έννοια και τα είδη των Βάσεων Δεδομένων καθώς και τις απαιτήσεις ασφαλείας. Στη συνέχεια, στο Κεφ. 2 θα παρουσιαστεί το γενικό πρόβλημα ασφαλούς υπολογισμού σε κρυπτογραφημένη βάση δεδομένων και θα παρουσιάσουμε τις κυριότερες κρυπτογραφικές αρχές οι οποίες μπορούν να διαμορφώσουν μία σθεναρή ασφαλή προσέγγιση στο πρόβλημα του υπολογισμού των k-πλησιέστερων γειτόνων (knn) σε μια κρυπτογραφημένη βάση δεδομένων και των επιθέσεων κακόβουλων χρηστών. Στο Κεφ. 3 θα παρουσιάσουμε ένα ενδιαφέρον μοντέλο ως εφαρμογή των τεχνικών που παρουσιάστηκαν στο Κεφ. 2 με σκοπό τη διατύπωση ασφαλών k-πλησιέστερων γειτόνων ερωτήματα. Επιπλέον, στο Κεφ. 4 γίνεται συζήτηση πάνω στα Μεγάλου Όγκου Δεδομένα και τα Περιβάλλοντα Διαχείρισής τους. Τέλος, στην παρούσα διπλωματική εκτελούνται ερωτήματα σε πραγματικά δεδομένα (αρχείο .csv) που αφορούν τις τροχιές ποδηλατών, τις ταχύτητες και γωνίες αυτών καθώς και τις χρονικές στιγμές τους. Με την βοήθεια των δομών του Spark, RDDs και Dataframes θα επεξεργαστούμε αυτά τα δεδομένα. Τα SQL ερωτήματα (queries) εκτελούνται στο περιβάλλον ανάπτυξης IntelliJ IDEA με την χρήση του Spark και SparkSQL και την γλώσσα προγραμματισμού Scala. Με την βοήθεια του Spark UI (web application), την εφαρμογή που δημιουργεί διεπαφή σε κάποιον φυλλομετρητή, θα παρατηρήσουμε τις δουλειές (jobs), τα στάδια (stages), τον χώρο (storage), το περιβάλλον του συστήματος (enviroment), τους εκτελεστές (executors) και τους χρόνους εκτέλεσης των ερωτημάτων.Τέλος εφαρμόζεται η τεχνική των k-πλησιέστερων γειτόνων μέσω των sql ερωτημάτων.
Abstract (translated): The rapid development of social networking technology and smart mobile devices, coupled with a large number of users, has resulted in an increase in the volume of digital data. Apart from the internet, there are other important sources of large amounts of data, such as scientific, telecommunication, banking, business data, whose analysis and management are important for making critical decisions. The large amount of data creates problems that are related not only to storage, processing and recovery, but also to protecting their security and privacy against attacks. Modern database systems often deal with the management of large volumes of spatial data that are linked to the location of a mobile user who provides location information through an appropriate application running on its intelligent mobile equipment. This data is stored in a database managed by a location-based service provider. Traditional encryption methods aimed at providing protection are often inadequate because they do not support the execution of queries in encrypted data. In this paper will be discussed in Chapter 1 the concept and types of databases as well as the security requirements. Next, in Chapter 2, we will present the general problem of safe calculation in an encrypted database and will present the main cryptographic principles that can form a solid secure approach to the problem of calculating the closest neighbors (knn) in an encrypted database and the attacks by malicious users. In Chapter 3 we will present an interesting model as an application of the techniques presented in Chapter 2 for the purpose of formulating safe and closer neighboring questions. In addition, Chapter 4 discusses Big Data and their Management Environments. Finally, in this diplomatic execution of queries on actual data (.csv file) relating to bicycle wheels, their speeds and their extremes and their timing. With the help of Spark structures, RDDs and Data will process this data. SQL queries (queries) are executed in the IntelliJ IDEA development environment using Spark and SparkSQL and the language Scala programming. With the help of Spark UI (web application), the application that creates interface to a browser, we will observe the jobs, the stages, the storage, the environment, the performers (executors) and query execution times. Finally, the technique of k-nearest neighbors is applied through sql queries.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Διπλωματική.pdf5.43 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.