Please use this identifier to cite or link to this item: http://hdl.handle.net/10889/13530
Title: Αναγνώριση αντικειμένων με χρήση τεχνικών βαθιάς μάθησης σε περιβάλλον παγκόσμιου ιστού
Other Titles: Object detection with the use of deep learning techniques in the web environment
Authors: Πουρνάρας, Ξενοφών
Keywords: Αναγνώριση αντικειμένων
Βαθιά μάθηση
Μηχανική μάθηση
Συνελικτικά νευρωνικά δίκτυα
Πλαίσια βαθιάς μάθησης
Βαθιά μάθηση σε φυλλομετρητή
Keywords (translated): Object detection
Deep learning
Machine learning
Convolutional neural networks
Deep learning frameworks
Object detection in browser
Abstract: Η επανάκαμψη των τεχνητών νευρωνικών δικτύων και ο συνδυασμός τεχνικών βαθιάς μάθησης τα τελευταία χρόνια φαίνεται να έχουν υποσχόμενα αποτελέσματα στην προσέγγιση παραδοσιακά δυσεπίλυτων προβλημάτων. Η βαθιά μάθηση βρίσκει εφαρμογή σε πολλούς τομείς των σύγχρονων επιστημών και η διασυνδεσιμότητά της με αυτές, διευρύνει τις επιστημονικές δυνατότητες. Οι αλγόριθμοι που προτείνονται για ανάπτυξη και εκπαίδευση τέτοιων μοντέλων συνήθως απαιτούν μεγάλη υπολογιστική ισχύ που απαντάται είτε σε υπερυπολογιστές είτε σε κατανεμημένα συστήματα βελτιστοποιημένα για το σκοπό αυτό. Παρόλα αυτά πολύ πρόσφατα έχουν αρχίσει να αναδεικνύονται υλοποιήσεις και εφαρμογές, που στοχεύουν στην καθημερινή χρήση Η/Υ και συγκεκριμένα στην πλοήγηση στο Διαδίκτυο, ώστε αφενός να επιτευχθεί συγκερασμός των δυο αυτών κύριων τεχνολογικών τάσεων και αφετέρου να δοθεί μια αίσθηση ευφυίας στην εμπειρία πλοήγησης του χρήστη μέσω φυλλομετρητών και εγγενών εφαρμογών σε κινητές συσκευές. Πιο συγκεκριμένα η εμφάνιση βιβλιοθηκών που υποστηρίζουν μια πληθώρα λειτουργιών για διάφορες εργασίες βαθιάς μάθησης στον φυλλομετρητή έχει καταφέρει να δημιουργήσει ένα ευνοϊκό κλίμα για την δημιουργία τέτοιου είδους εφαρμογών στους περιηγητές με συμβατικούς υπολογιστικούς πόρους. Μια εφαρμογή της βαθιάς μάθησης που υπάγεται στον τομέα της υπολογιστικής όρασης, είναι η αναγνώριση αντικειμένων. Η βαθιά μάθηση έχει πετύχει τέτοια ακρίβεια στην ταξινόμηση και τον εντοπισμό αντικειμένων, που σε μερικές περιπτώσεις ξεπερνά την ανθρώπινη επίδοση. Με την εκτεταμένη χρήση και εκτέλεση συνελικτικών νευρωνικών δικτύων η αναγνώριση αντικειμένων είναι πλέον εφικτή και στο περιβάλλον των φυλλομετρητών. Συνεπώς, ο συνδυασμός των λειτουργιών που παρέχονται από βιβλιοθήκες βαθιάς μάθησης στους φυλλομετρητές και των δυνατοτήτων των συνελικτικών νευρωνικών δικτύων καθιστούν δυνατή την δημιουργία εφαρμογών αναγνώρισης αντικειμένων στο παραπάνω περιβάλλον. Σκοπός επομένως της διπλωματικής αυτής εργασίας, είναι η μελέτη και αξιολόγηση πλαισίων και βιβλιοθηκών για αξιοποίηση βαθιάς μάθησης στην πλευρά του φυλλομετρητή, λαμβάνοντας υπόψιν βιβλιοθήκες όπως οι TensorFlow.js, brain.js, Keras.js, ConvNet.js καθώς και άλλες. Επίσης, η διπλωματική εργασία προτείνει μια ολοκληρωμένη υλοποίηση μιας εφαρμογής αναγνώρισης αντικειμένων με διάφορες λειτουργίες που θα εκτελείται στον φυλλομετρητή του χρήστη, με την χρήση ορισμένων από τις παραπάνω βιβλιοθήκες. Στην εφαρμογή γίνεται εκτεταμένη χρήση γνωστών ανιχνευτών αντικειμένων που επιλύουν με αποδοτικό τρόπο το πρόβλημα της αναγνώρισης αντικειμένων. Παράλληλα πραγματοποιείται μια εκτενής αξιολόγηση των μοντέλων που χρησιμοποιήθηκαν, ως προς την ακρίβεια, την ταχύτητα καθώς και άλλες παραμέτρους που επηρεάζουν την απόδοση τους στο περιβάλλον του φυλλομετρητή.
Abstract (translated): The resurgence of artificial neural networks and the combination of deep learning techniques in recent years seem to have promising results in approaching traditionally intractable problems. Deep learning finds application in many fields of modern science and its interconnectivity with them expands scientific possibilities. The algorithms proposed for the development and training of such models usually require a large computational power which is found either in supercomputers or in distributed systems optimized for this purpose. However, very recently, applications and implementations aimed at everyday computer use have begun to emerge, specifically in Internet browsing, in order to achieve a combination of these two main technological trends and to give a sense of intelligence to the user's browsing experience through browsers and native applications of mobile devices. More specifically, the appearance of libraries that support a variety of functions for various deep learning tasks in the browser has managed to create a favorable climate for the creation of such applications in browsers with conventional computing resources. One deep learning application, which belongs to the field of computational vision, is object recognition. Deep learning has achieved such precision in classifying and localizing objects that in some cases exceeds human performance. With the extensive use and execution of convolutional neural networks, object recognition is now possible in the environment of browsers as well. Therefore, the combination of functions provided by deep learning libraries in the browsers and the abilities of convolutional neural networks make possible the creation of object recognition applications in the above environment. Therefore, the purpose of this dissertation is to study and evaluate frameworks and libraries for deep learning on the browser side, taking into account libraries such as TensorFlow.js, brain.js, Keras.js, ConvNet.js and others. At the same time, the dissertation proposes a prototype object recognition application with various tasks that are performed in the user's browser, using some of the above libraries. The application makes extensive use of well-known object detectors, which solve the problem of object recognition in a fast and precise way. At the same time, a complete evaluation of the models that are being used is performed, in terms of accuracy, speed and other parameters that affect their performance in the browser environment.
Appears in Collections:Τμήμα Μηχανικών Η/Υ και Πληροφορικής (ΔΕ)

Files in This Item:
File Description SizeFormat 
Πουρνάρας_Ξενοφών_διπλωματική.pdf5.14 MBAdobe PDFView/Open
κώδικας.rar13.53 kBrarView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.