Please use this identifier to cite or link to this item:
Title: Βαθμολόγηση πιστοληπτικής ικανότητας με χρήση μηχανικής μάθησης
Other Titles: Credit scoring using machine learning
Authors: Παπαστεφανόπουλος, Βασίλειος
Keywords: Βαθμολόγηση πιστοληπτικής ικανότητας
Μηχανική μάθηση
Επιτηρούμενη κατηγοριοποίηση
Ημι-επιτηρούμενη κατηγοριοποίηση
Keywords (translated): Credit scoring
Machine learning
Supervised classification
Semi-supervised classification
Abstract: Η βαθμολόγηση της πιστοληπτικής ικανότητάς είναι μια διαδικασία με την οποία γίνεται ο διαχωρισμός των υποψήφιων δανειοληπτών σε αξιόπιστους και μη αξιόπιστους ανάλογα με το ποσό πιθανό είναι αυτοί να τηρήσουν ή μη τις οικονομικές τους δεσμεύσεις. Η διαδικασία αυτή είναι πολύ σημαντική για χρηματοπιστωτικούς οργανισμούς όπως τράπεζες η εταιρίες πιστωτικών καρτών προκειμένου να εκτιμήσουν τον κίνδυνο που φέρει η δανειοδότηση ενός ιδιώτη. Εντούτοις, λόγω της νομοθεσίας περί ιδιωτικότητας προσωπικών δεδομένων και άλλων εμπορικών ευαισθησιών, η απόκτηση μεγάλου ιστορικού δανειοδοτήσεων είναι δύσκολη, ειδικά για τις πρόσφατα ιδρυμένες οικονομικές οργανώσεις ή για οργανισμούς μικρότερου βεληνεκούς. Για το λόγο αυτό παρότι πολλές φορές υπάρχει ένας ικανοποιητικός αριθμός πελατών συνολικά, δεν υπάρχει επαρκής πληροφορία για τις επιδόσεις τους σε ότι αφορά στις οικονομικές τους δεσμεύσεις. Στόχος της διπλωματικής αυτής εργασίας είναι να εξετάσει την εφαρμοσιμότητα των τεχνικών μηχανικής μάθησης στο πρόβλημα της βαθμολόγησης πιστοληπτικής ικανότητας. Αρχικά, επαληθεύεται η εφαρμοσιμότητα των αλγορίθμων επιτηρουμένης μάθησης μέσω της σύγκρισης εννέα αλγορίθμων για κατηγοριοποίηση χρησιμοποιώντας δυο δημοσίως διαθέσιμα σύνολα δεδομένων από το αποθετήριο μηχανικής μάθησης του Πανεπιστήμιου της Καλιφόρνια. Ακόμη, διερευνάται εάν και σε ποιο βαθμό η χρήση αταξινόμητων στιγμιότυπων κατά τη διαδικασία της εκπαίδευσης μπορεί να βελτιώσει την προβλεπτική ακρίβεια των αλγορίθμων, οδηγώντας με αυτόν τον τρόπο σε καλύτερα αποτελέσματα. Πιο συγκεκριμένα, χρησιμοποιώντας τα ίδια σύνολα δεδομένων με πριν, γίνεται μια σύγκριση μεταξύ μεθόδων ημιεπιτηρούμενης μάθησης και των αντίστοιχων τεχνικών μάθησης με επίβλεψη.
Abstract (translated): In credit scoring, the goal is to assign borrowers to either reliable or non-reliable depending on their probability of default using methods which are based on the creditor’s loan history. Reliable borrowers are likely to commit to their financial obligations, while non-reliable ones are likely to default on them. Credit scoring is of great importance to lenders such as banks and credit card companies in order for them to calculate the risk posed by lending money to individuals. However, due to data privacy laws and commercial sensitivities, large labeled datasets of loan history can be difficult to obtain especially for newly founded financial organizations or for financial organizations of smaller scope. This dissertation investigates the applicability of machine learning techniques to the problem of credit scoring. Firstly, we examine the applicability of supervised learning schemes by comparing the performance of nine well-known supervised classification algorithms on two credit scoring datasets, which are publicly available at UCI Machine Learning repository. Secondly, we demonstrate how the use of unlabeled data during the training process can boost the algorithms’ predictability and lead to more accurate results. More specifically, using the datasets mentioned before, we draw a comparison between several semi-supervised classification methods and their supervised variants.
Appears in Collections:Τμήμα Μαθηματικών (ΔΕ)

Files in This Item:
File Description SizeFormat 
math_13355.pdf2.21 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.