Please use this identifier to cite or link to this item:
Title: Αναγνώριση γλώσσας κειμένου με βάση στατιστικά μοντέλα
Authors: Τσέλιος, Βασίλειος
Issue Date: 2013-04-16
Keywords: Ν-γράμματα
Αναγνώριση γλώσσας
Keywords (translated): N-gramms
Language recognition
Abstract: Στην παρούσα διπλωματική εργασία, κατασκευάστηκε μία βάση δεδομένων κειμένων (corpus) με κείμενα τεσσάρων θεματικών ενοτήτων από δέκα Ευρωπαϊκές γλώσσες. Κατόπιν πάνω στη βάση αυτή έγιναν πειράματα αναγνώρισης γλώσσας κειμένου, βασισμένα σε στατιστικά μοντέλα και εξάχθηκαν χρήσιμα συμπεράσματα που επιβεβαιώνουν την υπάρχουσα θεωρία για την ικανότητα αναγνώρισης γλώσσας ενός κειμένου χρησιμοποιώντας τη μέθοδο των Ν-γραμμάτων.
Abstract (translated): In this thesis, we constructed a multilingual and multidomain corpus.We then used the corpus to extract statistical information on language recognition rates using the N-gramms method.
Appears in Collections:Τμήμα Ηλεκτρολ. Μηχαν. και Τεχνολ. Υπολογ. (ΔΕ)

Files in This Item:
File Description SizeFormat 
teliko.pdf1.35 MBAdobe PDFView/Open

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.