Μέθοδοι ομαδοποίησης που βασίζονται σε μοντέλα κατανομής για μετρήσιμα και μεικτού τύπου δεδομένα

Περίληψη

Οι μέθοδοι ομαδοποίησης που βασίζονται σε μοντέλα κατανομής για τον πληθυσμό, είναι μια κοινή προσέγγιση για τη μοντελοποίηση δεδομένων με τη χρήση πεπερασμένων μίξεων παραμετρικών κατανομών. Για μετρήσιμα δεδομένα, η επιλογή της πολυμεταβλητής κατανομής Poisson μπορεί να οδηγήσει σε αυξημένο υπολογιστικό κόστος. Η έννοια της μεθόδου της σύνθετης πιθανοφάνειας με τη χρήση δι-μεταβλητών περιθωριων κατανομών μπορεί να προσφέρει ευελιξία στις εκτιμήσεις. Προκειμένου να μειωθεί περαιτέρω ο χρόνος εκτίμησης των παραμέτρων που σχετίζονται με τη σύνθετη μέθοδο πιθανοφάνειας, εισάγουμε μεθόδους δειγματοληψίας που μπορούν να προσφέρουν επαρκή αποτελέσματα, ειδικά σε μεγάλων διαστάσεων δεδομένα.Όσον αφορά τα δεδομένα μεικτού τύπου, η από κοινού κατανομή δεν είναι πάντα εύκολο να βρεθεί. Τα copulas είναι ευρέως γνωστά ως ευέλικτα μοντέλα που επιτρέπουν τη δημιουργία πολυμεταβλητών κατανομών όταν δίνονται οι περιθώριες κατανομές. Ως εκ τούτου, μπορούν να δημιουργήσουν μια πληθώρα πολυμεταβλητών μο ...
περισσότερα

Περίληψη σε άλλη γλώσσα

Model based clustering (MBC) is a common approach for modelling data with the use of finite mixtures of parametric distributions. For count data, the choice of high dimensional multivariate Poisson distribution can lead to increased computational effort. Composite likelihoods concept with the use of bi-variate marginals, can offer flexibility in estimations. In order to further reduce the time of estimation of the composite likelihood method associated parameters, in this thesis we introduce the sampling methods which can offer adequate results, especially for large data samples. When it comes to mixed data sets, the joint probability is not always easy to be found. Copulas are well known as flexible models which allow creating multivariate distributions with given marginals. Hence, they can create a wealth of multivariate models including models with different marginal distributions. The purpose of the present thesis is mainly to expand the derived so far results of using copula-based ...
περισσότερα

Όλα τα τεκμήρια στο ΕΑΔΔ προστατεύονται από πνευματικά δικαιώματα.

DOI
10.12681/eadd/53259
Διεύθυνση Handle
http://hdl.handle.net/10442/hedi/53259
ND
53259
Εναλλακτικός τίτλος
Model-based clustering for count and mixed mode data
Συγγραφέας
Πανάγου, Φωτεινή (Πατρώνυμο: Αναστάσιος)
Ημερομηνία
2022
Ίδρυμα
Οικονομικό Πανεπιστήμιο Αθηνών. Τμήμα Στατιστικής
Εξεταστική επιτροπή
Karlis Dimitrios
Ntzoufras Ioannis
Kosmidis Ioannis
Gormley Claire
Rau Andrea
Papageorgiou Ioulia
Papastamoulis Panagiotis
Επιστημονικό πεδίο
Φυσικές ΕπιστήμεςΜαθηματικά ➨ Στατιστική και Πιθανότητες
Λέξεις-κλειδιά
Ομαδοποίηση δεδομένων; Μεικτού τύπου δεδομένα; Μετρήσιμα δεδομένα
Χώρα
Ελλάδα
Γλώσσα
Αγγλικά
Άλλα στοιχεία
εικ., πιν., γραφ.
Στατιστικά χρήσης
ΠΡΟΒΟΛΕΣ
Αφορά στις μοναδικές επισκέψεις της διδακτορικής διατριβής για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΞΕΦΥΛΛΙΣΜΑΤΑ
Αφορά στο άνοιγμα του online αναγνώστη για την χρονική περίοδο 07/2018 - 07/2023.
Πηγή: Google Analytics.
ΜΕΤΑΦΟΡΤΩΣΕΙΣ
Αφορά στο σύνολο των μεταφορτώσων του αρχείου της διδακτορικής διατριβής.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.
ΧΡΗΣΤΕΣ
Αφορά στους συνδεδεμένους στο σύστημα χρήστες οι οποίοι έχουν αλληλεπιδράσει με τη διδακτορική διατριβή. Ως επί το πλείστον, αφορά τις μεταφορτώσεις.
Πηγή: Εθνικό Αρχείο Διδακτορικών Διατριβών.