Περίληψη
Ο προσδιορισμός της σχέσης μεταξύ δύο μεταβλητών είναι μία από τις πιο σημαντικές πτυχές κάθε ποσοτικής ανάλυσης. Στόχος αυτής της προσπάθειας είναι να διερευνηθεί σε αρχικό στάδιο εάν υπάρχει και σε ποιο βαθμό εξάρτηση μεταξύ των μεταβλητών, έτσι ώστε η ανάλυση να επεκταθεί στον ποσοτικό καθορισμό της σχέσης τους. Η τεχνική του συντελεστή συσχέτισης που εφαρμόζεται κατά κανόνα στην ποσοτική ανάλυση έχει αποδειχθεί ότι αρκετά συχνά δεν είναι ικανή να εντοπίσει ικανοποιητικά την ύπαρξη της σχέσης των μεταβλητών, δεδομένου ότι η τιμή του συντελεστή συσχέτισης εξαρτάται από τη φύση των δεδομένων, εμφανίζοντας μάλιστα ακόμα και εικονικές σχέσεις για την περίπτωση ανεξάρτητων χρονοσειρών. Για το λόγο αυτό, χρησιμοποιούνται για τη μέτρηση της εξάρτησης και άλλες πιο πολύπλοκες τεχνικές, όπως οι Copula, προκειμένου να συλλάβουν καλύτερα την έννοια της εξάρτησης μεταξύ των μεταβλητών ακόμα και για δεδομένου που παρουσιάζουν μεγάλη μεταβλητότητα και ποικιλομορφία. Σε αυτή τη διδακτορική διατριβ ...
Ο προσδιορισμός της σχέσης μεταξύ δύο μεταβλητών είναι μία από τις πιο σημαντικές πτυχές κάθε ποσοτικής ανάλυσης. Στόχος αυτής της προσπάθειας είναι να διερευνηθεί σε αρχικό στάδιο εάν υπάρχει και σε ποιο βαθμό εξάρτηση μεταξύ των μεταβλητών, έτσι ώστε η ανάλυση να επεκταθεί στον ποσοτικό καθορισμό της σχέσης τους. Η τεχνική του συντελεστή συσχέτισης που εφαρμόζεται κατά κανόνα στην ποσοτική ανάλυση έχει αποδειχθεί ότι αρκετά συχνά δεν είναι ικανή να εντοπίσει ικανοποιητικά την ύπαρξη της σχέσης των μεταβλητών, δεδομένου ότι η τιμή του συντελεστή συσχέτισης εξαρτάται από τη φύση των δεδομένων, εμφανίζοντας μάλιστα ακόμα και εικονικές σχέσεις για την περίπτωση ανεξάρτητων χρονοσειρών. Για το λόγο αυτό, χρησιμοποιούνται για τη μέτρηση της εξάρτησης και άλλες πιο πολύπλοκες τεχνικές, όπως οι Copula, προκειμένου να συλλάβουν καλύτερα την έννοια της εξάρτησης μεταξύ των μεταβλητών ακόμα και για δεδομένου που παρουσιάζουν μεγάλη μεταβλητότητα και ποικιλομορφία. Σε αυτή τη διδακτορική διατριβή διερευνάται η συμπεριφορά διαφόρων μέτρων εξάρτησης, συμπεριλαμβανομένου και του συντελεστή συσχέτισης, για γραμμικές σχέσεις που παράγονται από μη γραμμικές χρονοσειρές που έχουν έντονη μεταβλητότητα. Πιο συγκεκριμένα, για την εφαρμογή των προσομοιώσεων χρησιμοποιούνται τα υποδείγματα AR(1) – ARCH(1) των Bera, Higgins και Lee (1992 και 1996), τα οποία παρουσιάζουν μεγάλη μεταβλητότητα στις τιμές τους, δεδομένου ότι η ετεροσκεδαστικότητα προέρχεται από τις τιμές της μεταβλητής και όχι από τις τιμές του τυχαίου σφάλματος. Μάλιστα, όπως αναφέρουν οι συγγραφείς τα υποδείγματα αυτά μπορούν να παρουσιαστούν και ως μη γραμμικά υποδείγματα με μεταβαλλόμενους συντελεστές. Στο πρώτο κεφάλαιο αναφέρονται συνοπτικά τα βασικά στοιχεία που χρησιμοποιούνται στην ανάλυση τυχαίων μεταβλητών και περιγράφουν τον τρόπο συμπεριφοράς τους. Στη συνέχεια, αναλύεται η έννοια της από κοινού κατανομής δύο τυχαίων μεταβλητών με σκοπό την παρουσίαση του συντελεστή γραμμικής συσχέτισης, ενώ γίνεται ακόμα και μία σύντομη αναφορά στο πρόβλημα των υποφαινομενικών συσχετίσεων που υπάρχει από τη χρήση στάσιμων και μη στάσιμων χρονοσειρών. Στο δεύτερο κεφάλαιο παρουσιάζονται οι βασικές έννοιες των συναρτήσεων Copula μαζί με το θεώρημα του Sklar, το οποίο θεμελιώνει την ύπαρξη αυτών των συναρτήσεων και ορίζει τα άνω και κάτω όρια τους. Κατόπιν, περιγράφονται οι πιο σημαντικές συναρτήσεις Copula, οι οποίες χρησιμοποιούνται ευρέως και οι οποίες θα εφαρμοστούν σε αυτή τη διδακτορική διατριβή για τη διερεύνηση της συμπεριφοράς τους σε περίπλοκες χρονοσειρές, ενώ στο τέλος γίνεται μία σύντομη αναφορά στον τρόπο εκτίμησης των παραμέτρων τους. Στο τρίτο κεφάλαιο αναλύονται τα χαρακτηριστικά και οι ιδιότητες των στάσιμων χρονοσειρών και παρουσιάζονται τα βασικά υποδείγματα της μεθοδολογίας των Βox και Jenkins. Κατόπιν, γίνεται μία σύντομη αναφορά στις μη στάσιμες χρονοσειρές και περιγράφονται οι στατιστικοί έλεγχοι που εφαρμόζονται για τη διαπίστωση της ύπαρξης μοναδιαίας αυτοσυσχετιζόμενης ρίζας, σημειώνοντας ότι οι χρονοσειρές αυτές αποτυπώνουν συμπεριφορές φαινομένων με έντονη μεταβλητότητα. Στα πλαίσια αυτής της συμπεριφοράς παρουσιάστηκαν και τα υποδείγματα υπό συνθήκης ετεροσκεδαστικότητας τα οποία και αυτά απεικονίζουν τη μεταβλητότητα αλλά με ένα διαφορετικό τρόπο, όπου η διακύμανση των τιμών της χρονοσειράς μεταβάλλεται διαχρονικά με συγκεκριμένο υπόδειγμα. Τέλος, αναφορά γίνεται και στα υποδείγματα υπό συνθήκης ετεροσκεδαστικότητας στις τιμές της μεταβλητής που παρουσιάστηκαν από τους Bera, Higgins και Lee (1992 και 1996) ως μία άλλη μορφή υποδειγμάτων που μπορεί να περιλάβει ακόμα μεγαλύτερη μεταβλητότητα στις τιμές μιας χρονοσειράς. Στο τέταρτο κεφάλαιο διερευνάται η συμπεριφορά του συντελεστή συσχέτισης, καθώς και ορισμένων τεχνικών Copula για ανεξάρτητες, για γραμμικά εξαρτημένες χρονοσειρές με ετεροσκεδαστικότητα, όπου η συμπεριφορά ορισμένων από των οποίων ομοιάζει και με μη γραμμική, χρησιμοποιώντας ανάλυση Monte Carlo. Επιπρόσθετα, διερευνώνται και οι υποφαινομενικές συσχετίσεις που εμφανίζονται από τέτοια μορφής υποδείγματα, χρησιμοποιώντας το στατιστικό έλεγχο για τη μηδενική υπόθεση ότι δεν υπάρχει γραμμική συσχέτιση με βάση το συντελεστή συσχέτισης. Τέλος, εξετάζονται τόσο οι συμπεριφορές των μέτρων εξάρτησης όσο και της δύναμης τους στατιστικού ελέγχου της μηδενικής συσχέτισης για γραμμικές εξαρτήσεις δύο μεταβλητών που κατασκευάζονται. Στο πέμπτο κεφάλαιο διερευνάται μέσω Monte Carlo ανάλυσης η συμπεριφορά του φαινομένου των υποφαινομενικών παλινδρομήσεων για δύο ανεξάρτητες στάσιμες αυτοπαλίνδρομου πρώτου βαθμού AR(1) χρονοσειρές αλλά και δύο ανεξάρτητες μη στάσιμες τυχαίου περπατήματος χρονοσειρές, των οποίων τα σφάλματα δεν έχουν σταθερή διακύμανση, αλλά η διαχρονικά μεταβαλλόμενη διακύμανσή τους κατασκευάζεται από ένα αυτοπαλίνδρομο υπό όρους ετεροσκεδαστικότητας υπόδειγμα πρώτου βαθμού, δηλαδή από ένα ARCH(1) υπόδειγμα, όπου η μεταβλητότητα στη διακύμανση προέρχεται είτε από τις τιμές των σφαλμάτων είτε από τις τιμές της ίδιας της χρονοσειράς, με την τελευταία μορφή να σχηματίζει μια οικογένεια χρονοσειρών που μπορούν να θεωρηθούν και ως μη γραμμικές διεργασίες. Επίσης, διερευνάται η ύπαρξη αυτοσυσχέτισης στις τιμές των σφαλμάτων της παλινδρόμησης, καθώς και ο τρόπος αντιμετώπισης και των δύο προαναφερθέντων προβλημάτων. Στο έκτο και τελευταίο κεφάλαιο εξετάζονται οι σχέσεις εξάρτησης μεταξύ διαφόρων μεταβλητών που συνδέονται με την αγορά ενέργειας και ειδικότερα με την τιμή του πετρελαίου για συγκεκριμένη χρονική περίοδο χρησιμοποιώντας όλες τις τεχνικές Copula που εφαρμόστηκαν στην διατριβή αυτή. Αρχικά εξετάζονται οι σχέσεις των μεταβλητών στις τιμές τους και κατόπιν στις τιμές των πρώτες διαφορών τους, δεδομένου ότι οι χρονοσειρές βρέθηκαν να είναι μη στάσιμες πρώτου βαθμού. Τέλος, η ανάλυση της εξάρτησής τους επεκτάθηκε στις εκτιμηθείσες τιμές αλλά και στις τιμές των καταλοίπων που προέκυψαν από την εκτίμηση του καταλληλότερου ARIMA υποδείγματος, διαπιστώνοντας σημαντικές αλλαγές στις σχέσεις τους.
περισσότερα
Περίληψη σε άλλη γλώσσα
Determining the relationship between two variables is one of the most crucial aspects of any quantitative analysis. The goal of this effort is to explore if there is, and to what extent, a dependency between the two variables so that the analysis can expand to quantitatively determine their relationship. The technique of correlation coefficient commonly used in quantitative analysis has often been proven to be insufficient in adequately identifying the existence of variable relationships, given that the value of the correlation coefficient depends on the nature of the data, showing sometimes spurious relationships in the case of independent time series. For this reason, more complex techniques, such as Copulas, are used to measure dependency in a better way, capturing the concept of dependency between variables even for data with high variability and diversity. This doctoral thesis investigates the behavior of various dependency measures, including the correlation coefficient, for ...
Determining the relationship between two variables is one of the most crucial aspects of any quantitative analysis. The goal of this effort is to explore if there is, and to what extent, a dependency between the two variables so that the analysis can expand to quantitatively determine their relationship. The technique of correlation coefficient commonly used in quantitative analysis has often been proven to be insufficient in adequately identifying the existence of variable relationships, given that the value of the correlation coefficient depends on the nature of the data, showing sometimes spurious relationships in the case of independent time series. For this reason, more complex techniques, such as Copulas, are used to measure dependency in a better way, capturing the concept of dependency between variables even for data with high variability and diversity. This doctoral thesis investigates the behavior of various dependency measures, including the correlation coefficient, for linear relationships generated by non-linear time series with significant variability. Specifically, the AR(1) - ARCH(1) models introduced by Bera, Higgins, and Lee (1992 and 1996) are used for the simulation application, which exhibit high variability in their values, as heteroskedasticity stems from the variable values rather than from the random error values. Moreover, as the authors state, these models can also be presented as non-linear models with time-varying coefficients. The first chapter briefly outlines the basic elements used in the analysis of random variables and describes their behavior. The concept of the joint distribution of two random variables is then analyzed with the aim of presenting the linear correlation coefficient, while there is even a brief mention of the problem of spurious correlations that arise from the use of stationary and non-stationary time series. In the second chapter, the basic concepts of Copula functions are presented along with Sklar's theorem, which establishes the existence of these functions and defines their upper and lower bounds. Subsequently, the most important and widely used Copula functions are described which will be applied in this doctoral thesis to explore their behavior in complex time series, with a brief reference at the end on how to estimate their parameters. In the third chapter, the characteristics and properties of stationary time series are introduced along with the basic concepts of the Box and Jenkins methodology. Then, non-stationary time series are described along with their corresponding statistical tests used to detect the presence of unit autoregressive root, noting that these time series reflect behaviors of phenomena with significant variability. Within this context, conditional heteroskedasticity models are presented, which depict variability in a different way, where the fluctuation of time series values changes over time with a specific pattern. Finally, the Bera, Higgins, and Lee (1992 and 1996) models are presented as another form of models that may include even greater variability in time series values. In the fourth chapter, the behavior of the correlation coefficient and various Copula techniques for independent, linearly dependent time series with heteroskedasticity is explored, where the behavior of some of them resembles non-linear behavior, using Monte Carlo analysis. Additionally, the correlation behavior that arises from such models is investigated based on the statistical tests for the null hypothesis that there is no linear correlation along with the power of the test to understand better the spurious correlation phenomenon as well as the behaviors of the dependency measures used in this research. In the fifth chapter, a Monte Carlo analysis is applied to explore the phenomenon of spurious regression for two independent stationary first-order autoregressive AR(1) time series, as well as two independent non-stationary random walk time series, with errors that do not have constant variance. Indeed, the errors were constructed by a time-varying variance following an autoregressive conditional heteroskedasticity first-order model, namely an ARCH(1) model, where the variability of the variance arises either from error values or from the time series values themselves, with the latter forming a family of time series that can also be considered as non-linear processes. The error structures of this regression analysis are also investigated to detect serially correlated errors along with an effort to show how to address both issues. In the sixth and final chapter, the dependency relationships between various variables related to the energy market are examined using all the Copula techniques applied in this thesis. Specifically, the effort is consecrated on the price of oil for several other macro and finance variables for a specific period. Initially, the relationships of all variables are examined in their levels and then in their first differences, given that these time series were found to be first-order non-stationary processes. Finally, the analysis of their dependency is extended to the fitted values as well as the residuals resulting from the estimation of the most suitable ARIMA model, noting significant changes in their relationships.
περισσότερα