Περίληψη
Με την βελτίωση της μεθοδολογίας στη Γενετική, ο όγκος της πληροφορίας που προκύπτει στη Γενετική Επιδημιολογία είναι τεράστιος. Χιλιάδες μελέτες συσχέτισης γονοτύπου-φαινοτύπου δημοσιεύονται κάθε χρόνο μελετώντας τις σχέσεις μεταξύ ποικιλομορφιών του DNA και διαφόρων πολυσύνθετων νοσημάτων. Η διαφανής και ξεκάθαρη περιγραφή της μεθοδολογίας και των αποτελεσμάτων τους επιτρέπουν στον αναγνώστη να εκτιμήσουν καλύτερα την αξιοπιστία των εκάστοτε ευρημάτων. Στη συγκεκριμένη διατριβή επιδιώξαμε να μελετήσουμε τις πρακτικές αναφοράς σε μελέτες γενετικής επιδημιολογίας και να αξιολογήσουμε κατά πόσο υπάρχει υπέρβαση του αριθμού των στατιστικά σημαντικών ευρημάτων σε σχέση με το αναμενόμενο, οφειλόμενη είτε σε τυχόν μεροληψίες έιτε σε ετερογένεια μεταξύ των μελετών. Επιλέξαμε με τυχαίο τρόπο, άρθρα από μία διαρκώς ανανεούμενη βάση μελετών γενετικής επιδημιολογίας για να αποτελέσουν ένα αντιπροσωπευτικό δείγμα της συγκεκριμένης βιβλιογραφίας. Στην κύρια ανάλυση αξιολογήθηκαν 315 άρθρα δημοσιευ ...
Με την βελτίωση της μεθοδολογίας στη Γενετική, ο όγκος της πληροφορίας που προκύπτει στη Γενετική Επιδημιολογία είναι τεράστιος. Χιλιάδες μελέτες συσχέτισης γονοτύπου-φαινοτύπου δημοσιεύονται κάθε χρόνο μελετώντας τις σχέσεις μεταξύ ποικιλομορφιών του DNA και διαφόρων πολυσύνθετων νοσημάτων. Η διαφανής και ξεκάθαρη περιγραφή της μεθοδολογίας και των αποτελεσμάτων τους επιτρέπουν στον αναγνώστη να εκτιμήσουν καλύτερα την αξιοπιστία των εκάστοτε ευρημάτων. Στη συγκεκριμένη διατριβή επιδιώξαμε να μελετήσουμε τις πρακτικές αναφοράς σε μελέτες γενετικής επιδημιολογίας και να αξιολογήσουμε κατά πόσο υπάρχει υπέρβαση του αριθμού των στατιστικά σημαντικών ευρημάτων σε σχέση με το αναμενόμενο, οφειλόμενη είτε σε τυχόν μεροληψίες έιτε σε ετερογένεια μεταξύ των μελετών. Επιλέξαμε με τυχαίο τρόπο, άρθρα από μία διαρκώς ανανεούμενη βάση μελετών γενετικής επιδημιολογίας για να αποτελέσουν ένα αντιπροσωπευτικό δείγμα της συγκεκριμένης βιβλιογραφίας. Στην κύρια ανάλυση αξιολογήθηκαν 315 άρθρα δημοσιευμένα στο διάστημα 2001- 2003 και για λόγους σύγκρισης, επιπλέον 28 άρθρα δημοσιευμένα το 2006, εστιάζοντας σε θέματα που περιγράφονταν σπανιότερα στο διάστημα 2001-2003. Σε δεύτερη φάση, χρησιμοποιήσαμε όλες τις μελέτες γενετικής επιδημιολογίας της νόσου Alzheimer που περιλαμβάνονταν στη βάση γενετικών μελετών AlzGene έως τις 31/1/2007 (1,348 μελέτες σε 315 μετα-αναλύσεις). Ο αριθμός των παρατηρούμενων (Π) στατιστικά σημαντικά μελετών (στο επίπεδο σημαντικότητας p<0.05) συγκρίθηκε με 94 τον αναμενόμενο (Α) αριθμό τους για διαφορετικά μεγέθη του αποτελέσματος. Στην κύρια ανάλυση το μέγεθος του αποτελέσματος ήταν το συγκεντρωτικό αποτέλεσμα της μετα-ανάλυσης. Και στις 2 χρονικές περιόδους, οι περισσότερες μελέτες περιελάμβαναν μικρά μεγέθη δείγματος και δεν ήταν συνεπείς στην περιγραφή των απαραίτητων δεδομένων για την αξιολόγηση συστηματικού σφάλματος αναφοράς, δυσταξινόμησης (γονοτύπου, φαινοτύπου) ή διαστρωμάτωσης του πληθυσμού. Η στατιστική ισχύς, η χρήση ατόμων χωρίς συγγενικές σχέσεις μεταξύ τους και η αξιολόγηση της γονοτυπικής μεθόδου εις διπλούν περιγράφονταν συχνότερα στα άρθρα του 2006. Εξάλλου, 19 μετα-αναλύσεις (όλες με στατιστικά μη- σημαντικό συγκεντρωτικό
περισσότερα
Περίληψη σε άλλη γλώσσα
With the advent of massive genetic technologies, several thousand human genome epidemiology studies are published every year investigating the relationship between common genetic variants and diverse phenotypes. Transparent reporting of study methods and results allows readers to better assess the validity of study findings. In this thesis, we aimed to evaluate the reporting practices of human genome epidemiology studies along with the excess of statistically significant results in studies of genetic associations with Alzheimer’s disease reflecting either bias or between-study heterogeneity. Articles were randomly selected from a continuously updated database of human genome epidemiology association studies to be representative of genetic epidemiology literature. The main analysis evaluated 315 articles published in 2001-2003. For a comparative update, we evaluated 28 more recent articles published in 2006, focusing on issues that were poorly reported in 2001-2003. In a second phase, w ...
With the advent of massive genetic technologies, several thousand human genome epidemiology studies are published every year investigating the relationship between common genetic variants and diverse phenotypes. Transparent reporting of study methods and results allows readers to better assess the validity of study findings. In this thesis, we aimed to evaluate the reporting practices of human genome epidemiology studies along with the excess of statistically significant results in studies of genetic associations with Alzheimer’s disease reflecting either bias or between-study heterogeneity. Articles were randomly selected from a continuously updated database of human genome epidemiology association studies to be representative of genetic epidemiology literature. The main analysis evaluated 315 articles published in 2001-2003. For a comparative update, we evaluated 28 more recent articles published in 2006, focusing on issues that were poorly reported in 2001-2003. In a second phase, we analyzed all genetic association studies of Alzheimer’s disease entered into the comprehensive AlzGene database until 31/1/2007 (1,348 studies in 315 meta-analyses). The number of observed (O) studies with statistically siginificant results (P=0.05 threshold) was compared with the expected (E) number under differenet assumptions for the magnitude of the effect size. In the main analysis, the plausible effect size was the summary effect presented in the respective meta-analysis. During both time periods, most studies comprised relatively small study populations. Articles were inconsistent in reporting the data needed to assess selection bias, and the methods to minimize misclassification (of genotypes, phenotypes) or to identify population stratification. Statistical power, the use of unrelated study participants and the use of replicate samples were reported more often in articles published during 2006. Overall, 19 meta-analyses (all with eventually non-significant results) had a documented excess of significant findings. Typically, sinlge studies had significant effects pointing in opposite directions and early summary effects were dissipated over time. Across the whole domain, O was 235 (17.4%), while E was 164.8 (12.2%) (p<10-6). The excess showed a predilection for meta-analyses with non-significant summary effects and between-study heterogeneity. The excess was seen for all levels of statistical significance and also for studies with borderline p values (0.05- 0.10). We conclude that many items needed to assess error and bias in human genome epidemiology association studies are not consistenly reported. Although some improvements were seen over time, reporting guidelines may help enhance the transparency of this literature. Finally, the excess of significant findings may represent significance-chasing biases in a setting of massive testing.
περισσότερα