Περίληψη
To αντικείμενο της παρούσας διδακτορικής διατριβής είναι η ανάπτυξη και η εφαρμογή ποσοτικών σχέσεων δομής – ενεργότητας (Quantitative Structure – Activity Relationships, QSARs) με σκοπό την εύρεση σημαντικών βιοχημικών παραμέτρων που θα εισαχθούν σε μοντέλα βιοκινητικής για βιομηχανικά χημικά, που απαντώνται στο περιβάλλον. Οι παράμετροι που εξετάζονται είναι α) ο συντελεστής κατανομής ιστού/αίματος στο λιπώδη ιστό, τα νεφρά, το ήπαρ, τον εγκέφαλο, την καρδιά, τους πνεύμονες και τους μύες, β) ο χρόνος ημίσειας ζωής εκκαθάρισης και γ) οι κινητικές ιδιότητες της εξίσωσης Michaelis-Menten. Η μεθοδολογία για τη μοντελοποίηση των QSARs περιλάμβανε, αρχικά, την προ-επεξεργασία των δεδομένων εισόδου στην κατάλληλη μορφή για να επιτευχθεί η στατιστική ανάλυση. Τα αρχικά δεδομένα αποτελούνταν από τις πειραματικές τιμές των αποκρίσεων και από τις δύο ομάδες μοριακών περιγραφικών μεταβλητών (LFER και PaDEL) για τις χημικές ουσίες προς εξέταση. Οι αλληλεξαρτώμενες μεταβλητές, καθώς και αυτές με σ ...
To αντικείμενο της παρούσας διδακτορικής διατριβής είναι η ανάπτυξη και η εφαρμογή ποσοτικών σχέσεων δομής – ενεργότητας (Quantitative Structure – Activity Relationships, QSARs) με σκοπό την εύρεση σημαντικών βιοχημικών παραμέτρων που θα εισαχθούν σε μοντέλα βιοκινητικής για βιομηχανικά χημικά, που απαντώνται στο περιβάλλον. Οι παράμετροι που εξετάζονται είναι α) ο συντελεστής κατανομής ιστού/αίματος στο λιπώδη ιστό, τα νεφρά, το ήπαρ, τον εγκέφαλο, την καρδιά, τους πνεύμονες και τους μύες, β) ο χρόνος ημίσειας ζωής εκκαθάρισης και γ) οι κινητικές ιδιότητες της εξίσωσης Michaelis-Menten. Η μεθοδολογία για τη μοντελοποίηση των QSARs περιλάμβανε, αρχικά, την προ-επεξεργασία των δεδομένων εισόδου στην κατάλληλη μορφή για να επιτευχθεί η στατιστική ανάλυση. Τα αρχικά δεδομένα αποτελούνταν από τις πειραματικές τιμές των αποκρίσεων και από τις δύο ομάδες μοριακών περιγραφικών μεταβλητών (LFER και PaDEL) για τις χημικές ουσίες προς εξέταση. Οι αλληλεξαρτώμενες μεταβλητές, καθώς και αυτές με σταθερές τιμές στο μεγαλύτερο ποσοστό, εξαιρέθηκαν από την ανάλυση. Επιπλέον, εφαρμόστηκε η Ανάλυση Κύριων Συνιστωσών (PCA) για την κατηγοριοποίηση των χημικών ουσιών και τον προσδιορισμό των σημαντικότερων μεταβλητών για τη μοντελοποίηση. Στη συνέχεια, τα επεξεργασμένα δεδομένα χωρίστηκαν σε τρία υποσύνολα: α) εκπαίδευσης, β) επικύρωσης και γ) ελέγχου, και αναλύθηκαν με τις μεθόδους Πολλαπλής Γραμμικής Παλινδρόμησης βασισμένη σε Γενετικό Αλγόριθμο (GA-MLR) και Τεχνητών Νευρωνικών Δικτύων (ΑΝΝ). Οι αλγόριθμοι Levenberg-Marquardt (LM), Scaled Conjugate Gradient (SCG) και Quasi-Newton (BFG) χρησιμοποιήθηκαν για την εκπαίδευση των μοντέλων. Τα μοντέλα αξιολογήθηκαν με βάση το συντελεστή προσδιορισμού και το σφάλμα μέσης τιμής όσον αφορά στο σύνολο εκπαίδευσης, επικύρωσης και ελέγχου, ενώ το πεδίο εφαρμογής τους προσδιορίστηκε με τη χρήση γεωμετρικών και βασισμένων στο εύρος τιμών και τη συνάρτηση πυκνότητας-πιθανότητας μεθόδων. Τα αποτελέσματα έδειξαν ότι η μέθοδος Τεχνητών Νευρωνικών Δικτύων με τη χρήση του LM αλγορίθμου υπερίσχυσε των υπόλοιπων στατιστικών μεθόδων. Η ανάλυση κατέληξε σε ένα μοντέλο με τις PaDEL μεταβλητές και ένα μοντέλο με τις LFER μεταβλητές για κάθε μία από τις υπό εξέταση παραμέτρους. Συγκεκριμένα, οι συντελεστές προσδιορισμού για το σύνολο εκπαίδευσης, επικύρωσης και ελέγχου βρέθηκαν υψηλότεροι από τα βιβλιογραφικά κριτήρια για την αποδοχή μοντέλων QSARs. Επιπλέον, οι υπολογισμένες τιμές του σφάλματος μέσης τιμής για όλα τα σύνολα ήταν σημαντικά χαμηλές, επιβεβαιώνοντας ότι τα μοντέλα είναι αξιόπιστα. Τα μοντέλα που αναπτύχθηκαν με χρήση των περιγραφικών μεταβλητών PaDEL προσέφεραν ευρύτερο πεδίο εφαρμογής από εκείνο που ελήφθη από τα μοντέλα με τις μεταβλητές LFER, για την πλειονότητα των προς πρόβλεψη παραμέτρων.Τα προτεινόμενα μοντέλα εξετάστηκαν για την εγκυρότητα και την εφαρμοσιμότητά τους. Βρέθηκε ότι είναι αξιόπιστα και ικανά να προβλέψουν φυσικοχημικές και βιοχημικές παραμέτρους χημικών ουσιών, για τις οποίες υπάρχουν ανεπαρκή ή καθόλου δεδομένα και οι οποίες εμπίπτουν στο πεδίο εφαρμογής των μοντέλων. Με αυτόν τον τρόπο, τα in vivo πειράματα θα μπορούσαν να περιοριστούν και η ευρεία χρήση των βιοκινητικών μοντέλων (Physiologically Based Biokinetic models, PBBK) στις διαδικασίες εκτίμησης κινδύνου θα μπορούσε να ενισχυθεί. Τέλος, επιτρέποντας την επιτυχή πρόβλεψη της τοξικοκινητικής συμπεριφοράς χημικών ουσιών με βάση τις μοριακές τους περιγραφικές μεταβλητές υποστηρίζεται η έννοια της πρόληψης μέσω του σχεδιασμού.
περισσότερα
Περίληψη σε άλλη γλώσσα
The main objective of this thesis was to develop unified QSAR models, which could be used to predict significant physicochemical and biochemical properties of industrial chemical compounds. These properties include the tissue/blood partition coefficient for adipose, kidney, liver, brain, heart, lung and muscle, the elimination half-life and the kinetic properties of Michaelis-Menten equation.The first step of QSAR modeling was data pre-proccesing to bring them into the appropriate format for statistical analysis. The initial data consisted of the experimental values of responses and two sets of molecular descriptors for industrial chemical compounds, the LFER and PaDEL set. The semi-constant and intercorrelated descriptors were excluded from the analysis. Principal Component Analysis (PCA) was then used for the distribution of chemical compounds and the determination of the most influential descriptors for QSAR analysis.Moreover, the datasets were divided into the training, validation ...
The main objective of this thesis was to develop unified QSAR models, which could be used to predict significant physicochemical and biochemical properties of industrial chemical compounds. These properties include the tissue/blood partition coefficient for adipose, kidney, liver, brain, heart, lung and muscle, the elimination half-life and the kinetic properties of Michaelis-Menten equation.The first step of QSAR modeling was data pre-proccesing to bring them into the appropriate format for statistical analysis. The initial data consisted of the experimental values of responses and two sets of molecular descriptors for industrial chemical compounds, the LFER and PaDEL set. The semi-constant and intercorrelated descriptors were excluded from the analysis. Principal Component Analysis (PCA) was then used for the distribution of chemical compounds and the determination of the most influential descriptors for QSAR analysis.Moreover, the datasets were divided into the training, validation and test set and were analyzed using two statistical methods, Genetic Algorithm based Multiple Linear Regression (GA-MLR) and Artificial Neural Networks (ANN). Levenberg-Marquardt (LM), Scaled Conjugate Gradient (SCG) and Quasi-Newton (BFG) were implemented as training algorithms regarding ANN technique. The developed models were evaluated according to the coefficient of determination and Mean Squared Error (MSE). The Applicability Domain (AD) of the models was determined using geometric, range-based, distance-based and Probability Density Function (PDF)-based methods.The results showed that LM-based ANN outperformed GA-MLR and SCG/BFG-based ANN methods. The analysis concluded to one PaDEL and one LFER model for each of the responses of interest. Specifically, the estimated values of coefficients of determination for both training, validation and test set for the developed best models exceeded the desirable criteria for QSAR acceptance, which are 0.6, 0.5 and 0.6, respectively. In addition, the calculated MSE values for all sets were significantly low, verifying that the models could be both reliable and predictive. In the majority of the predicted responses, the models that were developed using PaDEL descriptors offered a larger chemical space than the one obtained from the models using LFER descriptors.The proposed models were examined for their fitting capacity, validity and applicability. They were stable, reliable and capable to predict physicochemical and biochemical parameters of “data poor” chemical compounds that fall within the applicability domain. In this way, the broader use of Physiologically Based Biokinetic (PBBK) models in chemical risk assessment could be reinforced, especially when considering the current shift of toxicological research to non-animal testing as aptly shown by the large international efforts on high throughput screening. Finally, the Prevention through Design (PtD) concept for environmental chemicals is supported, by allowing the successful prediction of toxicokinetic behaviour based on molecular parameters.
περισσότερα