Επαναλήψεις

Η στατιστική, θέλουμε-δε θέλουμε, είναι το μόνο εργαλείο που έχουμε για να πλησιάσουμε όσο μπορούμε την επιστημονική αλήθεια. Η κακή χρήση του εργαλείου δεν πρέπει να καταδικάζει το εργαλείο αυτό καθεαυτό. Η κακή χρήση της στατιστικής σε πολλές περιπτώσεις ευθύνεται για την κακή φήμη που έχει, ακόμα και στις τάξεις των επιστημόνων. Υπάρχει λοιπόν ανάγκη κάθε επιστήμονας να ελέγχει την ορθότητα των μετρήσεών του και των αποτελεσμάτων που εξάγει κάθε φορά, αλλά κυρίως των ερμηνειών που δίνει σε αυτά τα αποτελέσματα.

“…as with other methodological advances, the improvements to biological understanding they provide depend crucially on them being applied and interpreted correctly.”

Σε αυτό το άρθρο του περιοδικού PLoS Pathogens παρουσιάζεται η κακή χρήση της στατιστικής σε δημοσιεύματα σε -ακόμα και πολύ καλά- περιοδικά παρασιτολογίας. Επίσης, προτείνονται τρόποι αποφυγής τέτοιων σκοπέλων. Το άρθρο καταπιάνεται με το πρόβλημα των επαναλαμβανόμενων μετρήσεων στο ίδιο υποκείμενο, ένα πρόβλημα που συναντάται σε όλες τις βιολογικές επιστήμες και, από προσωπική πείρα, διαπιστώνω ότι σε μερικές περιπτώσεις είναι εξαιρετικά δύσκολο να γίνει κατανοητό. Ο εγκέφαλος μερικών -κατά τα άλλα πολύ καλών- επιστημόνων αρνείται πεισματικά να το κατανοήσει.

Μερικά αποσπάσματα από το άρθρο:

In a literature search of papers published in the last three years we found that, of 76 papers using mixed effects models to analyse infection data in seven high impact parasitology journals, only 25% of publications explicitly checked and/or controlled for temporal auto-correlation. This indicates a worrying trend and potentially a major problem with the validity of reported findings.

Advances in statistical methodology should provide important and useful tools for understanding infections and disease in just the same way as do advances in genetic, molecular, and immunological methods. Investing in learning how to effectively use tools, such as mixed effects models, pays by providing robust and novel insight into the roles of hosts and parasites in shaping patterns of disease. However, as with other methodological advances, the improvements to biological understanding they provide depend crucially on them being applied and interpreted correctly. Temporal correlation in time-course data can compromise statistical analyses by increasing the likelihood of false positives, yet this problem has been largely overlooked in parasitology. We strongly support the implementation of more sophisticated statistical analyses in which the assumptions underlying models are fulfilled to safeguard against inaccurate or misleading results and provide a solid foundation from which to progress understanding of disease.

Pollitt LC, Reece SE, Mideo N, Nussey DH, Colegrave N (2012) The Problem of Auto-Correlation in Parasitology. PLoS Pathog 8(4): e1002590. doi:10.1371/journal.ppat.1002590

Παλινδρόμηση

Το περασμένο καλοκαίρι (14 Ιουνίου 2005) έγινε νέο παγκόσμιο ρεκόρ στα 100 μέτρα (9,77) από τον Τζαμαϊκανό Asafa Powell, στα Τσικλητήρια της Αθήνας. Πριν από 37 χρόνια, τον Ιούνιο του 1968 ο Jim Hines ήταν ο πρώτος άνθρωπος που έτρεξε τα 100 μέτρα σε λιγότερο από 10 δευτερόλεπτα. Δεν θα σχολιάσω το συγκεκριμένο γεγονός, περί ντόπινγκ κ.λπ. Οι επιστήμονες λένε ότι είναι αδύνατο για το ανθρώπινο σώμα να τρέξει τα 100 μέτρα σε λιγότερο από 10 δευτερόλεπτα.

Μπήκα στην Wikipedia και διάβασα την εξέλιξη των ρεκόρ στα 100 μέτρα ανδρών. Στο γράφημα αναφέρεται η εξίσωση της παλινδρόμησης χρόνος = -0,4403 x ln(έτος – 1900) + 11,853, αλλά χωρίς το r2. Βάζοντας τα δεδομένα στο SPSS παίρνω την εξίσωση χρόνος = -0,7455 x ln(έτος -1867,8) + 13,433 με r2=0,93187. Το δικό μου μοντέλο είναι πολύ κοντά σε αυτό της Wikipedia, αλλά δεν είναι αυτό το θέμα. Στη λεζάντα του γραφήματος αναφέρεται επίσης ότι «αν ο υπολογισμός είναι σωστός, το 2100 το ρεκόρ θα κατεβεί στα 9,52 δευτερόλεπτα» (9,37 με το δικό μου μοντέλο)!

Εδώ ακριβώς είναι το πρόβλημα. Η παλινδρόμηση ως στατιστική μέθοδος δεν μπορεί να κάνει προβλέψεις για την εξαρτημένη μεταβλητή εκτός των διαθέσιμων ορίων της ανεξάρτητης. Είναι ένα λάθος που το βλέπω συχνά σε επιστημονικές εργασίες. Στη συγκεκριμένη περίπτωση, δηλαδή, το μοντέλο δεν μπορεί να κάνει πρόβλεψη για το μέλλον ή εκτίμηση για το παρελθόν, πέρα από το μέγιστο ή το ελάχιστο έτος για το οποίο έχουμε διαθέσιμα στοιχεία. Γι’ αυτό και οι γραμμές του διαστήματος εμπιστοσύνης «απομακρύνονται» από τη γραμμή παλινδρόμησης στα άκρα της. Ένα άλλο παράδειγμα: αν κάνουμε παλινδρόμηση του μέσου ύψους των Ελλήνων τις τελευταίες δεκαετίες θα βρούμε ένα μοντέλο με αυξητική τάση. Αν προσπαθήσουμε να υπολογίσουμε το μέσο ύψος το έτος 2100 θα βρούμε ότι οι Έλληνες θα είναι γίγαντες! Αντίθετα, το 1700 θα ήταν νάνοι!

Σε τι μας χρησιμεύει τότε η παλινδρόμηση; Με την παλινδρόμηση υπολογίζουμε την εξαρτημένη μεταβλητή, πάντα μέσα στα όρια των δεδομένων μας, σε περιοχές που αυτά μάς λείπουν ή για να εκτιμήσουμε αυτή την μεταβλητή σε μια συγκεκριμένη περιοχή με κάποια βεβαιότητα. Π.χ. μπορούμε να πούμε με αρκετή βεβαιότητα ότι το έτος 1956 το παγκόσμιο ρεκόρ ήταν 10,09. Στην πραγματικότητα το 1956 έγινε τέσσερις φορές χρόνος 10,1 και τέσσερις 10,2 (μέσος 10,15). Επίσης, θα μπορούσαμε να εκτιμήσουμε το χρόνο που θα μπορούσε να έχει επιτευχθεί το 1998 (χρονιά που δεν σημειώθηκε ρεκόρ): 9,80. Για να κάνουμε πρόβλεψη υπάρχουν άλλα στατιστικά εργαλεία. Η παλινδρόμηση δεν είναι γι’ αυτή τη δουλειά.

Αν έχουν νόημα ή πρακτική αξία όλα αυτά βρίσκεται στην κρίση του παρατηρητή-ερευνητή. Αυτό δεν την ενδιαφέρει τη στατιστική. Η κάθε στατιστική μέθοδος μάς δίνει τη δυνατότητα να εξαγάγουμε συμπεράσματα. Αν αυτά είναι λανθασμένα δεν φταίει η μέθοδος.