• Κύριος
  • Νέα
  • Το πείραμα του Facebook προκαλεί πολλή φασαρία για μικρό αποτέλεσμα

Το πείραμα του Facebook προκαλεί πολλή φασαρία για μικρό αποτέλεσμα

Μια μελέτη στην οποία το Facebook χειρίστηκε τις ειδήσεις τροφοδοσίας σε περισσότερους από 600.000 χρήστες έστειλαν τους χρήστες των κοινωνικών μέσων μαζικής ενημέρωσης σε αυτήν την εβδομάδα και έπεσαν στα κύρια μέσα: «Facebook Tinkers With Users 'Emotions», ξεκίνησε ο τίτλος στους New York Times δικτυακός τόπος.


Αλλά η διαμάχη για το τι έκαναν αυτοί οι ερευνητές μπορεί να επισκιάσει άλλες σημαντικές συζητήσεις, συγκεκριμένα συνομιλίες σχετικά με το τι πραγματικά βρήκαν-όχι πολύ, στην πραγματικότητα- και τον σωστό και λανθασμένο τρόπο σκέψης και αναφοράς ευρημάτων με βάση στατιστικές αναλύσεις μεγάλων δεδομένων. (Θα φτάσουμε στη δεοντολογία του πειράματός τους σε μια στιγμή.)

Επειδή είναι τόσο μεγάλα, οι μελέτες που βασίζονται σε υπερμεγέθη δείγματα μπορούν να παράγουν αποτελέσματα που είναι στατιστικά σημαντικά αλλά ταυτόχρονα είναι ουσιαστικά ασήμαντα. Είναι απλά μαθηματικά: Όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο μικρότερες είναι οι διαφορές που πρέπει να είναι στατιστικά σημαντικές - δηλαδή, πολύ πιθανό να είναι πραγματικά διαφορετικές μεταξύ τους. (Σε αυτή τη μελέτη, οι διαφορές που εξετάστηκαν ήταν μεταξύ εκείνων που είδαν περισσότερα και εκείνων που είδαν λιγότερες θέσεις με φορμά συναισθήματος σε σύγκριση με μια ομάδα ελέγχου της οποίας οι ειδήσεις δεν είχαν χειραγωγηθεί.)

Και όταν έχετε ένα τεράστιο τυχαίο δείγμα 689.003, όπως έκαναν αυτοί οι ερευνητές, ακόμη και μικροσκοπικές διαφορές περνούν τυπικά τεστ σημασίας. (Για προοπτική, ένα τυπικό μέγεθος δείγματος σε μια εθνικά αντιπροσωπευτική δημοσκόπηση δημοσκόπησης είναι 1.000.)

Αυτός είναι ο λόγος για τον οποίο οι γενιές των εκπαιδευτικών στατιστικών προειδοποιούν τους μαθητές τους ότι «στατιστικά σημαντική» δεν σημαίνει απαραίτητα «πραγματικά,Πραγματικάσπουδαίος'.


Πείραμα Facebook για χειρισμό ροής ειδήσεωνΕξετάστε τα ευρήματα της μελέτης στο Facebook στην οποία διέφεραν πόσες θετικές και αρνητικές αναρτήσεις από θεματικά άτομα που είχαν δοκιμαστεί. Οι αναρτήσεις προσδιορίστηκαν ως θετικές ή αρνητικές εάν περιείχαν μία μόνο θετική ή αρνητική λέξη. Στη συνέχεια, η χρήση θετικών και αρνητικών λέξεων από το ίδιο το εξεταστικό αντικείμενο στις ενημερώσεις κατάστασης παρακολουθήθηκε για μια εβδομάδα. Συνολικά, τα εξεταστικά θέματα δημοσίευσαν συνολικά 122 εκατομμύρια λέξεις, τέσσερα εκ των οποίων ήταν θετικά και 1,8 εκατομμύρια αρνητικά.



Όπως ανέφεραν οι συγγραφείς, ο αριθμός των αρνητικών λέξεων που χρησιμοποιήθηκαν στις ενημερώσεις κατάστασης αυξήθηκε, κατά μέσο όρο, κατά 0,04% όταν μειώθηκαν οι θετικές δημοσιεύσεις των φίλων τους στις ροές ειδήσεων. Αυτό σημαίνει μόνο τέσσερις ακόμη αρνητικές λέξεις για κάθε 10.000 που γράφονται από αυτούς τους συμμετέχοντες στη μελέτη. Ταυτόχρονα, ο αριθμός των θετικών λέξεων μειώθηκε μόνο κατά 0,1% ή περίπου μία λιγότερη λέξη για κάθε 1.000 λέξεις που γράφτηκαν. (Ως σημείο αναφοράς, αυτή η ανάρτηση έχει μήκος πάνω από 1.000 λέξεις.)


Αντίθετα, όταν μειώθηκαν οι αρνητικές αναρτήσεις, χρησιμοποιήθηκαν επτά λιγότερες αρνητικές λέξεις ανά 10.000 και ο αριθμός των θετικών λέξεων αυξήθηκε περίπου έξι ανά 10.000.

Με βάση αυτά τα αποτελέσματα, οι συγγραφείς κατέληξαν στο συμπέρασμα στη δημοσιευμένη μελέτη τους ότι «τα αποτελέσματά τους δείχνουν ότι τα συναισθήματα που εκφράζονται από άλλους στο Facebook επηρεάζουν τα δικά μας συναισθήματα, αποτελώντας πειραματικά στοιχεία για μαζική μετάδοση μέσω κοινωνικών δικτύων».


Αλλά αυτές οι μικροσκοπικές μετατοπίσεις, ακόμη και αν είναι πραγματικές, αποτελούν απόδειξη μιας ανησυχητικής «μεγάλης κλίμακας μετάδοσης»; Φυσικά, η σημασία είναι στο μάτι του θεατή. Για ορισμένους, αυτές οι μικροσκοπικές αλλαγές μπορεί να προκαλέσουν συναγερμό. Αλλά για άλλους, είναι μάλλον δίκαιοιναι.

Ένας από τους συγγραφείς φαίνεται να είχε δεύτερη σκέψη για τη γλώσσα που χρησιμοποίησαν για να περιγράψουν το έργο τους. Σε μια δημοσίευση στο Facebook που γράφτηκε ως απάντηση στη διαμάχη, ο Adam D. I. Kramer αναγνώρισε: «Οι συντάκτες μου και λυπάμαι πολύ για τον τρόπο που το έγγραφο περιέγραψε την έρευνα».

Πρότεινε επίσης ότι, ακόμη και με το τεράστιο δείγμα τους, δεν βρήκαν ιδιαίτερα μεγάλο αποτέλεσμα. Τα αποτελέσματα, έγραψε, βασίστηκαν στο «ελάχιστο ποσό για να το ανιχνεύσει στατιστικά - το αποτέλεσμα ήταν ότι οι άνθρωποι παρήγαγαν κατά μέσο όρο μία λιγότερη συναισθηματική λέξη, ανά χίλιες λέξεις, την επόμενη εβδομάδα».

Οι κριτικοί έθεσαν άλλα ερωτήματα, ιδίως το περιοδικό The Atlantic and Wired, το οποίο αμφισβήτησε εάν η ανάγνωση θετικών δημοσιεύσεων προκάλεσε απευθείας στο χρήστη του Facebook να χρησιμοποιεί πιο θετικές λέξεις στις επόμενες ενημερώσεις του.


Αλλά είναι τι ηθικό το Facebook; Υπάρχει μια καλή συζήτηση σχετικά με το εάν το Facebook ήταν αρκετά διαφανές με τους χρήστες του για αυτό το είδος πειραματισμού. Δεν ενημέρωσαν άμεσα εκείνους της μελέτης ότι επρόκειτο να χρησιμοποιηθούν ως ανθρώπινοι εργαστηριακοί αρουραίοι. Στην ακαδημαϊκή έρευνα, αυτό λέγεται ότι δεν λαμβάνεται «ενημερωμένη συγκατάθεση» και είναι σχεδόν πάντα ένα τεράστιο όχι-όχι. (Το Facebook ισχυρίζεται ότι όλοι όσοι συμμετέχουν στο Facebook συμφωνούν ως μέρος της συμφωνίας χρήστη του να συμπεριληφθούν σε τέτοιες μελέτες.)

Το ερώτημα είναι τώρα πώς, καθισμένος σε πολλά νέα κοινωνικά μέσα και άλλα ψηφιακά δεδομένα για να εξορύξω για το ίδιο είδος συμπεριφορικής ανάλυσης, θα πρέπει να γραφτούν οι νέοι κανόνες.

Η πειραματική έρευνα είναι γεμάτη με παραδείγματα του τρόπου με τον οποίο οι συμμετέχοντες στη μελέτη έχουν χειραγωγηθεί, εξαπατηθεί ή ξεκαθαρίσει ψέματα στο όνομα της κοινωνικής επιστήμης. Και ενώ πολλές από αυτές τις πρακτικές έχουν περιοριστεί ή απαγορευτεί στο academe, συνεχίζουν να χρησιμοποιούνται σε εμπορικούς και άλλους τύπους έρευνας.

Εξετάστε την περίπτωση του «Verifacitor», του νεότερου και καλύτερου ανιχνευτή ψεύδους στον κόσμο -ή τουλάχιστον αυτό είπαν ορισμένοι συμμετέχοντες σε αυτήν τη μελέτη που διεξήχθησαν από ερευνητές του Εθνικού Κέντρου Ερευνών του Πανεπιστημίου του Σικάγο στα μέσα της δεκαετίας του 1990.

Τα εξεταστικά θέματα χωρίστηκαν σε δύο ομάδες. Ζητήθηκε από τα μέλη της ομάδας ελέγχου να καθίσουν σε ένα γραφείο όπου ένας ερευνητής έθεσε ερωτήσεις σχετικά με τις συνήθειες άσκησης, το κάπνισμα, τη χρήση ναρκωτικών, τις σεξουαλικές πρακτικές και την υπερβολική κατανάλωση αλκοόλ.

Τα άλλα υποκείμενα δοκιμής απάντησαν στις ίδιες ερωτήσεις ενώ ήταν συνδεδεμένα με ηλεκτρόδια στο Verifacitor, που περιγράφεται από τον χειριστή ως ένας νέος τύπος ανιχνευτή ψεύδους. (Στην πραγματικότητα, ήταν απλώς μια συλλογή από παλιά στοιχεία υπολογιστών που είχαν οι ερευνητές.)

Για να βελτιωθεί περαιτέρω η αλήθεια, κάθε συμμετέχων ενημερώθηκε πριν ξεκινήσει η επίσημη συνέντευξη ότι ο χειριστής έπρεπε να βαθμονομήσει το μηχάνημα. Έτσι, ο συμμετέχων είπε να ψέψει τυχαία σε απάντηση σε δημογραφικές ερωτήσεις για τον εαυτό του που είχαν τεθεί νωρίτερα σε ένα ερωτηματολόγιο διαλογής. (Ερωτήσεις όπως: Είστε παντρεμένοι; Τελειώσατε το γυμνάσιο; κ.λπ.).

Φυσικά, ο ερευνητής είχε πάρει τις σωστές απαντήσεις, οπότε αναγνώρισε αμέσως μια ψευδής απάντηση, που προκαλεί έκπληξη το θέμα του τεστ.

Λοιπόν μπορείτε να μαντέψετε τι συνέβη. Πλήρως το 44% των ατόμων στην ομάδα Verifacitor αναγνώρισαν ότι είχαν χρησιμοποιήσει ποτέ κοκαΐνη σε σύγκριση με το 26% στην ομάδα ελέγχου. Πλήρως διπλάσιο του ποσοστού που αναφέρθηκε χρησιμοποιώντας αμφεταμίνες (39% έναντι 19%), χρήση άλλων φαρμάκων (39% έναντι 19%) και κατανάλωση περισσότερου αλκοόλ από την κανονική (34% έναντι 16%).

Με άλλα λόγια, η έρευνα κοινωνικής επιστήμης έχει μακρά ιστορία χειραγώγησης. Θα μάθει από το παρελθόν του;