4. Δημογραφικά δεδομένα

Καθώς η χρήση εμπορικών λιστών ψηφοφόρων από εκστρατείες και ερευνητές της κοινής γνώμης έχει αυξηθεί, οι προσφορές δεδομένων που παρέχονται από προμηθευτές αρχείων ψηφοφόρων έχουν διευρυνθεί. Εκτός από τις τυπικές πολιτικές προσφορές, πολλοί προμηθευτές παρέχουν τώρα μια σειρά από επιπλέον δημογραφικά δεδομένα και τρόπους ζωής που δημιουργούνται μέσω μοντέλων πρόβλεψης ή συλλέγονται από άλλες πηγές. Αυτό το κεφάλαιο συγκρίνει δημογραφικά δεδομένα στα αρχεία ψηφοφόρων με αυτοαναφορές από τους ειδικούς.


Τα μοντέλα πρόβλεψης αξιοποιούν δεδομένα από ένα συνδυασμό εμπορικών προμηθευτών τρίτων μερών και δεδομένων έρευνας για να προσπαθήσουν να προβλέψουν ορισμένα χαρακτηριστικά, που κυμαίνονται από τη φυλή ενός ατόμου έως το εκπαιδευτικό επίτευγμα. Ωστόσο, για ορισμένες μοντελοποιημένες μεταβλητές, πολλές από τις υποκείμενες πληροφορίες είναι διαθέσιμες μόνο σε ένα τμήμα των καταστάσεων. Για παράδειγμα, οι πωλητές βασίζονται σε ένα συνδυασμό πληροφοριών από αρχεία ψηφοφόρων και πρόσθετα δεδομένα για να προβλέψουν τη φυλή ή την εθνικότητα ενός ατόμου. Σε 16 πολιτείες ή τμήματα πολιτειών, σε μεγάλο βαθμό στο Νότο, ο νόμος για τα δικαιώματα ψήφου του 1965 έδωσε εντολή ότι τα κράτη απαριθμούν τη φυλή των ψηφοφόρων στους καταλόγους των κρατικών ψηφοφόρων. Ωστόσο, σε πολιτείες όπου αυτές οι πληροφορίες δεν είναι διαθέσιμες, οι πωλητές προσπαθούν να χρησιμοποιήσουν πληροφορίες από άλλες πηγές, όπως η αναγνώριση κοινών επωνύμων ή εάν κάποιος ζει σε μια περιοχή που είναι πυκνοκατοικημένη από μια συγκεκριμένη φυλή.

Εκτός από τις καταστάσεις ψηφοφόρων και εμπορικών δεδομένων, ορισμένοι προμηθευτές αρχείων ψηφοφόρων χρησιμοποιούν δεδομένα έρευνας για να βελτιώσουν και να δημιουργήσουν τα μοντέλα τους. Ειδικοί προμηθευτές, ιδίως, τροφοδοτούν δεδομένα έρευνας από συνεργαζόμενους οργανισμούς στα μοντέλα για να βελτιώσουν την ακρίβειά τους.

Η φυλή και η εθνικότητα μετρώνται γενικά καλά στα αρχεία

Δεδομένης της κεντρικής σημασίας της φυλής και της εθνικότητας στην αμερικανική πολιτική, οι πωλητές αρχείων ψηφοφόρων προσπαθούν να προσδιορίσουν τη φυλή των ατόμων στο αρχείο. Οι προμηθευτές μπορούν να χρησιμοποιούν τη φυλή όπως καταγράφεται στα αρχεία ψηφοφόρων του κράτους σε μέρη όπου τα κράτη υποχρεούνται να το συλλέξουν. Σε άλλες τοποθεσίες, ο αγώνας μπορεί να μοντελοποιηθεί χρησιμοποιώντας πληροφορίες όπως το επώνυμο ή τη γεωγραφική συγκέντρωση.

Η μοντελοποιημένη φυλή και εθνικότητα των πάνελ συγκρίθηκε με τον τρόπο που το περιέγραψαν οι ειδικοί όταν προσλήφθηκαν στο πάνελ (ή σε επόμενες έρευνες προφίλ). Συνολικά, οι περισσότεροι προμηθευτές είναι σε θέση να προσδιορίσουν με ακρίβεια τη φυλή των λευκών ερωτηθέντων, με τα ποσοστά σωστής αναγνώρισης να κυμαίνονται μεταξύ 81% για το αρχείο 3 έως 97% για το αρχείο 2. Ωστόσο, όταν πρόκειται για τον ακριβή προσδιορισμό της φυλής των αυτοαναφερόμενων μαύρων και Ισπανόφωνοι πάνελ, ορισμένοι προμηθευτές είναι πιο ακριβείς από άλλους.


Μεταξύ των επιτροπών που αναφέρουν ότι είναι μαύροι σε ένα μέτρο έρευνας, περίπου τα τρία τέταρτα στα αρχεία 2 και 5 (74% στο αρχείο 5 και 76% στο αρχείο 2) ταξινομούνται σωστά ως μαύρο από τα αντίστοιχα μοντέλα. Ωστόσο, το μοντέλο στο αρχείο 1 προσδιορίζει με ακρίβεια λιγότερους μαύρους πίνακες (56%).



Κατά την ταξινόμηση των αυτοαναφερόμενων ισπανικών επιτροπών, υπάρχει μικρότερη διαφορά μεταξύ των αρχείων, που κυμαίνεται από χαμηλό 64% των Ισπανών που ταξινομούνται σωστά στο Αρχείο 3 έως 75% στα Αρχεία 1 και 5.


Συνολικά, το ποσοστό της σωστής ταξινόμησης ανά αγώνα κυμαίνεται από 74% για το αρχείο 3 έως 85% για το αρχείο 2.

Άλλες δημογραφικές μεταβλητές ποικίλλουν πολύ στην ακρίβεια

Εκτός από τις πληροφορίες που παρέχονται από τις πολιτειακές λίστες ψηφοφόρων, πολλοί προμηθευτές αρχείων ψηφοφόρων περιλαμβάνουν πληροφορίες από άλλες δημόσιες και εμπορικές πηγές δεδομένων. Αυτά τα δεδομένα θα μπορούσαν να προέρχονται από μια ποικιλία πηγών, όπως από συνδρομές περιοδικών ή πιστωτικά γραφεία, με στόχο την παροχή πρόσθετων πληροφοριών για τους Αμερικανούς πέρα ​​από ό, τι διατίθεται απευθείας από τις λίστες των κρατικών ψηφοφόρων.


Η παρουσία εμπορικών δεδομένων σε αρχεία ψηφοφόρων είναι ευρέως διαδεδομένη. Ωστόσο, οι συγκεκριμένες διαθέσιμες μεταβλητές διαφέρουν ανά προμηθευτή. Πολλοί προμηθευτές διαθέτουν οικονομικά δεδομένα από εταιρείες πιστωτικών γραφείων ή εταιρείες πιστωτικών καρτών, όπως πράγματα όπως η τιμή κατοικίας και το ποσό της υποθήκης. Επιπλέον, ορισμένοι πωλητές παρέχουν πληροφορίες όπως επάγγελμα, εισόδημα και τον αριθμό ενηλίκων ή παιδιών σε ένα νοικοκυριό. Η παρουσία αδειών κυνηγιού ή αλιείας είναι μία από τις πιο πανταχού παρούσες εμπορικές μεταβλητές.

Αυτά τα εμπορικά δεδομένα παρουσιάζονται επίσης με διάφορους τρόπους. Ορισμένες από αυτές τις μεταβλητές στέκονται μόνες τους ως σημαίες, όπως η παρουσία άδειας κυνηγιού, ενώ άλλες περιλαμβάνονται σε μοντέλα για την πρόβλεψη συγκεκριμένων αποτελεσμάτων ή δημογραφικών στοιχείων. Για παράδειγμα, αρκετοί προμηθευτές παρέχουν μοντέλα για προσωπικά ενδιαφέροντα, όπως είναι ιδιοκτήτης όπλου ή λάτρης της κωπηλασίας - πληροφορίες που διαμορφώνονται βάσει πηγών, όπως συνδρομές περιοδικών.

Μια ανάλυση τριών από τις πιο συχνά διαθέσιμες εμπορικές μεταβλητές - εκπαίδευση, εισόδημα και θρησκευτική σχέση - δείχνει ότι ορισμένα μοντέλα είναι πιο ακριβή από άλλα. Συνολικά, οι περισσότεροι προμηθευτές είχαν υψηλότερο ποσοστό ακρίβειας στην πρόβλεψη της εκπαίδευσης από το εισόδημα. Όσον αφορά τη θρησκευτική σχέση, οι πωλητές προβλέπουν ως επί το πλείστον σωστά μεγάλες θρησκείες στις ΗΠΑ, όπως ο Προτεσταντισμός, αλλά έχουν λιγότερη επιτυχία με θρησκείες χαμηλότερης συχνότητας όπως ο Βουδισμός.

Ένα κοινό ζήτημα σε πολλά από τα μοντέλα είναι η υπεροχή των δεδομένων που λείπουν, με μεγάλες μερίδες αγώνων να αναφέρονται ως μη ταξινομημένες σε ορισμένες μεταβλητές. Για παράδειγμα, κατά την αξιολόγηση μοντέλων που παράγονται για την πρόβλεψη του εκπαιδευτικού επιπέδου, περισσότερα από τα μισά (57%) των αγώνων στο Αρχείο 4 και το ένα τέταρτο (25%) των αγώνων στο Αρχείο 5 αναφέρονται ως μη ταξινομημένα.


Ωστόσο, όταν αποκλείονται οι εκτιμήσεις για την εκπαίδευση, πολλά από τα μοντέλα έχουν ένα αρκετά υψηλό ποσοστό σωστής ταξινόμησης των επιτροπών με την αυτοαναφερόμενη εκπαιδευτική τους κατάσταση. Πλήρως έξι στους δέκα ή περισσότερους αποφοίτους κολεγίου ταξινομούνται σωστά ως έχουν αποφοιτήσει στο κολέγιο στα αρχεία 1, 4 και 5.12

Το εισόδημα των νοικοκυριών μπορεί να είναι το πιο δύσκολο να εκτιμηθούν οι δημογραφικές μεταβλητές. Η ακρίβεια των μετρήσεων του εισοδήματος από την έρευνα μπορεί να επηρεαστεί από πολλούς παράγοντες, συμπεριλαμβανομένης της έλλειψης γνώσης ενός ερωτηθέντος (οι ερωτηθέντες συνήθως καλούνται να ανακαλέσουν το συνολικό εισόδημα των νοικοκυριών από ένα προηγούμενο έτος). Επιπλέον, το εισόδημα είναι ένα ευαίσθητο θέμα και οι ερωτηθέντες στην έρευνα είναι πιο πιθανό να αρνηθούν να παρέχουν το εισόδημά τους παρά με άλλες δημογραφικές μεταβλητές. Ίσως δεν προκαλεί έκπληξη το γεγονός ότι τα μοντέλα εισοδήματος στα αρχεία - ακόμη και όπου παρέχονται - δεν ταιριάζουν πολύ με τις εκθέσεις έρευνας για τα έσοδα. Συνολικά, τα τέσσερα αρχεία που παρείχαν ένα εκτιμώμενο εισόδημα διορθώθηκαν τοποθετούσαν μόνο 30% έως 46% ερωτηθέντες σε μία από τις τέσσερις κατηγορίες.

Τα αρχεία αντιμετώπισαν προβλήματα κατά την ταξινόμηση τόσο των υψηλού όσο και του χαμηλού εισοδήματος ερωτηθέντων. Τέσσερα σε δέκα ή περισσότερα που αυτο-αναφέρουν ότι έχουν εισόδημα 100.000 $ ή περισσότερα ταξινομούνται σωστά από το Αρχείο 4 (41% σωστά ταξινομημένο) και το Αρχείο 5 (45%). Και περίπου το ένα τρίτο των αυτοαναφερόμενων ενηλίκων με χαμηλότερο εισόδημα (κάτω από 30.000 $ ετησίως) ταξινομούνται σωστά από καθένα από τα τέσσερα αρχεία που ανέφεραν εισόδημα.

Τα μοντέλα που χρησιμοποιούνται για την πρόβλεψη της θρησκευτικής σχέσης ποικίλλουν σημαντικά στα ποσοστά των σωστά ταξινομημένων επιτροπών. Για να είμαστε σίγουροι, όλα τα μοντέλα μπορούν να προβλέψουν με ακρίβεια τους Προτεστάντες, τη μεγαλύτερη θρησκευτική ομάδα στις Ηνωμένες Πολιτείες. Στα αρχεία 1, 4 και 5, περίπου τα τρία τέταρτα (72%, 77% και 75% αντίστοιχα) των αυτοπροσδιορισμένων Προτεσταντών ταξινομούνται σωστά. Το αρχείο 2 ταξινομεί σωστά περίπου έξι στα δέκα (62%) των προτεσταντών. (Ως βασική γραμμή, λίγο λιγότεροι από τους μισούς Αμερικανούς αναγνωρίζονται σήμερα ως Προτεστάντες.)

Εντός των μικρότερων θρησκευτικών ομάδων στις Η.Π.Α., ορισμένες είναι πιθανότερο να είναι σωστά μοντελοποιημένες από άλλες. Για παράδειγμα, τα περισσότερα από τα αρχεία κάνουν καλύτερη δουλειά για την σωστή ταξινόμηση των Ινδουιστών από την κατάταξη των Βουδιστών, παρόλο που και οι δύο ομάδες είναι σχεδόν εξίσου σπάνιες στις ΗΠΑ.

Τα αρχεία δεν επιχειρούν να κατηγοριοποιήσουν άτομα που δεν έχουν σχέση με τη θρησκεία, αλλά η υπολειπόμενη κατηγορία τους «μη ταξινομημένη» παρέχει στοιχεία ότι ορισμένα άτομα δεν αναγνωρίζονται θρησκευτικά. Συνολικά, η μη ταξινομημένη ομάδα κυμαίνεται από 5% έως 21% στα αρχεία. Αλλά αυτά τα μη ταξινομημένα άτομα δεν είναι απαραίτητα τα θρησκευτικά άσχετα - μόνο το 28% αυτών που δεν ταξινομούνται στο Αρχείο 1 είναι άτομα που αναγνωρίζουν στον πίνακα ως άθεο, αγνωστικό ή «τίποτα ειδικότερα» και αυτό αυξάνεται στο 36% μεταξύ αυτών των αρχείων 2 Δεδομένου ότι σχεδόν το ένα τέταρτο των ενηλίκων δεν σχετίζεται θρησκευτικά, η υπολειπόμενη κατηγορία «μη κατηγοριοποιημένων» δεν κάνει ιδιαίτερα καλή δουλειά για την εύρεση τους.

Το συνολικό ποσοστό που έχουν ταξινομηθεί σωστά, συμπεριλαμβανομένων εκείνων που λείπουν ή δεν ταξινομούνται για μια δεδομένη μεταβλητή, παρέχει σύγκριση μεταξύ διαφόρων δημογραφικών μοντέλων. Πολλά από τα αρχεία μπόρεσαν να ταξινομήσουν σωστά ένα μεγάλο μερίδιο των πάνελ στην αυτοαναφερόμενη θρησκεία τους. Ωστόσο, αρκετά αρχεία ξεχώρισαν, ιδιαίτερα το αρχείο με το χαμηλότερο ποσοστό αντιστοίχισης (Αρχείο 5), επειδή ήταν σε θέση να ταξινομήσει σωστά τα μεγάλα μερίδια της εκπαίδευσης και των εσόδων των ερωτηθέντων.