Το Τwitter «απειλεί» τους δημοσκόπους...

Για να διαβάσετε αυτό το κείμενο θα χρειαστείτε περίπου επτά λεπτά. Την ίδια ώρα στο Τwitter θα έχουν αναρτηθεί περίπου 3.456.203 σχόλια με ρυθμό 8.219 σχόλια το δευτερόλεπτο. Ενα από αυτά τα...


σχόλια μπορεί να μιλάει για την αποτυχία των δημοσκοπήσεων να προβλέψουν τα εκλογικά αποτελέσματα (Τραμπ, Brexit, ελληνικές εκλογές 2015 κ.ά.).

Η ακαδημαϊκή χρονιά που διανύουμε θα ολοκληρωθεί με μια σειρά εκλογικών αναμετρήσεων, ενώ δεκάδες δημοσκοπήσεις θα δημοσιευτούν επιχειρώντας να καταγράψουν τις τάσεις. Κι όμως, είναι πιο πιθανό να καταλάβουμε αν ο Αλέξης Τσίπρας ή ο Κυριάκος Μητσοτάκης θα είναι ο επόμενος πρωθυπουργός από το twitter και όχι από τις παραδοσιακές δημοσκοπήσεις. Ας γυρίσουμε δύο χρόνια πίσω.

Στις 8 Νοεμβρίου 2016, σχεδόν όλα τα αμερικανικά δίκτυα μέσω των δημοσκοπήσεων και των πρώτων exit polls προέβλεπαν τη νίκη της Χίλαρι Κλίντον.

Την ίδια ώρα στη μακρινή Βομβάη ο Ινδός προγραμματιστής και επιχειρηματίας Σαντζίβ Ράι, ιδρυτής της Genic AI, εταιρείας αξιοποίησης της Τεχνητής Νοημοσύνης και των «Μεγάλων Δεδομένων» (Big Data), επέμενε βάσει του δικού του συστήματος πρόγνωσης εκλογικών αποτελεσμάτων πως νικητής θα είναι χωρίς αμφιβολία ο Ντόναλντ Τραμπ, ο οποίος εκείνη την ώρα ήταν «δημοφιλέστερος από τον Μπαράκ Ομπάμα το 2008».

Ο Ράι δεν ήταν ο μοναδικός (ήταν από τους λίγους) και φυσικά δεν έκανε κάποια μαγικά. Σε μια εποχή που σχεδόν το σύνολο της κοινωνικής μας ζωής σταδιακά διαμορφώνεται από ψηφιακές τεχνολογίες, με εργαλεία που εισβάλλουν είτε ως σύμμαχοι είτε ως δυνάστες σχεδόν σε κάθε πτυχή της καθημερινότητάς μας, μια νέα επιστήμη αναπτύσσεται.

Στη σχετική βιβλιογραφία αναφέρεται ως υπολογιστική κοινωνική επιστήμη (computational social science) και πρόκειται για έναν τομέα που συνδυάζει την επεξεργασία φυσικής γλώσσας (natural language processing) και τη μηχανική μάθηση (machine learning).

H «Εφ.Συν.» παρουσιάζει σήμερα την έρευνα για το δημοψήφισμα του 2015 τεσσάρων Ελλήνων ακαδημαϊκών, η οποία θα παρουσιαστεί στα τέλη Οκτωβρίου στο Τορίνο σε ένα από τα μεγαλύτερα επιστημονικά συνέδρια Data Science παγκοσμίως (ACM International Conference of Information and Knowledge Management 2018).

Το θέμα της μελέτης τους σχετίζεται με την άμεση πρόβλεψη της τοποθέτησης των χρηστών κοινωνικών μέσων σε μια ξαφνική εκλογική αναμέτρηση, με παράδειγμα αναφοράς το ελληνικό δημοψήφισμα του 2015.

Το αποτέλεσμά τους είναι εντυπωσιακό. Αποδεικνύουν πως μπόρεσαν να προβλέψουν την επικράτηση του ΟΧΙ μέσα από την εκπαίδευση ενός συγκεκριμένου μοντέλου μηχανικής μάθησης για επεξεργασία φυσικής γλώσσας, για την πρόβλεψη της στάσης που θα έπαιρναν οι Ελληνες χρήστες του Twitter στο ελληνικό δημοψήφισμα του 2015.


Τα βασικά ευρήματα είναι τα εξής:

◼ Η τελική πρόβλεψή τους πέτυχε ιδιαίτερα υψηλό ποσοστό ακρίβειας (τουλάχιστον 88%). Μάλιστα, όσο προχωρούσαν οι μέρες, το μοντέλο γινόταν πιο ακριβές, αφού οι χρήστες εξέφραζαν ολοένα και πιο ανοιχτά τη στάση τους. Συγκεκριμένα, την τελευταία ημέρα πριν από το δημοψήφισμα, το μοντέλο ήταν σε θέση να προβλέψει τη στάση των χρηστών με ακρίβεια σχεδόν 94%, ενώ κατά τη διάρκεια των εννιά ημερών της προεκλογικής περιόδου πέτυχε ακρίβεια 88% κατά μέσο όρο ανά ημέρα.

«Αυτό δείχνει πως μπορούμε να κατηγοριοποιήσουμε εκατομμύρια χρήστες με πολύ υψηλή ακρίβεια, μέσα σε ελάχιστα δευτερόλεπτα (και μάλιστα σε ημερήσια βάση), ενώ ένας αναλυτής θα χρειαζόταν μάλλον μερικούς μήνες για να πετύχει αντίστοιχο αποτέλεσμα» μας εξηγούν οι ερευνητές.
◼ Διαπιστώθηκε πως η μεγάλη πλειοψηφία των χρηστών του Twitter που χρησιμοποιήθηκαν στα πειράματα τάχθηκε υπέρ του ΟΧΙ σε ποσοστό πολύ μεγαλύτερο από το εκλογικό αποτέλεσμα (77%).

◼ Οι υποστηρικτές του ΝΑΙ ανέφεραν πιο συχνά στα tweets τους τα ονόματα κομμάτων και των αρχηγών τού ΟΧΙ – και το αντίστροφο. Διαπιστώθηκε εμπειρικά πως ένας χρήστης του Τwitter που αναφέρεται σε ένα κόμμα είναι πιο πιθανό να αναφέρεται με επιθετικούς χαρακτηρισμούς ή σαρκασμό απέναντι στο κόμμα αυτό παρά να προωθεί τις θέσεις του. Για παράδειγμα, πριν από την ανακοίνωση του δημοψηφίσματος, οι μετέπειτα υποστηρικτές του ΝΑΙ αναφέρονταν πιο συχνά στη Νέα Δημοκρατία, κάτι που άλλαξε μετά τις 27 Ιουνίου.

◼ Πριν από την ανακοίνωση του δημοψηφίσματος παρατηρήθηκε πως δεν υπάρχει κάποιος ξεκάθαρος διαχωρισμός μεταξύ των υποστηρικτών του ΝΑΙ και του ΟΧΙ σε σχέση με τους λογαριασμούς που επιλέγουν να αναπαραγάγουν (retweet). Μετά την ανακοίνωση είναι ξεκάθαρος ο σχηματισμός των λεγόμενων «θαλάμων αντήχησης» (echo chambers), όρος που περιγράφει ανθρώπους που μοιράζονται τις απόψεις τους σε περιβάλλοντα, ιδιαίτερα στα μέσα κοινωνικής δικτύωσης, όπου εκείνοι που ακούν ή διαβάζουν έχουν τις ίδιες απόψεις.

efsyn.gr