Να ‘μαστε πάλι εδώ, στο πόστο μας, λοιπόν, με γεμάτες τις «μπαταρίες» (όσο γεμάτες μπορεί να είναι, έπειτα από τόσες και τόσες επαναφορτίσεις, βεβαίως, αλλά πάλι καλά να λες…) και με μια μάλλον προφανή διαπίστωση: ο κόσμος δεν σταμάτησε να γυρίζει, επειδή ο οικοδεσπότης σας αποφάσισε να κλείσει για ένα μήνα (δύσκολο πράγμα, το άτιμο…) τους διακόπτες και να αφήσει τα εισερχόμενα αδιάβαστα.
Ειδικά τις τελευταίες ημέρες πριν από την επικείμενη επιστροφή, αυτό δεν έγινε όσο θα έπρεπε – ας το χρεώσουμε στην χρόνια επαγγελματική διαστροφή κι αυτό…
Στην ελαφρώς πενιχρή «εσοδεία» των τεχνολογικών ειδήσεων, λοιπόν, ένα θέμα ξεχωρίζει κάνοντας τον τελευταίο μήνα συχνά-πυκνά την εμφάνισή του –σημάδι πως θα ακούσουμε και θα διαβάσουμε περισσότερα γύρω από αυτό, στο μέλλον- και δεν είναι άλλο από την αδήριτη ανάγκη να εκπαιδεύσουμε τις εφαρμογές Τεχνητής Νοημοσύνης, που μπαίνουν ολοένα περισσότερο στην καθημερινότητά μας.
Και δεν το γράφω τυχαία σε πρώτο πληθυντικό, καθώς η Μηχανική Μάθηση όντως χρειάζεται τη βοήθειά μας για την εκπαίδευση και σωστή λειτουργία των αλγορίθμων που «τρέχουν» στις νέες και καινοτόμες εφαρμογές. Τώρα το αντιληφθήκαμε αυτό; Όχι, το γνωρίζαμε και ως ένα βαθμό γινόταν «υπογείως», μόνο που τώρα πια οι απαιτήσεις αυξάνουν εκθετικά κι έχουν αρχίσει να βγαίνουν προς τα έξω τα πρώτα προβλήματα.
Όπως, για παράδειγμα, εκείνο που προέκυψε στις αρχές του μήνα, μετά την απόφαση του Zoom (τον Μάρτιο, αλλά χωρίς πολλή δημοσιότητα) να αλλάξει τους όρους παροχής των υπηρεσιών του στους απανταχού της Γης χρήστες -όλους εμάς, δηλαδή- ώστε να μπορεί να αξιοποιεί τις εικόνες, τους ήχους και γενικά, το δικό μας περιεχόμενο, προκειμένου να εκπαιδεύει τους αλγορίθμους του.
Φυσικά, έγινε ένας μικρός χαμός μόλις οι χρήστες συνειδητοποίησαν (έστω και πέντε μήνες αργότερα) τι πρόκειται να συμβεί, και η ηγεσία της εταιρίας «τα μάζεψε», δηλώνοντας ότι πρόκειται για παρεξήγηση κι ότι δεν πρόκειται να χρησιμοποιήσει περιεχόμενο, χωρίς την συγκατάθεση του χρήστη – που δεν ζητήθηκε ποτέ φανερά, βεβαίως, αλλά χρησιμοποιήθηκε η γνωστή μέθοδος της σιωπηρής αποδοχής…
Τόνισαν δε, στην επίσημη ανακοίνωσή τους, ότι «θα αξιοποιήσουμε το περιεχόμενο του χρήστη προκειμένου να του προσφέρουμε υπηρεσίες προστιθέμενης αξίας, βασισμένες σ’ αυτό, αλλά ο χρήστης εξακολουθεί να έχει την πλήρη ιδιοκτησία και τον έλεγχο».
Δηλαδή, σε μια τηλε-συνάντηση στην οποία συμμετέχουν πχ. τρία, πέντε, δώδεκα άτομα, θα ζητηθεί από την εταιρία η συγκατάθεση ενός εξ αυτών ή όλων, για την αξιοποίηση ολόκληρου ή μέρους του περιεχομένου (εικόνα, ήχοι, κλπ.); Και ποια θα είναι αυτή η χρήση, ώστε να προσφέρει προστιθέμενη αξία σε ενδεχομένως τόσο διαφορετικούς μεταξύ τους ανθρώπους; Ο ευρών αμοιφθήσεται!
Πέρα από τα «παιχνίδια» της αγοράς (γιατί, είναι σχεδόν βέβαιο πως ανάλογες κινήσεις γίνονται από πολλές εταιρίες, απλώς η περίπτωση του Zoom βγήκε στη δημοσιότητα), το πρόβλημα της εκπαίδευσης των αλγορίθμων είναι όχι μόνο υπαρκτό, αλλά και μεγάλο, αν θέλουμε να προχωρήσουμε σε θέματα αναγνώρισης εικόνων, επεξεργασίας φυσικής γλώσσας και, γενικά, παροχής δεδομένων για τη λήψη κρίσιμων αποφάσεων – μ’ άλλα λόγια, τομέων που μπορούν να επηρεάσουν σε σημαντικό (ενίοτε και κρίσιμο) βαθμό την καθημερινότητά μας. Η χρήση πολωμένων (biased) δεδομένων σταδιακά εγκαταλείπεται, ενώ τα συνθετικά (synthetic) δεδομένα δεν αποτελούν απάντηση για αρκετές περιπτώσεις.
Τα πραγματικά δεδομένα παραμένουν η καλύτερη λύση στον ρόλο του «εκπαιδευτικού υλικού», όμως, το πρόβλημα της προστασίας της ιδιωτικότητας δεν έχει βρει ακόμα μια γενικά αποδεκτή λύση. Η «ανωνυμοποίηση», που πολλές εταιρίες προβάλλουν ως επιχείρημα για να «εξορκίσουν» τις πάντα ισχυρές αντιδράσεις των οργανωμένων σε συλλογικότητες και κοινότητες χρηστών, μάλλον δεν έχει πείσει το ευρύ κοινό, που εξακολουθεί να φοβάται για την τύχη των δεδομένων του.
Περισσότερο ελκυστικό και με καλύτερες προοπτικές μοιάζει το Machine Un-learning, η τακτική της επιλεκτικής αφαίρεσης δεδομένων, που προβλέπεται και από τους ευρωπαϊκούς κανονισμούς, στο πλαίσιο του Right to be Forgotten. Όμως, όλα αυτά προϋποθέτουν διαφάνεια, συνθήκη που δεν είναι πάντα εξασφαλισμένη στην εποχή μας.
Έχουμε, λοιπόν, να γράψουμε ακόμα πολλά…