Επωνύμως…

Στης Τεχνητής Νοημοσύνης τον καιρό…

Στης Τεχνητής Νοημοσύνης τον καιρό…

Πάει κι αυτό! Πέρασε και το Πάσχα -βοήθειά μας, άργησε λιγάκι φέτος, τελειώνει ο Απρίλης την άλλη εβδομάδα- και πάμε πλέον ολοταχώς προς τον Μάη και το καλοκαίρι, αγκαλιά με την απομόνωσή μας και τα μέτρα προστασίας εαυτών και αλλήλων, από τον κορωνοϊό και τους κινδύνους του. Κι όπως έχουμε γράψει και ξαναγράψει σε τούτην εδώ τη φιλόξενη στήλη, το μέλλον μας δεν θα είναι μεν άδηλο, αλλά σίγουρα πολύ διαφορετικό

Σ’ αυτό το μέλλον, όπως όλα δείχνουν, «ο φόβος θα φυλάει τα έρμα» - μ’ άλλα λόγια, ακόμα κι αν πάψουν να ισχύουν μεμιάς όλα τα απαγορευτικά (κάτι που δεν πρόκειται να συμβεί, βεβαίως), η σημερινή «εσωστρεφής» συμπεριφορά μας δεν πρόκειται να αλλάξει σε μεγάλο βαθμό, πολύ περισσότερο όταν όλοι φοβούνται για νέο γύρο πανδημίας, το φθινόπωρο. Άρα, συνεχίζουμε -λίγο ως πολύ- να πορευόμαστε όπως σήμερα, παίρνοντας τα «συνήθη» μέτρα προφύλαξης και επιμένοντας στον τρόπο που μάθαμε να δουλεύουμε, τις τελευταίες εβδομάδες – με «ανέπαφες επαφές» - από μακριά και υγιείς! Γίνεται αυτό; Σε κάποιο βαθμό, ναι… Μάλιστα, τώρα που το είδαμε στην πράξη, έχω την αίσθηση ότι μπορούμε να προχωρήσουμε και σε βελτιώσεις, αν οργανωθούμε και δώσουμε λύσεις στα (υπαρκτά, βεβαίως) προβλήματα που διαπιστώσαμε τον τελευταίο καιρό. Πάντα με τη βοήθεια της τεχνολογίας, φυσικά, και ιδιαίτερα της πιο προηγμένης. Στην Τεχνητή Νοημοσύνη προσφεύγουν, άλλωστε, και τα μεγάλα ονόματα (ίσως, εκείνα συχνότερα, καθότι έχουν τα «μέσα» και τις δυνατότητες) για να βελτιώσουν καταστάσεις και να λύσουν προβλήματα.

Η Google, για παράδειγμα, επιστράτευσε Τεχνητή Νοημοσύνη και Μηχανική Μάθηση προκειμένου να λύσει ευφυώς το θέμα της συχνά μέτριας απόδοσης ήχου (λόγω υστέρησης δικτύων και γενικότερα τεχνικών προβλημάτων) στις πανταχού παρούσες πλέον τηλε-συνεδριάσεις και βιντεοκλήσεις. Διότι -θα έχει συμβεί και σ’ εσάς, όπως κι εμένα κάμποσες φορές- είναι ιδιαίτερα ενοχλητικό την ώρα που μιλάς με τον συνομιλητή σου να χάνεις με μεγαλύτερη ή μικρότερη συχνότητα τμήματα από τις λέξεις και τις προτάσεις του. Αν η συνεννόηση δυσκολεύει πολύ, μπορείς να διακόψεις και να ξαναδοκιμάσεις, αλλά κάποιες φορές αυτό δεν είναι εύκολο ή δυνατό. Έρχεται, λοιπόν, η Google με τη λύση της που λέγεται WaveNetEQ και ήδη δοκιμάζεται στο Duo, την εφαρμογή για βιντεοκλήσεις της εταιρίας, να αποκαταστήσει τη ροή της ομιλίας.

Ο λόγος που υπάρχουν αυτά τα κενά, είναι (όπως εξηγεί σε σχετικό πρόσφατο άρθρο του το Technology Review, το «επίσημο όργανο» του ΜΙΤ) ότι χάνονται για διάφορους λόγους κατά τη μετάδοση μικρότατα «πακέτα» δεδομένων σε μονοψήφιο μεν ποσοστό επί του συνόλου, αλλά ικανό κάποιες φορές να προκαλέσει προβλήματα στην πιστή μεταφορά του λόγου. Στην Google σκέφτηκαν να αναπληρώσουν ό,τι χάνεται με αντίστοιχες παρεμβολές τεχνητών ρεαλιστικών ήχων, οι οποίοι θα αποκαταστήσουν τη συνέχεια του λόγου. Το WaveNetEQ το οποίο δημιούργησε η DeepMind, ο τομέας της εταιρίας που ασχολείται με εφαρμογές Τεχνητής Νοημοσύνης, είναι ένα νευρωνικό δίκτυο μετατροπής κειμένου σε φωνή, που έχει περάσει από ειδική εκπαίδευση: το έχουν τροφοδοτήσει με μια μεγάλη βάση δεδομένων από 100 φωνές, που μιλάνε σε 48 διαφορετικές γλώσσες, ζητώντας του να συμπληρώνει αυτομάτως τα μικρά κενά, ώστε να βγαίνει νόημα.

Το εκπαιδευμένο πλέον δίκτυο, βρίσκεται σε ετοιμότητα στη διάρκεια της βιντεοκλήσης, ακούγοντας τους ομιλητές και (προφανώς, δεν γίνεται διαφορετικά…) καταγράφοντας τα ιδιαίτερα χαρακτηριστικά της φωνής τους και τον τρόπο ομιλίας τους. Στο πρώτο «ολίσθημα» του δικτύου, που εκδηλώνεται με την απώλεια ενός ή περισσότερων «πακέτων» δεδομένων, το νευρωνικό δίκτυο αναλαμβάνει δράση, προσθέτοντας ό,τι -κατά την κρίση του- και σε σχέση με τα συμφραζόμενα, λείπει.

Δουλεύει το σύστημα; Έτσι δείχνει… Αν πιστέψουμε τα ακουστικά παραδείγματα (τα συνήθη ‘πριν και μετά’) που δημοσιοποίησε η Google, υπάρχει αισθητή βελτίωση στο τελικό αποτέλεσμα. Το WaveNetEQ προσθέτει κάποιες συλλαβές που λείπουν εδώ κι εκεί, αναλύοντας τα συμφραζόμενα και «μιμούμενο» τον ομιλητή, αλλά αν τα κενά είναι περισσότερα, «γονατίζει». Προσθέτει λίγες συλλαβές, αλλά όχι ακόμα λέξεις και φράσεις – βρίσκεται, πάντως, σε καλό δρόμο! Τώρα, αν αυτός ο ‘καλός δρόμος’ μπορεί να αξιοποιηθεί από επιτήδειους και για κάποιας μορφής «παραχάραξη» φωνής, είναι ένα θέμα που σηκώνει μεγάλη συζήτηση και ξεχωριστό σχόλιο… Στης Τεχνητής Νοημοσύνης τον καιρό, πρέπει να μάθουμε να ζούμε τόσο με τα καλά, όσο και με τα (ευτυχώς, λιγότερα) κακά που τη συνοδεύουν…

[social_share googleplus="no" linkedin="yes" whatsapp="no" viber="no"]

Image
Image

Follow Us

Image
Εγγραφή στο Newsletter

Θα λαμβάνετε κάθε εβδομάδα τα πιο hot άρθρα στο email σας!

Image

Πρόσφατα άρθρα Επωνύμως…

Image
Image

See also from Verticom

Image
Image
Image
Image
Image
Image

Categories Menu

Site Menu

Image

Κόμβος πληροφόρησης για θέματα και εφαρμογές που αφορούν στις ψηφιακές τεχνολογίες και το Ηλεκτρονικό Επιχειρείν.

Stay in Touch

Εγγραφείτε στο εβδομαδιαίο Newsletter για να λαμβάνετε τα πιο hot άρθρα στο email σας!

Διεύθυνση εταιρείας

Ευμολπιδών 23
118 54, Αθήνα

Γενικές πληροφορίες

info@verticom.gr
(+30) 210 924 55 77

Αρθρογραφία

Διαφήμιση

© 2024 WebWorldNews. All Rights Reserved.Design & Development by Verticom

Search