Η A.I. της Google ξεχωρίζει τις φωνές μέσα σε ένα πλήθος (video)

Το σύνολο των εφαρμογών είναι αναρίθμητο
14 Απριλίου 2018 04:30
Η A.I. της Google ξεχωρίζει τις φωνές μέσα σε ένα πλήθος (video)

Η καθαρή καταγραφή οποιουδήποτε ήχου σε μέρη όπου υπάρχει συνωστισμός ανθρώπων (ο οποίος προκαλεί “ηχορύπανση”) είναι εξαιρετικά δύσκολη, πόσο μάλλον στις περιπτώσεις όπου προσπαθούμε να παρακολουθήσουμε τη φωνή ενός μεμονωμένου ομιλητή ανάμεσα σε ένα πλήθος. Πόσες φορές πιάσατε τον εαυτό σας για παράδειγμα να παρακολουθεί κάποιο ερασιτεχνικό vlog μόνο για να βρεθείτε να δυναμώνετε την ένταση σε σημεία όπου περισσότερα του ενός άτομα μιλούσαν συγχρόνως. Τη λύση στο άνωθεν πρόβλημα έρχεται να δώσει η Google με τη νέα της A.I.

Πρόκειται για μια τεχνητή νοημοσύνη με τη δυνατότητα να διαχωρίζει τις φωνές μέσα σε ένα πλήθος. Η ερευνητική ομάδα της εταιρίας εκπαίδευσε πρωταρχικά ένα νευρωνικό δίκτυο έτσι ώστε να αναγνωρίζει μέσω της ανίχνευσης προσώπου τη μεμονωμένη φωνή διάφορων ανθρώπων ξεχωριστά, ενώ σε ύστερο χρόνο τοποθέτησε αυτό σε εικονικά “πάρτι” όπου έπρεπε να διαχωρίσει και να απομονώσει το κάθε μέλους του συνόλου. Όπως θα δείτε στο ακόλουθο βίντεο τα αποτελέσματα είναι εκθαμβωτικά, ακόμη και σε περιπτώσεις όπου ο ένας ομιλητής διαγωνίζεται τον άλλο, ή κρύβει το πρόσωπο του με χειρονομίες ή αντικείμενα (βλ. Μικρόφωνο).

Οι τομείς εφαρμογής της εν λόγω τεχνολογίας είναι αναρίθμητοι. Από τη βελτίωση της κατανόησης των έξυπνων συσκευών (βλ. Google Home), σε υπηρεσίες ομιλίας με χρήση βιντεοκάμερας (βλ. Google Duo), μέχρι την ενσωματωμένη ενίσχυση της ομιλίας κατά την καταγραφή βίντεο, τη δημιουργία ακουστικών βοηθημάτων ως εξοπλισμός καμερών, καθώς και τον πιο αποτελεσματικό υποτιτλισμό για ανθρώπους με προβλήματα ακοής.