Η Microsoft με ανακοίνωσή της γνωστοποιεί πως οι ερευνητές της κατάφεραν να φτάσουν για πρώτη φορά τα επίπεδα ανθρώπινης κατανόησης στο λογισμικό αναγνώρισης ομιλίας της Microsoft. Έτσι ο υπολογιστής μπόρεσε να καταλάβει το περιεχόμενο της ομιλίας με απώλειες μόλις 5.9%, ποσοστό που οι ίδιοι οι άνθρωποι χάνουν σε μια μεταξύ τους συζήτηση.

“Φτάσαμε το ανθρώπινο επίπεδο. Πρόκειται για ένα ιστορικό επίτευγμα”, δήλωσε ο επικεφαλής επιστήμονας της Microsoft στον τομέα της ομιλίας, Xuedong Huang. Το προηγούμενο ρεκόρ ήταν 6.3% και είχε επιτευχθεί τον προηγούμενο μήνα. Για να πετύχει το στόχο η Microsoft χρησιμοποίησε το δικό της deep learning Computational Network Toolkit για να αναπτύξει τον αλγόριθμο. Επόμενος στόχος της ομάδας είναι να μπορέσει να εφαρμόσει την αναγνώριση ομιλίας σε συνθήκες καθημερινότητας, όπως ανάμεσα σε πλήθος ή οδηγώντας στην κίνηση, ενώ στόχο αποτελεί και η χρήση της από πολλαπλούς χρήστες ταυτόχρονα.
Η τεχνολογία φυσικά θα χρησιμοποιηθεί και στην Cortana, αλλά η δυσκολία εκεί έγκειται στη διδασκαλία της τεχνητής νοημοσύνης να καταλαβαίνει το νόημα των φράσεων και να δρά αναλόγως, όχι απλά να τις ακούει με ακρίβεια.
Must Read
UH Radar | Προς κλείσιμο πολλά στούντιο του Xbox – Μήπως απέτυχε το Xbox Game Pass;
Το Microsoft Flight Simulator 2024 αποκτά ένα εντυπωσιακό νέο χειριστήριο
Το Xbox μπορεί να γίνει ξεχωριστή εταιρεία μέσα στη Microsoft