Η τεχνολογία του Portrait Mode της Google γίνεται Open Source

Ανοίγει ο δρόμος σε τρίτους κατασκευαστές
16 Μαρτίου 2018 05:15
Η τεχνολογία του Portrait Mode της Google γίνεται Open Source

Αδιαφισβήτητα, η κάμερα του πιο πρόσφατου κινητού τηλεφώνου της Google ‘ρίχνει σαγόνια’. Μπορεί να μην προσφέρει στους χρήστες χειροκίνητες ρυθμίσεις για τις τιμές των ISO, exposure και shutter speed, ενώ παράλληλα δε φέρει κάποιο σύστημα διπλών αισθητήρων - όπως το σύνολο πλέον του ανταγωνισμού - καταφέρνει παραταύτα να απαθανατίσει μια στιγμή με αξιοζήλευτο τρόπο. Οι αλγόριθμοι της εταιρίας είναι εκείνοι που ευθύνονται για τα θεαματικά αυτά αποτελέσματα, με εκείνον του HDR+ να κάνει θαύματα ακόμη και σε συνθήκες χαμηλού φωτισμού.

Μεταξύ όλων της των “πατεντών” όμως, μία φαίνεται να ξεχωρίζει του συνόλου και μάλιστα με διαφορά. Λόγος για τη δυνατότητα λήψης Portrait Mode (του λεγόμενου bokeh), δίχως την ανάγκη ενσωμάτωσης μιας δεύτερης κάμερας. Ως επί το πλείστον, οι προτάσεις της αγοράς χρησιμοποιούν δύο κάμερες έτσι ώστε να επιτύχουν τη σωστή χαρτογράφηση του βάθους, η οποία τους επιτρέπει με τη σειρά της τη σύνθεση μιας εικόνας όπου υπόβαθρο και κυρίως θέμα είναι πλήρως διαχωρισμένα το ένα από το άλλο. Η τεχνολογία της Google όμως κάνει χρήση ενός ιδιόκτητα ανεπτυγμένου μοντέλου S.I.G (abbr. Semantic Image Sagmentation) ή αλλιώς ‘Σημασιολογικής Κατάτμησης της Εικόνας’. Πρόκειται για τη ξεχωριστή χαρτογράφηση του κάθε pixel, με σκοπό την αναγνώριση, το διαχωρισμό, καθώς και την ‘ταμπελοποίηση’ όλων εκείνων που συνθέτουν το κυρίως θέμα (πχ. Ουρανός, Σκυλί, Δρόμος, Πινακίδα, Άνθρωπος, κ.α.).

Σε μια απρόσμενη λοιπόν κίνηση, η εταιρία αποφάσισε να διαθέσει σε open-source μορφή την εν λόγω τεχνολογία. Αξίζει να σημειωθεί βέβαια πως δεν πρόκειται για τον proprietary κώδικα που έχει αναπτύξει η ίδια και βρίσκεται εντός του Pixel 2, αλλά για ένα barebones μοντέλο που έχει τη δυνατότητα να προσφέρει εφάμιλλα αποτελέσματα.

Ελπίζουμε ότι η κοινή χρήση του συστήματός μας με την κοινότητα θα διευκολύνει άλλες ομάδες στον ακαδημαϊκό χώρο και τη βιομηχανία, να αναπαράγουν και να βελτιώσουν περαιτέρω τα συστήματα τελευταίας τεχνολογίας, να εκπαιδεύσουν τα μοντέλα σε νέα σύνολα δεδομένων και να οραματιστούν νέες εφαρμογές για αυτήν την τεχνολογία. - Google’s Blog Post

Αυτό σημαίνει πως third-party κατασκευαστές συσκευών αλλά και εφαρμογών θα έχουν ανέξοδα πλέον στα χέρια τους μια τεχνολογία που υπό άλλες συνθήκες θα τους κόστιζε αρκετά χρήματα σε R&D, ενώ η χρήση αυτής θα μπορούσε να λειτουργήσει ευεργετικά και σε άλλους τομείς της τεχνολογίας.