Δε θα πιστεύουμε τα μάτια μας - Υπερ-ρεαλιστικά videos από την Sora AI

Της OpenAI
16 Φεβρουαρίου 2024 10:44
Δε θα πιστεύουμε τα μάτια μας - Υπερ-ρεαλιστικά videos από την Sora AI

Η OpenAI αποκάλυψε χθες το Sora, ένα νέο μοντέλο τεχνητής νοημοσύνης που παράγει υπερ-ρεαλιστικά, υψηλής ανάλυσης videos διάρκειας έως και ενός λεπτού. Το μόνο που χρειάζεται να κάνει ο χρήστης είναι να γράψει τι θέλει να δείξει το video.

Η ονομασία Sora προέρχεται από τα Ιαπωνικά και σημαίνει ουρανός. Το Sora δε θα γίνει άμεσα διαθέσιμο στο ευρύ κοινό, αλλά έχει διατεθεί σε ένα μικρό αριθμό ακαδημαϊκών και ερευνητών, οι οποίοι θα εκτιμήσουν τους πιθανούς κινδύνους από την κατάχρηση αυτού του εργαλείου.

Το Sora μπορεί να παράγει περίπλοκες σκηνές και πολλαπλούς χαρακτήρες, συγκεκριμένες κατηγορίες κινήσεων και ακριβείς πληροφορίες του αντικειμένου ή του background. Το μοντέλο καταλαβαίνει όχι μόνο αυτό που του ζητάει ο χρήστης από τη γραπτή εντολή, αλλά και πώς αυτά τα πράγματα υπάρχουν στο φυσικό κόσμο. – OpenAI

Μπορείτε να δείτε τις σχεδόν τρομακτικές δυνατότητές του στο παρακάτω video, όπου ένα ζευγάρι περπατά στο χιονισμένο Τόκιο ανάμεσα από κερασιές. Να υπενθυμίσουμε πως όλο το παρακάτω video είναι δημιουργημένο από το Sora με απλές γραπτές εντολές σε φυσική γλώσσα που περιγράφουν τι θέλουμε να δείξει το video.

Η OpenAI λέει πως το Sora είναι το αποτέλεσμα “βαθιάς κατανόησης της γλώσσας”, επιτρέποντας στην AI να κατανοήσει με ακρίβεια τις γραπτές εντολές. Το Sora είναι επίσης το μόνο μοντέλο που παράγει ολόκληρα videos με τη μία, χωρίς να χρειάζεται να συνθέσει το κάθε frame, κάτι που κάνει τα αντικείμενα του video να παραμένουν ίδια ακόμα κι όταν βγουν προσωρινά από το οπτικό πεδίο. Είναι επίσης το μόνο μοντέλο που μπορεί να παράγει videos 60 δευτερολέπτων.

Αναμενόμενα, προκύπτει η ανησυχία για υπερ-ρεαλιστικά videos τα οποία είναι ψευδή. Πώς μπορούν να επηρεάσουν τις εκλογές ενός κράτους για παράδειγμα ή έναν πόλεμο; Καλλιτέχνες, ηθοποιοί και δημιουργοί περιεχομένου, ανησυχούν επίσης πως αυτή η τεχνολογία μπορεί να σημάνει το τέλος της εργασίας τους.

Η OpenAI δήλωσε πως εργάζεται με ειδικούς σε τομείς της παραπληροφόρησης και της ρητορικής μίσους, για να δοκιμάσει το εργαλείο πριν το κάνει διαθέσιμο στο κοινό. Αναπτύσσει επίσης εργαλεία τα οποία θα μπορούν να εντοπίζουν τα videos που παράγονται από το Sora, συμπεριλαμβάνοντας metadata για ευκολότερο εντοπισμό.

Η OpenAI αρνήθηκε να αποκαλύψει στους Times πώς εκπαίδευσε το Sora και περιορίστηκε στο να δηλώσει πως χρησιμοποίησε δημόσια διαθέσιμα videos και videos για τα οποία αγόρασε τα πνευματικά δικαιώματα.