Μετά το ChatGPT, νέα εντυπωσιακή AI φτιάχνει βίντεο με ό,τι της λέτε! – Δείτε παραδείγματα

Άλλη μια τρομερά εντυπωσιακή τεχνολογία
21 Μαρτίου 2023 09:00
Μετά το ChatGPT, νέα εντυπωσιακή AI φτιάχνει βίντεο με ό,τι της λέτε! – Δείτε παραδείγματα

Η Runway, μια νεοσύστατη εταιρία τεχνητής νοημοσύνης με έδρα τη Νέα Υόρκη, ανακοίνωσε ένα νέο μοντέλο που μπορεί να παράγει βίντεο από κείμενο χρησιμοποιώντας τεχνητή νοημοσύνη. Το μοντέλο αυτό ονομάζεται ‘Gen-2’ και είναι μια βελτιωμένη έκδοση του προηγούμενου μοντέλου ‘Gen-1’, το οποίο μπορούσε μόνο να μετασχηματίσει υπάρχοντα βίντεο με βάση εισόδους κειμένου ή εικόνας. Το Gen-2 μπορεί να δημιουργήσει από το μηδέν βίντεο διάρκειας τριών δευτερολέπτων που ταιριάζουν με οποιαδήποτε περιγραφή κειμένου του χρήστη, χωρίς να απαιτείται κάποιο βίντεο ή εικόνα αναφοράς για να βασιστεί.

Η εταιρεία ισχυρίζεται ότι το Gen-2 μπορεί να παράγει πολύ πιο πιστά βίντεο σε σχέση με το Gen-1 και ότι ξεπερνά άλλα αντίστοιχα μοντέλα μετατροπής κειμένου σε βίντεο. Η Runway ανέπτυξε το Gen-2 χρησιμοποιώντας μια μέθοδο γνωστή ως «diffusion» και το εκπαίδευσε με ένα μεγάλο σύνολο δεδομένων εικόνων και βίντεο. Η εταιρεία δημοσίευσε ένα ακαδημαϊκό paper που περιγράφει λεπτομερώς τις τεχνικές πτυχές του Gen-2 νωρίτερα το 2023, αλλά δεν σκοπεύει να διαθέσει το μοντέλο ευρέως. Αντ' αυτού, το έκανε διαθέσιμο στο Discord, για χρήστες που θα περάσουν πρώτα από μια λίστα αναμονής στον ιστότοπό της.

Η Runway ελπίζει οι δημιουργοί περιεχομένου και οι κινηματογραφιστές θα χρησιμοποιήσουν το Gen-2 για διάφορους σκοπούς, όπως το storyboarding, η πρόταση projects πριν λάβουν χρηματοδότηση, η εκπαίδευση ή η ψυχαγωγία.

Για την ιστορία, η τεχνητή νοημοσύνη που μετατρέπει κείμενο σε βίντεο είναι μια αναδυόμενη τεχνολογία που έχει προσελκύσει το ενδιαφέρον τόσο των ερευνητών όσο και τεράστιων εταιρειών. Η Meta και η Google έχουν ήδη δημοσιεύσει διάφορα ερευνητικά έγγραφα σχετικά με τέτοια μοντέλα τεχνητής νοημοσύνης, αλλά δεν τα έχουν καταστήσει ακόμη δημόσια προσβάσιμα.

Ακολουθούν διάφορα παραδείγματα από την ίδια την εταιρία:

Το βίντεο της AI για το κείμενο: “Κοντινό πλάνο ενός ματιού”

Το βίντεο της AI για το κείμενο: “Εναέρια λήψη ενός ορεινού τοπίου”

Το βίντεο της AI για το κείμενο: “Ηλιοβασίλεμα μέσα από το παράθυρο ενός διαμερίσματος στη Νέα Υόρκη”