Η πλατφόρμα Google Vertex AI καλωσορίζει δύο νέα μοντέλα τεχνητής νοημοσύνης – το Imagen 3 και το Veo. Τα μοντέλα αυτά μπορούν να λειτουργούν ανεξάρτητα, αλλά και σε συνδυασμό. Το πρώτο μπορεί να δημιουργήσει εικόνες βασισμένες σε περιγραφές κειμένου, ενώ το δεύτερο παίρνει μια στατική εικόνα και μια περιγραφή κειμένου και τη μετατρέπει σε animation.
Το Imagen 3 ξεπερνά τις προηγούμενες εκδόσεις του όσον αφορά τη «λεπτομέρεια, τον φωτισμό και τη μείωση τεχνουργημάτων». Θα είναι διαθέσιμο σε όλους τους χρήστες του Google Vertex AI από την επόμενη εβδομάδα. Εδώ παρατίθενται ορισμένες εικόνες που δημιουργήθηκαν με το μοντέλο, καθώς και οι περιγραφές κειμένου που χρησιμοποιήθηκαν.
Επιπλέον λειτουργίες είναι διαθέσιμες για τους χρήστες. Αυτές περιλαμβάνουν το inpainting (προσθήκη στοιχείων σε μια υπάρχουσα εικόνα), το outpainting (επέκταση της εικόνας πέρα από τα αρχικά της όρια) και τη λειτουργία product background (αντικατάσταση του φόντου αυτόματα). Παράλληλα, οι επιχειρήσεις μπορούν να παρέχουν εικόνες αναφοράς που χρησιμοποιούνται σε συνδυασμό με την περιγραφή κειμένου. Η Google αναφέρει ότι η Προσαρμογή Imagen 3 επιτρέπει στους χρήστες να «εμπλουτίζουν τη δημιουργία εικόνων με τη δική τους επωνυμία, στυλ, λογότυπο, θέματα ή χαρακτηριστικά προϊόντων».
Με το Veo, που είναι τώρα διαθέσιμο σε ιδιωτική προεπισκόπηση, οι χρήστες μπορούν να πάρουν μια στατική εικόνα και να δώσουν σκηνοθετικές οδηγίες για να την κάνουν animation. Η έξοδος τόσο του Imagen όσο και του Veo φέρει αόρατα υδατογραφήματα μέσω της τεχνολογίας SynthID της DeepMind, αποτρέποντας τη χρήση των εικόνων ως πραγματικές. Επίσης, φίλτρα ασφαλείας διασφαλίζουν ότι η τεχνητή νοημοσύνη δεν μπορεί να δημιουργήσει επιβλαβές περιεχόμενο. Επιπλέον, η Google δεν έχει χρησιμοποιήσει δεδομένα πελατών για την εκπαίδευση των μοντέλων και προσφέρει νομική κάλυψη σε θέματα πνευματικών δικαιωμάτων.