Η μάχη για την κυριαρχία στην τεχνητή νοημοσύνη συνεχίζεται, με τη Google να παρουσιάζει το Gemini 2.0, τη νέα γενιά του μοντέλου AI της, λίγες μέρες μετά την κυκλοφορία του μοντέλου o1 της OpenAI. Σύμφωνα με τον CEO της Google, Sundar Pichai, το Gemini 2.0 είναι το πιο ικανό μοντέλο της εταιρείας μέχρι σήμερα, προσφέροντας εγγενή υποστήριξη για εξαγωγή εικόνας και ήχου, με στόχο τη δημιουργία «καθολικών βοηθών».
Η Google ακολουθεί διαφορετική στρατηγική, ξεκινώντας την προεπισκόπηση με το πιο προσιτό και αποδοτικό Gemini 2.0 Flash, διαθέσιμο για όλους τους χρήστες του Gemini μέσω web και σύντομα και μέσω εφαρμογής. Στο μέλλον, η Google σχεδιάζει να ενσωματώσει το Gemini 2.0 στη λειτουργία AI Overviews της Αναζήτησης, επιτρέποντάς της να αντιμετωπίζει πιο πολύπλοκες ερωτήσεις, συμπεριλαμβανομένων πολυβηματικών μαθηματικών και προβλημάτων κώδικα, και να επεκταθεί σε περισσότερες γλώσσες και χώρες.
Το Gemini 2.0 ήδη ενισχύει καινοτόμες εφαρμογές της Google, όπως το Project Astra, το πολυμορφικό AI εργαλείο που μπορεί να συνομιλεί σε πολλές γλώσσες και να «θυμάται» πληροφορίες για μεγαλύτερο χρονικό διάστημα. Το Astra επίσης συνδέεται με εργαλεία όπως το Google Lens και οι Χάρτες, ενώ προσφέρει βελτιωμένη απόδοση και μειωμένη καθυστέρηση.
Σε σύγκριση με τον προκάτοχό του, το Gemini 2.0 Flash επιδεικνύει σημαντικά καλύτερη απόδοση, πετυχαίνοντας σκορ 63% στο HiddenMath, έναντι 47,2% του Gemini 1.5 Flash. Σε πολλές περιοχές, το νέο μοντέλο ξεπερνά ακόμη και το Gemini 1.5 Pro, με εξαίρεση την κατανόηση μεγάλων κειμένων και την αυτόματη μετάφραση ομιλίας.
Η Google διατηρεί προσωρινά το παλιό μοντέλο για συγκεκριμένες χρήσεις, παρουσιάζοντας παράλληλα το Deep Research, ένα νέο εργαλείο που χρησιμοποιεί τις δυνατότητες του Gemini 1.5 Pro για τη συγγραφή ολοκληρωμένων αναφορών σε πολύπλοκα θέματα.