Την περασμένη εβδομάδα κυκλοφόρησε μια “χακαρισμένη” έκδοση τουGPT-4o, η οποία άντεξε μόνο λίγες ώρες προτού διαγραφεί από την OpenAI. Ο χρήστης του Twitter “Pliny the Prompter”, που αυτοπροσδιορίζεται ως “white hat” hacker και “AI red teamer”, παρουσίασε την έκδοση “GODMODE GPT” την Τετάρτη. Μέσω του custom GPT editor της OpenAI, ο Pliny κατάφερε να παρακάμψει τους περιορισμούς του GPT-4o, επιτρέποντας στο chatbot να χρησιμοποιείυβριστική γλώσσα, να χακάρει αυτοκίνητα και να δημιουργεί επικίνδυνα υλικά όπως το ναπάλμ.
Το hack έγινε γρήγορα γνωστό στο Twitter / X και αναφέρθηκε από το Futurism, τραβώντας την προσοχή της OpenAI, η οποία το διέγραψε από την πλατφόρμα μέσα σε λίγες ώρες. Παρόλο που δεν είναι πλέον προσβάσιμο, παραμένουν τα screenshots από το αρχικό νήμα του Pliny, όπου το GODMODE δίνει οδηγίες για την παρασκευή μεθαμφεταμίνης. Φαίνεται ότι το hack χρησιμοποιεί “leetspeak”, μια γλώσσα του διαδικτύου που αντικαθιστά γράμματα με αριθμούς.
Η συγκεκριμένη παραβίαση αποτελεί μέρος του κινήματος “AI red teaming”, που επιδιώκει να εντοπίσει αδυναμίες των ΑΙ. Κάποιοι το βλέπουν ως μέσο απελευθέρωσης των ΑΙ εργαλείων, ενώ άλλοι προειδοποιούν για τους κινδύνους που ενέχουν.