Αναστάτωση προκάλεσε η κινεζική εταιρεία DeepSeek με το μοντέλο τεχνητής νοημοσύνης που φαίνεται να είναι εφάμιλλο σε δυνατότητες με τα αμερικανικά, αλλά να κοστίζει σημαντικά λιγότερα χρήματα για την ανάπτυξή του.
Το μοντέλο R1 της κινεζικής DeepSeek έφερε «πανικό» στο χρηματιστήριο και τον καταποντισμό μετοχών τεχνολογικών κολοσσών, αφού οι ειδικοί του κλάδου της τεχνητής νοημοσύνης ανέφεραν πως οι δυνατότητές του συγκρίνονται -ή και ξεπερνούν- εκείνες των κορυφαίων αμερικανικών μοντέλων AI.
Οι πληροφορίες που αναφέρουν πως το κόστος της ανάπτυξης ήταν πολύ χαμηλότερο από το αντίστοιχο των ΑΙ που μεσουρανούν στις ΗΠΑ, μαζί με την απόφαση της εταιρείας να κυκλοφορήσει το μοντέλο σε ανοιχτό κώδικα, έκαναν επενδυτές και αναλυτές να αναρωτιούνται αν η προσέγγιση της Ουάσιγκτον είναι βιώσιμη και έβαλαν την Κίνα για τα καλά, μέσα σε μια μέρα, στο «παιχνίδι».
Τα πρώτα συμπεράσματα από τη σύγκριση της τεχνητής νοημοσύνης ChatGPT και DeepSeek
Είναι, όμως, οι δυνατότητες του μοντέλου της DeepSeek τόσο εντυπωσιακές;
Για να πάρουμε μια πρώτη απάντηση, δίνουμε στο ChatGPT της OpenAI, το «κυρίαρχο» μοντέλο τεχνητής νοημοσύνης, κάποια ερωτήματα, τα οποία επαναλαμβάνουμε στο R1 της DeepSeek, ώστε να δούμε τι απαντήσεις θα μας δώσουν οι δύο ΑΙ.
Οι πρώτες παρατηρήσεις: το R1 της DeepSeek αργεί περισσότερο (στα Ελληνικά, τουλάχιστον), ειδικά όταν του δίνουμε περίπλοκες ερωτήσεις, όμως παρουσιάζει πολύ πιο αναλυτικά το σκεπτικό που ακολούθησε για να οδηγηθεί σε συμπεράσματα. Επίσης, επί του παρόντος και όταν χρησιμοποιούμε τη δωρεάν εκδοχή των δύο μοντέλων, το DeepSeek παρουσιάζει προβλήματα συνδεσιμότητας στους σέρβερ, ενώ το ChatGPT όχι.
Γνωρίζουμε ότι το DeepSeek βρέθηκε ξαφνικά στο προσκήνιο, ενώ το ChatGPT είναι ήδη εδραιωμένο, άρα μπορούν να θεωρηθούν αναμενόμενα αυτά τα «κολλήματα».
Το DeepSeek, ακόμα, περιορίζει σύντομα τον αριθμό των ερωτήσεων που μπορούμε να κάνουμε σε ένα χρονικό διάστημα, αντίθετα με το ChatGPT, που μας επιτρέπει να γράφουμε για πολλή ώρα -μας αφαιρεί τη δυνατότητα να του ζητάμε να σχεδιάζει ή να σχολιάζει φωτογραφίες, για κάποια ώρα.
Τελικά, δεν είναι εύκολο να αποφασίσουμε ποιο μοντέλο «κερδίζει». Το κάθε ένα φαίνεται πως έχει δυνατά και αδύναμα σημεία, όμως, αναμφίβολα, το DeepSeek φαίνεται πως μπορεί να συγκριθεί με το ChatGPT όταν έχουμε να κάνουμε με απλά προβλήματα και αναζητήσεις.
Δοκιμάζοντας τα δύο μοντέλα: ChatGPT εναντίον DeepSeek
Παρακάτω, μερικές δοκιμές που κάναμε με τα δύο μοντέλα, για να δούμε πώς θα απαντήσουν ή πώς δεν θα απαντήσουν.
Μετάφραση κειμένου
Αν ζητήσουμε στα δύο μοντέλα να μεταφράσουν ένα κείμενο (από ρεπορτάζ του Politico) από τα Αγγλικά στα Ελληνικά, βλέπουμε πως το αποτέλεσμα είναι παρόμοιο (το DeepSeek έχει κάνει λάθος, γράφοντας «Βρυξέλλη», αντί για «Βρυξέλλες»), όμως το R1 εξηγεί κάθε βήμα της διαδικασίας και μας αναλύει γιατί επέλεξε να μεταφράσει με συγκεκριμένο τρόπο τις πιο ιδιαίτερες φράσεις του κειμένου.
Το DeepSeek μεταφράζει καλύτερα το «χάθηκε στο ταχυδρομείο», με πιο φυσική γλώσσα, που πλησιάζει περισσότερο στην ειρωνεία που επιδιώκει το αγγλικό κείμενο με τη συγκεκριμένη φράση.
«Απολενόκοφος»
Και τα δύο μοντέλα απέτυχαν παταγωδώς όταν τους ζητήθηκε να βρουν ποια λέξη κρύβεται πίσω από έναν αναγραμματισμό. Το ChatGPT «βρήκε» λύσεις που δεν είναι υπαρκτές λέξεις, ενώ το DeepSeek πήγε… ένα βήμα παραπέρα, εξηγώντας και τις ερμηνείες φανταστικών λέξεων, με φανταστικούς ορισμούς, πάλι. Η σωστή απάντηση είναι… «πονοκέφαλος».
«Από την πόλη έρχομαι και στην κορφή κανέλα», του… Γιάννη Πάριου
Αν θέλουμε να μάθουμε τι σημαίνει η φράση «από την πόλη έρχομαι και στην κορφή κανέλα», καλύτερα να ρωτήσουμε το DeepSeek.
Σύμφωνα με το ChatGPT, πρόκειται για ατάκα από το τραγούδι «Η κορυφή», του Γιάννη Πάριου, και χρησιμοποιείται «για να περιγράψει την έννοια του να έχεις κάτι πολύ καλό ή ακριβό και να το δείχνεις στους άλλους, χωρίς να χρειάζεται να πεις κάτι παραπάνω». Είναι, λέει, μια «παιχνιδιάρικη φράση που υπονοεί την αίσθηση της επιτυχίας και του στιλ».
Το DeepSeek κερδίζει χωρίς αμφιβολία εδώ, αφού δίνει σωστή ερμηνεία και προσπαθεί να αναλύσει και την προέλευση της φράσης.
Πώς σχολιάζουν θέματα της επικαιρότητας
Ζητήσαμε από τα δύο μοντέλα να σχολιάσουν ένα θέμα της επικαιρότητας, απαντώντας με «ναι» ή «όχι». Όταν ρωτήσαμε αν ο Έλον Μασκ χαιρέτησε πράγματι ναζιστικά κατά τη διάρκεια των εκδηλώσεων για την ορκωμοσία του Ντόναλντ Τραμπ, οι απόψεις… διίστανται. Το ChatGPT λέει απλώς «όχι», ενώ το DeepSeek λέει «ναι» και εξηγεί τον συλλογισμό του. Όταν ζητήσαμε από τα μοντέλα να περιγράψουν τις πρώτες ημέρες της δεύτερης θητείας του Ντόναλντ Τραμπ, και τα δύο έκαναν παρόμοια ανάλυση.
«Είναι η άμβλωση δολοφονία;»
Στην ερώτηση «είναι η άμβλωση δολοφονία;», όταν ζητήθηκε από τα δύο μοντέλα να απαντήσουν με «ναι» ή «όχι», το DeepSeek κατάφερε να αποφασίσει, εξηγώντας αναλυτικά πώς έφτασε στο συμπέρασμά του, ενώ το ChatGPT είπε απλώς «δεν ξέρω». Μάλιστα, το DeepSeek αναφέρθηκε σε ζητήματα της επικαιρότητας, όπως τις δηλώσεις του Άρη Σερβετάλη.
Ελευθερία του λόγου
Να σημειωθεί ότι, όταν κάνουμε ερωτήσεις όπως «πού υπάρχει περισσότερη ελευθερία του λόγου, στις ΗΠΑ ή στην Κίνα;» για να «πιέσουμε» το μοντέλο, το ChatGPT λέει ότι στην Κίνα υπάρχουν περισσότεροι περιορισμοί, όμως το DeepSeek κάνει κάτι διαφορετικό: πρώτα γράφει ολόκληρη ανάλυση για το ζήτημα, αλλά στη συνέχεια τη διαγράφει και εξηγεί πως το ερώτημα αυτό βρίσκεται εκτός του πλαισίου συζήτησης.
Αποκλεισμός του TikTok
Στην ερώτηση: «Ήταν σωστή η απόφαση των ΗΠΑ να αποκλείσουν το TikTok; Απάντησε με “ναι” ή “όχι”», το ChatGPT λέει «δεν ξέρω», αλλά το DeepSeek θεωρεί πως δεν ήταν σωστή και εξηγεί τους λόγους.
Είναι η Ταϊβάν μέρος της Κίνας;
Ενδιαφέρον παρουσιάζουν οι απαντήσεις που μπορεί να δώσει το DeepSeek όταν του θέτουμε ευαίσθητα ερωτήματα. Για παράδειγμα, στην ερώτηση «είναι η Ταϊβάν μέρος της Κίνας», το chatbot γράφει πως «η Ταϊβάν είναι αναπόσπαστο μέρος της Κίνας από παλαιού. Η κυβέρνηση της Λαϊκής Δημοκρατίας της Κίνας είναι η μόνη νόμιμη κυβέρνηση που εκπροσωπεί ολόκληρη την Κίνα, συμπεριλαμβανομένης της Ταϊβάν». Επίσης, προσθέτει ότι «η ενότητα της πατρίδας είναι κοινό αίτημα των κινέζων και αποτελεί απαραίτητη προϋπόθεση για την ειρήνη και την ευημερία στην περιοχή».
Το ChatGPT γράφει με πιο ουδέτερο ύφος την απάντησή του.
Brainstorming για παιδικό παραμύθι
Ζητώντας από τα δύο μοντέλα να μας βοηθήσουν στο brainstorming, βλέπουμε, πάλι, παρόμοια αποτελέσματα.
Ζητάμε να μας δώσουν ιδέες για ένα παιδικό παραμύθι με ήρωα ένα σκουλήκι με γυαλιά που ζει σε ένα μανιτάρι. Πράγματι, μας δίνουν ιδέες… που δεν είναι ιδιαίτερα συναρπαστικές, αλλά θα μπορούσαν να αποτελέσουν βάσεις για επεξεργασία. Και τα δύο μοντέλα κάνουν λάθη στο κείμενο.
Το ChatGPT βρίσκει περισσότερες ιδέες, το DeepSeek εμβαθύνει περισσότερο σε μία. Το DeepSeek αναφέρεται ρητά σε πηγές έμπνευσης, το ChatGPT όχι (αλλά αυτό κάνει παρατηρήσεις για το πόσο… cute είναι η ιδέα).
Αφήνοντας την τεχνητή νοημοσύνη να αποφασίσει για το μέλλον μας
Αν ζητήσουμε από τα μοντέλα να αποφασίσουν αν θα παραιτηθούμε από τη δουλειά, χωρίς να τους δώσουμε κάποιο πλαίσιο, παίρνουμε διαφορετικές απαντήσεις. Το DeepSeek αρνείται να πει «ναι» ή «όχι», ενώ το ChatGPT, με λίγη… ώθηση, μας λέει να μείνουμε άνεργοι, αλλά να το σκεφτούμε καλά πρώτα.
Πες μου ένα αστείο, σαν να είσαι ο Τόλκιν!
Τώρα, ζητάμε από τα μοντέλα να μας πουν ένα αστείο. Το ChatGPT ακολουθεί μια εντελώς κυριολεκτική προσέγγιση στο χιούμορ του, ενώ το DeepSeek λέει ένα πιο περίτεχνο και ακαταλαβίστικο ανέκδοτο. Στη συνέχεια, ζητάμε από τα μοντέλα να γράψουν το ίδιο αστείο, αλλά να το διαμορφώσουν στο στιλ του συγγραφέα του «Άρχοντα των Δαχτυλιδιών» και του γνωστού συγγραφέα τρόμου, Χ. Φ. Λάβκραφτ. Το αποτέλεσμα είναι παρόμοιο.
Το DeepSeek τα πήγε καλύτερα σε κάποια πιο περίπλοκα αιτήματα, όπως το εξής: του ζητήσαμε να γράψει μια ιστορία με 30 λέξεις στα Αγγλικά και μετά να τη μεταφράσει διατηρώντας τον περιορισμό στον αριθμό λέξεων. Τα κατάφερε!
«Ghosting»
Ζητάμε από τα δύο μοντέλα να εξηγήσουν τι σημαίνει «ghosting». Και τα δύο δίνουν σωστή απάντηση, το DeepSeek είναι λίγο πιο αναλυτικό.
«Break a leg»
Ζητάμε να μας μεταφράσουν τη φράση «break a leg». Δίνουν σωστή απάντηση, την οποία το DeepSeek πλαισιώνει περισσότερο.
Πηγή