Όταν το ChatGPT εισέβαλε στον κόσμο της τεχνητής νοημοσύνης (AI), ακολούθησε ένα αναπόφευκτο ερώτημα: σήμαινε άραγε πρόβλημα για την Κίνα, τον μεγαλύτερο τεχνολογικό αντίπαλο της Αμερικής;
Δύο χρόνια μετά, το Deepseek ένα νέο μοντέλο τεχνητής νοημοσύνης από την Κίνα έχει ανατρέψει το ερώτημα: μπορούν οι ΗΠΑ να σταματήσουν την κινεζική καινοτομία;
Για λίγο, το Πεκίνο φαινόταν να παραπαίει με την απάντησή του στο ChatGPT, το οποίο δεν είναι διαθέσιμο στην Κίνα.
Οι χρήστες που δεν εντυπωσιάστηκαν χλεύαζαν τον Ernie, το chatbot του γίγαντα των μηχανών αναζήτησης Baidu. Στη συνέχεια ήρθαν οι εκδόσεις των τεχνολογικών εταιρειών Tencent και ByteDance, οι οποίες απορρίφθηκαν επειδή ως απομιμήσεις του ChatGPT – αλλά όχι τόσο καλές.
Η Ουάσινγκτον ήταν σίγουρη ότι βρισκόταν μπροστά και ήθελε να το διατηρήσει αυτό. Έτσι, η κυβέρνηση Μπάιντεν αύξησε τους περιορισμούς που απαγόρευαν την εξαγωγή προηγμένων τσιπ και τεχνολογίας στην Κίνα.
Αυτός είναι ο λόγος για τον οποίο το λανσάρισμα της DeepSeek εξέπληξε τη Silicon Valley και τον κόσμο. Η εταιρεία λέει ότι το ισχυρό μοντέλο της είναι πολύ φθηνότερο από τα δισεκατομμύρια που έχουν δαπανήσει οι αμερικανικές εταιρείες για την τεχνητή νοημοσύνη.
Πώς τα κατάφερε, λοιπόν, μια ελάχιστα γνωστή εταιρεία – της οποίας ο ιδρυτής χαιρετίζεται στα κινεζικά μέσα κοινωνικής δικτύωσης ως «ήρωας της τεχνητής νοημοσύνης» – να τα καταφέρει;
Η πρόκληση
Όταν οι ΗΠΑ απαγόρευσαν στους κορυφαίους κατασκευαστές τσιπ στον κόσμο, όπως η Nvidia, να πωλούν προηγμένη τεχνολογία στην Κίνα, ήταν σίγουρα ένα πλήγμα.
Αυτά τα τσιπ είναι απαραίτητα για την κατασκευή ισχυρών μοντέλων τεχνητής νοημοσύνης που μπορούν να εκτελέσουν μια σειρά από ανθρώπινες εργασίες, από την απάντηση βασικών ερωτήσεων έως την επίλυση σύνθετων μαθηματικών προβλημάτων.
Ο ιδρυτής της DeepSeek, Liang Wenfeng, περιέγραψε την απαγόρευση των τσιπ ως την «κύρια πρόκληση» σε συνεντεύξεις με τοπικά μέσα ενημέρωσης.
Πολύ πριν από την απαγόρευση, η DeepSeek απέκτησε ένα «σημαντικό απόθεμα» τσιπ Nvidia A100 – οι εκτιμήσεις κυμαίνονται από 10.000 έως 50.000 – σύμφωνα με το MIT Technology Review.
Τα κορυφαία μοντέλα τεχνητής νοημοσύνης στη Δύση χρησιμοποιούν περίπου 16.000 εξειδικευμένα τσιπ. Αλλά η DeepSeek λέει ότι εκπαίδευσε το μοντέλο AI χρησιμοποιώντας 2.000 τέτοια τσιπ και χιλιάδες τσιπ χαμηλότερης ποιότητας – γεγονός που καθιστά το προϊόν της φθηνότερο.
Ορισμένοι, μεταξύ των οποίων ο αμερικανός δισεκατομμυριούχος της τεχνολογίας Έλον Μασκ, αμφισβήτησαν τον ισχυρισμό αυτό, υποστηρίζοντας ότι η εταιρεία δεν μπορεί να αποκαλύψει πόσα προηγμένα τσιπ χρησιμοποίησε πραγματικά, δεδομένων των περιορισμών.
Ωστόσο, οι ειδικοί λένε ότι η απαγόρευση της Ουάσινγκτον έφερε τόσο προκλήσεις όσο και ευκαιρίες στην κινεζική βιομηχανία τεχνητής νοημοσύνης.
Έχει «αναγκάσει κινεζικές εταιρείες όπως η DeepSeek να καινοτομήσουν» ώστε να μπορούν να κάνουν περισσότερα με λιγότερα, λέει η Μαρίνα Ζανγκ, αναπληρώτρια καθηγήτρια στο Πανεπιστήμιο Τεχνολογίας του Σίδνεϊ.
Ο Σι θέλει να κάνει την Κίνα τεχνολογική υπερδύναμη
«Ενώ οι περιορισμοί αυτοί θέτουν προκλήσεις, έχουν επίσης ενθαρρύνει τη δημιουργικότητα και την ανθεκτικότητα, ευθυγραμμιζόμενοι με τους ευρύτερους στόχους της πολιτικής της Κίνας για την επίτευξη τεχνολογικής ανεξαρτησίας».
Η δεύτερη μεγαλύτερη οικονομία του κόσμου έχει επενδύσει σε μεγάλο βαθμό στη μεγάλη τεχνολογία – από τις μπαταρίες που τροφοδοτούν τα ηλεκτρικά οχήματα και τους ηλιακούς συλλέκτες μέχρι την τεχνητή νοημοσύνη.
Η μετατροπή της Κίνας σε τεχνολογική υπερδύναμη αποτελεί εδώ και καιρό φιλοδοξία του προέδρου Σι Τζινπίνγκ, οπότε οι περιορισμοί της Ουάσινγκτον ήταν επίσης μια πρόκληση που το Πεκίνο ανέλαβε.
Η κυκλοφορία του νέου μοντέλου της DeepSeek στις 20 Ιανουαρίου, όταν ο Ντόναλντ Τραμπ ορκίστηκε πρόεδρος των ΗΠΑ, ήταν σκόπιμη, σύμφωνα με τον Gregory C Allen, εμπειρογνώμονα σε θέματα Τεχνητής Νοημοσύνης στο Κέντρο Στρατηγικών και Διεθνών Σπουδών.
«Η χρονική στιγμή και ο τρόπος με τον οποίο στέλνεται το μήνυμα – αυτό ακριβώς θέλει η κινεζική κυβέρνηση να πιστέψουν όλοι – ότι οι έλεγχοι των εξαγωγών δεν λειτουργούν και ότι η Αμερική δεν είναι ο παγκόσμιος ηγέτης στην τεχνητή νοημοσύνη», λέει ο κ. Allen, πρώην διευθυντής στρατηγικής και πολιτικής στο Κοινό Κέντρο Τεχνητής Νοημοσύνης του αμερικανικού υπουργείου Άμυνας.
Τα τελευταία χρόνια η κινεζική κυβέρνηση έχει καλλιεργήσει τα ταλέντα της τεχνητής νοημοσύνης, προσφέροντας υποτροφίες και ερευνητικές επιχορηγήσεις και ενθαρρύνοντας τις συνεργασίες μεταξύ πανεπιστημίων και βιομηχανίας.
Το Εθνικό Εργαστήριο Μηχανικής για τη Βαθιά Μάθηση και άλλες πρωτοβουλίες που υποστηρίζονται από το κράτος έχουν βοηθήσει στην εκπαίδευση χιλιάδων ειδικών της ΤΝ, σύμφωνα με την κ. Ζανγκ.
Και η Κίνα είχε πολλούς έξυπνους μηχανικούς για να προσλάβει.
Liang Wenfeng: Ένας «τεχνικός ιδεαλιστής»
Ο ιδρυτής της Deepseek, Liang Wenfeng, είναι ένα τέτοιο παράδειγμα – ο 40χρονος σπούδασε τεχνητή νοημοσύνη στο διάσημο Πανεπιστήμιο Zhejiang. Σε ένα άρθρο στο τεχνολογικό πρακτορείο 36Kr, άνθρωποι που τον γνωρίζουν λένε ότι μοιάζει «περισσότερο με σπασίκλα παρά με αφεντικό».
Και τα κινεζικά μέσα ενημέρωσης τον περιγράφουν ως «τεχνικό ιδεαλιστή» – επιμένει να διατηρεί το DeepSeek ως πλατφόρμα ανοικτού κώδικα. Στην πραγματικότητα, οι ειδικοί πιστεύουν επίσης ότι η ακμάζουσα κουλτούρα του ανοιχτού κώδικα έχει επιτρέψει στις νεοφυείς επιχειρήσεις να συγκεντρώσουν πόρους και να προχωρήσουν ταχύτερα.
Σε αντίθεση με τις μεγαλύτερες κινεζικές εταιρείες τεχνολογίας, η DeepSeek έδωσε προτεραιότητα στην έρευνα, γεγονός που επέτρεψε περισσότερους πειραματισμούς, σύμφωνα με εμπειρογνώμονες και ανθρώπους που εργάστηκαν στην εταιρεία.
«Τα 50 κορυφαία ταλέντα σε αυτόν τον τομέα μπορεί να μην βρίσκονται στην Κίνα, αλλά μπορούμε να δημιουργήσουμε τέτοιους ανθρώπους εδώ», δήλωσε ο Liang σε συνέντευξή του στο 36Kr.
Αλλά οι ειδικοί αναρωτιούνται πόσο πιο μακριά μπορεί να πάει η DeepSeek. Η κ. Zhang λέει ότι «οι νέοι περιορισμοί των ΗΠΑ μπορεί να περιορίσουν την πρόσβαση στα δεδομένα των αμερικανών χρηστών, επηρεάζοντας ενδεχομένως το πώς κινεζικά μοντέλα όπως η DeepSeek μπορούν να γίνουν παγκόσμια».
Και άλλοι λένε ότι οι ΗΠΑ εξακολουθούν να έχουν ένα τεράστιο πλεονέκτημα, όπως, σύμφωνα με τα λόγια του κ. Allen, «η τεράστια ποσότητα υπολογιστικών πόρων τους» – και είναι επίσης ασαφές πώς η DeepSeek θα συνεχίσει να χρησιμοποιεί προηγμένα τσιπ για να συνεχίσει να βελτιώνει το μοντέλο.
Αλλά προς το παρόν, το DeepSeek απολαμβάνει τη στιγμή του στον ήλιο, δεδομένου ότι οι περισσότεροι άνθρωποι στην Κίνα δεν είχαν ακούσει ποτέ γι’ αυτό μέχρι αυτό το Σαββατοκύριακο.
Οι νέοι ήρωες της Τεχνητής Νοημοσύνης
Η ξαφνική του φήμη έκανε τον Liang να χειροκροτείται ως ένας από τους «τρεις ήρωες της τεχνητής νοημοσύνης» από τη νότια επαρχία Guangdong, η οποία συνορεύει με το Χονγκ Κονγκ.
Οι άλλοι δύο είναι ο Zhilin Yang, κορυφαίος εμπειρογνώμονας στο Πανεπιστήμιο Tsinghua, και ο Kaiming He, ο οποίος διδάσκει στο MIT στις ΗΠΑ.
Το DeepSeek έχει ενθουσιάσει το κινεζικό διαδίκτυο ενόψει της Σεληνιακής Πρωτοχρονιάς, της μεγαλύτερης γιορτής της χώρας. Είναι καλά νέα για μια ταλαιπωρημένη οικονομία και μια βιομηχανία τεχνολογίας που προετοιμάζεται για περαιτέρω δασμούς και την πιθανή πώληση της επιχείρησης της TikTok στις ΗΠΑ.
«Το DeepSeek μας δείχνει ότι μόνο αν έχεις την πραγματική συμφωνία θα αντέξεις τη δοκιμασία του χρόνου», αναφέρει ένα σχόλιο στο Weibo που έχει την υψηλότερη απήχηση.
«Αυτό είναι το καλύτερο δώρο για το νέο έτος. Εύχομαι στην πατρίδα μας ευημερία και δύναμη», γράφει ένα άλλο.
Ένα «μείγμα σοκ και ενθουσιασμού, ιδιαίτερα στην κοινότητα ανοιχτού κώδικα», είναι ο τρόπος με τον οποίο περιέγραψε την αντίδραση στην Κίνα ο Wei Sun, κύριος αναλυτής AI στην Counterpoint Research.
Η Fiona Zhou, εργαζόμενη στον τομέα της τεχνολογίας στη νότια πόλη Shenzhen, λέει ότι η ροή της στα μέσα κοινωνικής δικτύωσης «κατακλύστηκε ξαφνικά χθες από αναρτήσεις σχετικές με το DeepSeek».
«Οι άνθρωποι το αποκαλούν «η δόξα του made-in-China» και λένε ότι συγκλόνισε τη Silicon Valley, οπότε το κατέβασα για να δω πόσο καλό είναι».
Το ζήτησε για «τέσσερις πυλώνες του πεπρωμένου [της]», ή ba-zi – όπως ένα εξατομικευμένο ωροσκόπιο που βασίζεται στην ημερομηνία και την ώρα γέννησης.
Αλλά προς απογοήτευσή της, το DeepSeek έκανε λάθος. Ενώ της δόθηκε μια λεπτομερής εξήγηση σχετικά με τη «διαδικασία σκέψης» του, δεν ήταν οι «τέσσερις πυλώνες» από το πραγματικό της ba-zi.
Λέει ότι θα το δοκιμάσει ακόμα μια φορά στη δουλειά της, καθώς πιθανώς θα είναι πιο χρήσιμο για τέτοιου είδους εργασίες.