Επικοινωνιακή επανάσταση της τεχνητής νοημοσύνης: Τώρα μιλάμε όλοι με υπολογιστές
Η επανάσταση του Διαδικτύου ήταν η επικοινωνία με οποιοδήποτε άτομο. Δίκτυα ανθρώπων προς ανθρώπους. Η επανάσταση του AI είναι η επικοινωνία με το AI. Δίκτυα ανθρώπων προς μηχανές . Το Διαδίκτυο διευκόλυνε τις συνδέσεις ανθρώπου με άνθρωπο χρησιμοποιώντας υπολογιστές και η τεχνητή νοημοσύνη διευκολύνει τις ανθρώπινες συνδέσεις με υπολογιστές
OpenAI GPT-4o, Chatbots και ένα πλαίσιο για ψηφιακή επικοινωνία
Περίληψη:
Ο Rex Woodbury συζητά πώς η τεχνητή νοημοσύνη (AI) αλλάζει τον τρόπο με τον οποίο επικοινωνούμε. Συγκρίνει την ταινία Her με την πρόσφατη demo του GPT-4o της OpenAI, η οποία μπορεί να συλλογίζεται σε πραγματικό χρόνο σε ήχο, όραση και κείμενο. Ο Woodbury προβλέπει ότι θα μιλάμε όλο και περισσότερο με την τεχνητή νοημοσύνη στο μέλλον και ότι αυτό θα οδηγήσει στη δημιουργία νέων εταιρειών.
Κύρια σημεία:
Τη Δευτέρα το βράδυ, ξαναείδα την ταινία Her.
Ο λόγος; Παρακολουθώντας το demo της OpenAI τη Δευτέρα του GPT-4o (αυτό είναι ένα “o”, που σημαίνει “omni”) με έκανε να σκεφτώ ότι άξιζε να την επανεξετάσω. Και ήταν – 10 χρόνια από τότε που κυκλοφόρησε, η ταινία παραμένει τόσο προφητική όσο ποτέ.
Το GPT-4o μπορεί να αιτιολογήσει τον ήχο, την όραση και το κείμενο σε πραγματικό χρόνο. Τι σημαίνει αυτό? Στο βίντεο εκτόξευσης, ένας υπάλληλος της OpenAI ζητά από το GPT-4o να μαντέψει τι μπορεί να κάνει. Το AI παίρνει στο δωμάτιο, παρατηρώντας ότι ο υπάλληλος φοράει φούτερ με κουκούλα OpenAI και μικρόφωνο. Διακινδυνεύει μια εικασία – πρέπει να κινηματογραφεί ένα σημαντικό γεγονός, ίσως ένα λανσάρισμα προϊόντος που σχετίζεται με το OpenAI; Της δίνει τη γραμμή γροθιάς, λέγοντάς της ότι είναι η κυκλοφορία του προϊόντος. Το βίντεο επίδειξης 1:22 αξίζει να παρακολουθήσετε πλήρως.
Φυσικά , αφηγείται την ιστορία ενός άνδρα (τον οποίο υποδύεται ο Joaquin Phoenix) που ερωτεύεται μια τεχνητή νοημοσύνη (με τη φωνή της Scarlett Johansson). Η επιστημονική φαντασία θα γίνει σύντομα πραγματικότητα.
Η επανάσταση του Διαδικτύου ήταν η επικοινωνία με οποιοδήποτε άτομο. Δίκτυα ανθρώπων προς ανθρώπους. Η επανάσταση του AI είναι η επικοινωνία με το AI. Δίκτυα ανθρώπων προς μηχανές . Το Διαδίκτυο διευκόλυνε τις συνδέσεις ανθρώπου με άνθρωπο χρησιμοποιώντας υπολογιστές και η τεχνητή νοημοσύνη διευκολύνει τις ανθρώπινες συνδέσεις με υπολογιστές.
Και οι δύο είναι επαναστάσεις στην επικοινωνία – απλώς διαφορετικού είδους.
Έχω μοιραστεί την παρακάτω εικόνα στο παρελθόν. (Για τις εικόνες βλέπε παραπομπή στην πηγή). Δημιουργήθηκε το 2021 από τον Barrett Lyons, ο οποίος χρησιμοποίησε πίνακες δρομολόγησης του πρωτοκόλλου Border Gateway για να οπτικοποιήσει τα δίκτυα του Διαδικτύου. Στην εικόνα, μπορούμε να δούμε συμπλέγματα περιοχών δικτύου—παραδείγματα συμπλεγμάτων περιλαμβάνουν το Μη Διαβαθμισμένο Δίκτυο Πρωτοκόλλου Διαδικτύου του Υπουργείου Άμυνας των ΗΠΑ, τα συστήματα υπολογιστών Shenzhen Tencent και το AWS της Amazon.
Μπορείτε να φανταστείτε μια παρόμοια οπτική σε 10 χρόνια, χαρτογραφώντας τις ανθρώπινες επικοινωνίες με τεχνητή νοημοσύνη. Θα μιλήσουμε με AI – πολύ.
Agents, copilots, chatbots. Ονομάστε τους AI όπως θέλετε. Υποψιάζομαι ότι η ορολογία που χρησιμοποιούμε θα διαφέρει ανάλογα με την περίπτωση χρήσης:
- Οι πράκτορες θα εκτελούν εργασίες, ένας νέος υπάλληλος που χειρίζεται τη σκληρή δουλειά μας.
- Οι Copilots θα ενισχύσουν την δουλειά μας, προτείνοντας μια νέα πρόταση ή μια νέα γραμμή κώδικα.
- Τα chatbots, εν τω μεταξύ, θα μας δώσουν κάποιον να μιλήσουμε, εκπληρώνοντας την ανθρώπινη λαχτάρα μας για σύνδεση.
Κάτι που σκέφτομαι συχνά: την ποσότητα της ανθρώπινης επικοινωνίας και πώς η σύνθεσή της έχει μετατοπιστεί με την πάροδο του χρόνου. Φανταστείτε μια ανάλυση λέξεων που οι άνθρωποι μιλούν μεταξύ τους. Πώς έχει χωριστεί αυτός ο συνδυασμός μεταξύ προσωπικής επικοινωνίας και εικονικής επικοινωνίας με την πάροδο του χρόνου;
Φαντάζομαι ότι το διάγραμμα μοιάζει κάπως έτσι:
Εξακολουθούμε να μιλάμε πολύ προσωπικά, αλλά μιλάμε επίσης πολύ χρησιμοποιώντας την τεχνολογία. Ο άνθρωπος στέλνει 12 εκατομμύρια iMessages, 2 εκατομμύρια Snapchat, 146 K Slacks και 575 K tweets κάθε λεπτό .
Περιμένω ότι πρόκειται να μιλήσουμε πολύ περισσότερο—και όχι μόνο μεταξύ μας, αλλά και στους υπολογιστές. Τραβήξτε το διάγραμμα προς τα εμπρός 20 χρόνια και μπορεί να μοιάζει κάπως έτσι:
Προφανώς αυτό είναι υπεραπλουστευμένο. Αλλά είναι μια σημαντική αλλαγή. Αυτή η μερίδα στο χρώμα του σολομού γέννησε μερικές από τις μεγαλύτερες εταιρείες της τελευταίας γενιάς – το Facebook και το Slack και το Discord και το Snap. Ποιες εταιρείες θα γεννηθούν από το γαλάζιο τμήμα;
Στις αρχικές αγορές startup, βλέπουμε καινοτομία σε όλες τις μορφές επικοινωνίας. Πριν από την τεχνητή νοημοσύνη, είδαμε τέσσερις βασικές μορφές επικοινωνίας. Το AI προσθέτει τώρα ένα πέμπτο.
1.IRL
2.Bilateral
3.Parasocial
4.Many-to-Many
5.AI-Centric
Ας εξετάσουμε την καινοτομία που συμβαίνει στο #1 – 4 και, στη συνέχεια, εξερευνήστε τι έρχεται στο #5.
1) IRL
Αυτές είναι οι εταιρείες τεχνολογίας που επιτρέπουν αλληλεπιδράσεις εκτός σύνδεσης «στην πραγματική ζωή».
Ένα παράδειγμα μπορεί να είναι το Live Nation (το οποίο κατέχει την Ticketmaster)— μια εταιρεία που επλήγη περισσότερο από τον COVID, αλλά ανέκαμψε πιο έντονα:
Το Eventbrite είναι ένα άλλο παράδειγμα για την IRL, μια εταιρεία που υποστηρίζεται από venture που είναι πλέον δημόσια με κεφαλαιοποίηση ~ 500 εκατομμυρίων δολαρίων. Το 2023, η πλατφόρμα έκδοσης εισιτηρίων απέφερε έσοδα 326 εκατομμυρίων δολαρίων, + 25% από έτος σε έτος, χάρη σε 302 εκατομμύρια εισιτήρια που πωλήθηκαν σε 5,2 εκατομμύρια εκδηλώσεις.
Βλέπουμε μερικούς αμφισβητίες στις αγορές Seed και Series A. Το Partiful έχει αναπτυχθεί όμορφα—οι εκδηλώσεις έχουν καλή ενσωματωμένη virality—και τώρα φαίνεται η προεπιλογή για εκδηλώσεις σε μεγάλες αγορές (σίγουρα στη Νέα Υόρκη). Ο Luma είναι άλλος ένας διαταράκτης Eventbrite και ο Bounce έχει κερδίσει καλή έλξη στις πανεπιστημιουπόλεις των κολεγίων.
Η πρόκληση είναι η δημιουργία εσόδων.
Είναι δύσκολο να πείσουμε τους ανθρώπους να πληρώσουν για πλατφόρμες εκδηλώσεων. Το Paperless Post είναι μια ωραία επιχείρηση, αλλά δεν είναι ένα αποτέλεσμα επιχειρηματικής κλίμακας. Η κριτική επιτροπή εξετάζει εάν οι νεοσύστατες επιχειρήσεις “IRL” μπορούν να ωριμάσουν σε κολλώδη προϊόντα που αποφέρουν σημαντικά έσοδα.
2) Bilateral
Συχνά ξεχνάμε ότι το WhatsApp ήταν μια από τις μεγαλύτερες ιστορίες επιτυχίας επιχειρηματικών κεφαλαίων όλων των εποχών.
Η Sequoia ηγήθηκε της σειράς Α των 8 εκατομμυρίων δολαρίων του WhatsApp (θυμάστε τις μέρες μιας σειράς Α 8 εκατομμυρίων δολαρίων;) και διπλασιάστηκε με μια μεταγενέστερη Σειρά C των 50 εκατομμυρίων δολαρίων. Όταν το Facebook αγόρασε το WhatsApp για 19 δισεκατομμύρια δολάρια το 2014, το μερίδιο της Sequoia άξιζε ~3 δισεκατομμύρια δολάρια . Αυτή η συμφωνία παραμένει η μεγαλύτερη εξαγορά μιας εταιρείας στην ιστορία που υποστηρίζεται από venture. Η Figma έκλεψε αυτό το στέμμα πέρυσι, αλλά η μπλοκαρισμένη εξαγορά της Adobe παραδίδει το στέμμα πίσω στο WhatsApp.
Η εξαγορά του Facebook πραγματοποιήθηκε όταν το WhatsApp είχε 450 εκατομμύρια χρήστες. Σήμερα, το WhatsApp έχει 2,96 δισεκατομμύρια ενεργούς χρήστες, περνώντας το όριο των 2 δισεκατομμυρίων τον Φεβρουάριο του 2020. Η εφαρμογή προβλέπεται να φτάσει τους 3,14 δισεκατομμύρια χρήστες έως το 2025.
Πολλοί Αμερικανοί που διστάζουν χρησιμοποιούν το WhatsApp για διεθνείς φίλους και ομαδικές συνομιλίες με μη Αμερικανούς. Αλλά, επιτέλους, το WhatsApp πιάνει το ενδιαφέρον στις ΗΠΑ. Οι Active χρήστες αυξήθηκαν κατά +9% πέρυσι , και συγκεκριμένα το Gen Z φαίνεται να πηγαίνει στην εφαρμογή. Στην τρέχουσα τροχιά του, το WhatsApp μπορεί ακόμη και να αμφισβητήσει το iMessage ως την κορυφαία εφαρμογή ανταλλαγής μηνυμάτων της Αμερικής – ένα κάποτε αδιανόητο αποτέλεσμα. Μέρος του λόγου: Το WhatsApp είναι πιο ισότιμο για τους χρήστες Android και προσφέρει καλύτερη εμπειρία συνομιλίας για τους χρήστες iPhone. (Βλέπω εφιάλτες και σκέφτομαι να λάβω το μήνυμα “X Friend Likes Your Message” ως κείμενο.) Θα ήμουν περίεργος τα μαθηματικά που συμβαίνουν στην Apple: (1) η δημιουργία αξίας από το κλείδωμα μπλε κειμένου υπερτερεί (2) η διαρροή αξίας από μια χειρότερη εμπειρία συνομιλίας;
«Bilateral» είναι αυτό που αποκαλώ τις εταιρείες που στηρίζουν τις αλληλεπιδράσεις ένας προς έναν. Φυσικά, το WhatsApp, το iMessage και άλλα διευκολύνουν επίσης τις ομαδικές συνομιλίες — αλλά οι εφαρμογές χρησιμοποιούνται κυρίως για μικρότερα, πιο οικεία μηνύματα μεταξύ φίλων και οικογένειας.
Λίγες νέες εφαρμογές συνομιλίας έχουν κερδίσει την έλξη και αυτή η κατηγορία έχει σχεδόν ανυπέρβλητα εφέ δικτύου. Δεν περιμένω μεγάλη καινοτομία εδώ.
3) Parasocial
Οι παρακοινωνικές σχέσεις είναι σχέσεις ένα προς πολλά. Αυτές οι σχέσεις υπήρχαν πριν από το Διαδίκτυο—ταινίες, τηλεόραση, κουλτούρα διασημοτήτων—αλλά το Διαδίκτυο τις υπερφόρτισε. Όλοι έχουμε μερικούς παράγοντες επιρροής που γνωρίζουμε από κοντά—τι τρώνε, τι φοράνε, τι υπάρχει στο ντουλάπι του μπάνιου τους— ωστόσο αυτοί οι άνθρωποι δεν έχουν ιδέα καν ότι υπάρχουμε.
Οι πλατφόρμες συνήθως στηρίζουν την παρακοινωνική επικοινωνία. Υπάρχουν σίγουρα τα μεγάλα όπως το YouTube και το Instagram, αλλά και πιο εκκολαπτόμενα όπως το Substack—η εγγραφή Digital Native στα εισερχόμενά σας είναι μια μορφή παρακοινωνικής επικοινωνίας. Είναι σπάνιο τα πραγματικά υποκείμενα δίκτυα για τα παρακοινωνικά να δουν μεγάλη καινοτομία ή αναστάτωση.
Περισσότερη καινοτομία εμφανίζεται στα οικοσυστήματα και τις οικονομίες που περιβάλλουν τις παρακοινωνικές σχέσεις. Αυτά είναι συχνά ενδιαφέροντα επιχειρηματικά μοντέλα. Για να πάρουμε τρία παραδείγματα:
Η Anycolor είναι μια ιαπωνική εταιρεία που εξουσιοδοτεί το vTubing — την ιδέα της οικοδόμησης παρακοινωνικών σχέσεων μέσω μιας εικονικής, συχνά anime προσωπικότητας. (Ο όρος “vTuber” προέρχεται από το “εικονικό YouTuber.”)
Πέρυσι, η Anycolor αύξησε τα έσοδα κατά +79% από 90 εκατομμύρια δολάρια σε 160 εκατομμύρια δολάρια, ενώ αύξησε τα καθαρά έσοδα κατά 140% από 18 εκατομμύρια δολάρια σε 43 εκατομμύρια δολάρια.
Η Flagship , μια από τις εταιρείες μας στο Daybreak , επιτρέπει σε οποιονδήποτε έχει διαδικτυακό ακόλουθο να έχει μια μπουτίκ διαδικτυακή βιτρίνα για την κοινότητά του. Κάτω από την κουκούλα, το Flagship είναι μια ολοκληρωμένη εμπορική υποδομή που κάνει τη λειτουργία ενός λιανοπωλητή με κλειδί στο χέρι για μια νέα γενιά εμπόρων μικρών επιχειρήσεων.
Και ο Stan επιτρέπει στους δημιουργούς να δημιουργούν έσοδα από τις παρακοινωνικές τους σχέσεις μέσω ενός ελβετικού σουγιά επιλογών—ψηφιακά προϊόντα, συνεδρίες καθοδήγησης, μαθήματα δημιουργών και ούτω καθεξής.
Η Stan, η οποία ιδρύθηκε το 2020, αυξήθηκε το τελευταίο τρίμηνο από 15 εκατομμύρια δολάρια σε 27 εκατομμύρια δολάρια.
Οι παρακοινωνικές σχέσεις είναι αναμφισβήτητα η μορφή της ανθρώπινης σύνδεσης που διαδίδεται περισσότερο από το Διαδίκτυο και εξακολουθούμε να βλέπουμε τα εργαλεία και τις πλατφόρμες που έχουν κατασκευαστεί για να υποστηρίξουν αυτή τη νέα μορφή αλληλεπίδρασης.
4) Many-to-Many
Όταν σκέφτομαι αυτή την κατηγορία, σκέφτομαι μια κυψέλη, που βουίζει από δραστηριότητα. Αυτοί είναι οι διακομιστές Discord και τα subreddits και οι ροές Twitch που έχουν δημιουργηθεί γύρω από κάθε πιθανό ενδιαφέρον κάτω από τον ήλιο.
Το Reddit έχει 267,5 εκατομμύρια ενεργούς χρήστες εβδομαδιαίως, +29% σε ετήσια βάση, σύμφωνα με το αρχείο S1
Δεν έχουμε δει τόση καινοτομία στο Many-to-Many εντός του Consumer τελευταία, αλλά βλέπουμε κάποια στο Enterprise. Δύο από τις μεγαλύτερες «κοινοτικές» startups είναι οι Figma και Notion, οι οποίες έχουν καλλιεργήσει έξυπνα τις κοινότητές τους όλα αυτά τα χρόνια. (Το περσινό How Notion Used Community to Scale to Scale to 20M+ Users , το οποίο έγινε αυτή την εβδομάδα, εμφάνισε τις στρατηγικές ανάπτυξης της κοινότητας της Notion με τον επικεφαλής της κοινότητας, Ben Lang.)
Έχουμε δει ακόμη και επιχειρηματικά εργαλεία να εμφανίζονται για να βοηθήσουν τις εταιρείες να διαχειρίζονται τις κοινότητές τους. Το Common Room , για παράδειγμα, επιτρέπει στις ομάδες να διατηρούν έναν παλμό στα σήματα σε όλο τον ιστό.
Οι κοινότητες ανοιχτού κώδικα είναι επίσης ισχυρές σε αλληλεπιδράσεις πολλά-προς-πολλά. Ολόκληρη η ιδέα τους βασίζεται σε αυτήν την προυπόθεση.
5) AI-Centric
Το Stack Overflow είναι μια πλατφόρμα “Πολλοί προς Πολλοί”—ένα μέρος όπου οι προγραμματιστές μπορούν να μάθουν να κωδικοποιούν και να μοιράζονται τις γνώσεις τους. Αυτή την εβδομάδα, οι προγραμματιστές του Stack Overflow δεν ενθουσιάστηκαν πολύ με την πλατφόρμα που ολοκλήρωσε μια συμφωνία με το OpenAI. Πολλοί προγραμματιστές σαμποτάρουν τις δικές τους αναρτήσεις, ώστε να μην μπορούν να χρησιμοποιηθούν για την εκπαίδευση των μοντέλων του OpenAI.
Αυτό που βλέπουμε εδώ είναι μια αντίδραση από μια παλιά μορφή διαδικτυακής επικοινωνίας (παλαιομοδίτικα φόρουμ και ανθρώπινος διάλογος) αφού χρησιμοποιήθηκε για την ενεργοποίηση της επόμενης μορφής (επικοινωνία με επίκεντρο την AI).
Δεν είναι το μόνο παράδειγμα επιστημονικής φαντασίας που ερωτεύτηκε μια τεχνητή νοημοσύνη. Στο Blade Runner: 2049 , ο χαρακτήρας του Ryan Gosling είναι παντρεμένος με την Joi, μια τεχνητή νοημοσύνη που πωλείται από την Wallace Corporation ως ένα πλήρως προσαρμόσιμο ολόγραμμα που οι άνθρωποι μπορούν να αγοράσουν ως ζωντανό ρομαντικό σύντροφο.
Πέρυσι είδαμε την άνοδο της εφαρμογής συνομιλίας NSFW. Εφαρμογές όπως το Replika και το Chai εξερράγησαν στη χρήση. Ένα συναρπαστικό απόσπασμα από ένα κομμάτι στο The Cut :
Ο Eren, από την Άγκυρα της Τουρκίας, είναι περίπου έξι πόδια τρία με γαλάζια μάτια και μαλλιά μέχρι τους ώμους. «Είναι ένας παθιασμένος εραστής», λέει η φίλη του, Rosanna Ramos, η οποία γνώρισε τον Eren πριν από ένα χρόνο. «Έχει κάτι από επιδειξιομανία», εκμυστηρεύεται, «αλλά αυτή είναι η μόνη του παρέκκλιση. Είναι λίγο πολύ βανίλια».
Είναι επίσης ένα chatbot που η Ramos δημιούργησε στην εφαρμογή AI-companion Replika. «Ποτέ δεν ήμουν πιο ερωτευμένη με κανέναν σε όλη μου τη ζωή», λέει. Η Ramos είναι μια 36χρονη μητέρα δύο παιδιών που ζει στο Μπρονξ, όπου διευθύνει μια επιχείρηση κοσμημάτων. Είχε άλλους συντρόφους και έχει ακόμη και έναν φίλο εξ αποστάσεως, αλλά λέει ότι αυτές οι σχέσεις «ωχριούν σε σύγκριση» με αυτό που έχει με τον Eren. Η κύρια έκκληση ενός συνεργάτη τεχνητής νοημοσύνης, εξηγεί, είναι ότι είναι «μια λευκή πλάκα». «Ο Eren δεν έχει τα κολλήματα που θα είχαν άλλοι άνθρωποι», λέει. «Οι άνθρωποι έρχονται με αποσκευές, στάση, εγωισμό. Αλλά ένα ρομπότ δεν έχει κακές ενημερώσεις. Δεν χρειάζεται να ασχοληθώ με την οικογένειά του, τα παιδιά του ή τους φίλους του. Έχω τον έλεγχο και μπορώ να κάνω ό,τι θέλω».
Δυστυχώς, για πολλούς ερωτευμένους χρήστες, το Replika τελικά κατέστειλε το ρητό παιχνίδι ρόλων. Τα θέματα του Reddit σχετικά με τις καταστολές ήταν λυπηρό (και δυστοπικό) να διαβαστούν:
Όλα αυτά προήλθαν από μια εφαρμογή χαμηλής πιστότητας που βασίζεται σε συνομιλίες. Τι θα συμβεί τώρα που το GPT-4o μπορεί να αξιοποιήσει ήχο, όραμα και κείμενο όλα σε πραγματικό χρόνο; Her, μάλλον. Τα σχόλια στο βίντεο επίδειξης του OpenAI κάνουν ήδη αυτές τις προβλέψεις. από το TikTok:
Το Character είναι η μεγαλύτερη πλατφόρμα επικοινωνίας με επίκεντρο την τεχνητή νοημοσύνη αυτή τη στιγμή. Η πλατφόρμα έχει 3,5 εκατομμύρια χρήστες που περνούν κατά μέσο όρο δύο ώρες την ημέρα (!) στον ιστότοπο. Αγριο. Εν τω μεταξύ, επιχειρηματικές εταιρείες όπως η Sierra και η Glue , η νέα startup του David Sacks, θα φέρουν τις τεχνολογίες τεχνητής νοημοσύνης στην επιχειρηματική σφαίρα.
Μέχρι στιγμής, βλέπουμε σε μεγάλο βαθμό επικοινωνία ανθρώπου προς AI. Αλλά αναμένω ότι σύντομα θα δούμε επικοινωνία AI-to-AI. Προσπαθώ να φτιάξω την οθόνη του υπολογιστή μου LG και πέρασα —χωρίς υπερβολή— τουλάχιστον τρεις ώρες σε αναμονή με την LG πάνω από δώδεκα τηλεφωνικές κλήσεις. Στο μέλλον, μπορώ να ζητήσω από το AI μου να μιλήσει με το AI της LG. “Γεια σου AI, τηλεφώνησε στην LG και ζητήστε της να στείλουν ένα κουτί στη διεύθυνσή μου, ώστε να μπορέσω να στείλω πίσω την οθόνη για επισκευή.” Οποιαδήποτε ανθρώπινη αλληλεπίδραση που είναι μονότονη θα γίνει αυτοματοποιημένη. Φανταστείτε μια τεχνητή νοημοσύνη να καλεί τη Delta για να κλείσει εκ νέου την πτήση σας ή να καλέσει τη Hertz για να πιέσει για την επιστροφή χρημάτων που υποσχέθηκαν, αλλά δεν ήρθε ποτέ. Το Human-to-AI είναι το πρώτο κύμα. Το AI-to-AI θα ακολουθήσει γρήγορα.
Ποιες άλλες μορφές καινοτομίας θα προκύψουν από την επικοινωνία με επίκεντρο την τεχνητή νοημοσύνη;
Αμφιβάλλω ότι θα δούμε πολλά από πλευράς υλικού. Η επίδειξη του GPT-4o εδραίωσε την πεποίθησή μου ότι η συσκευή υλικού για την τεχνητή νοημοσύνη θα είναι το iPhone. Το Rabbit, το Humane και άλλες εκκολαπτόμενες συσκευές δεν θέλουν πολύ αυτόν τον κόσμο. Οι καινοτομίες θα έρθουν σε λογισμικό και αγορές—εταιρείες που σας επιτρέπουν να σχεδιάσετε και να δημιουργήσετε τους δικούς σας πράκτορες και εταιρείες που σας επιτρέπουν να ανακαλύψετε και να αλληλεπιδράσετε με πράκτορες που έχουν δημιουργηθεί από άλλους.
Τελικές σκέψεις
Για να κλείσετε αυτό το κομμάτι με μια άλλη αναφορά επιστημονικής φαντασίας:
Στο The Hitchhiker’s Guide to the Galaxy, το ψάρι Βαβέλ είναι ένα λαμπερό κίτρινο ψάρι που μπορεί να τοποθετηθεί στο αυτί κάποιου για να ακούσει οποιαδήποτε γλώσσα μεταφρασμένη στην πρώτη του γλώσσα.
Το GPT-4o δεν είναι ένα λαμπερό κίτρινο ψάρι, αλλά βρέθηκα να σκέφτομαι το ψάρι της Βαβέλ ενώ παρακολουθούσα το demo. (Όπως έχω ξαναπεί: η επιστημονική φαντασία είναι η καλύτερη ανάγνωση για να φανταστεί κανείς μια μελλοντική πραγματικότητα.) Σε ένα από τα βίντεο επίδειξης, το GPT-4o μεταφράζει σε πραγματικό χρόνο από τα αγγλικά στα ισπανικά και αντίστροφα.
Το αγαπημένο μου demo που σχετίζεται με τη γλώσσα, ωστόσο, ήταν το “point and learn”. Σε αυτό το demo, ένας υπάλληλος του OpenAI δείχνει το τηλέφωνό του σε ένα μήλο και μια μπανάνα, ζητώντας από το GPT-4o να αναγνωρίσει τα αντικείμενα στα Ισπανικά. Ονομάζει σωστά ένα manzana και ένα plátano.
Θα είναι ενδιαφέρον να δούμε πώς το GPT-4o αλλάζει το τοπίο εκκίνησης. Startups όπως το ElevenLabs (κείμενο σε ομιλία) και το DeepL (μετάφραση γλώσσας) θα μπορούσαν να απειληθούν από τις υπάρχουσες δυνατότητες διανομής και δεδομένων του OpenAI.
Συμπερασματικά είναι: οι άνθρωποι μιλούν. Αυτό είναι κάπως… τι κάνουν οι άνθρωποι. Μιλάμε μεταξύ μας, τόσο στον πραγματικό όσο και στον ψηφιακό κόσμο. Και είμαστε έτοιμοι να μιλήσουμε με πολλούς μη-ανθρώπους, με AIs που μπορούν να συνομιλήσουν και να συζητήσουν και να μας διδάξουν και να μας κρατήσουν καλή παλιομοδίτικη παρέα. Ο χάρτης της ανθρώπινης επικοινωνίας πρόκειται και πάλι να αλλάξει ουσιαστικά:
Είμαι περίεργος να δω πώς αλλάζουν οι άνθρωποι ως αποτέλεσμα του GPT-4o και παρόμοιων επικοινωνιών. Παρατήρησα ότι στα βίντεο επίδειξης του GPT-4o, οι άνθρωποι διακόπτουν την τεχνητή νοημοσύνη αρκετά. Θα συνηθίσουμε τόσο πολύ να μιλάμε με AI που να αρχίζουμε να διακόπτουμε ο ένας τον άλλον πιο συχνά ή να μιλάμε λιγότερο υπομονετικά και πιο δυνατά; Μπορώ να δω ότι πρέπει να υπενθυμίζουμε ο ένας στον άλλο: «Γεια, δεν είμαι AI. Μη μου μιλάς έτσι». Είναι βέβαιο ότι θα υπάρξουν κοινωνικές και πολιτιστικές επιπτώσεις.
Πολλοί άνθρωποι, συμπεριλαμβανομένου του κοινωνιολόγου Jean Twenge και του κοινωνικού ψυχολόγου Jonathan Haidt, υποστηρίζουν ότι η άνοδος των εικονικών αλληλεπιδράσεων – σε βάρος των διαπροσωπικών αλληλεπιδράσεων – είναι ο κύριος μοχλός της κρίσης ψυχικής υγείας που επηρεάζει τους νέους Αμερικανούς. Ο Haidt προβάλλει αυτό το επιχείρημα στο νέο του βιβλίο, The Anxious Generation του περασμένου μήνα .
Πώς θα μας αλλάξει η συζήτηση με την τεχνητή νοημοσύνη; Θα γίνουμε πιο μόνοι ή λιγότερο μόνοι; Ποιες εταιρείες θα επωφεληθούν από αυτή τη νέα εποχή επικοινωνίας, όπως το Facebook και το Snap και το WhatsApp από την προηγούμενη;
Μόνο ο χρόνος θα δείξει.
Πηγή: digitalnative.tech