Είχατε σκεφτεί ποτέ ότι μπορείτε να επιλέξετε να σας διαβάσει ένα κείμενο οΤζέιμς Ντιν ή η Τζούντι Γκάρλαντ; Κι όμως, η τεχνητή νοημοσύνη μπορεί να πραγματοποιήσει αμέσως την επιθυμία σας.
Η εταιρεία ElevenLabs αγόρασε, μέσω των κληρονόμων τους, τη φωνή διάσημων καλλιτεχνών, που δεν βρίσκονται στη ζωή για να τις χρησιμοποιεί σε μια νέα εφαρμογή. Σύμφωνα με δημοσίευμα της βρετανικής Telegraph, μέσω της εφαρμογής φωνητικής αφήγησης «Εμβληματικές Φωνές», οι χρήστες έχουν τη δυνατότητα να επιλέξουν μια φωνή για να διαβάσει δυνατά οποιοδήποτε κείμενο θέλουν. Επίσης, μπορούν να γράψουν το δικό τους κείμενο, να επικολλήσουν συνδέσμους ειδησεογραφικών άρθρων ή να ανεβάσουν αρχεία PDF ή ePub.
«Είναι συναρπαστικό να βλέπουμε τη φωνή της μητέρας μας διαθέσιμη σε αμέτρητα εκατομμύρια ανθρώπων που την αγαπούν» δηλώνει στην Telegraph η βραβευμένη με Όσκαρ Λάιζα Μινέλι, κόρη της Τζούντι Γκάρλαντ και διαχειρίστρια της περιουσίας της. «Η οικογένειά μας πιστεύει ότι αυτή η κίνηση θα δημιουργήσει νέα γενιά θαυμαστών της μαμάς» λέει χαρακτηριστικά.
Εκτός από τις φωνές των Τζούντι Γκάρλαντ και Λόρενς Ολίβιε, οι χρήστες θα μπορούν να ακούσουν τις κλωνοποιημένες μέσω ΤΝ φωνές του πρόωρα χαμένου θρύλου της οθόνης Τζέιμς Ντιν, που σκοτώθηκε σε αυτοκινητιστικό ατύχημα το 1955 και του γοητευτικού σταρ Μπαρτ Ρέινολντς.
Ο Ντάστιν Μπλανκ, εκπρόσωπος της ElevenLabs, τόνισε στην Telegraph: «Η Τζούντι Γκάρλαντ, ο Τζέιμς Ντιν, ο Μπαρτ Ρέινολντς κι ο σερ Λόρενς Ολίβιε είναι μερικοί από τους πιο διάσημους ηθοποιούς στην ιστορία του κινηματογράφου. Σεβόμαστε βαθιά την κληρονομιά τους και μας τιμά, που έχουμε τις φωνές τους ως μέρος της πλατφόρμας μας».
Η εφαρμογή για iOS είναι διαθέσιμη στις ΗΠΑ, ενώ η εφαρμογή για Android έχει λίστα αναμονής. Η εφαρμογή της ElevenLabs υποστηρίζει, προς το παρόν, μόνο αγγλόφωνες φωνές, αλλά σύντομα θα προστεθούν περισσότερες από 24 γλώσσες. Υπάρχουν μόνο τέσσερις επίσημα αδειοδοτημένες φωνές διασημοτήτων, αλλά η εφαρμογή διαθέτει επίσης έναν σωρό άλλες αποπροσωποποιημένες φωνές με φαινομενικά τυχαία ονόματα όπως “Hope”, “Patrick International” και “Zeus Epic”.
Η ElevenLabs ιδρύθηκε από τον Μάτι Στανιζέβσκι από το Λονδίνο και τον πρώην μηχανικό της Google Πιοτρ Νταμπκόβσκι. Η εταιρεία αναπτύσσει τεχνολογία ΤΝ και ειδικεύεται στις μιμήσεις φωνών μέσω τέτοιων προγραμμάτων. Το λογισμικό της έχει επιφέρει κέρδη δεκάδων εκατ. δολαρίων, ενώ η αξία της εταιρείας εκτιμάται στα 920 εκ. ευρώ.
Η αξιοποίηση της φωνής μέσω ΤΝ δεν είναι το μοναδικό παράδειγμα αξιοποίησης των νέων τεχνολογιών. Την τελευταία δεκαετία, οι φιγούρες του Μάικλ Τζάκσον και του δολοφονημένου ράπερ Τούπακ Σακούρ προβλήθηκαν ως ολογράμματα σε ζωντανές παραστάσεις μετά τον θάνατό τους. Αλλά και εν ζωή καλλιτέχνες χρησιμοποιούν την ΤΝ: τα τέσσερα μέλη του σουηδικού συγκροτήματος ABBA κερδίζουν χρήματα από τα άβατάρ τους, που εμφανίζονται σε παραστάσεις και συναυλίες.
Ωστόσο, υπάρχει και η άλλη όψη του νομίσματος. Οι τεχνολογικές εξελίξεις έχουν προκαλέσει εντάσεις και διαμάχες. Η απειλή της Τεχνητής Νοημοσύνης πυροδότησε απεργία 118 ημερών στο Χόλιγουντ, η οποία κατέληξε σε μια νέα συνδικαλιστική συμφωνία– από τους ηθοποιούς, εν μέσω γενικευμένου φόβου ότι τα στούντιο θα μπορούσαν να τους αντικαταστήσουν με λογισμικό.
Τον περασμένο Μάιο, η OpenAI, δημιουργός του γνωστου ChatGPT, επικρίθηκε για την απόφασή της να δημιουργήσει μια συνθετική φωνή, που ακουγόταν σαν εκείνη της ηθοποιού Σκάρλετ Γιόχανσον για την εφαρμογή της. Γνωστή για την ερμηνεία της ως προϊόν ΤΝ στην ταινία του 2013 «Her», η Γιόχανσον ισχυρίστηκε ότι το OpenAI, πριν μιμηθεί τον ήχο της φωνής της, είχε προσπαθήσει να κλείσει συμφωνία μαζί της. Η εταιρεία αρνήθηκε τις κατηγορίες, αλλά τελικά απέσυρε το συγκεκριμένο προϊόν.
Η άνοδος των ψηφιακών κλώνων φωνής έχει προκαλέσει φόβους ότι θα μπορούσαν να χρησιμοποιηθούν για τη διάδοση παραπληροφόρησης. Τον περασμένο Ιανουάριο, ένα πλαστό clip με τη φωνή του Τζο Μπάιντεν χρησιμοποιήθηκε για την πραγματοποίηση ρομποτικών προεκλογικών κλήσεων στις ΗΠΑ. Η ElevenLabs αργότερα απαγόρευσε έναν λογαριασμό στα μέσα κοινωνικής δικτύωσης, που πιστεύεται ότι δημιούργησε το συγκεκριμένο ηχητικό.