Aleksas “Leksi” Boganas balss pirms pagājušās vasaras bija dzīvespriecīga
Viņai patika dziedāt Teiloras Sviftas un Zaka Braiena balādes mašīnā. Viņa smējās visu laiku – pat ganot nepaklausīgus pirmsskolas vecuma bērnus vai debatējot par politiku ar draugiem pie dārza ugunskura. Vidusskolā viņa bija soprāns korī.
Tad šī balss pazuda
Ārsti augustā izņēma dzīvībai bīstamu audzēju, kas atradās pie viņas smadzeņu aizmugures. Kad elpošanas caurule tika izņemta mēnesi vēlāk, Boganai bija grūtības norīt un viņa varēja tikai ar pūlēm pateikt “sveiki” saviem vecākiem. Mēnešiem ilga rehabilitācija palīdzēja viņas atveseļošanā, bet viņas runa joprojām ir traucēta. Draugi, svešinieki un pat viņas pašas ģimenes locekļi cīnās saprast, ko viņa cenšas viņiem pateikt.
Aprīlī 21 gadu vecajai meitenei atgriezās viņas vecā balss
Ne īstā, bet mākslīgā intelekta radīta balss kopija, ko viņa var izsaukt no telefona lietotnes. Apmācīta no 15 sekunžu ilgas laika kapsulas ar viņas pusaudžu balsi – kas iegūta no ēdiena gatavošanas demonstrācijas video, ko viņa ierakstīja vidusskolas projektam – viņas sintētiskā, bet pārsteidzoši reālistiski skanošā mākslīgā intelekta balss tagad var teikt gandrīz jebko, ko viņa vēlas.
Viņa ieraksta dažus vārdus vai teikumus savā telefonā un lietotne uzreiz to skaļi izlasa.
“Sveiki, vai es varētu lūdzu saņemt lielu ledus brūnā cukura auzu pienu sakratītu espresso,” teica Boganas mākslīgā intelekta balss, kad viņa turēja telefonu pie savas mašīnas loga Starbucks braukšanas caurlaidē.
Eksperti ir brīdinājuši
ka strauji uzlabojoties mākslīgā intelekta balss kopēšanas tehnoloģijai, tas var pastiprināt telefonu krāpniecību, traucēt demokrātiskas vēlēšanas un pārkāpt cilvēku – dzīvo vai mirušo – cieņu, kuri nekad nav piekrituši, lai viņu balss tiktu atkārtoti radīta, lai teiktu lietas, ko viņi nekad nav teikuši.
Tas ir izmantots, lai ražotu viltus zvanus Jaunhempšīras vēlētājiem, imitējot prezidentu Džo Baidenu. Merilendā iestādes nesen apsūdzēja vidusskolas sporta direktoru par mākslīgā intelekta izmantošanu, lai radītu viltus audio klipu par skolas direktora rasistiskiem komentāriem.
Bet Bogana un ārstu komanda Rodailendas Lifespan slimnīcu grupā uzskata, ka ir atraduši lietojumu, kas attaisno riskus
Bogana ir viena no pirmajiem cilvēkiem – vienīgais ar savu stāvokli – kas ir spējuši atjaunot zaudēto balsi ar OpenAI jauno Voice Engine. Daži citi mākslīgā intelekta pakalpojumu sniedzēji, piemēram, start-up uzņēmums ElevenLabs, ir testējuši līdzīgu tehnoloģiju cilvēkiem ar runas traucējumiem un zaudējumiem – ieskaitot advokāti, kas tagad izmanto savu balss kopiju tiesas zālē.
“Mēs ceram, ka Leksi būs pionieris, kamēr tehnoloģija attīstās,” sacīja Dr. Rohaid Ali, neiroķirurģijas rezidents Braunas Universitātes medicīnas skolā un Rodailendas slimnīcā. Miljoniem cilvēku ar invalidizējošiem insultiem, rīkles vēzi vai neirodeģeneratīvajām slimībām varētu gūt labumu, viņš teica.
“Mums jābūt apzinīgiem par riskiem, bet mums nevajadzētu aizmirst par pacientu un sociālo labumu,” sacīja Dr. Fatima Mirza, vēl viens rezidents, kas strādā pie pilotprojekta. “Mums izdevās palīdzēt Leksijai atgūt viņas patieso balsi un viņa var runāt tādos veidos, kas ir vispatiesākie viņai pašai.”
Mirza un Ali, kuri ir precējušies, piesaistīja ChatGPT ražotāja OpenAI uzmanību ar savu iepriekšējo pētījumu projektu Lifespan, izmantojot mākslīgā intelekta tērzēšanas robotu, lai vienkāršotu medicīniskos piekrišanas veidlapas pacientiem. Sanfrancisko kompānija sazinājās, meklējot šogad agrāk soli solim medicīniskos pielietojumus savam jaunajam mākslīgā intelekta balss ģeneratoram.
Bogana joprojām lēni atveseļojas no operācijas. Slimība sākās pagājušajā vasarā ar galvassāpēm, neskaidru redzi un nokarūsu seju, kas satrauca ārstus Hasbro bērnu slimnīcā Providensē. Viņi atklāja asinsvadu audzēju golfa bumbiņas lielumā, kas spieda uz viņas smadzeņu kauliņa un bija sajaukts asinsvados un galvas nervos.
“Tas bija cīņa, lai iegūtu kontroli pār asiņošanu un izņemtu audzēju,” sacīja pediatriskais neiroķirurgs Dr. Konstantina Svokos.
Desmit stundu ilgais operācijas laiks kopā ar audzēja atrašanās vietu un smagumu bojāja Boganas mēles muskuļus un balss saites, traucējot viņas spēju ēst un runāt, sacīja Svokos.
“Tas bija gandrīz kā daļa no manas identitātes tika nozagta, kad es zaudēju savu balsi,” sacīja Bogana.
Barošanas caurule tika izņemta šogad. Runas terapija turpinās, ļaujot viņai runāt saprotami klusajā telpā, bet bez pazīmēm, ka viņa atgūs pilnu savas dabiskās balsis skaidrību.
“Kaut kādā brīdī es sāku aizmirst, kā es skanēju,” sacīja Bogana. “Es esmu pieradusi pie tā, kā es skanu tagad.”
Kad mazliet piezvanija pie ģimenes miteklis Providenses priekšpilsētaj North Smithfield, viņa to pabīdija uz savu māti, lai ņemtu zvanus. Viņai likās, ka apgrūtina savus draugus katru reizi, kad viņi devas uz trokšņainu restorānu. Viņas tēvs, kuram ir dzirdes zudums, cīnijas saprast viņu.
Atgriežoties slimnīcā, ārsti meklēja pilotpacientu eksperimentam ar OpenAI tehnoloģiju
“Pirmais cilvēks, kas nesaistijies prata Dr. Svokos prats bija Leksi,” sacija Ali. “Mums sazinajamies ar Leksi lai redzetu vai viņai tas interesetu nezinot kada bus vinjas atbilde. Viņa bija gatava to izmeginat un redzet ka tas stradas.”
Boganai bija jatiekat atpakal dažus gadus lai atrastu piemerotu savas balsis ierakstu lai “apmacitu” AI sistemu ka vinja runaja. Tas bija video kur vinja skaidroja ka pagatavot makaronu salatus.
Vinas arsti apzinati baroja AI sistemu tikai ar 15 sekunzu klipu. Citi video dalas bija nepilnigi sakara ar gatavosanas skanam. Tas ari bija viss kas OpenAI vajadzeja – uzlabojums salidzinajuma ar ieprieksejo tehnologiju kas prasa daudz garakus paraugus.
Vini ari zinaja ka sanemt ko noderigu no 15 sekundem var but vitali jebkuram nakamajam pacientam kam nav nevienas savas balsis paliekas internete. Ispats var but isais balss pasts atstata radiniekam.
Kad vinji to izmeginaja pirmo reizi visi bija parsteigti par balss kopijas kvalitati. Gadigie defekti – nepareizi izrunats vards vai trukstosa intonacija – lielakoties bija neuzmanami. Aprili arsti aprikoja Boganu ar pielagotu telefonu lietotni ko vinja varena izmantot tikai pati.
“Es tik emocionala katru reizi kad dzirdu vinas balsi,” sacija vinjas mate Pamela Bogana asaras acis.
“Man liekas ka tas ir lieliski ka es varu atkal dzirdet to skanu,” piebilda Leksi Bogana sakot ka tas palidzejis “pacelt manu parliecibu lidz tam kur tas bija pirms visa notikuma.”
Tagad vinja izmanto lietotni apmeram 40 reizes diena un sutit atsauksmes kuras vinja ceres palidzes nakamajiem pacientiem. Viena no vinjas pirmajiem eksperimentiem bija runat ar berniem pirmsskolas vecuma kur vinja strada ka macibu asistente. Vinja ierakstija “ha ha ha ha” gaidot robotisku atbildi. Parsteiguma tas skaneja ka vinjas vecais smiekli.
Vinjas izmantota to Target un Marshall lai pajautatu kur atrast preces. Tas palidzejis vinai atkal sazinaties ar vinjas teti. Un tas padarits vieglaku vinai pasutit edienus.
Boganas arsti ir sakusi kopet citu gatavu Rodailendas pacientu balsis un cer vest tehnologiju slimnicam visa pasaule. OpenAI sacija ka tas rupigi paplasina Voice Engine lietojumu kas vel nav publiski pieejams.
Daudzi mazaki AI start-up jau pardod balss kopijosanas pakalpojumus izklaides studijam vai padara tos plašak pieejamus. Lielaka dala balss generacijas pakalpojumu sniedzeji saka ka tie aizliedz personifikaciju vai izmantosanu nepareiza veida bet tie dazadi ievieš savus lietojuma noteikumus.
“Mes gribam parliecinaties ka ikviens kura balss tiek izmantota pakalpojuma dod piekrisanu pastavigi,” sacija Dzeffs Hariss OpenAI produkta vaditajs. “Mes gribam parliecinaties ka tas netiek izmantots politiskos kontekstos. Tadel mes esam pieņemusi loti ierobezotu pieeju kam mes dodam tehnologiju.”
Hariss sacija ka OpenAI nakamais solis ietver drošas “balss autentifikacijas” riku izstradi lai lietotaji var replicet tikai savu balsi. Tas var but “ierobezots pacientiem ka Leksi kam bija strauji zaudeta runas spejas,” vinjs sacija. “Tadel mes domajam ka mes vajadzesim augsta uzticibas attiecibas it ipasi ar medicinas sniedzejiem lai dot nedaudz vairak neierobezotu pieeju tehnologijai.”
Bogana ir iespaidojusi savus arstus ar vinjas fokusu domat par to ka tehnologija var palidzet citiem ar lidzigiem vai smagakiem runas traucijumiem.
“Dala no tas ko vinja ir darijusi visa so procesa laika ir domat par veidiem ka pielabot un mainit so,” sacija Mirza. “Vinja ir liels iedvesmas avots mums.”
Kamer pagaidam vinjai jabojajas ar telefonu lai dabut balss dzini runat Bogana iedomajas par AI balss dzini kas uzlabo vecakos risinajumus runas atveselosanai – piemeram robotiski skanošo elektrolaringeks vai balss protesi – sapludinot to ar cilveka ipasu vai tulkojot vardus realaja laika.
Vinai nav tik skaidrs kas notiks kad vinja kluvs vecaka un vinjas AI balss joprojam skanes ka pusaudze. Varbut tehnologija var “novecinat” vinjas AI balsi vinja sacija.
Pagaidam “pat ja es vel neatguvu pilnigu savu balsi man ir kaut kas kas man palidz atrast manu balsi velreiz,” vinja sacija.