Šī lietotne ļaus jums dziļi viltot savu balsi Podcast apraides nolūkos

Descript Overdub var sintezēt jaunus vārdus vai frāzes, pamatojoties uz lietotāja balss skaņu. Uzņēmums saka, ka ļaunprātīgi izmantot ir praktiski neiespējami.

Šī lietotne ļaus jums dziļi viltot savu balsi Podcast apraides nolūkos

Tagad, kad džins ir izgājis no pudeles, izmantojot dziļas viltības - AI paņēmienu, kas ģenerē viltus personas video vai audio - Apraksts to izmanto labdabīgiem mērķiem.

Podcast apraides ražošanas sākums ir uzsācis privātu beta testu funkcijai Overdub, kas var izmantot personas balss audio paraugus, lai radītu jaunus vārdus vai frāzes. Descript meklē podkastus, youtuberus, audiogrāmatu veidotājus un citus audio profesionāļus, lai palīdzētu pārbaudīt jauno funkciju, kurai vajadzētu ietaupīt laiku un naudu pārrakstīšanai.

Ideja šeit patiešām ir glābt cilvēkus no ceļojuma atpakaļ uz ierakstu kabīni, kas ir tik sāpīgi, ja veicat jebkāda veida ierakstus, saka Desrew izpilddirektors Endrjū Meisons. Tas vienkārši patiešām paver cilvēkiem iespēju, veicot lidojumu, veikt redakcionālus labojumus, kas kopumā izklausās patiešām labi un lietojami.



Ierakstiet audio

Meisons, kurš līdzdibināja Groupon pirms vairāk nekā desmit gadiem, 2017. gadā izveidoja aprakstu Descript kā spinoff no sava iepriekšējā starta, audio tūres lietotnes ar nosaukumu Detour. Audio ekskursiju veidošanas procesā Detour izveidoja savus rīkus, kas redaktoriem ļautu mainīt audio, rediģējot runas teksta stenogrammu. Piemēram, izdzēsiet norakstā klaiņojošu vārdu vai sajauktu teikumu, un tas pazudīs arī no audio ieraksta. Tas izrādījās diezgan noderīgs aplāžu rediģēšanai, kas tagad ir galvenā lietojumprogramma Descript Windows un Mac programmatūrai.

Overdub ir paredzēts, lai risinātu lielāko trūkstošo daļu Descript tekstapstrādes programmā audio koncepcijai, ļaujot lietotājiem ģenerēt jaunus vārdus papildus tikai esošo dzēšanai vai jaukšanai. Demonstrācijā Meisons man parādīja, kā viņš var ierakstīt balss aktrises esošo atšifrējumu, lai sintezētu jaunu audio, kas atbilst viņas balsij. Aprobežojoties ar vienu vārdu vai īsu frāzi, tas izklausījās gluži kā īstais.

Tas ne tikai ģenerēs runu, bet arī darīs to tādā veidā, ka tā mēģina izveidot tonālu savienojumu starp audio, kas bija pirms un pēc, saka Meisons.

Aiz Overdub funkcijas atrodas vēl viens starta uzņēmums ar nosaukumu Lyrebird, kuru Descript tagad iegūst par neatklātu summu un rēķiniem kā tās AI izpētes komanda. Līdz šim Lyrebird savā vietnē ļāva cilvēkiem klonēt savu balsi, izmantojot rīku. Process ietvēra virkni nejaušu teikumu, lai Lyrebird varētu apmācīt savu AI modeli, un tas aizņēma tikai dažas minūtes. Šis rīks tiks izslēgts, jo Lyrebird salocīs savas audio sintēzes funkcijas aprakstā.

Jūs varat iedomāties virkni veidu, kā šādu tehnoloģiju varētu izmantot ļauniem mērķiem. Bet Meisons saka, ka Lyrebird iestatīšanas process pēc būtības neļauj sliktiem aktieriem viltot kāda cita balsi. Tā kā lietotājam ir jāizrunā nejauši teikumi, un šiem izteikumiem ir jāsakrīt ar stenogrammu, lai Lyrebird tos apstrādātu, ikvienam, kurš tiek ņemts izlasē, gandrīz noteikti būtu jāzina, ka viņš piedalās.

Tas ir patiešām vienkāršs sīkums, bet, ja jūs par to padomājat, patiesībā neko nevarat darīt, lai to apietu, viņš saka.

Darbs progresā

Lai gan tas rada iespaidīgu demonstrāciju, Descript runas ģenerēšanai joprojām ir ierobežojumi.

Pirmkārt, ar īpašu balss aktrises atļauju Descript izmantoja stundas audio, lai apmācītu AI modeli demonstrēšanai. Meisons saka, ka Descript joprojām izdomā, cik daudz audio tas būs nepieciešams Overdub, taču atzīst, ka tas būs vairāk nekā nelielas minūtes, kuras Lyrebird pieprasīja savā demonstrācijas vietnē.

Tas izskaidro, kāpēc Descript sākas ar privātu beta versiju audio profesionāļiem: ja labam runas modelim nepieciešama maratona sesija, kurā jāizrunā nejauši balss paraugi, tas būs lietderīgi tikai tiem cilvēkiem, kuri regulāri pavada stundas ierakstu studijā.

[Ekrānuzņēmums: apraksts]

Klienti, uz kuriem mēs mērķējam, ir cilvēki, kuriem ir savas aplādes vai kuri veic daudz balss audio darbu, un audio sliekšņa sasniegšana viņus neuztrauc, saka Meisons.

Turklāt pat ar stundu audio paraugu Descript runas sintēze kļūst pamanāmāka, ja tai jāsastāda vairāk nekā daži vārdi. Demonstrācijā es dzirdēju, piemēram, klona audio stostījās vārda lelles vidū, kad tā bija daļa no garākas sintezētas frāzes. Pagaidām tehnoloģija nebūs noderīga, lai radītu pilnus teikumus, nemaz nerunājot par veselām aplādēm.

[Ekrānuzņēmums: apraksts]

Mēs sagaidām, ka tas laika gaitā mainīsies, taču izmantošanas gadījums, uz kuru mēs šobrīd koncentrējamies, ir šīs mazākās redakcionālās korekcijas, kas ir ļoti izplatītas, saka Meisons.

Aprakstā nav teikts, cik ilgi Overdub tiks saglabāts privāts vai cik plaši tiks veikts beta tests. Bet īstermiņā tas varētu kalpot citam mērķim, pievēršot uzmanību programmatūrai kopumā. Privātā beta versija Overdub ir daļa no lielāka Descript atjauninājuma visiem lietotājiem, pievienojot vairāku celiņu rediģēšanu un iespēju izveidot un rediģēt grupu ierakstīšanas sesijas internetā. Tehniski tā ir 3.0 versija, taču Meisons to vairāk uzskata par Descript pirmo lielo izlaidumu.

Tā ir pirmā reize, kad jūs varēsit izveidot podcast zupu ar riekstiem Descript, viņš saka.

Lai turpinātu izmantot lietotni, Descript ir savācis $ 15 miljonus no Andreessen Horowitz un Redpoint, un tā strādā pie jaunām rediģēšanas funkcijām, piemēram, pēcapstrādes efektiem un publicēšanas ar vienu klikšķi aplāžu platformās.

Šādi papildinājumi, iespējams, nav tik tehniski iespaidīgi kā Overdub, taču tie ir tikpat svarīgi Podcast apraides veidošanā kā pareizrakstības pārbaude tekstapstrādē. Salīdzinot ar savas balss klonēšanu ar AI, tās varētu būt arī nedaudz mazāk satraucošas.