ОпенАИ-јевом АИ моделу за репродукцију звука потребан је само узорак од 15 секунди да би функционисао

ОпенАИ нуди ограничен приступ платформи за претварање текста у глас коју је развио под називом Воице Енгине, која може да креира синтетички глас на основу 15-секундног снимка нечијег гласа. Глас генерисан вештачком интелигенцијом може да чита текстуалне упите на захтев на истом језику као и говорник или на бројним другим језицима. „Ове мале примене помажу у информисању нашег приступа, заштите и размишљања о томе како се Воице Енгине може користити за веће добро у свим индустријама“, ОпенАИ рекао је у свом блог посту.

Компаније са приступом укључују едтецх компанију Аге оф Леарнинг, платформу за визуелно приповедање ХеиГен, произвођача здравственог софтвера на првој линији Димаги, креатора апликација за комуникацију са вештачком интелигенцијом Ливок и здравствени систем Лифеспан.

У овим узорцима које је објавио ОпенАИ, можете чути шта… Ера учења Технологија је изманипулисана за креирање унапред написаног аудио садржаја, као и за читање „личних одговора у реалном времену“ ученика које је написао ГПТ-4.

Прво: Референтни аудио на енглеском:

Ево три аудио клипа генерисана вештачком интелигенцијом на основу тог узорка:

ОпенАИ је рекао да је почео да развија Воице Енгине крајем 2022. године и да је технологија већ покренула унапред направљене гласове за АПИ за претварање текста у говор и функцију читања наглас у ЦхатГПТ-у. У интервјуу са ТецхЦрунцхМодел је обучен на „комбинацији лиценцираних и јавно доступних података“, рекао је Џеф Харис, члан ОпенАИ производног тима за Воице Енгине. ОпенАИ је рекао публикацији да ће модел бити доступан само за око 10 програмера.

Генерисање конверзије текста у говор помоћу вештачке интелигенције је област генеративне вештачке интелигенције која наставља да се развија. Док се већина фокусира на звукове инструмената или природне звукове, мањи број се фокусирао на генерисање звука, делимично због питања која цитира ОпенАИ. Нека имена у овом простору укључују компаније као што су Подцастле и ЕлевенЛабс, које пружају технологију и алате за клонирање АИ звука вертцаст Истражите прошле године.

Према ОпенАИ-ју, његови партнери су пристали да се придржавају његових политика коришћења у којима се наводи да неће користити генерисање гласа за лажно представљање људи или организација без њиховог пристанка. Такође захтева од партнера да добију „изричит и информисани пристанак“ од изворног говорника, а не да граде начине за појединачне кориснике да креирају сопствене гласове и да открију слушаоцима да гласове генерише вештачка интелигенција. ОпенАИ је такође додао водени жиг аудио клиповима како би пратио њихово порекло и пратио како се аудио ефикасно користи.

ОпенАИ је предложио неколико корака за које верује да би могли да ограниче ризике везане за алатке попут ових, укључујући постепено укидање аутентификације засноване на гласу за приступ банковним рачунима, политике за заштиту употребе гласова људи у АИ и повећање образовања о АИ деепфакес и развој система за праћење. За садржај вештачке интелигенције.

Trilby Miltone

„Љубитељ пива. Предан научник поп културе. Нинџа кафе. Зли љубитељ зомбија. Организатор.“

ОпенАИ-јевом АИ моделу за репродукцију звука потребан је само узорак од 15 секунди да би функционисао

ЈПМорган очекује да ће Фед ове године смањити референтну каматну стопу за 100 базних поена

Акције гиганта чипова за вештачку интелигенцију Нвидиа су опали упркос рекордној продаји од 30 милијарди долара

Иелп тужи Гоогле због кршења антимонополских прописа

У Националном центру „Русија“ отворен је Међународни симпозијум „Креирајући будућност“

САД доминирале у Абу Дабију победивши Србију

Најновије вести о Баиесиан суперјахти Микеа Линцха: Могулова жена ‘није хтела да напусти чамац без своје породице’ док се посада суочава са кривичном истрагом

Предвиђања резултата 1. недеље НФЛ-а 2024, данашњи избори: Стручњак даје тачне резултате за свих 16 утакмица

Оставите одговор Одустани од одговора

More Stories