новембар 16, 2024

Beogradska Nedelja

Најновије вести из Србије на енглеском, најновије вести о Косову на енглеском, вести о српској економији, српске пословне вести, вести о српској политици, балканске регионалне вести у …

ОпенАИ-јевом АИ моделу за репродукцију звука потребан је само узорак од 15 секунди да би функционисао

ОпенАИ-јевом АИ моделу за репродукцију звука потребан је само узорак од 15 секунди да би функционисао

ОпенАИ нуди ограничен приступ платформи за претварање текста у глас коју је развио под називом Воице Енгине, која може да креира синтетички глас на основу 15-секундног снимка нечијег гласа. Глас генерисан вештачком интелигенцијом може да чита текстуалне упите на захтев на истом језику као и говорник или на бројним другим језицима. „Ове мале примене помажу у информисању нашег приступа, заштите и размишљања о томе како се Воице Енгине може користити за веће добро у свим индустријама“, ОпенАИ рекао је у свом блог посту.

Компаније са приступом укључују едтецх компанију Аге оф Леарнинг, платформу за визуелно приповедање ХеиГен, произвођача здравственог софтвера на првој линији Димаги, креатора апликација за комуникацију са вештачком интелигенцијом Ливок и здравствени систем Лифеспан.

У овим узорцима које је објавио ОпенАИ, можете чути шта… Ера учења Технологија је изманипулисана за креирање унапред написаног аудио садржаја, као и за читање „личних одговора у реалном времену“ ученика које је написао ГПТ-4.

Прво: Референтни аудио на енглеском:

Ево три аудио клипа генерисана вештачком интелигенцијом на основу тог узорка:

ОпенАИ је рекао да је почео да развија Воице Енгине крајем 2022. године и да је технологија већ покренула унапред направљене гласове за АПИ за претварање текста у говор и функцију читања наглас у ЦхатГПТ-у. У интервјуу са ТецхЦрунцхМодел је обучен на „комбинацији лиценцираних и јавно доступних података“, рекао је Џеф Харис, члан ОпенАИ производног тима за Воице Енгине. ОпенАИ је рекао публикацији да ће модел бити доступан само за око 10 програмера.

Генерисање конверзије текста у говор помоћу вештачке интелигенције је област генеративне вештачке интелигенције која наставља да се развија. Док се већина фокусира на звукове инструмената или природне звукове, мањи број се фокусирао на генерисање звука, делимично због питања која цитира ОпенАИ. Нека имена у овом простору укључују компаније као што су Подцастле и ЕлевенЛабс, које пружају технологију и алате за клонирање АИ звука вертцаст Истражите прошле године.

READ  Џо Бајден ће објавити највеће ослобађање америчких резерви нафте икада

Према ОпенАИ-ју, његови партнери су пристали да се придржавају његових политика коришћења у којима се наводи да неће користити генерисање гласа за лажно представљање људи или организација без њиховог пристанка. Такође захтева од партнера да добију „изричит и информисани пристанак“ од изворног говорника, а не да граде начине за појединачне кориснике да креирају сопствене гласове и да открију слушаоцима да гласове генерише вештачка интелигенција. ОпенАИ је такође додао водени жиг аудио клиповима како би пратио њихово порекло и пратио како се аудио ефикасно користи.

ОпенАИ је предложио неколико корака за које верује да би могли да ограниче ризике везане за алатке попут ових, укључујући постепено укидање аутентификације засноване на гласу за приступ банковним рачунима, политике за заштиту употребе гласова људи у АИ и повећање образовања о АИ деепфакес и развој система за праћење. За садржај вештачке интелигенције.