Ана Риу/Висуал Цхина Гроуп/Гетти Имагес
Знак Мицрософта се види у седишту компаније 19. марта 2023. у Сијетлу, Вашингтон.
Њу Јорк
ЦНН
—
Мона Лиза сада може више од само осмеха, захваљујући новој АИ технологији из Мицрософта.
Прошле недеље, Мицрософтови истраживачи су детаљно описали нови модел вештачке интелигенције који су развили и који може да направи непокретну слику лица и аудио снимак некога ко говори и аутоматски креира видео реалистичног изгледа те особе која говори. Видео снимци — који се могу креирати од лица из стварног живота, као и од карикатура или уметничких дела — употпуњени су убедљивим синхронизацијама усана и природним покретима лица и главе.
У једном експерименталном видеу, истраживачи су показали како су анимирали Мона Лизу да рецитује комичну реп песму глумице Ен Хатавеј.
Излази из АИ модела се позивају Васа-1, и забавни и помало контрадикторни у својој стварности. Мицрософт је рекао да би се технологија могла користити за образовање, „побољшање приступачности за појединце са комуникацијским изазовима“, или можда за стварање виртуелних пратилаца за људе. Али такође је лако видети како се алатка може злоупотребити и користити за лажно представљање стварних људи.
То је брига која превазилази Мицрософт: како се појављује све више алата за креирање убедљивих слика, видео записа и аудио снимака генерисаних вештачком интелигенцијом, Стручњаци су забринути А њихова злоупотреба може довести до нових облика дезинформација. Неки такође брину да технологија може додатно пореметити креативне индустрије, од филмова до реклама.
У овом тренутку, Мицрософт је рекао да не планира да одмах објави модел ВАСА-1 јавности. Овај потез је сличан начину на који Мицрософт партнер ОпенАИ решава околне проблеме Видео алат генерисан од стране вештачке интелигенцијеСора: ОпенАИ је задиркивао Сору у фебруару, али га је до сада учинио доступним само неким професионалним корисницима и професорима сајбер безбедности у сврхе тестирања.
„Противимо се сваком понашању у циљу стварања обмањујућег или штетног садржаја за стварне људе“, рекли су истраживачи из Мицрософта у блогу. Али они су додали да компанија „нема планове да објави“ производ јавно „све док не осигурамо да се технологија користи одговорно и у складу са одговарајућим прописима“.
Истраживачи су рекли да је нови АИ модел Мајкрософта обучен на неколико видео снимака лица људи док говоре, и да је дизајниран да препозна природне покрете лица и главе, укључујући „покрет усана, израз (без усана), поглед очију и трептање, између осталог. “ друге ствари“. Резултат је реалистичнији видео када ВАСА-1 помера статичну слику.
На пример, у једном пробном видео снимку постављеном на снимак неког ко се појављује узнемирено, очигледно док игра видео игрице, лице које говори има намрштене обрве и стиснуте усне.
Алат АИ такође може бити усмерен да произведе видео у коме субјект гледа у одређеном правцу или изражава одређену емоцију.
Када пажљиво погледате, још увек постоје знаци да су видео снимци генерисани машином, као што су ретко трептање и претерани покрети обрва. Али Мицрософт је рекао да верује да његов модел „значајно надмашује“ друге сличне алате и „утире пут интеракцијама у реалном времену са реалистичним аватарима који опонашају људско понашање у разговору“.
„Комуникатор. Љубитељ музике. Сертификовани пионир сланине. Заговорник путовања. Суптилно шармантан фанатик друштвених медија.“
More Stories
Овај ГаН пуњач од 100 В је танак и склопив
Куо: Надоградња РАМ-а на 12 ГБ следеће године биће ограничена на иПхоне 17 Про Мак
Верданск се коначно враћа у Цалл оф Дути Варзоне, и фанови су срећни због тога