Македонски истражувачи од ФИНКИ за миг го вратија Блаже Конески на подиумот на МАНУ

Во чест на 100-годишнината од раѓањето на академик проф. д-р Блаже Конески, група истражувачи од Факултет за информатички науки и компјутерско инженерство – ФИНКИ во состав: Стојанчо Туџарски (со кој муабетевме на темава пред некој месец) , Ташко Павлов, Јована Добрева, Мартин Мишев, Костадин Мишев,  Моника Симјаноска и Димитар Трајанов во соработка со претседателот на МАНУ академик проф. д-р Љупчо Коцарев направија нов историски чекор, кој несомнено револуционерно ги пробива стереотипите на машините.

Тимот од ФИНКИ

Тие ги споија технологијата и уметноста и го оживеаја повторно ликот на Блаже Конески. Со помош на способностите на најновите достигнувања во областа на Длабоко Учење, овој тим од истражувачи успеа да направи интелигентни „машини“ кои креираат нови стихови во духот на Блаже Конески и уште повеќе, овозможуваат тие стихови да бидат рецитирани со емоција преку глас кој претставува клон на оригиналниот глас на овој кодификатор на македонскиот литературен јазик.  

Ова дело беше достојно презентирано од страна на претседателот на Македонската академија на науките и уметностите (МАНУ), академик проф. д-р Љупчо Коцарев, за време на собирот кој се одржа на 19-ти декември по повод 100-годишнината од раѓањето на првиот претседател на МАНУ и една од најзначајните фигури на македонскиот 20-ти век.

За тоа како функционира истражувачите од ФИНКИ успеаа да го рекреираат гласот на Блаже Коневски и на кој начин работи оваа технологија, побаравме појаснување од тимот…

Како дојде до идејата токму на овој начин да ја одбележите 100-годишнината од раѓањето на Блаже Конески?

Пред сѐ мора да искажеме огромна благодарност до академик проф. д-р Љупчо Коцарев кој низ целиот процес имаше доверба во нас и во крајниот исход – претставување на достигнувањата на технологијата пред група уметници, филолози, поети, прозаисти, есеисти, историчари, критичари и професори. Воедно поддршката која МАНУ ни ја даде беше неопходна потпора на истражувањето кое немаше да стане реалност без архивските аудио материјали и дела преку кои нашите „машини“ го научија делото на Блаже Конески.

Идејата за градење на нов дигитален споменик на Блаже Конески е токму од неговиот симбол за вечност кога станува збор за суштествувањето на македонскиот јазик и творештво. Неговата “Тишина” низ годините е сѐ поголема, но тој никогаш не заспа. Затоа што секое негово поменување, секое рецитирање и толкување на неговите песни е будилник од вечниот сон. Дури и сонот не е само темнина, тој за нас е едно ѕвездено небо каде секоја ѕвезда е едно негово дело и во морето на стиховите тој сигурно е Посејдон. Нашиот бог на вечноста не можеме никако на друг начин да го удостоиме, освен со едно бесконечно дело. Дело кое е спој на технологијата и уметноста и со кое духот на Конески повторно ќе ја пополни тишината.

Како е возможно една „машина“ да пишува или да говори со гласот на човекот?

Веќе подолго време научниците создаваат јазични модели, коишто, во суштина, претставуваат статистички модели. Јазичните модели го моделираат и го прикажуваат реалниот јазик во поедноставена форма (реалниот јазик е посложен и понепредвидлив), а истовремено тие можат да послужат за создавање паралелен свет, дигитален близнак на јазикот, којшто служи не само за негова анализа и толкување, туку може и да го предвидува неговиот развој. Денешните јазични модели се создаваат со статистичко учење на голем број постоечки текстови, написи, пишувања. Еден претставник на овие авторегресивни невронски мрежи е GPT-2 кој претставува втора генерација на „генеративен претходно обучен трансформатор“, кој е обучен на дури 425 милијарди зборови. Овие модели користат статистика, машинско учење и вештачка интелигенција за да дознаат кои зборови имаат тенденција да се наоѓаат во текстот по одредено множество зборови и, притоа, собираат информации за значењето на зборовите и синтаксата на јазикот. Ете, сега навестивме што се крие позади интелигентната „машина“ која е способна да генерира нови стихови врз основа на претходните дела на Блаже Конески.

Што се однесува на говорот, тоа е една сосем друга проблематика која е цел на поразлични длабоки невронски мрежи од оние кои ги објаснивме. Предизвикот да се научи една мрежа да зборува со гласот и дикцијата на Блаже Конески беше огромен, пред се заради ограничениот број на аудио записи. Велиме ограничен, бидејќи за креирање на синтетизатор на говор кој е во целост природен, потребни се неколку десетици часови говор проследен со транскрипција. Сепак, тимот беше подготвен за овој предизвик со тоа што минатата година го објави и првиот синтетизатор на говор Македонка кој е базиран на 20-тина часа говор. Постоечката технологија, имплементирана во Македонка од страна на нашиот тим беше надградена со можност за клонирање на глас за кои има мали ресурси и истата беше аплицирана за да се клонира гласот на Блаже Конески со користење на само 15-тина минути постоечки аудио рецитали. Продуктот беше високо-квалитетна машина за синтеза на говор со гласот на Блаже Конески.

Дали овие модели реално можат да претставуваат конкуренција на писателите?

Одговорот е секако дека не може да претставуваат никаква конкуренција. Како што напоменавме погоре, овие модели со помош на статистички и математички функционалности доаѓаат до текстови кои имаат смисла. Но, дефинитивно тие не се креативни, туку учат од претходно искуство. Креативноста е карактеристика која сеуште само човекот ја поседува. Исто така мора да нагласиме дека како што писателите/поетите нивните дела ги базираат на некое искуство или некоја преживеана болка, радост, љубов или тага, така и јазичниот модел на GPT-2 своите дела ги создава врз база на претходното искуство, т.е., историјата која ја преживеал низ текстовите кои ги учел. Сепак, GPT-2 нема можност да создава врз основа на „фантазија“, па затоа велиме дека моделот не е креативен.

Но, колку моделот е добар е прашање на кое ние како информатичари и инженери не би се осмелиле да дадеме конкретен одговор. Ние можеме да зборуваме за технологијата и начинот на кој моделот работи, но за неговите перформанси во креирањето на новите стихови на Блаже Конески сакавме да слушнеме и мислење од македонист. Голема благодарност до Професорката по македонски јазик во гимназијата „Корчагин“, Татјана Алексиќ која одвои време да ги прочита и анализира новосоздадените песни од нашиот GPT-2 модел. Не би сакале да ја парафразираме па затоа само ќе го оставиме нејзиниот коментар во форма на цитат:

„Многу добро направено, техниката е чудо! Селектирани зборови препознатливи за Конески, компјутерот како да го препознава духот на авторот, неговите изрази, метафори, кованици, слеаноста со природата, душата, зборот, човекот, традицијата, бреговите на Небрегово… битието на Македонецот преку стиховите на Конески. Сите како да се автентично негови, потсетуваат на неговите песни во форма, содржина, тематска рамка, симболиката, градба на стихот, архитектурата на зборот, акустиката на рефренот… Ова како да е компјутерска реанимација на поезијата на Конески!“

Дали може да очекуваме уште многу дигитализации и каде може да ги слушнеме песните во изведба на интелигентните машини?

Се надеваме дека да. Ние сме секогаш среќни и подготвени за нови соработки и предизвици, особено кога истите имаат историско значење за македонскиот јазик. Во продолжение ќе ве оставиме да ја слушнете новата песна од GPT-2 јазичниот модел – песната „Ноќеска”, во изведба на втората машина која го синтетизира гласот на Блаже Конески:

…како и до новосинтетизираниот и досега непостоечки рецитал на „Калемегдан“.

Калемегдан“:

Велите дека особено ви е драго кога развивате интелигентни системи за македонскиот јазик, а споменавте дека сте изработиле и синтетизатор на македонски говор. Дали може да ни откриете нешто повеќе за вашите проекти?

Секако. Развојот на првиот налик човек синтетизатор на говор беше почеток на една серија од интелигентни модели за македонски јазик. Предизвикот започна со Македонка, пред сѐ заради фактот што идејата за таква креација се провлекуваше во изминатите 30 години, но сепак технологијата не беше созреана до степен да може да се реализира еден ваков интелигентен модел. Оттука, се начна прашањето „што е со спротивниот процес, како од говор автоматски да се испише текстот“?

Креирање на првиот говор-во-текст систем претставуваше уште поголем предизвик од претходниот текст-во-говор систем. Ако во првиот случај имаме единствен говорник, во вториот случај имаме 2 милиони потенцијални говорници и нашиот систем треба да ги препознае СИТЕ, без разлика на пол, дијалект, интонација, акцент и слични карактеристики. Така, се зафативме сериозно со проблематиката да прибереме што е можно повеќе податоци од различни говорници. Ја користиме оваа прилика да упатиме благодарност и до Министерството за култура кое поддржа една наша иницијатива за зачувување на културното наследство и тоа, дигитализација на македонски дијалекти. Севкупната наша упорност и искуство вроди и овој пат со плод, па гордо можеме да објавиме дека го креиравме и првиот систем за автоматска транскрипција на македонски говор, т.н., интелигентен говор-во-текст преведувач за македонски јазик. Уште поголемо е задоволството дека овие системи се употребуваат во реалност и отворија нови прозорци, пред сѐ за лицата

Kоментари на статија (0)Што се дискутира на ИТ форум...

Нема одговори сè уште.

Loading new replies...

Тие ги споија технологијата и уметноста и го оживеаја повторно ликот на Блаже Конески. Со помош на способностите на најновите достигнувања во областа на Длабоко Учење, овој тим од истражувачи успеа да направи интелигентни „машини“ кои креираат нови стихови во духот на Блаже Конески и уште повеќе, овозможуваат тие стихови да бидат рецитирани со емоција преку глас кој претставува клон на оригиналниот глас на овој кодификатор на македонскиот литературен јазик.

Ова дело беше достојно презентирано од страна на претседателот на Македонската академија на науките и уметностите (МАНУ), академик проф. д-р Љупчо Коцарев, за време на собирот кој се одржа на 19-ти декември по повод 100-годишнината од раѓањето на првиот претседател на МАНУ и една од најзначајните фигури на македонскиот 20-ти век.

View: https://www.youtube.com/watch?v=CkPxyjOeONI

За тоа како функционира истражувачите од ФИНКИ успеаа да го рекреираат гласот на Блаже Коневски и на кој начин работи оваа технологија, побаравме појаснување од тимот…

Повеќе @ Македонски истражувачи од ФИНКИ за миг го вратија Блаже Конески на подиумот на МАНУ ⋆ IT.mk

одговори 5 лајкови

Добивај известувања
Извести ме за
guest
0 Коментари
Inline Feedbacks
View all comments
види ги сите огласи на kariera.it.mk