Светските трендови покажуваат сѐ поголем интерес за аудио книги и поткасти. Во регионот еден од предводниците на ова поле е платформата Boksy. Со над 50 000 наслови, кои вклучуваат аудио, е-книги и подкасти за сите возрасти, Boksy успешно соработува со над 230 издавачи и автори од целиот свет, нудејќи богата и разновидна содржина. Boksy нуди наслови на македонски, англиски, шведски и албански јазик, а понудата континуирано се збогатува со нови книги.
За најновите достигнувања на Boksy, особено во однос на користењето на вештачката интелигенција за производство на аудио содржини разговаравме со Ивана Каралиева-Петреска, извршна директорка на Boksy. Ивана ни откри како AI технологијата драстично ја промени брзината и трошоците за креирање аудио книги, а истовремено го задржува „застрашувачки добриот“ квалитет.

Можете ли подетално да објасните како се правеа аудио книгите порано во споредба со сега, и кои конкретни технолошки достигнувања ја овозможија оваа револуционерна брзина и „застрашувачки добар“ квалитет?“
Уште од лансирањето на Бокси во нашата држава се залагаме за поттикнување на пазарот, особено издавачите, да соработуваме во понудата на аудиокниги, имајќи предвид дека глобалните трендови покажуваат доминација на аудиокнигите и подкастите во светот на книгата и дигиталната содржина. Во потрага по начин како да ја понудиме оваа услуга, спроведовме детално пазарно истражување за да создадеме квалитетна и одржлива услуга. Иако традиционалното студиско снимање со актери или автори нуди висок квалитет, процесот за создавање аудиокнига од 6–8 часа е прескап и премногу бавен. Покрај значителните финансиски трошоци, важно е да се истакне и времето потребно за продукција на ваков начин. Затоа развивме модел кој овозможува генерирање аудиокниги со висок квалитет до 70% побрзо и со приближно исто толкава заштеда на финансиски средства во споредба со традиционалниот пристап.
Освен брзината, на кои други начини вештачката интелигенција го подобрува процесот на креирање аудио книги во Boksy?
Сѐ што работиме во врска со аудио книгите има човечки фактор. До сега ниту еднаш не сме имале генерирање на книга со ВИ без да има нашиот тим работа на аудио записите. Во врска со брзината на постигнување на правиот тон, боја, емоција и слично зависи од два фактори: јазикот и текстот во книгата.
На пример, хрватскиот јазик е доста развиен и многу брзо го постигнуваме правиот ефект со соодветниот глас. Потоа следи обработката на аудио книгата со звуци и финални корекции некаде каде што има потреба. Исто важи и за англиски, босански, бугарски и српски јазик. Македонскиот е секој ден сѐ подобар и таму се наближуваме до многу квалитетен изговор и различни гласови за интерпретација на вакви записи.
Можете ли да раскажете за процесот и предизвиците поврзани со локализирањето на аудио содржини користејќи вештачка интелигенција, особено за јазиците во регионот?
Предизвиците во врска со оваа услуга на Бокси се одвиваше многу месеци наназад, со континуиран „trial and error“ на неколку наврати. Откако ги решивме основните елементи на овој модел, потоа полесно ги решававме следните предизвици како на пример: генерирање на нови гласови соодветни за содржината и тоналитетот што треба да се креира во аудио формат. И тука, како и секаде до сега, тимот играше клучна улога во крајниот резултат. Имено, тоа е и нашиот диференцијален фактор од останатите алатки на пазарот.
На Boksy има книги на македонски, албански, српски, англиски и шведски јазик, планирате ли аудио верзии за сите? Дали имате во план проширување на листата на поддржани јазици во иднина?
Многу би сакале да ги имаме сите книги во двете верзии и како аудио книга и како е-книга. Но, целиот тој процес се базира на партнерство и заеднички проект со издавачите. Тука многу круцијална улога имаат правата за дигитална дистрибуција бидејќи за креирање на една книга во аудио верзија, добиваме права од авторот или издавачот. Ние напорно работиме за да обезбедиме што повеќе аудио книги на сите наведени јазици и секако, да претставиме нови јазици и да лансираме на нови пазари во иднина.

Каде ја гледате улогата на Boksy за аудио-книгите во регионот?
Бокси цели да биде лидер во регионот, особено кога станува збор за дигитални содржини, дигитализација на издавачи и дигитална дистрибуција на истите. Паралелно, поддршка и услуги за маркетинг и адвертајзинг индустријата кадешто локализацијата на содржината е неопходен составен дел.
Според вашето искуство, каков е интересот за слушање аудио книги во регионот? Дали корисниците сè уште ги претпочитаат традиционалните книги или забележувате промена во навиките?
Постојат различни сегменти на корисници и во Бокси и во регионот. Корисникот денес има многу поголеми очекувања од претходно па така, еден корисник, очекува книгата да ја добие во секаков облик, па да одлучи како ќе ја конзумира. Некои корисници тежнеат кон е книгите, други повеќе кон аудио книгите а трети ги сакаат и двете варијанти. Во Бокси, засега 66% од корисниците претпочитаат е-книги и дел од истите повремено одбираат аудиокнига или поткаст.
Трендовите во регионот покажуваат значителен раст од година во година и очекувањата се дека во иднина аудио книгите ќе го заземат пазарот дури со 50%.
Регионот дефинитивно има потреба да ги следи глобалните трендови во поглед на потрошувачката на аудио книги, но сите сме многу далеку од целта. Најнапред понудата на аудио книги е многу мала, и затоа, ние сме тука да ги поддржиме сите кои сакаат што побрзо да се доближат до оваа за нас понова понуда за краните корисници. Ова е генерализиран пристап и секоја чест на исклучоците.
Ако споредиме, во Шведска, приближно 63% од сите купени книги биле ауди книги. Постојат над 2 Милиони аудио книги таму.
Во нашиот регион, има многу мала и засега незначителна застапеност на аудио книгите. Креирањето на аудио книгите значи и одржување на нашиот јазик во форма на звук, што за сите држави тука е од огромно значење и зачувување на јазиците.
Кои се некои од етичките размислувања и потенцијалните предизвици поврзани со прифаќањето на гласовите генерирани со вештачка интелигенција? Како во Boksy се справувате со нив?
Некои од етичките размислувања и предизвици поврзани со прифаќањето на гласовите генерирани со вештачка интелигенција вклучуваат прашања за транспарентност, авторски права, одобрување од оригиналните гласови, и можност за злоупотреба (на пример, во лажни реклами или дезинформации). Во Boksy внимателно се справуваме со овие предизвици преку јасно означување кога се користи генериран глас, обезбедување лиценцирани и одобрени модели на гласови, и воведување човечка проверка за контрола на квалитет и етичка употреба. Дополнително, соработуваме со лингвисти и инженери за да обезбедиме културно чувствителна и точна локализација, минимизирајќи ризик од погрешно претставување или навредливи содржини. Нашата цел е одговорно користење на AI технологијата за подобрување на пристапноста и квалитетот на содржината без компромиси на етичките стандарди.

Како гледате на еволуцијата на соработката помеѓу човечките гласовни актери и гласовите генерирани со вештачка интелигенција во индустријата?
Ние ја гледаме иднината на соработката помеѓу човечките гласовни актери и AI-генерираните гласови како комплементарна и еволутивна, а не конкурентска. AI-гласовите овозможуваат побрзо и поекономично производство на аудиокниги и реклами, особено за помалите пазари или за содржини со ограничен буџет. Сепак, уникатната емоција, интерпретација и креативна длабочина на човечките актери остануваат незаменливи за висококвалитетни, уметнички наративи и премиум проекти. Во Boksy веруваме дека иднината ќе се базира на хибридни модели, каде AI ќе им помогне на актерите да произведуваат побрзо, да експериментираат со повеќе стилови и да локализираат содржина на повеќе јазици. Наша цел е да изградиме алатки кои го зајакнуваат човечкиот талент, не да го заменат.







