Вештачката интелигенција се почесто наоѓа реална примена во решавање на секојдневните задачи… Гласовни асистенти како Alexa и Siri; Amazon со предвидувањата кои производи да ни ги покаже; Google Translate; Netflix со персонализирањето на содржини, термостатот Nest со регулирање на температурата се само дел од актуелните примери.
Дефинитивно во иднина ќе гледаме се повеќе стартапи кои ќе наоѓаат најразлични начини да направат вистинска револуција во одредени вертикали и индустрии користејќи ML и AI. Еден ваков потенцијален стартап е и DeepJudge. Тие работат на вештачка интелигенција која им помага на адвокати да работат подобро и поефикасно. DeepJudge е швајцарски стартап кој излезе од универзитетот ЕТХ Цирих. A eден од ко-основачите на DeepJudge е Паулина Грнарова, скопјанка и поранешен најдобар студент на ФЕИТ.
Кажи ни нешто повеќе за себе во кратки црти… која е Паулина?
По потекло сум од Скопје, каде и што дипломирав на ФЕИТ како најдобар студент на генерацијата. Добитник сум и на инженерскиот прстен – награда што ја доделува претседателот на Република Македонија. Основите стекнати на ФЕИТ ми овозможија да го продолжам моето образование и кариера во странство. Веќе 10 години живеам во Швајцарија каде што завршив магистерски студии на факултетот за Компјутерска Техника на ЕПФ Лозана, а потоа и докторски студии на универзитетот ЕТХ Цирих во областа на Вештачка Интелигенција. Мојата пасија е токму вештачка интелигенција и како истата може да се искористи да го смени статус квото во различни области. Моментално сум коосновач и извршен директор на DeepJudge, компанија лоцирана во Цирих што има за цел да ја револуционизира областа на правото односно судската и адвокатската професија.
За своите достигнувања како претприемач сум прогласена за digital shaper на Швајцарија, сум на листата на Forbes 30 under 30 и сум во топ-3 жени иноватори на Швајцарија.
Што е DeepJudge?
DeepJudge е спин-оф од универзитетот ЕТХ Цирих основан од четворица доктори на науки од областа на вештачка интелигенција. Нашата мисија е да ги ослободиме адвокатите и сите оние што работат со легислативни документи од разни макотрпни мануелни задачи при процесирањето на документи.
Истражувањата покажуваат дека секој адвокат поминува најмалку 40% од своето време токму на такви мануелни задачи, кои најмногу вклучуваат читање на голем број документи за да пронајдат и процесираат релевантни податоци. Овој процес не само што е многу неефикасен и бавен, туку и дополнително води кон грешки или носење на одлуки без да се има комплетна слика. Токму тука доаѓа до израз нашиот продукт како решение. Продуктот DeepJudge е базиран на вештачка интелигенција која ја разбира содржината на документите и може комплетно да ги преземе мануелните и повторливи задачи. Начинот на кој што го правиме тоа е така што DeepJudge ги потенцира потребните информации во документите или прикажува само релевантни параграфи и документи, овозможувајќи му на корисникот да се фокусира само на нив. Оваа технологија е уникатна и е развиена од нас и води кон значителна компетитивна предност на нашите клиенти. Со оваа технологија имаме освоено голем број на награди, вклучувајќи ја и престижната Swiss FinTech award за најдобар стартап на годината, победници сме на натпреварите помеѓу стартапи на VentureKick и Venture, и сме финансиски поддржани од InnoBooster, Bridge како и Swiss National Science Foundation и владата на Швајцарија. Дополнително сме дел од Google for startups, Microsoft for startups и Amazon AWS.
Покрај моќната технологија што нуди семантичко разбирање на документи, DeepJudge ја има предноста што има корени во еден од светските најдобри универзитети и е поддржан од угледни инвеститори.
Како ги споивте вештачката интелигенција и правото? Како всушност вештачката интелигенција може да го подобри правото?
Правото е многу интересна област затоа што вклучува читање и процесирање на многу текст. На пример, во due diligence адвокатите се под временски притисок, и за краток временски период треба да ги пронајдат сите потенцијални ризици при купување на некоја компанија. Документите често надминуваат преку 1000 договори и разни други податоци, така што е јасно дека читање на сè е многу споро, па некогаш дури и практично невозможно во дадениот рок, а можноста да се пропушти некој ризик е голема. Слично е и во други области на правото, каде што се пребарува низ голем број податоци за да се најдат релевантни судски случаи, претходни слични документи или корисни закони. Јас и моите ко-основачи имаме големо искуство во работење со вештачка интелигенција за разбирање и процесирање текст – како во академијата така и во индустријата. Во последните неколку години во оваа област бевме сведоци на еден тип на револуција каде што моделите за текст станаа многу добри, па за некои задачи дури и значајно подобри од луѓето. Со тоа се отвори можност за решавање на проблеми кои претходно не беа возможни. Така ние ги споивме правото и вештачката интелигенција – со тоа што идентификувавме голем проблем за кој што ние имаме решение и добивме многу позитивни реакции за истото од инвеститори и самите корисници.
Прочитав дека си била заинтересирана за математика уште пред да започнеш да одиш во училиште… Дали математичкиот пристап помага кон изнаоѓање на решение на „правни равенки“?
Математичкиот пристап кон сите проблеми е нешто што е вградено во мене и му го должам на татко ми затоа што од таму ми потекнува љубовта кон математиката и компјутерските науки. :) Мислам дека математичкиот и инженерскиот пристап ми помагаат доста. Интересно е дека правната наука и покрај тоа што не е базирана на математика има доста сличности затоа што логиката е клучна и за двете области.
DeepJudge се тренира на претходни судски случаи, можете ли да споделите како се одвива овој процес? Од каде ги црпите податоците?
Класично при тренирање на модели од вештачка интелигенција, потребни се лабелирани податоци. Легалниот домен е голем предизвик затоа што нема големи колекции од вакви лабелирани податоци со оглед на тоа дека документите се генерално сензитивни.
Скорашниот напредок на моделите со вештачка интелигенција, особено кога станува збор за разбирање на текст, главно се должи на deep learning како и нови методи кои што можат да го пре-тренираат моделот со нелабелирани податоци. Таквите техники ги користиме и ние. Најпрво го тренираме моделот врз различни документи што содржат текст. По овој чекор моделот разбира природен јазик. Во следниот чекор моделот е трениран врз сите легислативни документи кои што се достапни (претходни судски случаи и разни останати документи) каде што моделот дополнително учи да препознава легислативни коцепти. Во последниот чекор го прилагодуваме моделот со тренирање на податоците од корисниците и на помали лабелирани колекции податоци кои што ги поседуваме. Во овој чекор моделот се специјализира на решавање на конкретен тип на проблем (на пример анонимизација кој што е изграден врз разбирањето на текст и правни концепти).
Како се справувате со различна лeгислатива по држава? Дали е потребно повторно тренирање за различни држави кои немаат идентични закони?
За некои од алатките кои што ги нудиме важен е само јазикот, но за некои (на пример нашиот пребарувач на закони и судски случаи) процесот е различен во зависност од легислативата по држава. За првата категорија, Швајцарија, каде што започнавме е доста интересна затоа што има 4 официјални јазици и плус се користи aнглиски, така да нашите продукти од самиот почеток се повеќејазични.
За вториот тип, за секоја нова држава што ја таргетираме, го тренираме моделот на соодветни локални документи. Процедурата е иста, само податоците се менуваат. Кога започнавме, имавме на ум дека сакаме да се шириме глобално, така да процесот на тренирање за секоја нова држава е ист.
Беше дел од истражувачите кои работеа на Google Assistant… Што работеше таму и колку тоа ти помогна кога започнав да го развиваш DeepJudge?
Неколку години бев дел од Google. Во Google Assistant работев на сумаризација на текст. Конкретно, кога корисник ќе постави прашање на Google Assistant, во позадина Google Search наоѓа веб страни или документи кои што се релевантни и ги рангира. Понатаму ние го детектираме параграфот од најдобриот резултат кој што го содржи одговорот на прашањето и го сумаризираме во пократок одговор за да може концизно да е приложен на корисникот. Со оглед на тоа дека Assistant се користи најчесто од телефон (како Сири), за одговорот да звучи добро во говорна форма, треба да е фокусиран само на клучните делови.
Сумаризација на текст е доста тежок проблем. Моделот базиран на вештачка интелигенција треба да ја разбере семантички содржината на текстот за да може да одлучи како да го парафразира одговорот или да отфрли некои непотребни зборови. Дополнително, бев дел и од Google Brain каде што работев со техники од deep learning за процесирање на слики и текст.
Сето тоа ми помогна многу за DeepJudge. Во текот на моите докторски студии се фокусирав на истражување на подобрување на моделите од вештачка интелигенција за разбирање и процесирање на текст и бев главен асистент за предавање на тие предмети на магистерски-докторски студии. Во Google имав можност да го искусам сето тоа надвор од академска перспектива, односно да ги имплементирам тие модели во продукција. Таа комбинација на истражување и пракса за модели за семантичко разбирање на текст е токму тоа што ни треба за развивање на алатки за процесирање на легислативни документи.
Работите со неколку швајцарски правни компании на финализирање на DeepJudge, колку сте далеку од готов производ? Како ќе се финансира платформата во иднина?
Моментално нашите алатки се користат од најголемите Швајцарски адвокатски куќи и некои поголеми компании за нивните правни оддели. Со помош на фидбекот што го добиваме од нив, во наредните шест месеци планираме да го доусовршиме продуктот и понатаму да се прошириме низ повеќе земји. DeepJudge е финансиран од познати ангел инвеститори од Европската сцена (вклучувајќи сопственици на познати адвокатски куќи, директори на банки итн.). Дополнително е секако и наградите кои што ги имаме освоено (кои се околу 1М Швајцарски франци) како и заработката од клиентите. Во наредната година исто така планираме уште една рунда на инвестиции.
Ако добро разбравме, DeepJudge автоматски ги анонимизира податоците од релевантните случаи; Колку е важна заштитата на чувствителните податоци?
Токму така. Многу често адвокатите треба да анонимизираат документи – на пример кога споделуваат чувствителни податоци со некоја странка. Ова е особено изразено сега со GDPR во Европа и законите за заштита на лични податоци. Анонимизарање документи е доста спор процес, затоа што треба да се отстранат сите лични директни или индиректни идентификатори, како и останати делови од текстот кои што можат на некој начин да откријат кој е клиентот. Моментално, анонимизација се прави главно мануелно што е многу споро и скапо. Со оглед на тоа дека е лесно да се заборави нешто на тој начин а казните се огромни, адвокатските куќи имаат неколку нивоа на проверки и препрочитување на текстот.
Како што споменав, DeepJudge работи така што ги потенцира битните делови во легислативни документи во зависност од задачата. Во овој случај, DeepJudge ги потенцира сите сензитивни делови во документите и овозможува анонимизација на колекции документи со неколку клика.
Започна како програмер, а сега си извршен директор на DeepJudge, ти недостасува ли пишувањето на код?
Понекогаш ми недостасува пишувањето код, но навистина сум среќна со мојата моментална улога. Сеуште сум активно вклучена во одлуките за како ги тренираме нашите модели, што го задоволува мојот истражувачки и технички апетит за сега.
Кој беше најголемиот предизвик како CEO?
Со оглед на тоа дека нашиот тим се состои од експерти во вештачка интелигенција со големо истражувачко искуство, лесно е да различни проблеми ни личат доста примамливи затоа што се интересни и знаеме дека можеме да ги решиме. Зборуваме со различни компании и адвокатски куќи кои што ни споделуваат свои искуства и проблеми кои што произлегуваат во нивната секојдневна работа. Еден од моите предизвици како CEO е да не размислувам како научник, туку бизнис ориентирано и да ја насочам компанијата кон решавање на проблеми кои што водат кон развивање на продукт што може да се продава и скалира.
Дали во блиска иднина може да очекуваме судските одлуки да ги носи AI наместо човек? Колку е ова издржливо сценарио?
Тоа е активна тема на дискусија моментално. Судски одлуки донесени од ВИ би можело да се очекува да бидат пофер и да не се под влијание на различни фактори како пол, националност или различни карактеристики на судиите. Постојат компании кои користат ВИ за предвидување на колкава е шансата да го освојат случајот доколку одат на суд, меѓутоа не верувам наскоро да комплетната одлука биде донесена само од ВИ. Сметам дека некои работи не е лесно да бидат целосно заменети со машина. Во овој случај пореалистична комбинација е човек плус машина, односно секој судија да добие предлог од машината заедно со интерпретација на одлуката (на пример преку слични претходни одлуки), но крајната одлука сепак да е донесена од човек.
Кои се негативните страни на AI кои ви претставуваат пречка во моментот?
Има разни предизвици кога се продава продукт базиран на ВИ. Еден аспект што е универзален без разлика на индустријата е да се објасни дека ВИ не е магија и дека може да направи грешки. Сепак, комбинацијата на човек асистиран од вештачка интелигенција е добитна комбинација каде што процесот е значително оптимизиран и целокупните грешки се значително намалени.
Можеше ли DeepJudge да биде развиен во Македонија? Според тебе кои се пречките што претприемачите во Македонија ретко се решаваат да работат на свој производ?
Во Швајцарија стартап екосистемот е многу развиен. Прво, има многу голема поддршка од самите универзитети доколку стартапот произлегува од нив како во нашиот случај. Второ, има многу начини за финансирање. Добри и амбициозни идеи бараат финансиски инвестиции за да бидат реализирани, а потоа и скалирани. За тоа е потребен добар екосистем на владини грантови, инвеститори, VC фондови и конекции помеѓу разни основачи на компании. Често се кажува дека “It takes a village to build a business” и комплетно се согласувам со тоа. Мислам дека ваквиот екосистем недостасува во Македонија.