Може ли вештачката интелигенција да им застане на патот на „местените“ тендери

во Вести

„Јавни набавки“ самото споменување на терминот често е доволно да ви се крене косата на глава. Во Македонија јавните набавки се доживуваат како „корумпирана игра“ резервирана за вистинските врски. За среќа, технологијата можеби ќе може да ги промени работите. Ѓорѓи Димески неодамна ја лансираше бета верзијата на Piksiu алатка базирана на вештачка интелигенција која ги анализира тендерите. Piksiu ги препознава коруптивните показатели и им помага на компаниите да дојдат до договорите што ги заслужуваат, или барем ќе може да дознаеме кои тендери нѐ чинат пари.

Ѓорѓи Димески е софтверски инженер и дипломец на ФИНКИ. Неодамна ја претстави апликацијата „Регистар на лекови“, а сега својот фокус го насочува кон транспарентноста и одговорното трошење на јавните пари. Со Ѓорѓи зборувавме за инспирацијата, технологијата зад Piksiu и визијата за потранспарентно општество.

Ѓорѓи Димески

Што те инспирираше да го креираш Piksiu? Зошто името „Piksiu“?

Иако системот за јавни набавки е целосно дигитализиран, податоците се сирови и треба многу рачна работа за да се извлече суштинска бизнис интелигенција од нив. Секако, ова не е толку голем проблем за огромни бизниси што можат да вложат човечки и финансиски ресурси, или корумпирани организации кои однапред се договараат за некои зделки.

Сметам дека корупцијата активно ја уназадува државата. Многу мали и средни претпријатија се обесхрабрени од аплицирање на тендери поради асоцијацијата со корупција и недостатокот на ресурси. Мојата цел е да им помогнам на овие фер компании да ги насочат своите ограничени ресурси кон вистинските тендери, да заштедат време, пари и нервози. Слични системи постојат во држави како Италија, Индонезија и Казахстан, но тие се специфични за тие пазари и повеќе служат како алатки за антикорупциски агенции, отколку за бизнис интелигенција.

Инаку, Пиксиу е митолошко битие од Кина што носи богатство, среќа и штити од зло. Мислам дека концептот одговара одлично на целта на апликацијата. Дури и логото е направено да личи на стара кинеска монета.

Велиш дека вештачка интелигенција ги анализира тендерите во позадина. Кои се тие „црвени знамиња“ (red flags) што алгоритамот најлесно ги препознава? (На пример: кратки рокови, премногу специфични технички спецификации итн.)

Во тековната бета верзија најјасно се детектираат 4 сигнали кај доделени договори:

  • Договорената цена е иста со проценетата.
  • Цената е >30% под проценката.
  • Цената е 50% под проценката.
  • Објавата е направена долго по потпишувањето.

Ризикот потоа се класифицира: 0 сигнали = низок, 1 = среден, 2+ = висок. Корисниците имаат пристап до анализа на сите склучени договори за една институција.

Има многу повеќе сигнали за ризик дефинирани од интернационални организации што имам намера да ги имплементирам, но не се дел од иницијалната бета верзија.

Освен тоа, се калкулира и HHI (Herfindahl–Hirschman index) за секоја институција, кој дава индикација за компетитивноста на пазарот (покажува дали тендерите постојано ги добиваат истите неколку фирми).

Колку беше тешко да се тренира моделот да ја препознае потенцијалната корупција во контекст на македонскиот систем за е-Набавки?

Искрено, не тренирав сопствен модел од нула. Користам веќе обучен embedding модел (text-embedding-3-small), а тежината беше во data engineering: справување со нестандардни одговори, ASP.NET Date(…) формати, парсирање на сложен dossier JSON и подесување праг за сличност за да дава релевантни совпаѓања.

Накратко, каков е технолошкиот стак? Што се врти во заднина (Backend/Frontend) и зошто ги одбра токму тие алатки?

Фронтенд апликацијата е направена со SvelteKit, бидејќи во последно време експериментирам и навистина уживам да работам со него. Бекендот е направен со .NET, што вклучува и scraping (прибирање податоци) и аналитика. Го избрав .NET бидејќи е стабилна рамка за развој на серверски апликации и имам големо искуство со неа.

За scraping не користам Selenium/Playwright, користам сопствени HTTP клиенти што директно ги повикуваат internal XHR endpoint-ите на e-nabavki со retry/backoff и робусно JSON парсирање. За справување со динамичните содржини на државните портали, процесот се потпира на  HTTP клиенти кои ги симулираат повиците до нивните интерни API-ња.

Користам и некои надворешни сервиси за моделите и за известувањата.

Тендерската документација е често обемна и напишана на специфичен административен јазик. Како Piksiu го „чита“ овој текст?

Прво од е-Набавки извлекувам структурирани податоци (предмет, CPV, категории, процедура, техничко/економски информации). Од тие полиња се гради консолидиран текст, се претвора во embedding вектор (математички приказ на текстот), па се споредува со профил-векторот на организацијата преку cosine similarity.

Тендерските документи ги чувам како HTML во базата, што ми дозволува лесно да ги презентирам на корисниците, а воедно HTML форматот е релативно добро разбирлив и за машините.

Како Piksiu ги собира податоците? Дали се потпирате исклучиво на отворени податоци од Бирото за јавни набавки или користите и други извори?

Системот ги прибира податоците автоматски на секои неколку часа. Засега користам исклучиво податоци од електронскиот систем за јавни набавки. Има и дополнителни сетови на податоци од data.gov.mk кои имаат огромен потенцијал и планирам да ги интегрирам во иднина за уште попрецизна аналитика.

Велиш дека Piksiu им помага на фирмите да не трошат време на „нефер огласи“. Како изгледа процесот за еден нов корисник – колку време му е потребно за да почне да добива релевантни нотификации?

Со регистрацијата, корисникот може да се придружи на постоечка организација или да креира нова. Доколку креира нова организација, треба да внесе опис, колку е подетален описот, толку подобро системот ќе ја поврзе со релевантни тендери. Уште следниот ден, системот ја анализира организацијата и ги мапира сите соодветни постоечки и нови тендери. Потоа, секое утро системот испраќа имејл известувања со релевантни тендери од изминатите 24 часа. Корисниците исто така имаат детален преглед на сите тендери директно во конзолата.

Бидејќи сме во бета фаза, јас рачно го одобрувам пристапот (ги надградувам во платен пакет) за новите организации. Корисниците можат да побараат бесплатен пристап преку контакт мејлот, а јас секојдневно го надгледувам системот за брзо да ги активирам.

Бета верзијата е моментално бесплатна. Кој е твојот план за одржливост на проектот во иднина?

Главниот фокус во моментов ми е да соберам реален фидбек, да видам како се користи апликацијата и која е вистинската вредност што корисниците ја добиваат. Откако ќе потврдам дека Пиксиу навистина решава проблем и имаме задоволни корисници, ќе направам анализа за монетизација.

Идејата е евентуално да преминам на модел со месечна претплата. Секако, за првите корисници кои ми помогнаа со тестирањето, планирам да го продолжам бесплатниот пристап како знак на благодарност.

Стани премиум член и доби пристап до сите содржини, специјален попуст на над 2.200 производи во ИТ маркет, верификуван профил и можност за огласување на ИТ Огласник. Плус ќе го поддржиш медиумот кој го градиме цели 16 години!

basic

членство

42 ден./мес

зачлени се

1337

членство

125 ден./мес

зачлени се
* плаќањето е на годишно ниво

Доколку веќе имаш премиум членство, најави се тука.

Добивај известувања
Извести ме за
guest
0 Коментари
Најнови
Најстари Со највеќе гласови
Inline Feedbacks
View all comments