Вештачката интелигенција (ВИ) брзо напредува, но нашето разбирање за нејзиното функционирање не го следи овој напредок. Дарио Амодеи, извршниот директор на Anthropic, неодамна изјави дека никој навистина не знае како функционира вештачката интелигенција. Оваа изјава од лидер во оваа област ја нагласува парадоксалната реалност: иако вештачката интелигенција станува сè помоќна и важен дел во нашите животи, нејзините основни механизми остануваат во голема мера нејасни. Амодеи нагласува дека разбирањето на овие системи е од клучно значење бидејќи тие ќе ја обликуваат иднината на човештвото.
„Кога генеративен систем со вештачка интелигенција прави нешто, како на пример сумира финансиски документ, немаме поим, на специфично или прецизно ниво, зошто ги прави изборите што ги прави – зошто избира одредени зборови наместо други или зошто повремено прави грешка и покрај тоа што обично е точен“, вели Амодеи.
Признанието на Амодеи за ова „незнаење“ е значајно и го истакнува големиот предизвик со кој се соочува заедницата за вештачка интелигенција. Фактот дека Anthropic е основан делумно поради безбедносните грижи во врска со развојот на вештачката интелигенција во други организации ја нагласува сериозноста на ова прашање.
Веројатно за најголем дел од луѓето признанието на Амодеи е изненадување. Дури и врвните експерти кои работат на моделите не знаат како моделите работат.
Луѓето надвор од оваа област честопати се изненадени и вознемирени кога ќе дознаат дека не разбираме како функционираат нашите сопствени креации со вештачка интелигенција. И имаат право да бидат загрижени: овој недостаток на разбирање во суштина е без преседан во историјата на технологијата.
Амодеи објави есеј во кој ги изнесе плановите за создавање „магнетна резонанса за вештачката интелигенција“ во следните десет години. Овој амбициозен проект има за цел да ги демистифицира внатрешните механизми на ВИ, надминувајќи го сегашното разбирање на „црна кутија“. Тој пишува дека кога генеративен систем за вештачка интелигенција прави нешто, ние немаме детална идеја зошто ги прави тие избори. Овој недостаток на разбирање е незабележан во историјата на технологијата и дава право на загриженост.
Современите достигнувања во вештачката интелигенција се овозможени од моделите за длабоко учење, кои се карактеризираат со сложени архитектури со милиони, па дури и милијарди параметри. Оваа сложеност го отежнува следењето и интерпретирањето на протокот на информации. Дури и дизајнерите на овие модели тешко можат со сигурност да го следат протокот на информации. Процесот на учење вклучува прилагодување на овие параметри во високо-димензионален простор. Ова го отежнува визуелизирањето на внатрешните врски што ги развива моделот. Амодеи го споредува ова со одгледување растение. Може да ги поставиме основните услови, но изгледот на растението е непредвидлив. Сложеноста на невронските мрежи и огромниот број на параметри создаваат бариера за разбирливост, бидејќи влијанието на секој параметар е испреплетено со другите. За разлика од традиционалниот софтвер, моделите за длабоко учење учат преку оптимизација во огромен параметарски простор. Ова резултира со дистрибуирана претстава на знаење што не може да се сведе на едноставни правила.
Некои од произлезените карактеристики од тренингот се неочекуван развој на способности во сложените AI системи кои не биле експлицитно програмирани. На пример способноста на големите јазични модели да вршат задачи како превод и сумирање, не се програмирани. Системите се тренирани единствени за предвидување на следниот збор. Непредвидливоста на овие способности дополнително ја отежнува интерпретацијата на функционирањето на вештачката интелигенција. Ако таа може да развие нови вештини без експлицитно програмирање, тешко е да се предвидат нејзините способности и да се разберат основните механизми.
Современата вештачка интелигенција заснована на длабоко учење се разликува од поранешната симболичка вештачка интелигенција. Класичниот модел се заснова на експлицитно програмирани правила. Симболичката ВИ беше транспарентна бидејќи процесот на донесување одлуки можеше да се следи до дефинираните правила. Моделите за длабоко учење се здобиваат со знаење имплицитно од податоци. Иако длабокото учење постигна голем успех, тој доаѓа по цена на интерпрeтaцијата. „Знаењето“ во моделот за длабоко учење е честопати дистрибуирано и апстрактно, што го отежнува разбирањето во споредба со експлицитните правила.
Проблемот со „црна кутија“ се однесува на неможноста да се разберат внатрешните механизми на напредните AI системи. Оваа непроѕирност поставува различни предизвици во здравството, финансиите и автономните возила. Во овие сектори е важно да се разбере зошто се донесени одредени одлуки. Покрај ова се отежнува откривањето и ублажувањето на пристрасностите во податоците за обука. Дебагирањето и надградбата на овие модели е комплексно ако нивните внатрешни процеси не се разбирливи. Користењето на AI системи со „црна кутија“ отвора интересни етички и регулаторни прашања.
Со иницијативи како „магнетна резонанца (MRI) за вештачката интелигенција“ Anthropic посветува значително внимание на решавање на проблемот со интерпретирањето. Пошироката област на интерпретабилна вештачка интелигенција (XAI) развива техники и алатки за обезбедување увид во процесите на донесување одлуки на AI моделите, вклучувајќи механизми за внимание и бодирање на важноста на карактеристиките. Зголеменото внимание и ресурси посветени на интерпретабилноста ја покажуваат потребата да се разбере како функционираат системите за да се обезбеди нивниот одговорен развој.
Моменталниот недостаток на целосно разбирање за напредната ВИ се должи на сложеноста на архитектурата за длабоко учење, појавата на развивање на неочекувани способности, разликите во претставувањето на знаењето во споредба со симболичката ВИ и проблемот со „црна кутија“. Разбирањето на начинот на кој вештачката интелигенција ги носи одлуките е неопходен за одговорно работење со неа во иднина.







