Половина од одговорите на ChatGPT на програмерски прашања се погрешни ⋆ IT.mk

Повеќе од една година главните вести од технологијата се поврзани со генеративната вештачка интелигенција (generative AI). Големите јазични модели револуционеризираат и од корен менуваат различни сектори.

Речиси сите модели доаѓаат со некаква можност за помош при кодирање која треба да им помогне на програмерите. Една од жртвите на новите функционалности на вештачката интелигенција е популарниот форум Stack Overflow. Форумот во октомври 2023 година, отпушти 28 отсто од своите вработени. Stack Overflow како главна причина ја наведе потрагата по поголема профитабилност. Платформата се обиде да побара надомест од компаниите кои ги користат податоците за тренинг на своите модели, па дури објавија дека работат на своја вештачка интелигенција Overflow AI.

Половина од прашањата добиваат погрешни одговори

Во теорија додавањето на вештачка интелигенција за пронаоѓање на програмерски одговори звучи супер. За жал во пракса не е така. На годинешната конференција Computer-Human Interaction, истражувачите од Универзитетот Пердју споделија податоци од своето истражување според кое над половина од резултатите кои ги генерира ChatGPT се погрешни.

Истражувачите на ChatGPT му поставиле 517 прашања од Stack Overflow, и од вештачката интелигенција добиле 52 отсто погрешни одговори. Дополнително, дури 77 отсто од одговорите биле непотребно долги. Најголем дел од корисниците препознаваат грешки и поквалитетни одговори, но значителен дел не можат да ги препознаат грешките во кодот. Еден од главните проблеми со генерирање на одговори за програмерски прашањa со ChatGPT е заеднички со било кои одговори: „Понекогаш платформата презентира глупости кои звучат прилично веројатно“.

Нашата анализа покажa дека 52% од одговорите на ChatGPT содржат неточни информации, а 77% се предолги. Сепак, 35 отсто од учесниците во студијата на корисници, поради нивната сеопфатност и добро артикулиран јазичен стил ги претпочитаат одговорите на ChatGPT. Истовремено, не забележуваат дека одговорите на ChatGPT имаат погрешни информации во 39% од случаите.

Во својата анализа истражувачите откриле дека голема улога во квалитетот и точноста на одговорите на ChatGPT играат популарноста на прашањата и датирањето. За постарите и популарни програмерски прашања ChatGPT генерира поточни одговори.

Што се однесува до генерираните примери, во огромен дел, дури 98 отсто имаат точна синтакса, но во 48 отсто од случаите содржат грешна логика или погрешно користење на API.

Грешките се поопасни за понеискусните

Веројатно очекувано, ризикот од користење на ChatGPT е значително поголем кога го користат помалку искусни програмери. Дополнително користењето на алатки кои можат наеднаш да додаваат цели делови на код е и поризично.

За компаниите кои развиваат код со помош на вештачка интелигенција ова значи дека ќе биде потребна сериозна проверка на кодот и негово тестирање. Toa е една од потенцијалните употреби на ChatGPT – користење во процесот на тестирање. Во оваа фаза додавањето на вештачката интелигенција за тестирање ќе може значително да го забрза целиот процес, сметаат истражувачите од Пердју.

Ако има некоја причина за оптимизам, таа е дека учесниците во истражувањето сепак претпочитаат код напишан од луѓе.

Учесниците претпочитаат одговори од луѓе од Stack Overflow во споредба со ChatGPT (во 65, 18% од случаите). Учесниците во истражувањето велат дека одговорите од луѓе се поточни, попрецизни и покорисни.

Дејан Соколоски

Дејан Соколоски е автор на IT.mk. Долгогодишен гејмер кого го интересираат обновливите извори на енергија, автоматизација, хардвер, фан е на стрипови, алтернативна уметност и Ливерпул.

Сите написи од овој автор

Cookie	Duration	Description
itmkhascookiez-checkbox-analytics	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Аналитика".
itmkhazcookies-checkbox-others	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Други".
itmkhazcookiez-checkbox-functional	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Функционални".
itmkhazcookiez-checkbox-necessary	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Потребни".
itmkhazcookiez-checkbox-performance	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност. Колачето се користи за да се зачува изборот на корисникот за колачиња во категорија "Перформанси".
viewed_itmk_cookiez_policy	11 months	Ова колаче е поставено од плагинот за контрола на прифаќање/одбивање на политиката за приватност и не чува лични податоци.

Кошничка

Кошничката е празна

Половина од одговорите на ChatGPT на програмерски прашања се погрешни

Половина од прашањата добиваат погрешни одговори

Грешките се поопасни за понеискусните

Дејан Соколоски

Половина од прашањата добиваат погрешни одговори

Грешките се поопасни за понеискусните

Дејан Соколоски

Поврзани статии

w00t w00t