Користењето на податоци за тренирањето на вештачка интелигенција од почетоците беше проблематично прашање. Google е казнет во Франција поради користењето на содржина заштитена со авторски права без дозвола од издавачите. Содржината е користена за тренирање на вештачка интелигенција. Француската Управа за заштита на конкуренција „Autorité de la Concurrence“ ја казни компанијата со 250 милиони евра.
Казната е поради тоа што Google собирал податоци од веб-сајтовите (scrapping) за да ја тренира својата вештачка интелигенција Bard/Gemini. Компанијата не само што не побарала дозвола од издавачите, туку и не ги известила дека ги обработува овие податоци. Ова секако не е добра идеја, уште повеќе, бидејќи Google веќе со години е во конфликт со француските издавачи.
Содржината за која станува збор се кратките снипети кои Google ги објавува како дел од вестите во пребарувањето. Причината за казната е лоша комуникација, а Google не ги известил издавачите дека ќе ги користи снипетите за тренинг на Bard Gemini.
Одлуката за казната е своевидно продолжување на судскиот спор кој Google го имаше со издавачите во Франција во 2019 година. Associated Press заедно со повеќе медиуми го обвини Google дека користењето на делови од написите во резултатите од пребарувањето го намалува бројот на посети, и со тоа влијае на нивната заработка. Резултат на овој спор на крај беше договор во кој Google се обврза дека во следните 5 години ќе плаќа за содржината на France-Presse. Autorité de la Concurrence му изрече и казна на Google во висина од 500 милиони долари. Дополнително како дел од обврските кои Google ги презема беше олеснување на процесот на наградување на издавачите.
Целиот процес беше малку покомплициран отколку што изгледа. Првата идеја на Google беше да ги повлече Google News од Франција. Сепак во овој период Google News веќе имаше доминантна положба на пазарот. Управата за заштита на конкуренцијата сметаше дека нивното повлекување ќе направи уште поголема штета. Па ова, воопшто не дојде предвид. Google на крај прифати да ја плати казната, иако со напомена дека е превисока, потсети TechCrunch.
„Google е првата и единствена платформа која потпиша договори за лиценцирање и сродни права со 280 издавачи на француски печат – договорите покриваат над 450 публикации –и плаќа неколку десетици милиони евра годишно. И покрај ваквиот напредок, Управата за конкуренција (ADLC) денеска изрече санкција од 250 милиони евра против Google за начинот на кој ги водевме овие преговори. ADLC побара промени во начинот на преговарање, што го прифативме како дел од постигнатиот договор за конечно затворање на овој случај кој е отворен предолго.
Направивме компромис затоа што е време да ја свртиме страницата, и како што докажуваат нашите бројни договори со издавачите, сакаме да се фокусираме на одржлив пристап со цел да ги поврземе корисниците на Интернет со квалитетна содржина и да работиме конструктивно со издавачите.“, пишува Сулина Конел на блогот Google.
Користењето на содржина за тренинг на вештачка интелигенција е нов проблем. Веќе има повеќе тужби поради користење на содржина без дозвола, но секако барем за сега вештачката интелигенција е и дополнителен канал за заработка. Дел од издавачите потпишуваат договори со креаторите на вештачка интелигенција. ChatGPT во своите резултати ќе ги користи вестите од Politico, Bild, и Business Insider. Во замена, нивниот издавач ќе заработува десетина милиони долари годишно.