Humbug

Blog Humbug Josef Havelka
Méně = lépe: Lidská i umělá inteligence trpí informační zaujatostí

Méně = lépe: Lidská i umělá inteligence trpí informační zaujatostí


Je dobré začít příspěvek rovnicí. A to i proto, že Josef Havelka nemá rád Excel, nejlepšího přítele každého výzkumníka.  Na podzim minulého roku jsem se zůčastnil conference DataX v New Yorku. Prezentace o optimalizaci algoritmů umělé inteligence přilákala hodně pozornosti. 

Z celé prezentace jsem si odnesl dvě velké myšlenky: 1. Šíře dat je důležitější než hloubka dat, protože zachycuje realitu v její komplexitě. 2. Algoritmy založené na menším množství (na sobě nezávislých) proměnných jsou v praxi účinější než algoritmy založené na velkém množství proměnných bez ohledu na to, jestli jsou na sobě závislé nebo nezávislé. 

Tato druhá myšlenka mě dovedla k závěru, že nejenom lidská, ale i umělá intelligence trpí kognitivní zaujatostí, které se někdy říká informační zaujatost. Více informací znamená lepší rozhodnutí pouze do určitého množství informací. Pokud překročíme hranici informací, kterou je náš mozek schopen zpracovat, výsledkem jsou horší rozhodnutí.  

Kdo z nás nezažil snahu mnohých ředitelů marketingu nebo prodeje, brand managerů nebo výzkumníků udělat rozhodnutí na základě maxima informací, které jsme schopni shromáždit. Velice často se jednalo o odkládání důležitého rozhodnutí. Užívali jsme si dávky dopaminu, které vylučuje mozek v reakci na nové informace, což však snižuje naše kognitivní schopnosti. A tak nové informace nahlodávaly naše předchozí strategie a rozhodnutí založená na limitovaném množství informací. Výsledkem byla často nejenom prokrastinace, ale i kvalitativně horší rozhodnutí, protože jsme přestali vidět pro stromy les.  Je zajímavé, že podobnou ‘kognitivní ‘zaujatostí trpí i umělá inteligence. Nárůst proměnných v algoritmu od určitého momentu vede ke snižování kvality predikce, kterou algoritmus produkuje. Navíc se algoritmus stává ‘specializovanějším‘ a aplikovatelným na užší rozsah dat.  

Limitovaná data nám lidem umožnují vyšší míru generalizace, a to platí i pro umělou inteligenci.

Méně správných dat, která reflektují širší realitu, je zkrátka lepší pro rozhodování jak člověka tak i umělého mozku.