Umělá inteligence: Přehled klíčových pojmů

Inteligence – obecná definice
Schopnost učit se, porozumět a přizpůsobovat se novým situacím.

Umělá inteligence (AI – Artifical Intelligence)
Žádná z definic termínu umělá inteligence vlastně není ustálená. Všechny se ale shodují v tom, že to je systém, který simuluje lidské myšlení a reakce. Umělá inteligence má obvykle formu počítačového programu a slouží k řešení úloh, které ještě nedávno byly doménou lidí a navíc vyžadovaly značný lidský intelekt. 

Kromě toho jde o vědecký obor s počátky sahajícími do první poloviny 20. století. Jeho důležitou vlastností je, že se inteligentním systémům snaží nejen porozumět, ale hlavně je tvořit. Víc na: aidetem.cz/co-je-ai

Strojové učení (ML – Machine Learning)
Sejně jako se člověk umí učit ze zkušeností, jsou toho schopné i člověkem vytvořené stroje. A stejně jako my lidé, i stroje k tomu potřebují data (a zkušenosti). Stroje k učení používají metodu, které říkáme strojové učení. Umožňuje systémům umělé inteligence, aby nebyly jen souborem předem naprogramovaných akcí, ale aby samy přicházely s novými řešeními. Cílem metod strojového učení je odhalit vzory vyskytující se ve velkém množství dat. Víc na: aidetem.cz/strojove-uceni

Model strojového učení
Model je produkt strojového učení. Aby učení mohlo proběhnout, potřebujeme vždycky data. To znamená tabulku, složku obrázků nebo textů atd. Pro jednoduché modely nám stačí pár desítek datových vzorků. Složitější modely, například neuronové sítě, se běžně trénují i na tabulkách s miliony řádků. Získané poznatky model po natrénování používá k rozpoznávání nebo vytváření nových dat. Existuje spousta typů modelů strojového učení používaných k řešení různých úloh. Například pro rozpoznávání obrazu nebo hlasu, analýzu dat nebo generování obrazů (Midjourney) nebo textů (ChatGPT).

Dataset
Pro trénování modelů strojového učení se používají například hlasové záznamy, hudba, videa, obrazy, texty z knih, novin nebo sociálních sítí. Volba datasetu z velké části definuje, co bude model umět, jak se bude chovat a jaké problémy bude řešit. Dataset by měl být co největší. Měl by obsahovat kvalitní a pro daný úkol relevantní data. Tím se zajistí, že model bude dobře fungovat. Cílem metod strojového učení je odhalit vzory vyskytující se ve velkém množství dat.

Big data (velká data)
Různorodá data v mnoha formátech, lišící se velikostí a strukturou. Můžeme si je představit jako obrázky, videa, audia, texty nebo tzv. digitální stopy ve formě údajů o uživatelském chování. Jsou důsledkem zrychlení a vývoje internetu, kdy jeho obsah vytváříme z velké míry my, uživatelé. Vznik Big dat ovlivňuje také vývoj IoT technologií (internetu věcí — např. lednička, žaluzie... napojené na internet), které dokážou získávat data ze všech možných zdrojů. Roli hraje i výrazné zlevnění ukládání dat a jejich zpracování. Je jich tolik, že jejich zpracování vyžaduje nové přístupy. Například ukládání a zpracovávání za pomoci velkého množství počítačů a jejich paměťových úložišť. Totéž platí i pro moderní metody strojového učení.

Předpojatost (bias)
Pokud je dat málo nebo jsou špatně připravená, může se stát, že umělá inteligence bude určitým způsobem předpojatá. Pokud například budeme chtít, aby se umělá inteligence naučila rozpoznávat boty, ale budeme jí ukazovat jen obrázky tenisek, nebude boty na vysokém podpatku, sandály ani kozačky za boty považovat. Aby systémy umělé inteligence byly etické a riziko zkreslení co nejnižší, programátoři je průběžně ladí a dodávaná data pečlivě posuzují. To je jediný způsob, jak zajistit, aby systémy dobře pracovaly. Víc na: aidetem.cz/predpojatostý

Zdroj: V téhle výukové sekci uvádíme několik materiálů, textů a obrázků pro správné pochopení tématu zpracovaných neziskovou organizací AI dětem, z.s

Vzdělávací podklady tématu ke stažení