<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="cs">
	<id>https://wiki.knihovna.cz/index.php?action=history&amp;feed=atom&amp;title=Data_Mining</id>
	<title>Data Mining - Historie editací</title>
	<link rel="self" type="application/atom+xml" href="https://wiki.knihovna.cz/index.php?action=history&amp;feed=atom&amp;title=Data_Mining"/>
	<link rel="alternate" type="text/html" href="https://wiki.knihovna.cz/index.php?title=Data_Mining&amp;action=history"/>
	<updated>2026-06-30T04:56:32Z</updated>
	<subtitle>Historie editací této stránky</subtitle>
	<generator>MediaWiki 1.35.0</generator>
	<entry>
		<id>https://wiki.knihovna.cz/index.php?title=Data_Mining&amp;diff=3877&amp;oldid=prev</id>
		<title>Michal Klajban: 24 revizí: IMPORT D-F: import stránek z hlavního jmenného prostoru z KiskWiki (http://kisk.phil.muni.cz/)</title>
		<link rel="alternate" type="text/html" href="https://wiki.knihovna.cz/index.php?title=Data_Mining&amp;diff=3877&amp;oldid=prev"/>
		<updated>2012-02-06T11:06:58Z</updated>

		<summary type="html">&lt;p&gt;24 revizí: IMPORT D-F: import stránek z hlavního jmenného prostoru z KiskWiki (http://kisk.phil.muni.cz/)&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nová stránka&lt;/b&gt;&lt;/p&gt;&lt;div&gt;'''Autor:''' Kristýna Svobodová&lt;br /&gt;
&lt;br /&gt;
'''Klíčová slova:''' Data mining, dobývání dat, zpracování dat, modelování dat, vztahy mezi daty &lt;br /&gt;
&lt;br /&gt;
'''Synonyma:''' Vytěžování dat&lt;br /&gt;
&lt;br /&gt;
'''Nadřazené pojmy:''' Business Intelligence, KDD (Knowledge Discovery in Databases – dobývání znalostí z databází)&lt;br /&gt;
&lt;br /&gt;
'''Podřazené pojmy:''' -&lt;br /&gt;
        &lt;br /&gt;
== '''Definice Data Miningu''' ==&lt;br /&gt;
&lt;br /&gt;
'''Data mining''' ([dejta majnyn], angl. ''dolování z dat'', ''vytěžování dat'') bývá definován jako sada automatizovaných postupů používaných k nalezení dosud neznámých vzorů a vztahů v datech. Jedná se o pojem z oblasti Business Intelligence, kde tyto vzory a vztahy mohou být použity, aby dokázaly předpovědět chování zákazníka. Definic data miningu je velmi mnoho. Mnozí odborníci považují data mining za synonymum pojmu KDD (Knowledge Discovery in Databases – dobývání znalostí z databází), jiní zase tvrdí, že data mining je pouze jednou součástí tohoto širšího procesu. Profesor Berka ve své knize Dobývání znalostí z databází píše o Data Miningu jako o kroku, který zahrnuje aplikaci vybraných analytických metod pro vyhledávání zajímavých vztahů v datech [[#Použitá literatura|[2, s. 18]]]. Pojetí data miningu jako součásti KDD potvrzuje také první mezinárodní konference KDD z roku 1995, která se konala v Montrealu. &lt;br /&gt;
&lt;br /&gt;
Data mining je do značné míry, ne-li zcela, využit k obchodním účelům. Nejčastějšími uživateli jsou bankovní, finanční a telekomunikační průmysl, velmi rychle však proniká i do dalších oblastí.&lt;br /&gt;
&lt;br /&gt;
Klíčem k uspění v tomto rychle se měnícím odvětví je porozumět zákazníkovi nebo trhu, který zákazník představuje. Prostřednictvím data miningu je toto možné.&lt;br /&gt;
&lt;br /&gt;
== '''Kategorie úloh dolování dat''' ==&lt;br /&gt;
&lt;br /&gt;
Data mining můžeme použít na řešení tisíců různých problémů. Podle povahy problému je můžeme seskupit do určitých skupin, jejichž cílem je postižení neznámých vztahů v datech. Setkat se můžeme s různými druhy dělení, jednotná podoba dána není. Následující dělení vytvořil jeden z předních světových expertů na data mining Usama Fayyad [[#Použitá literatura|[4, s. 44]]].&lt;br /&gt;
&lt;br /&gt;
Dvěma primárními cíly data miningu v praxi jsou predikce a deskripce.&lt;br /&gt;
&lt;br /&gt;
• '''Predikce (Prediction)''' – umožňuje předvídat budoucí hodnoty atributů na základě nalezených vzorů v datech &lt;br /&gt;
&lt;br /&gt;
• '''Deskripce (Description)''' – popisuje nalezené vzory a vztahy v datech, které mohou ovlivnit rozhodování &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Cílů predikce a deskripce je dosaženo pomocí následujících úkolů:&lt;br /&gt;
&lt;br /&gt;
• '''Klasifikace (Classification)''' – podstatou klasifikace je rozdělit objekty s určitými charakteristickými rysy do jednotlivých tříd na základě modelu vybudovaného podle tréninkové množiny dat (třídy jsou dány předem a každý objekt je možné zařadit).&lt;br /&gt;
&lt;br /&gt;
• '''Regrese (Regression)''' – řada již dříve zjištěných hodnot, která slouží k předpovězení toho, jaké další hodnoty budou následovat&lt;br /&gt;
&lt;br /&gt;
• '''Shlukování (Clustering)''' – rozdělení datového souboru do určitých skupin (počet skupin je většinou zjišťován v průběhu analýzy dat), čímž jsou vytvářeny shluky objektů. Užívanými metodami pro tento úkol jsou rozhodovací stromy, neuronové sítě, logistická regrese, diskriminační analýza.&lt;br /&gt;
&lt;br /&gt;
• '''Sumarizace (Summarization)''' – zahrnuje metody pro hledání uceleného popisu podmnožiny dat&lt;br /&gt;
&lt;br /&gt;
• '''Modelování závislostí (Dependency Modeling)''' – spočívá v nalezení modelu, který popisuje podstatné závislosti mezi proměnnými, rozdělujeme jej na dvě úrovně:&lt;br /&gt;
1. Strukturální úroveň modelu specifikuje (často graficky), které proměnné jsou na sobě lokálně závislé&lt;br /&gt;
2. Kvantitativní úroveň modelu specifikuje síly závislostí za použití číselné stupnice&lt;br /&gt;
&lt;br /&gt;
• '''Detekce změn a odchylek (Change and Deviation Detection)''' – se zaměřuje na objevení nejpodstatnějších změn v datech od původně naměřených nebo normativních hodnot&lt;br /&gt;
&lt;br /&gt;
Nejznámějšími metodami užívanými při řešení zmíněných úkolů jsou např. rozhodovací stromy, rozhodovací pravidla, asociační pravidla, neuronové sítě, statistické metody nebo nejbližší soused.&lt;br /&gt;
&lt;br /&gt;
== '''Postup při dolování dat''' ==&lt;br /&gt;
&lt;br /&gt;
Aby mohl být data mining co nejefektivnější, bylo nezbytné vypracovat standardizovaný „návod“, který by po jednotlivých krocích popisoval, jak během celého procesu postupovat. Proto v rámci výzkumného projektu Evropské komise vznikla metodologie CRISP-DM (CRoss-Industry Standard Proces for Data Mining). Metodologie CRISP-DM [[#Použitá literatura|[3]]] rozděluje proces do následujících etap:&lt;br /&gt;
&lt;br /&gt;
• '''Porozumění problematice (Business Understanding)''' &lt;br /&gt;
Tato počáteční fáze se zaměřuje na pochopení cílů projektu a požadavků z manažerského hlediska a poté převedení těchto poznatků do definování problému data miningu a předběžný plán sestavený k dosažení určených cílů.&lt;br /&gt;
&lt;br /&gt;
• '''Porozumění datům (Data Understanding)'''&lt;br /&gt;
Fáze porozumění datům začíná prvotním sběrem dat a pokračuje aktivitami vedoucími k seznámení se s daty, určením kvality dat, prvním „nahlédnutím“ do dat nebo odhalením zajímavých podmnožin k vytváření hypotéz pro skryté informace.&lt;br /&gt;
&lt;br /&gt;
• '''Příprava dat (Data Preparation)'''&lt;br /&gt;
Fáze přípravy dat zahrnuje všechny aktivity na vybudování konečného datového souboru, který bude zpracováván jednotlivými analytickými metodami. Tato data by tedy měla obsahovat údaje relevantní k dané úloze a mít podobu, která je vyžadována vlastními analytickými algoritmy.&lt;br /&gt;
&lt;br /&gt;
• '''Modelování (Modeling)'''&lt;br /&gt;
V této fázi jsou zvoleny a aplikovány různé modelovací techniky a jejich parametry jsou kalibrovány na optimální hodnoty. Obvykle existuje řada různých metod pro řešení dané úlohy, je tedy třeba vybrat ty nejvhodnější (doporučuje se použít více různých metod a jejich výsledky kombinovat) a vhodně nastavit jejich parametry. Některé techniky mají specifické požadavky na podobu dat. Pak je tedy často potřeba přistoupit zpět k fázi přípravy dat.&lt;br /&gt;
&lt;br /&gt;
• '''Vyhodnocení (Evaluation)'''&lt;br /&gt;
V této fázi máme sestavený model (nebo modely), který se zdá mít z hlediska analýzy dat vysokou kvalitu. Před konečným využitím modelu je důležité důkladněji vyhodnotit model a přezkoumat kroky vedoucí ke stavbě modelu k nabytí jistoty, že skutečně dosáhneme daných cílů. Hlavním cílem je zjistit, zda existuje nějaká důležitá záležitost, která nebyla dostatečně zahrnuta. Na konci této fáze by mělo být dosaženo rozhodnutí o využití výsledků data miningu.&lt;br /&gt;
&lt;br /&gt;
• '''Využití výsledků (Deployment)'''&lt;br /&gt;
Vytvoření modelu obecně není konec projektu. Získané znalosti budou muset být zorganizovány a prezentovány způsobem, aby je zákazník mohl využít. V závislosti na úkolu může být tato fáze zcela prostá – pouhé sepsání závěrečné zprávy, nebo také složitá – zavedení systému pro automatickou klasifikaci nových případů.&lt;br /&gt;
&lt;br /&gt;
== '''Použitá literatura''' ==&lt;br /&gt;
&lt;br /&gt;
[1] BERKA, Petr. ''Aplikace systémů dobývání znalostí pro analýzu medicínských dat'' [online]. 2001, poslední revize 30.5.2003 [cit. 2010-06-09]. Dostupné z: &amp;lt;http://euromise.vse.cz/kdd&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
[2] BERKA, Petr. ''Dobývání znalostí z databází''. 1.vyd. Praha: Academia, 2003. 366 s. ISBN 80-200-1062-9.&lt;br /&gt;
&lt;br /&gt;
[3] ''CRoss Industry Standard Process for Data Mining'' [online]. [cit. 2010-06-09]. Dostupné z: &amp;lt;http://www.crisp-dm.org/Process/index.htm&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
[4] FAYYAD, Usama M.: ''Data Mining and Knowledge Discovery''. An International Journal. [online]. [1996]. vol. 1. is. 1 [cit. 2010-06-09]. Dostupné z: &amp;lt;http://www.kdnuggets.com/gpspubs/aimag-kdd-overview-1996-Fayyad.pdf&amp;gt;.&lt;br /&gt;
&lt;br /&gt;
[5] SOŠKOVÁ, Michala. ''Analýza a vyhodnocení činností uživatelů souborného on-line katalogu Masarykovy univerzity''. Brno: Masarykova univerzita, Filozofická fakulta, Ústav české literatury a knihovnictví, 2006. 58 s. Vedoucí diplomové práce Dr. Ing. Zdeněk Kadlec.&lt;br /&gt;
&lt;br /&gt;
[6] WANG, John. ''Data mining : opportunities and challenges''. Hershey : IRM Press, 2003. xiii, 468 s. ISBN 1-931777-83-7.&lt;/div&gt;</summary>
		<author><name>Michal Klajban</name></author>
	</entry>
	<entry>
		<id>https://wiki.knihovna.cz/index.php?title=Data_Mining&amp;diff=3853&amp;oldid=prev</id>
		<title>Kovarovap: Založena nová stránka: '''Autor:''' Kristýna Svobodová</title>
		<link rel="alternate" type="text/html" href="https://wiki.knihovna.cz/index.php?title=Data_Mining&amp;diff=3853&amp;oldid=prev"/>
		<updated>2010-03-26T14:44:51Z</updated>

		<summary type="html">&lt;p&gt;Založena nová stránka: &amp;#039;&amp;#039;&amp;#039;Autor:&amp;#039;&amp;#039;&amp;#039; Kristýna Svobodová&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Nová stránka&lt;/b&gt;&lt;/p&gt;&lt;div&gt;'''Autor:''' Kristýna Svobodová&lt;/div&gt;</summary>
		<author><name>Kovarovap</name></author>
	</entry>
</feed>