Štatistická metóda, programy

Z WikiKnihovna

Autor: Paulína Kosturáková

Kľúčové slová:

Synonymá: štatistika

Súvisiace pojmy:

nadradené štatistické výpočetné prostredie, štatistická analýza
podradené dáta

Štatistika

Statistika pochádza z latinského STATUS, tj. STAV, ŠTÁT, vedecké štúdium dát popisujúcich existujúcu variabilitu a hodnotiacich súťažacie myšlenky (hypotézy) vysvetlujúce dáta. Štatistiku možno definovat z rôznych uhlov pohľadu i účelov rozdielne. Všeobecne je to „…praktická činnosť /často institucionálne podložená/ spočívajúca v zbere a spracovaní číselných údajov o hromadných prírodných a společenských javoch a procesoch." [1]

História

K najstarším štatistickým činnostiam patrí bezpochyby sčítanie obyvateľov. Poznatky zo súpisov využíval panovník k fiškálnym, vojenským, ekonomickým a iným účelom. John Graunt poukázal na zákonnitosti, ktoré nemožno poznať z jednotlivých pozorovaní, ale sú platné pre celé súbory. K týmto poznatkom sa dopracoval pri štúdiu úmrtnosti obyvateľov Londýna. William Petty poukázal na význam predvídateľnosti hromadných javov a to na základe rázu týchto javov. Je označovaný za zakladateľa politickej aritmetiky. Obaja bádatelia nesporne zahájili éru, ktorá bola v znamení zvyšujúceho sa záujmu o nové pojatie bádania v zmysle induktívneho poznávania. Začiatkom 19. storočia bola štatistika budovaná na základe teórie pravdepodobnosti, ktorá bola v tej dobe vypracovaná v hlavných rysoch (Opierala sa o práce Pascala, Bernoulliho, a Laplaceho.) Rozvoj štatistiky bol v znamení anglickej štatistickej školy s predstaviteľmi F. Galton, Ch. Pearson, R. A. Fischer. Počiatky štatistiky v našich zemiach sú späté s počiatkami štatistiky v Rakúsko- Uhorsku. Rovnako ako v západných krajinách sa štatistika u nás radila do politických vied. Na pražskej univerzite bola výuka zavedená v roku 1764, kde sa prednášalo o štatistike obyvateľstva. Významný krok nastal ku koncu 18. storočia zásluhou univerzitných profesorov J. A. Rieggera a J. Madera, ktorí začali vedľa doposiaľ iba verbálneho hodnotenia dát s hodnotením dát pomocou číselných charakteristík. Zvlášť Riegger sa považuje za priekopníka štatistiáky v tej dobe. V prvej polovici 19. storočia bol u nás najvýznamnejším štatistikom G. N. Schnabel. Zaoberal sa štatistickým popisom jak Čiech tak aj iných európskych štátov. Pripisuje sa mu prvé použitie grafov v štatistickej literatúre u nás aj prvé použitie indexov pri porovnaní hustoty obyvateľstva. V druhej polovici 19. storočia a v 20. storočí rastie s ďalším vývojom priemyselnej výroby i počet publikácií so štatistickou náplňou. Dôležitú úlohu zohralo založenie Medzinárodného štatistického ústavu a konanie medzinárodných štatistických kongresov. Vedci z druhej polovice 19.storočia, ktorí stoja za zmienku sú Dobroslav Krejčí a Václav Láska. [2]

Aplikovateľnosť štatistických metód

Štatistické metódy dosiahli behom minulého storočia ocenenia vo veľkom počte oborov, nielen výskumnej ale aj riadiacej činnosti. Preukázali, že sú schopné poskytnúť metódy pre poznanie podstaty javov a poskytnúť aparát ku kvalitným výskumným záverom. Riadiacim pracovníkom poskytujú štatistické metódy cenné podklady a umožňujú predvídať a overovať hodnoty ukázateľov, podľa ktorých sa rozhoduje.[3] V dnešnej dobe poznáme veľa druhov štatistických metód. Každá oblasť (obor) využíva vlastné metódy. 2 hlavné metódy ktoré sa využívajú sú deskriptívna štatistika a deduktívna štatistika. Štatistika sa aplikuje najmä v týchto sférach:

  • aplikovaná štatistika
  • strojové učenie
  • data mining
  • marketing

Databázy

Veľké dátové súbory sú väčšinou spravované pomocou "veľkých" databází. Tu je zrejme najčastejšie používaným databázovým programom systém Oracle. Ten je často umiestený na tzv. databázovom serveri a málokedy je to zariadené tak, že b normálny bežný užívateľ pracoval priamo s týmto programom. Častejšie je situácia riešená takým spôsobom, že uživateľ si iba "vytiahne" dáta z tohto serveru a potom s nimi pracuje v niektorej z databázi určených pre PC. Tu sa potom naskytá široké spektrum programov, z ktorých je možné zvoliť ten pravý. "klasikom" a taktiež normou sa v minulých rokoch stala databáza dBASE. Veľmi obľúbenou databázou je FoxProod firmy Microsoft. Súčasťou kancelárskeho balíku MS Oficce je databáza Access. [4]

SPSS ako príklad štatistického programu

SPSS ako štatistický program je pomerne starou záležitosťou. Pôvodne bol vytvorený vo verzii pre veľké sálové počítače (IBM apod.). Po rozmachu osobných počítačov sa objavila verzia pre PC a pochopiteľne najprv verzia pre DOS. Po nástupe Windows bola vytvorená verzia i pre toto prostredie. I táto verzia bola neustále vylepšovaná, takže dnes sa program už značne odlišuje od pôvodného, predovšetkým z hľadiska obsluhy, práce s dátami a práce s oknom výstupu. Menších zmien dostal program aj po stránke štatistickej. SPSS ako program pre Windows pracuje zároveň v niekoľkých oknách. Jedná sa predovšetkým o dve základné a síce SPSS Data Editor a SPSS Output Navigator. Prvý z nich je určený pre prácu s dátami a má podobu spreadsheetu - silne teda pripomína napr. tabuľky z Excelu, i keď možnosti editoru SPSS zďaleka nie sú tak veľké. V tabuľke editoru je možné dáta pomocou tabuľky upravovať, ale na druhej strane slúži čiastočne i pre výstup, pretože sa do tabuľky nahrávajú premenné, ktoré sa behom prce počítajú ako výsledok niektorých procedúr. SPSS Output Navigator je okno výstupu a má podobu textového okna - veľmi vzdialene teda pripomína prácu v textovom procesore. Pretože slúži pre výstup objavujú sa v tomto okne výsledky spustených procedúr. V okne výstupu je možné mazař, editovať výsledky,kopírovať z nich do iných programov (teda i do Wordu) a v podstate prevádzať obdobné úpravy ako v textovom procesore. Práce v tomto okne sa pomerne líšia v starých verziách (7,0 a nižšie) SPSS. Tretím oknom, ktoré väčšina bežných užívateľov vôbec nespustí, je tzv. SPSS Script Editor skrátene nazývaný Autoscript. SPSS je totiž možné ovládať ako z ponuky, tak i pomocou príkazov. Príkazy je možné organizovať do "skrípt", čo sú vlastne programy ktoré možno uložiť a potom kedykoľvek spustiť. SPSS už samo obsahuje niekoľko takých hotových skrípt, ktoré sa nachádzajú v podadresári Script. V starších verziách sa objavuje okno Chart Carousel, ktoré sa aktivuje vytvorením ľubovoľného typu grafu a slúži teda pre prácu s týmito grafmi. Vo verzii 7,5 je toto okno už súčasťou SPSS Output Navigator. [5]

Typy dátových súborov, komunikácia s inými programami

SPSS pre windows má svoj vlastný dátový formát, ktorý je čitateľný iba v tomto programe. Dátové súbory ukladá s príponou *.sav. Pokiaľ však pracujeme s verziou pre DOS, majú dátové súbory nešastne zvolenú koncovku *.sys. S okolím komunikuje SPSS pomerne jednoducho pomocou ponúk File, Export a File, Import. Tie umožňujú vystrčiť (a načítať) dáta vo formátoch bežne používaných programoch. Veľmi dobre je organizované načítavanie dát z databází (resp. tabuľkových procesorov), ktoré možno nájsť pod postupnosťou ponúk File, Database capture. Ponúkajú sa tu všetky bežne používané databázy. Celý prevod sa odohráva v piatich krokoch pod vedením Database Capture Wizard, čo je vlastne sprievodca, ktorý urobí veľa práce za nás.[6]

Citácie

  1. STRÁDALOVÁ, Jarmila; KUBÁTOVÁ, Květa. Vybrané kapitoly ze statistiky I.. Praha : Univerzita Karlova v Praze - Nakladatelství Karolinum, 1999, s.5. ISBN 80-7184-493-4.
  2. KADEŘÁBEK, Jiří.Statistika. Liberec: Technická univerzita v Liberci, 2006, s.4-5. ISBN 80-7372-044-2
  3. KADEŘÁBEK, Jiří.Statistika. Liberec: Technická univerzita v Liberci, 2006, s.3. ISBN 80-7372-044-2
  4. MAREK, Luboš. Statistické výpočetní prostředí. Praha: Vysoká škola ekonomická v Prahe, 1997, s.11. ISBN 80-7079-033-4
  5. MAREK, Luboš. Statistické výpočetní prostředí. Praha: Vysoká škola ekonomická v Prahe, 1997, s.26-27. ISBN 80-7079-033-4
  6. MAREK, Luboš. Statistické výpočetní prostředí. Praha: Vysoká škola ekonomická v Prahe, 1997, s.27. ISBN 80-7079-033-4

Použitá literatúra

  • KADEŘÁBEK, Jiří.Statistika. Liberec: Technická univerzita v Liberci, 2006, s.3. ISBN 80-7372-044-2
  • MAREK, Luboš. Statistické výpočetní prostředí. Praha: Vysoká škola ekonomická v Prahe, 1997, s.129. ISBN 80-7079-033-4
  • STRÁDALOVÁ, Jarmila; KUBÁTOVÁ, Květa. Vybrané kapitoly ze statistiky I.. Praha : Univerzita Karlova v Praze - Nakladatelství Karolinum, 1999. 250 s. ISBN 80-7184-493-4.