DP BAUDYŠ: Moderní dataminingové nástroje a jejich využití v managementu

email konzulatcia 25.6.2020
dakujem za zaslanie verzie prace – prosim cislujte ich aby sa dalo zistit o ktoru verziu ide.
Prosim zmenit strukturu 4.kap tak ako je uvedene dole.
4. Metodologie dataminingu a komparativní analýza moderních nástrojů určených pro datamining
4.1 Metodologie dataminingu
— metodologie DM sa standardizovali [2]- jedna z nich je CRISP [3]
— porovnanie metodologii vid [4]
4.1.1 Metodologie dataminingu CRISP
— open sourcemetodologia
— velmi dobry popis metodologii a aj CRISP je uvedeny v zaverecnych pracach mojich studentov – mate ich k dispozicii na [1] a pohrabte sa v nich – oplati sa to
4.1.2 Metodologie dataminingu SEMMA
— [5] – proprietarna metodologie spolocnosti SAS
4.1.3. Metodologie dataminingu KDD
4.2 Komparativní analýza moderních nástrojů určených pro datamining
4.2.1 Analyticky nastroj Weka
— vid prve tri prace [1]
4.2.2 Analyticky nastroj Rapid Miner
4.2.3 Programovaci jazyk R
— nepopisovat syntax jazyka a operacie
— sustredit sa na princip rozsirujucich  balickov pre jazyk  R medzi ktore patria aj balicky pre DM
— z netu sa da vidiet ze R jazyk je rozsirenim v bankach rozsirenych SQL serverov ako je Oracle a Microsoft SQL server [6]
ZDROJE: 
[1] http://www.drpancik.sk/archiv-vyucby/vyucba-leto-2020/zaverecne-prace-leto-2020/moderni-dataminingove-nastroje-a-jejich-vyuziti-v-managementu/
cast dole: „Vybrané diplomové práce zaměřené na spolupráci s praxí – oblast dataminingu a jeho využití v bankách“
[2] https://en.wikipedia.org/wiki/Data_mining#Standards
[3] https://en.wikipedia.org/wiki/Cross-industry_standard_process_for_data_mining
[4] https://recipp.ipp.pt/bitstream/10400.22/136/3/KDD-CRISP-SEMMA.pdf
[5] https://en.wikipedia.org/wiki/SEMMA
[6] https://docs.microsoft.com/en-us/sql/machine-learning/r/sql-server-r-services?view=sql-server-2016

[7] https://www.oracle.com/database/technologies/datawarehouse-bigdata/oml4r.html

email konzulatcia 25.5.2020

AGENDA:
— zaslana verzia ku konzultacii: …\Moderní dataminingové nástroje a jejich využití v ekonomice.docx
— JuPa upravena verzia ku konzultacii: …\200525 DP BAUDYS Moderní dataminingové nástroje a jejich využití v ekonomice ver.B.docx
— ULOHA: verziovat zaslane texty (do nazvu suboru doplnit datum a cislo verzie)
— ULOHA: zaradit vo Worde pracu s PREHLADOM a OSNOVOU (zobrazi sa pootm navigacne okno so strukturou dokumentu a umozni to automaticky generovat obsah ….), treba parcovat so stylmi – vyrobil som 1,2 a 3 nazov a normal – vid. verzia JuPa
— verzia JuPa ku konzultacii obsahuje pracu s urovnami v osnove vratne zobrazenia navigacnej tabule a automatickeho obsahu a vygenerovaneho automatickeho odkazu
— ULOHA: vsetku uvedenu literaturu treba vlozit do systemu zdrojova a odkazov Word (MENU:Reference–> Citace a Bibliografie –> Vlozit citaci), zdroje su knihy, webove odkazy na stranky a el. dokumenty
— verzia JuPa ku konzultacii: vlozil som cislo strany
— verzia JuPa ku konzultacii: uroven 1 zacina vzdy na novej strane (t.j. kap.1,2,…)

POZNAMKY K DALSIEMU POSTUPU:
— dokoncit kap.3 NN a ostatne nedokoncene podkapitolky ak treba – vznikne cca 40 stran textu
— kap.4 Metodologie bude mat cca 10 stran
— kap.5 Metodologie bude mat cca 15 stran
— spolu by to mohlo mat 65 a > stran co by bolo OK

OBSAH PODLA:

JuPa upravena verzia ku konzultacii: …\200525 DP BAUDYS Moderní dataminingové nástroje a jejich využití v ekonomice ver.B.docx

Obsah
1 Vymedzení základních pojmů v předmetní oblasti 12
1.1 Big Data 12
1.2 Big data a jejich rozdělení 14
1.3 Big data a jejich využití 14
1.3.1 Strojové učení 14
1.3.2 Populární metody strojového učení 16
1.3.3 Předvídání údržby 17
1.4 Datamining 18
1.4.1 Průřez historií data miningu 19
1.4.2 Jednotlivé moderní nástroje data miningu 20
1.4.3 Základní výhody a uplatnění data mingu v praxi 22
1.5 Business Intelligence 22
1.5.1 Business inteligence vs data mining 24
1.5.2 Synchronizace data miningu a business intelligence 25
2 Umělá inteligence (AI) 26
2.1 Využití umělé inteligence 27
2.2 Umělá inteligence for Good 27
2.3 Umělá inteligence v zemědělství 27
2.4 Umělá inteligence v informatice 28
2.5 Umělá inteligence ve vzdělání 28
2.6 Výhody a nevýhody umělé inteligence 28
2.6.1 Snížení lidské chyby 28
2.6.2 Omezení riskování člověka 29
2.6.3 Umělá inteligence funguje bez odpočinku 29
2.6.4 Náhrada rutinních záležitostí 29
2.6.5 Digitální pomoc 29
2.6.6 Rozhodování na úrovni milisekund 29
2.6.7 Nové vynálezy 30
3 Neuronové sítě 31
3.1 Využití neuronových sítí 33
4 Metodologie dataminingu a komparativní analýza moderných nástrojů určených pre datamining 34
5 Případové studie využití metod dataminingu v ekonomice 35
5.1 Market Basket Analysis [3] 35
5.2 Churn analysis [4] 35
5.3 Karuselové podvody s DPH 35
5.4 Diskuse 35
6 Zaver 36
Seznam použitých zdrojů 37

email KONZULTACIA 24.3.2020

  • emailova refres uz skor vymenenych informacii, termin odovzdania  a  obsah prace (vid. tato stranka)
  • p. B: KICK OFF prac na DP 

17.3. 2020  kontaktny email doc.P –> p. B

1.11. 2019  Ziadna aktivita v poslednom obdobi 

  • TEMA DIPLOMOVEJ PRACE: „Moderní dataminingové nástroje a jejich využití v managementu“
    MODRY TEXT: Navrh textu pre zadavaci list diplomovej prace 
    HLAVNY CIEL:   Vymezení základních pojmů  v oblasti BigData a dataminingu, porovnání moderních softvérových nástrojů pro datamining a vybrané  případová studie využití metod dataminingu v ekonomice   
    CIASTKOVE CIELE:
    1. TEORIE: Vymedzení základních pojmů v předmetní oblasti
  • — Big Data (BI)
  • — dolovanie dat (datamining, DM)
  • — porovnat pojmy BI, DM
  • — umela inteligencia (AI)
  • — deep learning (DM, DL)
  • — neuronove siete (NN)
  • 2. ANALÝZA: Metodologie dataminingu a komparativní analýza moderných nástrojů určených pre datamining 
  • – -WEKA [5] , Jazyk R [6], Rapid Miner
  • 3. NÁVRHOVO REALIZAČNÍ ČÁST: případové studie využití metod dataminingu v ekonomice 
  • — Market Basket Analysis [3] , Churn analysys [4], Karuselové podvody s DPH
  • — vid. diplomove rpace
[email KONZULTACIA 13.5.2019]
v  TEORETICKEJ casti popisal co to je datamining (20 stran) – budetete cerpat z teoretickych casti DP uvedenych v [7].
V ANALYTICEKJ  casti sa mozete venovat 2-3 dataminingovym technikam  (15 stran)- popis napr. Market Basket Analysis [3] a Churn analysys [4].
V tretej NAVRHOVO REALIZACNEJ CASTI – (10 stran) popise moderne open source nastroje urcene pre datamining – WEKA [5] a Jazyk R [6].
Pre prvu cast, co je datamining, budete cerpat z diplomoviek [7] –  studenti, prace robili v spolupraci s praxou – pre konkretne banky ci poistovne  – prace by sa mali dat stiahnut
PS:
— defincie dataminingu :
— historicky pojem datamining a pojmy okolo dataminingu sa  vyskytli uz pred 10-15 rokmi, BigData je pojem relativne novy a velmi siroky a zahranuje aj hlbkovu analyzu data (t.j. datamiing) . V DP praci sa budeme drzat pojmu datamining preto aby sme jasnejsie vymedzili tuto podmnozinu pojmov, technologii a softveru. Je to dolezite pre „hygienu pisania“ – siroky zaber prace vytvara riziko „rozpliznuti se“.

Na stránce http://diplomovka.sme.sk/univerzita/ra/ekonomicka-fakulta.php jsou mnou vedeny závěrečné práce týkající se data miningu M. Z nich bych zmínil (jméno, pracoviště banky, použité DM technologie, název práce-link ):

  1. Veljačiková, 2011 – open source WEKA http://diplomovka.sme.sk/praca/3723/modelovanie-spravania-sa-klienta-poistovne.php
  2. Krkošová,2011- open source WEKA http://diplomovka.sme.sk/praca/3710/volne-dostupne-nastroje-pre-data-mining.php
  3. Čipkala,2011- open source WEKA http://diplomovka.sme.sk/praca/3700/h-bkova-analyza-udajov-v-banke.php
  4. Hromada,2010, PSLSP- SAS Enterprise Miner http://diplomovka.sme.sk/praca/3625/analyza-poistovacich-produktov-s-vyuzitim-metod-dataminingu.php
  5. Hujíková,2009,PSLSP -SAS Enterprise Miner http://diplomovka.sme.sk/praca/3523/metody-riadenia-rizika-s-vyuzitim-h-bkovej-analyzy-udajov.php
  6. Lenárt,2009 – SAS ETC http://diplomovka.sme.sk/praca/3505/analyza-kapitalovych-trhov-s-vyuzitim-predikcie-casovych-radov.php
  7. Butková,2009, VUB BA – SAS Enterprise Miner http://diplomovka.sme.sk/praca/3503/cieleny-marketing-v-banke-s-vyuzitim-nastrojov-sas.php
  8. Papalová,2009, VUB BA – SAS Enterprise Miner http://diplomovka.sme.sk/praca/3502/riadenie-kreditneho-rizika-v-banke-s-vyuzitim-nastrojov-sas.php
  9. Kollariková,2009, VUB BA – –http://diplomovka.sme.sk/praca/3497/moderne-metody-riadenia-uveroveho-rizika.php
  10. Óbert,2008, VUB BA -SAS Enterprise Miner http://diplomovka.sme.sk/praca/3432/riadenie-kreditneho-rizika-v-banke-s-vyuzitim-h-bkovej-analyzy-dat.php
  11. Račák,2008, VUB BA – SAS Enterprise Miner http://diplomovka.sme.sk/praca/3347/multidimenzionalna-segmentacia-klientov.php
  12. Ivanič,2008 , VUB BA – SAS Enterprise Miner http://diplomovka.sme.sk/praca/3340/credit-scoring-v-praxi.php
  13. Kontúrová,2008 , VUB BA – SAS Enterprise Miner http://diplomovka.sme.sk/praca/3337/cieleny-marketing-na-baze-h-bkovej-segmentacie.php
  14. Gabaľ,2007, ocenená práca – SAS Enterprise Miner http://diplomovka.sme.sk/praca/3166/detekcia-poistovacich-podvodov-pomocou-nastrojov-sas.php