Datu analīzes pamati

Data analīze izmantojot SQL un Python valodas

Mūsdienās datu apjomi datu bāzēs pieaug lavīnveidīgi. Tas attiecas gan uz nelielu veikalu, gan starptautisko finanšu korporāciju datu bāzēm. Vienlaikus pieaug biznesa pārvaldes lēmumu pieņemšanas ātrums. Kopā šie divi faktori noteic nepieciešamību pēc precīzas, ātras un profesionālas vajadzīgo datu izlašu sagatavošanas un cita vieda datu apstrādes lēmumu pieņemšanas vajadzībām.

Programmas pasniedzējs

Jurijs Zubkovs
datu analīzes specialists

Mācību programma ir domāta menedžeriem un citiem specialistiem, kuru darbā rodas nepieciešamība analitisko datu izlašu un atskaišu sagatavošanā. Programma sastāv no divām daļām: datu analīze datu bāzē vaicājumu valodā SQL un statistiskās analīzes pamati ar realizāciju programmēšanas valodā Python.

Pastāv daudz gadījumu, kad pārvaldes lēmumu pieņemšanai nav nepieciešama statistisko likumsakarību noskaidrošana, bet ir vajadzīgas precīzas atbildes uz «Kas? Kur? Kad?» tipa jautājumiem. Šādas atbildes no datu bāzes sniedz vaicājumu rezultāti SQL valodā. Minēsim piemērus.

Ja uzņēmums nodarbojas ar nekustāmo īpašumu, tad firmas vadītājus var interesēt, cik un/vai kuri objekti ar platību vairāk nekā 60 (100, 200, 300 utt.) kvadrātmetrus tika realizēti noteiktā periodā un tos realizējuši noteiktie menedžeri; attiecība starp pārdošanas un īres darījumiem noteiktā periodā.

Ja uzņēmums realizē viena tipa preci daudzos paveidos vairākos reģionos vai vairākās valstīs, tad var interesēt, kādiem paveidiem dod priekšroku viena vai otra reģiona un vecuma iedzīvotaji, kādas ir darījuma slēgšanas nianses.

Prognozei, trūkstošo datu atjaunošanai un slēptu tendenču noskaidrošanai ir vajadzīga statistiskā datu analīze. Programmēšanas valoda Python ar specializētu izstrādes vidi un daudziem datu vizualizēšanas rīķiem ir lielisks instruments datu analītiķa rokās.

Turklāt programma «apmāca mācīties»: pēc apmācības prezultātiem studenti būs spējīgi patstāvīgi izvēlēt valodas Python biblioteku reta uzdevuma atrisināšanai un uzrakstīt kodu mijiedarbībai ar šo biblioteku.

Programmas saturs

Datu analīze SQL valodā

Mācāmies raksīt vaicājumus datubāzei (piemēros un uzdevumos patstāvīgai atrisināšanai izmantojam 7 mācību datubāzes)

  1. Datubāzes projektēšana
    1. Relāciju datu modelis
    2. Datubāzes projektēšanas pamati
    3. Relāciju algebra un tās operācijas
  2. Datubāzes un tabulu veidošana, datu modifikācija
    1. Datubāzes un tabulu veidošana.
    2. ALTER TABLE — izmaiņas tabulās.
    3. INSERT — datu ievietošana.
    4. UPDATE — datu atjaunināšana.
    5. DELETE — datu dzēšana.
  3. Vaicājumi datu izlases iegūšanai, SQL operatori un predikāti
    1. SELECT — vaicājums datu iegūšanai.
    2. IN — kopas uzdošana datu meklēšanai.
    3. BETWEEN — intervāla uzdošana datu meklēšanai.
    4. LIKE — simbolu uzdošana rindas meklēšanai.
    5. JOIN — datubāzes tabulu savienojums.
    6. GROUP BY — grupēšana vaicājumos.
    7. HAVING — grupējošo funkciju interesējošas vērtības.
    8. EXISTS — vērtību kopas eksistences pārbaude.
    9. Apakšvaicājumi, to veidi, izmantošanas pareizība.
  4. Operācijas ar vaicājumu rezultātiem
    1. UNION — vaicājumu rezultātu apvienošana.
    2. INTERSECT, EXCEPT — vaicājumu rezultātu šķēlums un starpība.
  5. SQL funkcijas un konstrukcijas
    1. Grupējošas funkcijas - SUM, MIN, MAX, AVG, COUNT.
    2. Datuma un laika funkcijas.
    3. Funkcijas noapaļošanai un citām darbībām ar daļskaitļiem.
    4. Funkcijas darbībām ar rindām.
    5. Funkcija COALESCE — pirmā ne-NULL vērtība.
    6. ALL un ANY: vairāk par visu, vienāds ar kaut vienu.
    7. TOP un citas konstrukcijas rindu diapazona iegūšanai.

Rakstam vaicājumus datubāzei patstāvīgi: laboratorijas darbs (20 uzdevumu risināšana saistībā ar to, kādiem preču paveidiem dod priekšroku noteiktu valstu, reģionu un vecumu iedzīvotāji, kurā laika diapazonā un pēc citām pazīmēm, izmantojam vienu datubāzi)

Datu statistiskā analīze ar realizāciju programmēšanas valodā Python

  1. Ievads programmēšanas valodā Python un tās konstrukcijās, kuras ir nepieciešamas, lai izmantotu bibliotekas statistiskai datu analīzei
  2. Pamatzināšanas no matemātiskās statistikas
    1. Datu izlases un aprakstoša statistika.
    2. Gadījumlielumi un to sadalījuma likumi.
    3. Statistisko hipotēžu pārbaude.
  3. Matemātisko modeļu uzbūves metodes
    1. Korelācijas analīze.
    2. Regresijas analīze.
    3. Dispersiju analīze.
    4. Klāsteranalīze.
    5. Faktoranalīze.
    6. Laikrindu analīze.
    7. Salīdzinoši retie uzdevumi un to atrisināšanai nepieciešamas valodas Python bibliotekas (apskats).

Tests matemātiskās statistikas pamatos, analīzes rezultātu interpretēšanā un programmēšanas valodas Python biblioteku izmantošanā

Programmas beigās studentam tiek izsniegts sertifikāts par programmas pabeigšanu. Turklāt visi šīs programmas absolventi saņems 20% atlaidi mācībām jebkurā no mūsu skolas mācību programmām.
Bez priekšzināšanām
Mācību valoda: krievu, latviešu
Kursa ilgums
3 mēneši (84 stundas)
Mācību sākums
2020. gada 7. janvārī
Nodarbību dienas un laiki
otrdienās, ceturtdienās 18:00—21:00
Mācību maksa
Speciālais piedāvājums tikai līdz 16.12.2019
Ar savu datoru
249
mēnesī
Ar skolas datoru
299
mēnesī
Ar savu datoru
299
mēnesī
Ar skolas datoru
349
mēnesī
Atlaide skolēniem 10%
Naudas atmaksas garantija14 dienu laikā

Mācību valodaMācību forma

Paldies par reģistrāciju mācībām Webskolā.
Mēs ar jums sazināsimies tuvākajā laikā!