Pozvané prednášky

Aplikácia prístupov hĺbkového učenia na riešenie (ne)štandardných úloh strojového učenia

Peter Lacko, Michal Barla, Márius Šajgalík (FIIT STU v Bratislave)

Veľké medzinárodné spoločnosti ako Google, Microsoft alebo Facebook investujú nemalé prostriedky do podpory výskumu a rozvoja tejto oblasti. Nedávne porazenie šampióna v hre Go, práve vďaka hĺbkovému učeniu, ukazuje potenciál tohto prístupu. Aplikácie strojového učenia založené na hlbokých umelých neurónových sietiach dosahujú v mnohých oblastiach lepšie výsledky ako prístupy založené na ručne ladených črtách. V tejto pozvanej prednáške si prejdeme základné princípy hĺbkového učenia a ukážeme si aplikáciu tohto prístupu na rôzne problémy, ktoré riešime na UISI FIIT STU.

Graph Mining: Applications

Karel Vaculík (FI MU Brno)

Traditional data mining algorithms typically assume data instances to be independent. However, there is a lot of real-world scenarios where relationships between data instances exist and they are principal for data understanding. For example, there are relationships between people in social networks, between chemical elements in chemical compounds, etc. It is difficult or even impossible to express such information in the classical attribute-value representation. Graph mining is an area of data mining that uses a graph representation of data and it allows us to exploit the relationships in the data. The goal of this talk is to present diverse successful applications of graph mining on real-world graphs.

 

Automatic recognition of vehicle attributes using machine learning

Jan Sedlák (MU Brno)

Schopnost detekce a přesného rozpoznání různých atributů, jako jsou například barva nebo výrobce vozidla, hraje poměrně důležitou roli v inteligentních dopravních systémech (ITS), ale i při práci PČR, kde je tato schopnost velmi ceněna, obzvláště při detekci zájmových nebo odcizených vozidel. Práce se zaměřuje na klasifikaci zmíněných atributů ze snímků získaných z různých kamer v reálném provozu. Takovéto snímky často obsahují různé typy deformací, které správnou klasifikaci výrazně komplikují. Součástí práce je praktické porovnání použitelnosti populárních metod strojového učení, mezi které patří například RandomForest, Support vector machine a nebo dnes stále oblíbenější hluboké neuronové sítě. Provedené experimenty ukázaly, že ačkoli hluboké neuronové sítě dosahují velmi dobrých výsledků, ne vždy je nutné a efektivní tuto metodu využít.

 

Skutočné potreby podnikov na zber a spracovanie externých dát - prípadové štúdie z praxe

Filip Vítek (Mediworx)

Téma využívania externých dátových zdrojov, neraz BigData charakteru, sa prehupla z roviny teoretických možností do prvých implementačných projektov aj v rámci stredoeurópskeho kontextu. Autor sa spolupodieľal na implementáciách viacerých podnikových riešení na zber a spracovanie externých dát. V rámci príspevku sumarizuje ako správne odhaliť informačné potreby podnikov a ktoré úskalia pri ich zbere a spracovaní boli identifikované. Na sade konkrétnych príkladov zo SR a ČR ekonomického prostredia dokumentuje technologické a informačné požiadavky pre komerčné využitie tohto druhu služieb. Samostatná pozornosť je venovaná okruhom kolaboratívneho filtrovania a monitoringu konkurencie, ako typickým modelovým zástupcom spomínaných informačných potrieb spoločností. V závere príspevku autor naznačuje oblasti, v ktorých by výskumné a vzdelávacie inštitúcie mohli akcelerovať rozvoj tejto oblasti.

 

Aktuální dění v oblasti otevřených dat v ČR

Michal Kubáň, Dušan Chlapek (VŠE v Prahe, MV ČR)

V přednášce budou shrnuty hlavní dosažené výsledky v oblasti otevřených a propojených dat realizované v uplynulých letech v ČR. Dále budou prezentovány záměry dalšího rozvoje oblasti otevřených propojitelných dat v ČR, včetně vytvoření datové architektury na úrovni státu a zasazení otevřených propojitelných dat do Národního architektonického plánu ČR.

 

Aktuálne dianie v oblasti otvorených dát v SR

Peter Hanečák (EEA), Ľubor Illek (Slovensko.Digital)

Téma otvorených údajov v SR zaznamenáva zmiešané reakcie a výsledky, vo všeobecnosti však napreduje a z témy ktorá bola okrajovou až neznámou sa za pár rokov stala téma bežne akceptovaná. Pokiaľ ide o reálne publikovanie, čaká SR ešte mnoho práce, zaznamenali sme však už aj vcelku unikátne a pozitívne výsledky. V prednáške teda bude zhrnutá história otvorených údajov v SR za ostatných zhruba päť rokov, aktuálna situácia a tiež odhad toho, čo by sa mohlo udiať v najbližšom období.

 

Vizualizácia dat

Matej Novotný (Vis Gravis)

Interaktívna vizualizácia dát sa stala dôležitou súčasťou analytických procesov, kedy úspešne prepája výpočtový výkon strojov s inteligenciou a skúsenosťami ľudí. Radikálne zmeny (Big Data, údaje v reálnom čase, bezpečnostná politika, sociálne siete atď.) však predstavujú nové výzvy aj pre overené postupy a musíme na ne vedieť reagovať. Sme preto svedkami evolučných aj revolučných zmien v oblasti vizualizácie. Prednáška predstaví tieto súčasné trendy a načrtne riešenia pre nové výzvy v oblasti vizuálnej analýzy dát.

 

Vývoj databází a jeho reflexe v konferencích DATASEM, DATAKON a Data a znalosti v letech 1981 – 2016

Jaroslav Pokorný (MFF UK v Praze)

Padesát let vývoje databází je již úctyhodné číslo. Se zhruba desetiletým zpožděním jsme ho zaznamenali i v Československu. Československá odborná komunita se zapojila rychle do této atraktivní problematiky. Historicky nestarší odborná setkání pod názvem DATASEM (DATabázový SEMinář) započala již v roce 1981. Charakteristická pro tyto první konference byla velmi plodná symbióza odborníků teorie i praxe. Setkání se totiž hojně účastnili vedle akademiků i zástupci komerční sféry. Cílem přednášky je ukázat, jak se se světový vývoj databází odrážel a odráží v těchto odborných národních setkáních, tj. ve dvaceti letech semináře (později konference) DATASEM, pokračujícího dalších čtrnáct let jako DATAKON a konečně od r. 2015 jako konference Data a Znalosti. Zvláštní pozornost bude věnována novým databázovým architekturám a současným trendům.

 

 

R vs. Python – which one fits you best?

Jakub Ševcech, Peter Laurinec, Ondrej Kaššák (FIIT STU v Bratislave)

The choice of suitable analytic programming language is an important decision, which significantly influence your project. R and Python are first choices for many data analysts and data scientists. For a long time there has been an open discussion comparing both languages, their pros and cons. Their strength lies in packages (libraries), which enable effective data manipulation, machine learning or visualisation.
R was perceived as language developed by statisticians for statisticians, which is suitable mainly for advanced computing in standalone analytic applications. It was used for effective analyses with easy visualisation. Python was used mainly by “hackers” and it was later equipped with packages providing the ability of advanced data processing, statistics, machine learning and visualization.
Do stereotypes about these languages and its programmers still apply? What are strong and weak parts of both languages and ecosystems around them? What to consider when making your choice of language?