Martin NaN1
Nan1_name
Rok začiatku štúdia: 2018
Podmienkou pre získanie zápočtu je účasť na konzultácii min. raz za 2 týždne. Menej ako 6 konzultácií za semester je dôvod pre zníženie hodnotenia alebo neudelenie zápočtu. Komunikácia je možná aj cez MS Teams, Cisco Webex... Konzultačné hodiny sú podľa dohody, preferujem chat na MS Teams.
Bakalársky projekt 2020
Názov: Využitie najnovších nástrojov v rámci prirodzeného spracovania reči
Cieľ:
- Pokúsiť sa použiť slovenské dáta na spracovanie prirodzeného jazyka v prostredí zvoleného nástroja
Návrh na zadanie:
- Vyberte a naštudujte najnovšie a najvýznamnejšie metódy spracovania prirodzeného jazyka.
- Vypracujte základnú teóriu k zvolenej metóde a nástroju na spracovanie textu.
- Vytvorte demonštračnú webovú aplikáciu pomocou ktorej je možné vyskúšať zvolenú metódu.
- Navrhnite možné zlepšenia Vašej práce z hľadiska výberu architektúry, nástroja alebo metódy spracovania textu.
Zásobník úloh:
- Vytvorte si repozitár na GITe, nazvite ho bp2021. Do neho budete dávať kódy a dokumentáciu, ktorú vytvoríte.
Virtuálne stretnutie
Stav:
- prečítajte si niečo o NLP:
- odporúčam zdroje ako arxiv, blogy z medium.com
- https://colab.research.google.com/github/NVIDIA/NeMo/blob/main/tutorials/nlp/GLUE_Benchmark.ipynb#scrollTo=daYw_Xll2ZR9
- https://colab.research.google.com/github/NVIDIA/NeMo/blob/main/tutorials/NeMo_voice_swap_app.ipynb#scrollTo=I9eIxAyKHREB
- https://github.com/pytorch/fairseq/tree/master/examples/roberta
- zistite čo je to NER, POS.
- https://www.youtube.com/embed/wBgpMf_KQVw //NeMO, Jarvis
- https://github.com/pytorch/fairseq/blob/master/examples/wav2vec/README.md
- odporúčam zdroje ako arxiv, blogy z medium.com
Úlohy do ďalšieho stretnutia:
-
Stretnutie x.yy.2O20:
Na štúdium:
Na vypracovanie:
Na zlepšenie:
- Chceme vybrať metódu NLP ktorej sa budeme venovať.
- chceme vybrať knižnicu alebo demo ktoré budeme prezentovať.