Ediz Morochovič

October 2, 2020 Daniel Hladek bp2019 0 minutes, 40 seconds
ner, nlp

Ediz Morochovič

Rok začiatku štúdia: 2016

Bakalárska práca 2019

Názov bakalárskej práce: Štatistické rozpoznávanie pomenovaných entít

Meno vedúceho: Ing. Daniel Hládek, PhD.

Zadanie bakalárskej práce:

  1. Vypracujte prehľad štatistických metód identifikácie pomenovaných entít v texte.
  2. Podrobne opíšte zvolenú metódu identifikácie pomenovaných entít v texte
  3. Zvoľte si vhodnú metodiku vyhodnotenia a na vhodnej testovacej množine navrhnite a vykonajte sadu experimentov.
  4. Na základe výsledkov experimentov navrhnite možné zlepšenia.

Bakalársky projekt 2019

Úlohy: Nainštalujte si prostredie Anaconda https://www.anaconda.com/ Oboznámiť sa so zvoleným štatistickým systémom pre rozpoznávanie pomenovaných entít (https://www.nltk.org/), https://www.nltk.o/install.html, https://stanfordnlp.github.io/CoreNLP/, https://www.nltk.org/book/ Zistite použitú štatistickú metódu a podrobne ju opíšte Vypracujte prehľad používaných štatistických metód (maximum entropy, conditional random fields, hidden markov models), min. 5 strán s min. 10 odkazmi na odborné články Navrhnite experimenty a vykonajte ich s rôznymi parametrami systému

Písomná práca :

Výstupy bakalárskeho projektu:

Poznámky: