Anotácia textových dát

February 9, 2021 Daniel Hladek info 0 minutes, 20 seconds

Anotácia textových dát

  • Natrénovanie štatistického modelu pre spracovanie prirodzeného jazyka zo slovenských dát
  • Manuálna anotácia slovenských dát pre výskyt pomenovaných entít

Postup

  • Definovanie anotačnej schémy
  • Príprava dátovej množiny vhodnej na anotáciu
  • Natrénovanie štatistického modelu Spacy
  • Príprava anotačnej úlohy Prodigy

Nástroje

  • Python (príprava dát)
  • Spacy (štatistický model) Spacy)
  • Prodigy (anotácie)

Riešitelia

  • Andrej Hopko (BP, ex?)
  • Tomáš Kuchárik (príprava dát z wikipedie)
  • Jakub Maruniak
  • Cesar Gutierez (stáž leto 2019)