Matej Kobyľan

February 17, 2023 Daniel Hladek bp2023 2 minutes, 6 seconds
ir

rok začiatku štúdia: 2020

Bakalárska práca 2024

Cieľ: Vytvoriť dialógový systém pre podporu komunikácie občana s mestom Košice

Úlohy:

  • Zistite, čo je to Natural Language Understanding. Napíšte o tom správu na 2 strany.
  • Prečítajte si BP Samuel Horáni. https://opac.crzp.sk/?fn=detailBiblioForm&sid=A770A18E340C6018B48DE7BDD5C2 Napíšte čo ste sa dozvedeli.
  • Prečítajte si článok https://link.springer.com/article/10.1007/s10462-022-10248-8 a napíšte, čo ste sa dozvedeli.
  • Vyskúšajte si chatbota z repozitára https://git.kemt.fei.tuke.sk/sh662er/Rasa. Nainštalujte si https://pytorch.org/get-started/locally/ Nainštalujte si https://github.com/hladek/spacy-skmodel
  • Skúste ho upraviť tak, aby dával informácie o meste Košice.

Bakalárska práca 2023

Systém pre monitoring médií

Práca súvisí s DP Michal Stromko

Návrh na zadanie:

  • Navrhnite a implementuje systém pre extrakciu textu a metainfrmácií z webových stránok alebo sociálnych sietí
  • Modifikujte agenta pre získavanie textu tak aby do databázy ukladal sledované webové stránky v pravidelných intervaloch.
  • Aplikujte neurónovú sieť na klasifikáciu získaných článkov.

Analýza úlohy:

Chceme vytvoriť databázu novinových článkov.

Pre článok chceme evidovať:

  • zdroj
  • autor
  • titulok
  • text rozdelený na odseky
  • odkazy na iné články
  • autorská sekcia
  • autorské tagy alebo kľúčové slovíčka.
  • perex
  • dátum vydania.
  • pôvodné html

Ku databáze chceme vytvoriť agenta ktorý by v pravidelných intervaloch dopĺňal nové články. Agenta pre zber textu stačí modifikovať.

Ku databáze chceme vytvoriť webové rozhranie.

V databáze chceme vedieť vyhľadávať.

Chceme vedieť automaticky zistiť tému článku.

Chceme automaticky zistiť sumár článku.

  • Vyberte vhodnú databázu.
    • Postgres, Cassandra.
  • Navrhnite schému.
  • Modifikujte agenta pre zber textu.
  • Implementujte webové rozhranie na prístup k databáze.

Stretnutie 24.1.2022

Stav:

  • Začiatok štúdia Python.
  • Prečítané články: "COVID a kľúčové slová", o Elasticsearch.

Úlohy:

  • Pokračovať v otvorených úlohách z 30.9.
  • Zistite, čo je to systém RASA a ako pracuje.
  • Skúste prejsť tutoriál https://rasa.com/blog/category/tutorials/
  • Zvážiť zmenu témy na "RASA" dialógový systém.

Stretnutie 30.9.2022

Úlohy:

  • [x] Prečítajte si záverečné práce J. Holp, M. Stromko.
  • [ ] Nainštalujte si systém Anaconda. Naučte sa pracovať s virtuálnymi prostrediami.
  • [x] Prejdite si Python tutoriál.
  • [ ] Zistite ako pracuje agent pre zber textu - web crawler. Vyhľadajte odborné články alebo knihy na túto tému a urobte si poznámky.
  • [ ] Oboznámte sa s kódom agenta websucker https://git.kemt.fei.tuke.sk/dano/websucker-pip.

Zásobník úloh:

  • Pozrieť sa na https://github.com/microsoft/playwright-python
  • Zistite, ako funguje knižnica BeautifulSoup, vypracujte tutoriál.
  • Vypracujte prehľad literatúry na tému "Monitorovanie médií". Otvorte si google scholar, hyhľadajte heslo "news monitoring" , "social media monitoring". Vyberte články ktoré sa Vám zadajú zaujímavé, prečítajte si ch a napíšte na min. jednu stranu poznámky čo ste sa dozvedeli. Uveďte zdroje - názy článkov a autorov.
  • Zistite si, čo je systém Elasticsearch a ako pracuje. Napíšte o tom správu na jednu stranu.
  • Pomocou systému Docker si nainštalujte Elasticsearch 8.4
  • Prejdite si tutoriál https://elasticsearch-dsl.readthedocs.io/en/latest/index.html
  • Urobte si GIT repozitár, kde budeme dávať kódy.