Maksym Zatirka

October 2, 2025 Daniel Hladek bp2026 0 minutes, 44 seconds

rok začiatku štúdia: 2023

študent KM

Bakalárska práca 2026

Téma:

Grafová databáza pre podporu generovania slovenského jazyka

Ciele:

Vytvorte databázu pre vyhľadávanie v rozsudkoch s využitím grafovej informácie.

Stretnutie 2.10.

Úlohy:

  • Prejdite si tutoriál https://python.langchain.com/docs/tutorials/rag/
  • Prejdite si tutoriály https://neo4j.com/docs/getting-started/appendix/tutorials/tutorials-overview/
  • Zistite, ako vieme využiť grafy pri RAG - ako skombinovať langchain a neo4j
  • Pokračujte v štúdiu Python
  • Prečítajte si články https://arxiv.org/abs/2408.08921 a https://ieeexplore.ieee.org/abstract/document/10771030 a robte si poznámky.

Zásobník úloh:

  • Pripravte databázu znalosti zo súdnej domény pre zlepšenie vyhľadávania v rozsudkoch.

Predbežné úlohy:

  • Naučte sa Python lepšie. Nainštalujte si prostredie Anaconda.
  • Poučte sa o strojovom účení. Dive into deep learning.
  • Zistite čo je to Retrieval Augmented Generation a napíšte si o tom poznámky
  • Pozrite si knižnicu llamaindex.
  • Zistite čo je to znalostný graf
  • Zistite ako funguje databáza Neo4J.
  • Zistite čo je to SparkQL.
  • Napíšte si poznámky z vecí ktoré ste sa naučili. Využívajte odborné články, ktoré nájdete na google scholar.