Ján Malinovský

May 14, 2026 Daniel Hladek dp2027 1 minute, 54 seconds
rag, nlp

rok začiatku štúdia: 2022

Diplomový projekt 2026

Téma:

Grafové vyhľadávanie pre podporu vzdelávania

Ciele na semester.

  • Zistite čo je to Retrieval Augmented Generation
  • Zistite, čo je to znalostný graf
  • Naučte sa čo je to GraphRAG
  • Zostavte malý znalostný graf z oblasti vzdelávania. Pri zostavení môžete využiť jazykový model. Môžete preložiť existujúci znalostný graf.
  • Využite znalostný graf pre zlepšenie práce alebo vysvetliteľnosti jazkového modelu

Napr.

  • výchovné opatrenia v špeciálnej pedagogike.
  • osnovy pre výuku na základnej škole.
  • spôsoby práce asistenta pedagóga.

Stretnutie 14.5.2026

Stav:

  • Preštudované materiály podľa pokynov nižšie .
  • Získané dokumenty - osnovy pre pre základné školy: slovenčina, matematika, angličtina, informatika, fyzika, biológia, občianska náuka, telesná výchova, chémia pre všetky ročníky.
  • Extrahovaný text pomocou pypdf a docx. Sú tam aj excel tabuľky, ale tie nie sú extrahované.
  • Text sa rozdelí na chunky (cca 8000 znakov), vypočíta sa hash na deduplikáciu.
  • Pomocou LM sa dokument transformtuje na JSON. Z dokumentu LLM extrahuje "vzdelávacie koncepty" a vzťahy medzi nimi. Vzťahy sú z určenej množiny typu "implements", "depends on", "teaches", "requires".
  • Výsledok sa zobrazí vo forme grafu.
  • Vytvorený jednoduchý agent, ktorý vyhľadáva v znalostnom grafe a na základe týchto informácií generuje odpoveď.

Zdroje doumentov:

  • https://www.minedu.sk/vzdelavacie-standardy-pre-1-stupen-zs/
  • https://www.minedu.sk/vzdelavacie-standardy-pre-2-stupen-zs/
  • https://podporneopatrenia.minedu.sk/zabezpecenie-posobenia-pedagogickeho-asistenta-v-triede/
  • https://www.upsvr.gov.sk/socialne-veci-a-rodina/rodina/opatrenia-socialnopravnej-ochrany-deti-a-socialnej-kurately/socialno-pravna-ochrana-deti/opatrenia-na-zabezpecenie-ochrany-zivota-zdravia-a-vyvinu-dietata/vychovne-opatrenia.html?page_id=1205
    • https://www.minedu.sk/pedagogicky-asistent-podporne-opatrenie/
    • https://podporneopatrenia.minedu.sk/katalog-podpornych-opatreni/

Úlohy:

  • dajte zdrojové kódy na GIT.

Týka sa ďalšieho obdobia:

  • Pozrite si https://github.com/hkuds/minirag . Prečítajte si článok, vyskúšajte zdrojové kódy s dátami ktoré máte.
  • Pozrite si https://github.com/HKUDS/LightRAG. Prečítajte si článok, pozrite zdrojové kódy, môžete aj vyskúšať.
  • Preštudujte si jazyk Cypher.
  • Preštudujte si embedding modely a vektorové databázy, napr. ChromaDB a multilingual e5-large.
  • Pokračujte štúdiu GraphRAG:
  • Vytovrte webové demo pre pomoco pedagógovi pri príprave na hodinu. Môžete použiť gradio alebo streamlit.
  • Vytvorte agenta pre pomoc učiteľovi alebo pedagogickému asistentovi pri príprave na vyučovanie.

Zásobník úloh:

  • Využite školskú infraštruktúru
  • Zlepšite proces tvorby znalostného grafu. Zlepšite druhy vzájomných vzťahov, zlepšite proces extrakcie.
  • Vytvorte proces zhlukovania konceptov (pomenovaných entít)
  • Použite grafovú datagázu Neo4J alebo inú.
  • Jeden z možných spôsobov vyhľadávnaia je použitie relačnej dabázy.
  • Preštudujte si spôsoby vyhodnotenia RAG - RAGAS, DeepEval a vyhodnnotte systém.

Stretnutie 20.2.2026

Úlohy:

  • Naučte sa programovať v Python.
  • Zistite, čo je to RAG. Zistite ako funguje generatívny model. Napíšte o tom poznámky a zdroje ktoré ste použili.
  • Prihláste sa na https://ui.tukekemt.xyz/ , api https://docs.openwebui.com/reference/api-endpoints/
  • https://docs.langchain.com/oss/python/langchain/quickstart
  • Pozrite si https://graphrag.com/concepts/intro-to-graphrag/
  • https://docs.langchain.com/oss/python/integrations/retrievers/graph_rag

Zásobník úloh:

  • Indexujte a vyhľadávajte v databáze dokumentov z oblasti vzdelávania.
  • Oboznámte sa s https://github.com/topoteretes/cognee