Kamil Tomčufčík

February 7, 2025 Daniel Hladek dp2025 2 minutes, 5 seconds

lm

rok začiatku štúdia: 2020

Diplomová práca 2025

Ciel:

Overiť a zlepšiť možnosti generovania jednotkových testov

Zadanie:

Vypracujte prehľad veľkých jazykových modelov s podporou generovania programového kódu.
Vyberte vhodnú dátovú množinu a metriku na vyhodnotenie generovania kódu.
Navrhnite a vyhodnoťte experimenty s generovaním kódu s pomocou veľkého jazykového modelu.
Identifikujte slabé miesta a navrhnite zlepšenia.

Stretnutie 12.12.2024

Stav:

Metrika Pass@K sa používa na vyhodnotenie generovaného kódu. Meria, koľko automatických textov bolo splnených. Používa sa aj BLEU, verzia CodeBLEU. CodeJudge.
Na testovanie generovaných testov sa používajú: vykonanie produkčného kódu, pokrytie testov, mutácie kódu, statická analýza generovaného kódu.
Vyskúšaný model polycoder (na C),codeparrot (na python) na kaggle. Code T5 zatiaľ nie je vyskúšaný.
Copilot by mal byť pre študentov zadarmo. Študneti majú aj Azure kredity.

Úlohy:

Zásobník úloh:

Stretnutie 14.11. 2924

Stav:

Vyhľadané modely na generovanie kódu. Nie sú vyskúšané. Codex, CodeParrot a Incoder. Na unittesty CodeT5 a AthenaTest.
Rozčítané knihy podľa pokynov.

Úlohy:

Zistite odpovede na tieto otázky:

[x] Ako zistíme, že vygenerovaný kód je dobrý.
[x] Ako zistíme, že vygenerovaný test vyhovuje špecifikácii?
[-] Vypracujte písomný prehľad modelov pre generovanie kódu. Napíšte aké modely sa používajú, Akým spôsobom sa vyhodnocujú. Napíšte na akej neurónovej sieti sú založené, aké sú veľk=, aké jazyky podporujú, aké výsledky dosahujú. Použite odborné články. Odborné články nájdete na google scholar alebo scopus.
[-] Pripravte vzorovú dátovú množinu. Hotové testy, implementácie aj dokumentáciu. Možno vybrať existujúci open source projekt alebo hotovú dátovú množinu.
[-] Vyskúšajte niekoľko jazykových modelov pre generovanie kódu aj generovanie testov.
[ ] Do diplomovej práce vypracujte experimenty kde vyhodnotíte jazykové modely pre generovanie testov v rôznych prostrediach.

Zásobník úloh:

Stretnutie online 5.2.2024:

Úlohy:

Nainštalujte si prostredie Anaconda, pozrite si knihu https://diveintopython3.net/ Dive Into Python 3
pre úvod do neurónových sietí si prečítajte knihu https://d2l.ai/index.html Dive into Deep Learning — Dive into Deep Learning 1.0.3 documentation
vyskúšajte viac modelov pre generovanie kódu. Codex, Copilot, ChatGPT
zistite ako funguje veľký jazykový model

Zásobník úloh (zadanie na ďalšie stretnutie):

Zistite zoznam open source modelov pre generovanie kódu a porovnajte ich možnosti. Zoznam zapíšte do textového súboru.
Vyberte si jeden z modelov na generovanie kódu, nainštalujte si ho a vyskúšajte.
Zistite, ako sa číselne vyjadrí kvalita generovania počítačového kódu. Aké metriky sa používajú? Zistie aké trénovacie a vyhodnocovacie množiny sa používaju. Zoznam zapíšte do súboru.
Zistite, ako sa dá taký model "dotrénovať" na špecifickú úlohu generovania testov.