Czarna Magia na podium w międzynarodowym programie Amazon
Zespół członków Koła Naukowego Sztucznej Inteligencji z Wydziału Matematyki i Informatyki UWM zajął trzecie miejsce w kategorii Machine Learning w międzynarodowym Amazon University Engagement Program Cohort 2025. Przez 12 tygodni Kacper Gutowski, Dawid Koterwas, Remigiusz Sęk i Andrii Norets pracowali nad systemem mającym wspomagać naukowców w pisaniu prac naukowych. O projekcie opowiedzieli członkowie koła.
O czym był Wasz projekt?
GALIS, czyli Graph-Aware Literature Intelligence System for Research Synthesis, to aplikacja webowa, której celem jest wspomaganie badaczy z dziedziny informatyki w automatyzacji tworzenie sekcji "Related Work" i "References" w publikacjach naukowych. Pisanie tych sekcji to notorycznie czasochłonne zadanie, które wymaga nie tylko streszczenia poszczególnych publikacji, ale też zrozumienia złożonych relacji między pracami naukowymi. Nasze rozwiązanie wykorzystuje graf semantyczny do mapowania relacji między artykułami naukowymi i ich kluczowymi koncepcjami, co pozwala generować spójne i trafne bibliografie oraz sekcje z przeglądem literatury.
Na czym polega program Amazon?
University Engagement Program to inicjatywa stworzona w 2021 roku przez Albę Mustafaj, napędzana przez wolontariuszy z Amazona na całym świecie we współpracy z Amazon Women in Engineering Community. Program składał się z trzydniowego bootcampu skupionego na Software Engineering, Product Management i Machine Learning, a następnie dwunastotygodniowej fazy mentoringu, podczas której pracowaliśmy nad projektem pod okiem doświadczonej mentorki, Software Engineera z Amazon Kindle z Madrytu. Na koniec odbyła się ceremonia online, gdzie panel jury oceniał projekty i ogłaszał zwycięzców.
Jakie technologie wykorzystaliście?
Wykorzystaliśmy cały stos nowoczesnych technologii z obszaru machine learningu. Backend oparliśmy na PyTorch i PyTorch Geometric do trenowania sieci grafowych, wykorzystaliśmy bibliotekę Sentence Transformers z modelem all-mpnet-base-v2 generującym 768-wymiarowe embeddingi semantyczne. Do generowania ostatecznych treści sekcji Related Work użyliśmy LangChain zintegrowanego z modelem Google Gemini 2.0 Flash. Całość zapakowaliśmy w Dockera, a interfejs użytkownika stworzyliśmy w Streamlit. Trenowaliśmy na zbiorze OGBN-ArXiv, który reprezentuje sieć cytowań artykułów z informatyki.
Jak przebiegał proces tworzenia systemu?
Zaczęliśmy od eksperymentów z podejściem link prediction wykorzystującym GNN (Graph Neural Network), ale napotkaliśmy problem niskiej trafności semantycznej rekomendacji i dużej złożoności obliczeniowej. Następnie wdrożyliśmy baseline z TF-IDF (Term Frequency-Inverse Document Frequency) jako rozwiązanie pośrednie, ale miało ono ograniczenia w wychwytywaniu znaczenia semantycznego. Ostatecznie przeszliśmy na architekturę z Sentence Transformers, która znacznie przewyższyła wcześniejsze podejścia - potrafi uchwycić kontekstualne znaczenie i odkrywać semantycznie powiązane artykuły nawet przy różnej terminologii.
Co wyróżnia GALISa na tle konkurencji?
W przeciwieństwie do narzędzi takich jak Connected Papers, Litmaps czy ResearchRabbit, które skupiają się na wizualizacji sieci cytowań, GALIS został zaprojektowany specjalnie do automatyzacji i usprawnienia generowania sekcji Related Work i References. Dzięki wykorzystaniu grafu semantycznego system zapewnia, że referencje są kontekstowo trafne, logicznie zorganizowane i dostosowane do potrzeb zarówno środowiska akademickiego, jak i przemysłowych zespołów R&D. Użytkownik wprowadza abstrakt swojej pracy, a system przetwarza go, generując listę referencji i strukturalny szkic sekcji Related Work.
Jakie macie plany na rozwój projektu?
Testy użytkowników pokazały, że system jest szybki i łatwo integruje się z istniejącym workflow badawczym. Otrzymaliśmy feedback dotyczący poprawy dopasowania między generowanymi treściami a abstraktami użytkowników oraz ściślejszego wyrównania między odpowiedziami systemu a treścią badań. To obszary, nad którymi można pracować, aby rozwinąć projekt.
Końcowy komentarz
Jesteśmy bardzo wdzięczni Elwirze Glowacz za rekomendację do programu, Albie Mustafaj za organizację, a zwłaszcza naszej mentorce Esther Ruano Hortoneda, której prowadzenie i opieka miały kluczowe znaczenie dla naszego rozwoju technicznego.
Więcej informacji o Czarnej Magii oraz działaniach Koła możecie znaleźć na ich mediach społecznościowych: https://linktr.ee/czarnamagia
W imieniu całej społeczności akademickiej Wydziału Matematyki i Informatyki gratulujemy naszym studentom i życzymy kolejnych sukcesów


