9 grudnia 2024 18:09
Wykład Tomasza Zielińskiego o SLPS, 18.12, 17:00, s. 119
Wykład Tomasza Zielińskiego odbędzie się w środę 18 grudnia o 17:00 w sali 119.
„Dostałeś z ministerstwa 10 milionów PDF-ów. Co teraz?”
Gdy Ministerstwo Sprawiedliwości przekaże ci 10 milionów plików PDF z raportami losowego przydziału spraw, wraz z satysfakcją pojawia się wątpliwość - jak wyciągnąć użyteczne dane z takiej masy dokumentów? Opowiem o wyzwaniach związanych z realizacją serwisu https://slps.pl, począwszy od procesu pozyskania dokumentów, przez ekstrakcję tekstu z plików PDF, agregację wartości w bazie danych, aż po generowanie serwisu WWW i jego skrajnie oszczędny hosting. Bonusowo - przykłady błędów i niezgodności otrzymanych raportów ze specyfikacją Systemu Losowego Przydziału Spraw oraz rozważania, jaki sens ma robienie po godzinach takich dziwnych rzeczy