Emacs Artificial General Intelligence Algorithmic Game Theory: Prediction Markets (po polsku) Systemy Inteligentnych Agentów
|
Zapoznaj się z SVM (Support Vector Machines, Tutorial Slides by Andrew Moore, Support Vector and Kernel Machines). Możesz przetestować działanie SVM wykorzystuąc pakiet e1071, patrz SVM-Tutorial using R (e1071-package) oraz R News 1/3 2001 s. 23–27. Obejrzyj wykład dotyczący klasyfikacji wykorzystującej informację pochodzącą z wielu źródeł (jakościowo różną), za pomocą kombinacji macierzy podobieństwa: Gert Lanckriet Sparse and large-scale learning with heterogeneous data. W zadaniu wykorzystamy toolbox SHOGUN (Shogun - A Large Scale Machine Learning Toolbox), wykorzystujący trochę inną technikę od zaproponowanej przez Lanckrieta, patrz Large Scale Multiple Kernel Learning. Zadanie polega na zgromadzeniu zbioru danych ze zmiennymi o różnym charakterze, w tym przynajmniej liczbowymi, napisowymi i kategorialną, może też z szeregiem czasowym, i wykorzystaniu toolboxa SHOGUN do wyuczenia klasyfikatora wykorzystującego kilka jąder (odpowiednio dobranych dla zmiennych). Przygotuj raport przedstawiający wyniki eksperymentów z klasyfikatorem, dołącz też istotne skrypty wykorzystane w eksperymentach. (Wykorzystanie pakietu R nie jest wymagane, można działać w Pythonie albo w Matlabie/Octavie.) Zadanie nie jest tak trudne jak może się wydawać, bo nie musisz rozumieć “jak to działa” (w razie braku wystarczającej motywacji by przemóc brak czasu, możesz zignorować część zadania “zapoznaj się z”.) Trudną częścią jest znalezienie/skonstruowanie ciekawego zbioru danych zawierających zarówno tekst / dane typu “string” ale nie typowo kategorialne, oraz dane numeryczne. Na stronie SHOGUNa można znaleźć linki do analiz danych udostępniających również pokaźne zbiory danych (ale raczej nie typu “hurtownia danych”), np.: Zadanie nie ma wersji podstawowej (należy do kategorii “rozszerzone”). |