Emacs Artificial General Intelligence Algorithmic Game Theory: Prediction Markets (po polsku) Systemy Inteligentnych Agentów
|
Teoria decyzji (statystyka)Eksperyment X=x, decyzja a=d(x), prawdziwy stan natury \theta, strata L(\theta, a) = L(\theta, d(X)). Funkcja ryzyka R(\theta, d) = E_\theta L(\theta, d(X)) = \int_X L(\theta, d(x)) dP_\theta Bayesowskie funkcje decyzyjneZasada Bayesa: \theta jest zmienną losową o zadanym rozkładzie \tau = rozkład a priori. Ryzyko bayesowskie: r(\tau, d) = E_\tau R(\theta, d) = \int_\Theta R(\theta, d) d\tau(\theta). d_0 jest funkcją bayesowską ze względu na \tau gdy r(\tau, d_0) = {inf}_{d \in D} r(\tau, d). Minimaksowe funkcje decyzyjned_0 jest minimaksową funkcją decyzyjną gdy {sup}_{\theta \in \Theta} R(\theta, d_0) = {inf}_{d \in D} {sup}_{\theta \in \Theta} R(\theta, d). Najostrożniejsza strategia: traktuje naturę jako inteligentnego gracza o antagonistycznym nastawieniu. Optymalne sterowanieA Simple Introduction to Dynamic Programming in Macroeconomic Models (Ian King) (sterowanie z czasem dyskretnym) Możesz też rzucić okiem na: Applications of Optimal Control Theory Using the Pontryagin Maximum Principle (sterowanie z czasem ciągłym) Łańcuchy Markowahttp://en.wikipedia.org/wiki/Markov_chain Teoria gierModeling agents’ beliefs and decision making processes in games, Avi Pfeffer |