Lukasz Stafiniak pages | Agents / Decision and Control

Teoria decyzji (statystyka)

Eksperyment X=x, decyzja a=d(x), prawdziwy stan natury \theta, strata L(\theta, a) = L(\theta, d(X)). Funkcja ryzyka R(\theta, d) = E_\theta L(\theta, d(X)) = \int_X L(\theta, d(x)) dP_\theta

Bayesowskie funkcje decyzyjne

Zasada Bayesa: \theta jest zmienną losową o zadanym rozkładzie \tau = rozkład a priori. Ryzyko bayesowskie: r(\tau, d) = E_\tau R(\theta, d) = \int_\Theta R(\theta, d) d\tau(\theta). d_0 jest funkcją bayesowską ze względu na \tau gdy r(\tau, d_0) = {inf}_{d \in D} r(\tau, d).

Minimaksowe funkcje decyzyjne

d_0 jest minimaksową funkcją decyzyjną gdy {sup}_{\theta \in \Theta} R(\theta, d_0) = {inf}_{d \in D} {sup}_{\theta \in \Theta} R(\theta, d).

Najostrożniejsza strategia: traktuje naturę jako inteligentnego gracza o antagonistycznym nastawieniu.

Optymalne sterowanie

A Simple Introduction to Dynamic Programming in Macroeconomic Models (Ian King) [1] (sterowanie z czasem dyskretnym)

Możesz też rzucić okiem na: Applications of Optimal Control Theory Using the Pontryagin Maximum Principle [2] (sterowanie z czasem ciągłym)

Łańcuchy Markowa

http://en.wikipedia.org/wiki/Markov_chain

Teoria gier

Modeling agents’ beliefs and decision making processes in games [3], Avi Pfeffer

Agents: Decision and Control