Risk-Sensitive Markov Decision Processes

Concepedia

Publication | Closed Access

DOI

508

Citations

References

1972

Year

Ronald A. Howard, James Matheson

Management Science

Mathematical ProgrammingEngineeringCertain Equivalent RewardStochastic GameRisk ManagementManagementRisk MetricSequential Decision MakingProbability TheoryComputer ScienceDecision ScienceDecision TheoryStationary PolicyMarkov Decision ProcessDynamic OptimizationOperations Research

Abstract

This paper considers the maximization of certain equivalent reward generated by a Markov decision process with constant risk sensitivity. First, value iteration is used to optimize possibly time-varying processes of finite duration. Then a policy iteration procedure is developed to find the stationary policy with highest certain equivalent gain for the infinite duration case. A simple example demonstrates both procedures.

References

Page 1

	Year	Citations

Page 1