скачать рефераты

скачать рефераты

 
 
скачать рефераты скачать рефераты

Меню

Окремі випадки задач оптимального стохастичного керування скачать рефераты

Окремі випадки задач оптимального стохастичного керування

ОКРЕМІ ВИПАДКИ ЗАДАЧ ОПТИМАЛЬНОГО СТОХАСТИЧНОГО КЕРУВАННЯ

1. Зовнішній інтеграл

Функції і можуть бути довільними, а математичні сподівання можна обчислювати, якщо як функція від є вимірною.

Якщо ж оптимальна стратегія, отримана в результаті оптимізації, виявиться невимірною, то і функція може виявитися невимірною. У цьому випадку математичне сподівання невизначено.

Для розв'язання цієї проблеми застосовують два підходи. Перший полягає в накладенні на функції і таких обмежень, які забезпечували б вимірність підінтегральної функції на кожному кроці оптимізації : функції і , , повинні бути неперервними по своїх аргументах і повинна існувати щільність імовірності розподілу випадкової величини , а множини значень припустимих стратегій повинні бути компактними.

На жаль, на практиці ці вимоги не завжди виконуються. Тому другий підхід пов'язаний з використанням зовнішнього інтеграла.

Позначимо через простір елементарних подій, що є довільною множиною, а - деяка система підмножин множини .

Математичним сподіванням випадкової величини , заданої на імовірнісному просторі , називається число , якщо інтеграл з правої частини існує.

Нехай і - борелівські простори, , є -алгеброю в . Функція називається -вимірною, якщо для будь-якої множини . Тут - борелівська -алгебра простору .

Для функції , () зовнішній інтеграл за мірою визначається як нижня грань інтегралів від всіх вимірних функцій (), що мажорують , тобто

, .

Тут - функція розподілу випадкової величини , що відповідає ймовірнісній мірі .

Для довільної функції має місце співвідношення:

,

де , , і вважають, що .

Оскільки зовнішній інтеграл визначений для будь-якої функції, як для вимірної, так і для невимірної, то ніяких додаткових обмежень на функції і накладати не треба.

Для вимірних функцій обидва види математичних сподівань співпадають. Отже, у постановках задач можна замінити звичайне математичне сподівання на зовнішнє, і навіть якщо знайдена при цьому функція виявиться вимірною, то отримана стратегія керування не перестане бути оптимальною.

Зовнішня міра множини визначається співвідношенням .

Для будь-якої множини

,

де - це індикатор множини , що визначається як

а) якщо , то ;

б) якщо і , то ;

в) якщо або , то ;

г) якщо задовольняє рівності , то для будь-якої функції має місце рівність ;

д) якщо , то для будь-якої функції ;

е) якщо і , то . Якщо при цьому хоча б одна з функцій або -вимірна, то останнє співвідношення вірно зі знаком рівності.

Позначимо через дійсну пряму, а через - розширену дійсну пряму і надалі у всіх висновках замість дійсної прямої використовуватимемо поняття розширеної дійсної прямої.

Вважатимемо, що для розширеної дійсної прямої мають місце всі співвідношення порядку додавання і множення, які було введено для , і припустимо, що і .

Позначимо через множину всіх дійсних у розширеному розумінні функцій , де - простір станів.

- банахів простір всіх обмежених дійсних функцій з нормою, що визначається за формулою

, .

Позначатимемо , якщо , , і , якщо , , .

Для будь-якої функції і будь-якого числа позначимо через функцію, що приймає значення в кожній точці , так, що

, .

Припущення монотонності. Для будь-яких станів , керування і функцій мають місце нерівності

якщо і ;

, якщо і ;

, якщо , і .

Для будь-якого стратегія називається -оптимальною при горизонті , якщо

і -оптимальною, якщо

Багато задач послідовної оптимізації, що становлять практичний інтерес, можуть розглядатися як окремі випадки задач загального виду. Розглянемо деякі з них:

· задачі детермінованого оптимального керування;

· задачі стохастичного керування зі зліченним простором збурень;

· задачі стохастичного керування із зовнішнім інтегралом;

· задачі стохастичного керування з мультиплікативним функціоналом витрат;

· задачі мінімаксного стохастичного керування.

2. Детерміноване оптимальне керування

Розглянемо відображення , що задане формулою

, , , (1)

за таких припущень:

функції і відображають множину відповідно в множини і , тобто , ; скаляр додатний.

За цих умов відображення задовольняє припущенню монотонності. Якщо функція дорівнює нулю, тобто , , то відповідна -крокова задача оптимізації (1) набуває вигляду:

, (2)

. (3)

Ця задача є задачею детермінованого оптимального керування зі скінченним горизонтом. Задача з нескінченним горизонтом має наступний вигляд:

, (4)

. (5)

Границя в (4) існує, якщо має місце хоча б одна з наступних умов:

· , , ;

· , , ;

· , , , і деякого .

У задачі (4) - (5) може бути уведене додаткове обмеження на стан системи , . У такому разі, якщо , позначатимемо .

3. Оптимальне стохастичне керування: зліченний простір збурень

Розглянемо відображення , що задане формулою

, (6)

за таких припущень:

параметр приймає значення зі зліченної множини з заданим розподілом ймовірностей , що залежать від і ; функції і відображають множину відповідно в множини і , тобто , ; скаляр додатний.

Якщо , , - елементи множини , - довільний розподіл ймовірностей на , а - деяка функція, то математичне сподівання визначається за формулою

,

де ,

,

.

Оскільки , то математичне сподівання визначене для будь-якої функції і будь-якого розподілу ймовірностей на множині .

Зокрема, якщо , ,… - розподіл ймовірностей на множині , то формулу (6) можна переписати так:

При використанні цього співвідношення треба пам'ятати, що для двох функцій , рівність має місце, якщо виконується хоча б одна з трьох умов:

та ;

та ;

та .

Відображення задовольняє припущенню монотонності. Якщо функція - тотожний нуль, тобто , , то за умови , , функцію витрат за кроків можна подати у вигляді:

(7)

де , .

Ця умова означає, що математичне сподівання обчислюється послідовно по всіх випадкових величинах .

При цьому зміна порядку операцій додавання і узяття математичного сподівання припустима, тому що , , і для довільних простору з мірою , вимірної функції і числа має місце рівність .

Якщо виконується одна з двох нерівностей

або

,

то функцію витрат за кроків можна записати у вигляді:

,

де математичне сподівання обчислюється на добутку мір на , а стани , , виражаються через за допомогою рівняння .

Якщо функція допускає подання у такому вигляді для будь-якого початкового стану та будь-якої стратегії , то -крокова задача може бути сформульована так:

, (8)

. (9)

Відповідна задача з нескінченним горизонтом формулюється так:

, (10)

. (11)

Границя в (10) існує при виконанні будь-якої з трьох наступних умов:

· , , , ;

· , , , ;

· , , , , і деякого .

Математичне сподівання визначається і як звичайний інтеграл, і як зовнішній інтеграл з -алгеброю в множині , що складається із всіх підмножин , в залежності від вимірності або невимірності функцій.

Для багатьох практичних задач виконується припущення про зліченність множини .

Якщо ж множина незліченна, то справа ускладнюється необхідністю обчислення математичного сподівання

для будь-якої функції . Подолання цих труднощів і пов'язане з використанням зовнішнього інтеграла.