МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

Общая модель эксплуатации

Постановка задачи. Процесс эксплуатации комплексов оборудования уп­равляем. Пусть X(t) есть векторный случайный процесс изменения параметров (нрелполагается, что выбор параметров осуществлен по некоторому приемлемо­му критерию) комплексов с учетом регулировок параметров в процессе эксплуа­тации (регулировки могут быть плановыми и неплановыми — при отказах ком­плекса). В процессе эксплуатации обслуживающий персонал (а в случае само — <>|Н аиизующегося комплекса — кибернетическое устройство) вырабатывает и реализует некоторую стратегию эксплуатации комплексов, оависящую от прот­ії. і значений процесса X(t) и от принятых в прошлом решений в связи с ре — I лнровками параметров (замену системы или блоков, входящих в состав ком­плекса, будем рассматривать как частный случай регулировок). Так как в про­мессе эксплуатации параметры комплексов, как правило, измеряются в дискрет­ные моменты времени, будем считать, что (єГ принимает значения 0, 1,2,…

Обозначим через flj векторную случайную функцию — процесс изменения параметров комплекса без учета регулировок, а через Ct—некоторую вектор­не ні управляющую функцию. По определению вероятностные распределения at (вес возможные значения этого процесса обозначим через А) не зависят от управления (в том числе и скачкообразные изменения процесса at пли его сос — I а паяющих). Будем предполагать; что эти распределения неизвестны, а следо — нагельно, остаются неизвестными также и свойства пространства А’°(А'(/)єА°), ілк как в эксплуатацию поступила новая система.

Управляющая функция С(єС (С— пространство всех. возможных ее значе­ния) должна зависеть от всех прошлых значений процесса Xt. Физический смысл этой функции поясним ниже.

На основании вышеизложенного можно записать, следуя Ю. Гренанде — ру 183]; X(t)=D(at, t, Ct). Функция D, описывающая динамику изменения па­раметров комплекса в процессе эксплуатации, символически может быть записа­на таким образом: Л XТXС->-Х. При этом предполагаем, что А, С, X являются конечными измеряемыми евклидовыми пространствами.

Введем понятие стратегии управления. Известно, что в моменты t—О, 1, наблюдается векторный процесс X(t) и управляющая функция С( зависит пі Х. х2,..х(_1 и от Сл, С2,…, С|_і. Обозначим систему управляющих функ­ции Сі, С2,…, Ct через Gt:

С і = const;

Подпись: е,= Подпись: Сз = С3(х1, х2); Подпись: (1.1)

С2 = C’2(-c1);

Cf = Ct (-*д. х2,. • ■, Xf—i).

Систему управляющих функций (1.1) будем называть стратегией управ­ления.

В процессе эксплуатации может встретиться и такой — случай, когда наблю­дается не процесс X(t), а некоторый процесс y(t) (например, если учитывать — іііиіики измерения процесса X(t)), связанный оператором Q с процессом X(t):

У і = Qxf, і = ІТТ.

Подпись: Тогда стратегия .управления примет вид:

С = const;

Подпись: 'G?С2 = С2 (Qxty,

Сз — С3 (Qxi, Qx2);

Cj — С/ (Q. xy, Qx2,…, Qxt—i).

Типичной в практике эксплуатации комплексов оборудования является си­туация, когда только некоторые координаты вектора X (І) доступны наблюдению (выбор контролируемых параметров не обеспечивает наблюдения за всеми со­ставляющими вектора X(/), или другой пример — наблюдение сигнала на фоне аддитивного шума е(: yt=Xt+Bt, в этом случае et не может наблюдаться от­дельно).

Стратегии, которые будут рассмотрены ниже, назовем физически реализуе­мыми или допустимыми.

В процессе эксплуатации комплекса обслуживающий персонал стремится вы­брать такую стратегию управления техническим состоянием комплекса (т. е. не­которым случайным процессом at), которая бы при сохранении заданного каче­ства подготовки комплекса к работе обеспечила минимум затрат, связанных с обслуживанием комплекса. Под затратами будем понимать стоимость обслужи­вания комплекса или время на его обслуживание.

Рассмотрим эксплуатацию комплекса на конечном отрезке времени Т=

={1, 2…….. N] и ‘введем критерии Уі и Уг затрат на эксплуатацию комплекса,.

которые определим формулами:

N

Vi^YUX. Gn)^ 2Ф(*<):

Подпись: (1.2>/=1

N

У2= y2(X, gn)= ct),

t=1

где ф— заданная функция затрат, которая определяется из опыта эксплуатации" комплексов аналогичного назначения и уточняется затем применительно к* чг-следуемому комплексу.

Для критерия (‘l,.-2i) в аддитивном случае

С/)=Ф№) + Ф(С/).

Следует отметить, что рассматриваемые стратегии управления предназна­чаются для удержания векторного процесса at в пределах заданных допусков — на составляющие этого процесса. .Поэтому стратегия управления, — выбираемая из условия минимума затрат, оказывается весьма эффективной по критерию — среднего времени удержания процесса at в заданных пределах.

Остановимся на одном из главных определений — на понятии адаптивного управления применительно к исследуемому процессу эксплуатации комплекса оборудования. Известно, что в процессе эксплуатации комплексов происходит достаточно большое число отказов, которые классифицируются как конструк­тивно-производственные, обусловленные недостатками, допущенными в процессе — проектирования, а также несовершенством технологического процесса. В прин­ципе в процессе эксплуатации за изменением параметров, характеризующих ка­чество конструирования и ‘производства деталей сложного комплекса оборудо­вания, можно наблюдать (рассматривая их как составляющие вектора Xt), нс практически это невозможно из-за увеличения затрат на эксплуатацию комплек­сов (для контроля таких параметров и управления ими пришлось бы изыскать, в процессе эксплуатации комплекса технические средства для проведения хими­ческого, спектрального, фотографического и другого анализа каждой детали)- Поэтому будем предполагать, что векторный случайный процесс at (а значит,. и Xt) зависит от некоторого внутреннего (не наблюдаемого в процессе эксплуа­тации) параметра а (в общем случае векторного), характеризующего конструк­тивно-производственное совершенство комплекса. Будем считать, что а может быть действительным числом, последовательностью, функцией, функционалом и; т. д. Естественно — полагать, что для заданного а (установившийся процесс про­изводства деталей и комплексов) процесс at имеет известное вероятностное распределение Ра (в общем случае это многомерная функция распределения).

По мере накопления опыта эксплуатации комплекса (по мере роста /) мож­но лучше оценить параметр а (более квалифицированно судить о конструктив­но iipiiii шпдетвеиных недостатках комплекса). Это позволит вносить коррективы и пьігпірііемую стратегию управления (будем учитывать доработки комплекса

іі|н-ді’і;іпитєлями промышленности и связанные с ними затраты). Таким обра — шм, щж горный процесс Xt окажется «шире» охваченным управлением. В этом и оудст заключаться смысл вводимого понятия адаптивного управления техниче — < ким состоянием комплекса.

Математически тот факт, что а остается до конца для нас неизвестным (его можно оценить только статистически), будем представлять следующим образом:

111 к — ^положим, что а имеет априорное распределение п. Тогда задача сведется к пі исканию такой стратегии управления, при котором достигается минимум |83] W) / J- J Y-, (X, Оді) Ра (dec) п (dot). В этом случае (когда а — неизвестный

а о.

іі.’ір. імі’тр) возможен и другой подход: применение минимаксного критерия для выбора такой управляющей стратегии обеспечивает min sup J Yi(X, ОдО Pa (da).

a a

При решении поставленных выше задач возникают большие трудности. Дей — с| ніпельно, в общем случае нельзя выбирать отдельно значения Ct, минимизи­рующие значения Mty(Xt), t— I, 2 N, так как выбор Ct влияет на посдедую-

IIIне члены Мф (Ха), s>t. Таким образом, здесь имеет место своеобразное после — III истине. Поясним это на простом примере.’Допустим, что а —действительные •пи. сі (время между отказами комплекса из-за конструктивно-производственных дефектов). Допустим, что эти дефекты приводят к скачкообразному изменению ішічспнй процесса Xt (внезапные отказы), тогда параметр а формально явля — сі си функцией от Xt. Кроме того, появление отказов, обусловленных конструк­тиво-производственными дефектами, зависит и от параметров управления С( (мри управлении могут заменяться детали с конструктивно-производственными дефектами). Поэтому, используя наблюдения Xi, х2,…, xt_i и принятые по этим наблюдениям решения Сі, С2,…, C(_i, можно оценить неизвестный параметр а:

== ct/ (-^1» х21 — ■ *» xt—і» С, С2» • •. * Ct—j).

Далее на основании этой оценки, можно выбрать такое управление С(, ко­тимо минимизирует значение ф(А’і), где интеграл Ма (для учета скачков нужно использовать 6-функции) должен быть оценен при условии, что а—а*. I нк как точное значение и остается неизвестным, процедура. в принципе не при­водит к оптимальному управлению, но получаемое управление практически дол­іпім быть близким к оптимальному. Однако это утверждение требует экспери­ментальной проверки1. При точно известном значении а управление было бы мпшмальным в смысле наиболее эффектной борьбы (путем замен) с конструк — I нвно-производственными дефектами детален комплекса.

Отмеченное выше последействие в выборе управляющей стратегии в ряде частных случаев может быть снято. Например, можно показать, что линейно — юі. ідратическая форма может быть с успехом использована для марковского процесса at. В этих моделях динамическое (и линейное) программирование приводит к приемлемым для практики решениям.

Сравнительно простыми оказываются, в частности, и решения задач, когда допускается почленная минимизация общих затрат.

Общий случай управления. Используя стратегию управления (1.1), запишем следующее:

S(20 = 5(хгь х2…., xt)= {ai, а2,… at | *1) =

= D {at, t, Ct(xb x2l…, є A x A X—X A = A‘.

t раз

При изменении вектора Х=(хи х%…, xt) по Xі имеем семейство (Ч(Х)|Лд=Х‘>.

1 В данном рассмотрении задача имеет смысл, если среднему времени меж — IV отказами по причинам конструктивно-производственного характера соответ­ствует определенный уровень технологического процесса производства деталей комплекса.

Для некоторого пространства £, принадлежащего о-алгебре, используемой для вектора X, аналогично получаем преобразование S(E). Тогда мы имеем дело с а-алгеброй пространства А‘. Обозначим а-алгебру через 2(Gt), чтобы показать зависимость ее от выбранной стратегии управления Gt. Действительно, процесс at зависит от стратегии Gt (он подвергается регулировкам), а если процесс at неизвестен (например, это параметры изменения внутренней структу­ры деталей комплекса, не контролируемые в процессе эксплуатации), то можно говорить о зависимости а-алгебры 2(а<) от управляющей стратегии Gt (зави­симость областей возможных изменений параметров, характеризующих струк­туру деталей, от стратегии Gt).

Если же для t= 1, 2, 3,…, а-алгебра 2 (ст*) =2t не зависит от управляющей стратегии Gt, то стохастическая составляющая at является преобразованным модулем Например, регулировками (без замены деталей) нельзя изменить внутреннюю структуру деталей комплекса. Это можно объяснить и так. Если известно, что процесс X(t) принимает значения х,, хг,…, Xt, то это значит, что а= (оь аг,…, at) содержится в S(X). Незнание вектора at может быть ском­пенсировано тем, что известна область изменения этого вектора, т. е. 0-алгеб­ры X(Gt).

Для преобразованной составляющей at (имеющей преобразованный модуль 2г), имеется некоторое семейство преобразованных значений S(X), не завися­щих от выбираемых стратегий управления. Такой подход упрощает решение задачи о выборе оптимальной стратегии управления. В работе [83J доказана следующая теорема. Пусть Xt=D(at, t, Ct) есть управляемый процесс, случай­ная составляющая которого at является преобразованным модулем 2Ь и пусть для каждого имеется С=С(5), такое, что

M№t{D{at, t, С (S))) |2,_d = min М [<W{O(0,, t. C)} | = °< (s)-

Тогда существует управляющая стратегия G^J1*, минимизирующая

N

М ‘h {Xt)- Существование этой стратегии вытекает из того факта, что управ-

t=і

ляющие функции C(S) для <=1, 2,…, N рассматриваются в классе допусти­мых (физически имеющих смысл) стратегий. Возьмем в этом классе произ­вольную управляющую стратегию GK. Можно записать Мфі (Xt) через после­довательно вычисляемый интеграл AUp,(Xt)~MI(X), где 1(Х) — условное его значение при известном вероятностном распределении at и заданных величинах X—Xi, х2, . .., Xt_i. Но знание этих величин наряду со знанием используемой управляющей стратегии эквивалентно тому, что a^S(X).

Для завершения доказательства теоремы запишем неравенство

/{X)=M[^t{D(at, t, C,)J|fleS(*)] >M[^t{D(at, t, C(S))}|2,_,] > «?(S).«

N N

Следовательно, Mfyt (Xt) > Mrf(S) и MY = ^ Mtyt (Xt) > ^ Ma2f (S).

l <=1

Последнее выражение, соответствующее оптимальной управляющей стратегии G% и завершает доказательство теоремы.

Пусть имеется скалярный процесс xt=D(at, t, Ct) =at+nt+Ct, где наблю­даемый процесс at = a, а «шум» п, задается таким образом:

щ (гауссовский процесс); Мщ = 0; Мщ, nt,

а априорное распределение для случайной величины а имеет вид: ct (гауссово распределение); Ма = 0; Ма.2 = аа%.

Ниже будем использовать квадратичную функцию стоимости фt(xt)=xt2.

Для функции S(x)

S(x)={ai………… at I a! + C1 = xu a2 + Сг = *2………………… at + Ct = xt).

Здесь содержатся точки а с координатами at=xt— Сі, аг—х2—С2,…,

=xt — Ct.

В этом случае с-алгебра 2(Gf) = 2( не зависит от управляющей стратегии G(t). Следовательно, щ есть преобразованный модуль 2(.

Для нахождения C(S) нужно решить уравнение

М {£>2 (at, t. С) I 2<_х) = min

или М {(я* + С)2(вх, at—1} =min. (1.3)

Другими словами, управление С нужно выбрать равным отрицательному значению величины at при условии, что известны предыдущие значения at, 02, • •., at—1.

В работе [83] показано, что в этом случае, согласно (1.3), можно получить С = (t — 1 + г)~і (ах + а2 + — + в/—х)=

= (t — 1 + /-)—1 (Jtrx-— Сх + х2 — C-i 4- … Ч- ле/_х —Ct-i),

где г=ал2/аа2 характеризует уровень динамического шу, ма.

В данном случае оптимальная стратегия управления

Подпись:______ XI __ *2 _ Xt_i

l~ 1 + г 2 + г " ■ t— + r’

т. е. на величину Gf в момент t нужно осуществить снос процесса х<.

Подпись: G't = x 1 Подпись: *2 __ *3 2 3 Подпись: xt~ t— 1

Если уровень шума низкий, то эта стратегия может быть аппроксимиро­вана следующим образом:

Функция стоимости, определяемая в момент t, находится в соответствии со стратегией управления (1.4):

Подпись: t—1 + r* 1 (<-l + r)2jМОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)Мх

которая уменьшается быстрее ап2 при t-*-00. Следовательно, значение пара­метра а может быть оценено самостоятельно. Если а неизвестно, то следует вы — брать С[——а, что приводит к средней стоимости xt2=an2. Этот простой ре­зультат является следствием ограничений, наложенных на «шум» щ и случай­ный параметр а (предположения гауссовостн), и предположения о квадратич­ной функции стоимости. Далее будет показано, что ограничения относительно Hi. а и функции стоимости в ряде случаев не являются критическими. Можно проанализировать разобранный пример и с позиции минимаксного критерия.

Рассмотрим скалярный процесс хt = D (at, t, Ct) = at + С/.

Случайная составляющая здесь вновь является преобразованным модулем ii-ii же о-алгебры. Найдем для величины С такой управляющий параметр, что — иы M{(at+C)z|ai, a2,…, a(_i}=min. В этом случае C=C(S)—C(x 1, х2,…, xt_t) «пи регрессия at по случайным переменным at, a2,…, at-t. Если допустимая і і ратегия управления является линейной, то управление должно давать наилуч — iiiiiii линейный прогноз для случайной составляющей at. В данном случае зада — |.| управления сводится к задаче прогноза (или к задаче регрессии).

Видоизменим задачу следующим образом. Пусть

Xf—D (at, t, С і) = a + nt + Ct

(no многих задачах эксплуатации «шум» rit можно трактовать как ошибки из­мерения параметров). Считаем, что а есть случайная величина, не подвержен — ити прямому наблюдению и принимающая значения из ‘натурального ряда чисел. Пусть а имеет следующее (геометрическое) распределение:

P{a = v) =9v_1p; v = 1, 2,…; q~— p

ні средним Ма=р~*.

Для динамического шума rit имеем нормальное (гауссово) распределение: Ря = Лг(0,о) для t< а и Ра = N (1,о) для t > а.

Это означает, что процесс Xt управляется при /= 1, 2,…, а—1 и не управ­ляется при t— а. Будем предполагать, что ги независим для разлітчньїх t (при заданном а).

Подпись: і / (fli, 02. • • -, at) ■= (а У'.2яУ ^ pq«-1 exp | 1 МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР) Подпись: X

Запишем частотную функцию для процесса ас

Подпись: XЩ+ S(а* -,)2]+ (тЫ‘ 2 pqa 1 ехр {~ S 4 =

v=1 v=a a=t+1 м= 1

Подпись: v = l v«=a t

+qtp lexp{-~i"S4

V=1

Подпись: Условная частотная функция от at, заданная при условии, что известны at, а2,..тогда запишется так: / («і. П2 а<) 1 У (#/ I &* • • ■ > l) — — , ч — iAow

/(fli, a2,…, a/_i) |/2Я’

* t

2 9"_iexp{“i}H“22a’+^a+l]+9</7_lexp{_^

Подпись: x-^tqa 1ехр{-4г[-22^ + ‘_аї)+9< lp 1

a—1 v=a

В этом случае регрессия at относительно а і, a2,..щ_ есть

oo

M [at (ai, a2> • ■•» a>t—1] = J af (Pt («1» ^2» • • • > a/-i)) —

/-1

g= 1___________________________ v __________________________________

Оптимальная управляющая стратегия Ct равна введенной выше функции от ai, а2,…, at_, взятой с обратным знаком.

Рассмотрим еще ряд вариантов для разобранного примера. Пусть a — орто­гональная 0, nt матрица размера пХп для стационарного случайного процесса (векторного процесса с п составляющими) и С — пространство из пХп ортого-

нальных матриц. Тогда Xt — Ct + at, <= 1, 2,…, М Ясно, что at здесь является преобразованной, как и везде выше. Введем функцию стоимости ф(л:) = (х(1))2, х = (*(4, х") є

На основании теоремы из [83] необходимо определить условное распреде­ление fl(, если известны Cl, 02 С(_

Обозначим ковариационную матрицу этого распределения через

^ («ь Я2………. c<-i) = {т ij (ai, о2.- • ■. і, j= 1, 2,., и}.

Предположим, что эта матрица существует. Тогда выбираем

Сt = С = {Cij; і, j = 1, 2,…, п) такими, чтобы п

Мф(х) = М (x<1))2= V CuCiJrij(al, ………….. …… c<-l)

П

сделать минимальным. Ясно, что У С|= 1, так как С должна быть ортонор-

/-1

мальнон матрицей. Решение поставленной задачи сводится к отысканию наи­меньшего собственного значения (характеристического числа) матрицы «(tii, £*2.—., С|_,) Следовательно, оптимальная стратегия управления получа­ется таким образом: Ct есть собственный вектор с наименьшим собственным шачением (характеристическим числом) матрицы R(а/, а2,…, at_і).

Исследование различных функций затрат. Выше рассматривалась квадра­нтная по х функция t|)(x). Для исследования более широкого класса функций ф (л) воспользуемся теоремой, доказанной Ю. Гренандером [83]. Пусть F есть t|ivыкция распределения на действительной оси и ф>(х)— функция с такими тре­мя свойствами: ф(х)з»0; ф(х) =0, если х = 0; ф(х)—непрерывная, неубывающая но модулю (х) (функция со значениями ф(—ос) = ч|)(+ ос) = + оо; ф(х)—выпук­лая функция.

Iona в задаче нахождения

/(«)= J ф (х — ri)F(dx) = min (1.5)

лудіт единственное решение По или интервальное решение (пі, п2): минимум (I Г») достигается на этом интервале и вне его функция F не обладает свойства­ми функции распределения.

Обозначим величину п, доставляющую минимум 1(п), через фг, где z— слу­чайная величина с функцией распределения F.

X

!фля непрерывного случая ф (х) = ( А (у) dy, где /4(у)>0 для у>0, А(у)<

0

11 1 (У) —неубывающая функция.

.'(ля отыскания оптимального п запишем уравнение

со с» X—п

I (п) = J ф (x — ri)F (dx) = J А (у) dyF (dx) =

•— со —- °о о

оо О

= j A(y)[—F(y+n)dy— j A{y)F (у + n)dy.

y=0 !/ = —“

n" 0

‘.In l (n") — I (n’) = J К (v) dv, если положить К (v) = J A{y — )F(dy).

h’ У—«о

Фнкипя K(v), как следует из предыдущей теоремы, является неубывающей, (нрицагсльной при больших отрицательных v и положительной при больших пм. чпжнтельных V. Минимум /(v) достигается в точке или точках, в которых Л( ( проходит через нуль.

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

18

 

19

 

 

бы иметь возможность пронумеровать все правила данного подкласса) содержит оптимальное правило.

В отличие от введенных пыше вероятностей переходов дц, соответствующих любому правилу замен, обозначим через pij вероятности переходов, связанные с применением следующего правила замен: замена системы происходит только при. отказе. На практике обычно вероятности {рц} точно не известны, поэтому очень важно, чтобы искомое оптимальное правило было некритично к точным — значениям {ри}. Ниже будут приведены условия, накладываемые на переход­ные вероятности {pij}, при которых оптимальное правило замен имеет следую­щее содержание: замена должна осуществляться всякий раз, когда наблюдаемое состояние системы является одним из состояний £, £+1,-.., L для некоторого £. Для удобства дальнейшего изложения материала назовем это правило прави­лом типа «а».

Перейдем к строгой математической формулировке задачи.

Пусть переходные вероятности в марковской цепи с — состояниями — О, 1, …. L — {Ра} в дополнение :< обычным условиям [36) удовлетворяют сле­дующим условиям: Pjo = 0 для /<Х, p^l >0 для некоторого при каждом

j<L, где — вероятность перехода через t шагов из состояния / в состоя­ние L.

Можно представить себе некоторую измененную цепь Маркова, если для одного или нескольких значений / (0</</.), но не для всех j будем иметь во введенных обозначениях рщ— 1. Для измененной цепи Маркова это означает, что замена системы происходит тогда, когда система в момент наблюдения нахо­дится в состоянии j. Таким образом, имегм 2i_1—1 возможных измеиеииіі (количество новых цепей Маркова). Каждое такое изменение цепи соответству­ет возможному правилу замены системы. Пусть С обозначает класс таких пра­вил и пусть <7/у[1] для каждого правила R в классе С обозначают стационарны! значения переходных вероятностей. Рассмотрим следующие функции потерь:

g (]) = 0, если gjо = 0, j < L

ёЦ)—Тп. п, если qjо=1, j < Ц

g U) = Т’а. п, если j = L.

Таким образом, функция g(j) обозначает потери времени на замены слете мы к моменту времени £, когда состояние системы равно / (цепь Маркова иахо дится в состоянии /).

Из теории цепей Маркова [49] известно, что

г L

t=l /=0

с вероятностью единица, где вероятности я3- удовлетворяют уравнениям L L

я/=2я^дЬ’=°. і……………………… L), 2я/=1

1=0 j-о

и неравенствам (/=0, 1, …, L).

Предел Yя является средними потерями времени иа обслуживание (заме ны) системы, отнесенными к единице времени «жизни» системы. Критерием Y, и будем пользоваться при оценке эффективности правила замен R.

•Если вероятности pij имеют вид p, j=0 для |/—г|>1, т. е. если переход і марковской цепи возможен только в соседнее состояние, то, очевидно, что ОПТИ мальное правило будет правилом типа «а»: <7зО=0, j <L—2 и <7ь_і, о=1 или ( в зависимости от величин Гп. п, Та. п и рц.

Однако в случае, когда состояния в системе могут совершать скачки (воз можен переход в цепи за один шаг в любое состояние), оптимальное правил замен не является тривиальным. Для отыскания этого правила применяются м«

годы динамического и линейного программирования. Предположим, что Р{Х= =*} = 1, т. е. в момент £=0 система находится в состоянии і с вероятностью единица.

Рассмотрим функцию

Подпись: YR(i, а) = МПодпись: a‘g(Xt) ,МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)О < а < 1

для любого правила R в классе С. В работе [70] установлено, что Пга(1 — а) К/? (I, а)=ГЛ.

Коэффициент а здесь рассматривается по аналогии с теорией инвентаризации (теорией управления запасами) как коэффициент скидки (или коэффициент свя­ти). Ниже критерий min YK(i, а) будет использоваться как основной критерий оптимизации.

Пусть правило Ra в классе правил С является таким, что для всех — і

Y(i, a)=Y *(г, сс) = min Ед (7, а),

Ra РЄС

г. е. по критерию min Ек(7, а) правило R’a является оптимальным правилом — гамены системы. Тогда с помощью стандартных в теории динамического про­граммирования рассуждений можно показать, что Y(i, а) удовлетворяет следу­ющим функциональным уравнениям:

!

L L,

Подпись: для 7 + L;а 2 puy а)> г»-п +«2 р°іг и> а)

Подпись: (1.7),і-0 7-о

L

Y (L, Й)= 7’а. п + « 2 P0tY 7=О

іде связь между уравнением (1.7) и оптимальным правилом R* очевидна.

Рассмотрев оптимальные решения на каждом шаге, перепишем введенные — иышс функциональные уравнения следующим образом:

) (і, a, N)= min fa %pijY[(/, a, N— I), TB-„ + a 2 PojY U, a, TV — I)L

( /=o /=o J

L

если І Ф L; Y (*, a, 7V) = Га. п + a 2 PoJY U> “• *)»

7-0

гімні і — L при этом очевидно, что К (г, а, 0) = 0, если і Д L; Y (і, а, 0) = если і = L.

Тля Л/» 1 можно показать [10], что

Пш Y (7, a, N)—Y(i, а), 7 = 0, I,…, L.

N-* оо І

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

является неубывающей функцией. Такая замена возможна вследствие следую­щей леммы, доказательство которой дано в работе [76].

Лемма. Ограничения А и Б эквивалентны.

На основе полученных результатов сформулируем теорему 2 (доказательство. приведено в работе [76]).

Теорема 2. Если выполняется ограничение Б, то верна теорема 1.

Если на практике (что почти всегда имеет место) значения вероятностей рі,- неизвестны, то можно воспользоваться общим видом ограничений (ограничение А). В этом случае, согласно теореме 1, правило типа «а» является оптимальным.

Еще один подход к получению оптимального правила состоит в оценке ве­роятностей из наблюдений, полученных во время работы системы. Однако существует и другой путь, связанный с иным определением критерия Ун-

Пусть Nk есть время, соответствующее k-му возвращению системы в состо­яние 0 (с момента начала эксплуатации); это есть «длина» /г-го цикла замены. Пусть далее Th есть потери (временя на обслуживание системы), связанные с k-м циклом замены (либо Тп. п, либо 7Yn). Тогда {Nk} и {Г*,} (А=1, 2,…) есть последовательности независимых и одинаково распределенных случайных вели­чин. С помощью усиленного закона больших чисел можно показать, что М [Г]

Ур = "ттд—Поэтому нет необходимости оценивать величины рц, а следует

лишь для каждого правила R в классе С правил типа «а» определить последний критерий и выбрать правило, которому, как окажется при проведении расчетов, соответствует наименьшее значение этого критерия.

Так как процесс замен (регулировок) систем неограничен (по крайней мере теоретически), то на практике критерий Ун вычисляется именно на основе этого іпредположения и предположения, что правило R существует (но не в классе С). Правило R выбирается на основе использования предыдущих наблюдений (пре­дыстории замен) таким образом, что оно достаточно быстро превращается в пра­вило., эквивалентное оптимальному пр_авилу R*.

Покажем эквивалентность правил R и R* на одном примере.

Пусть Rг (і—2,…. L) есть правило типа «а» (с состояния і правило начина­ет применяться). Теперь определим правило R. Используем правило Rh+i в ка­честве правила замен на k-м цикле замен (k=.l—1). Таким образом, выбе­рем правило случайно, так, что P{Ri используется в течение k-го цикла} =

= ,1 — если минимум нашего критерия достигается при более, чем одном

 

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)
МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

 

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

Пусть имеется управляемая стохастическая динамическая система, наблю­даемая в моменты /=0, 1,… В каждый момент наблюдается одно из L+1 воз­можных состояний 0, После каждого наблюдения система «управляется»

с помощью реализации одного из К решений d………… dK, которые влияют на из­

менения состояний системы( после осуществления решений).

Пусть Х0, Xi,… обозначают последовательность наблюдаемых состояний, а* V Ді, … — последовательность решений. Класс С состоит из функций

Dk(Xо. Ао>—> ХІ) = Р {Д/ = dk | Xq, Д0,…, Xt}
при k = 1,…, К‘, t = 0, I, Для каждого Х0, Д0,…, Xt (<= 0, 1..),

Du (Л’о. До.• • • * Xt) >0, k = I……………. К

к

и До,…, Xt)= 1.

k і

Будем далее полагать, что

К

Р {^т+1 = j I -^о» До,—, Xt—i} — ij (k) Dk (X0, Д0………………………….. Xt — i)

k-1

.uni /, 7=0,…, Д; <=0,1,…, где l|9/(fy)|| являются, такими, что q ij (k) > ", (/,/=-0,…, і; 1,…, /С)

L

и 2««(*)= і (,=0………………….. Ю-

1=О

Таким образом іі<?іі(*)іі — стохастические матрицы для каждого k.

Пусть С будет классом решающих процедур R таких, что

Dk (Д’о* До, ■ — — > Xt = 0 = Dikij — — 0…………… Ц к = •………….. <0

иг іпішсят от К0, Ло,…, К(_|, Л/_і и <.

[■ели RsC’, то последовательность {Kf}, <=0, 1,… является цепью Маркова

k, п. щпонарными вероятностями переходов {рц}-

К

PH = 2 Яti (*) Рік (П J = 0,…, L).

1

Пусть далее С" будет подклассом С’, таким, что £),* = 0 или 1. Следова — Н II. IHI, С" содержит только конечное число процедур.

Придадим использованному ранее критерию оптимизации стоимостный смысл..

l, и м считать, что каждой последовательности состояний системы и последопа — II II. ПОПП принимаемых решений соответствуют некоторые средние СТОИМОСТИ luip. im, в частности и рассмотренные уже затраты на обслуживание систем) ні, гіП 0, г=0,…. L; k=l,…,K t=0, 1 …, зависящие от момента t (система II, in. in, ч.-іется в момент t в состоянии і, и в момент I принимается решение dh). іМіі. ікіі далее будем предполагать, что ыи, (t) = оць, т. е. исключим зависимость. , 11 ill миг П1 IDift от времени.

Инсдем еще одно обозначение: Wt, t — 0, I,… — среднюю стоимость, отнесен — и и, і, моменту t, которая ставится в соответствие решающей процедуре R. Рас — I мііірнм две задачи.

Ііііііічи 1. Предположим, что Х0=і с вероятностью единица. Необходимо, nllpr нмнть такую процедуру /?!, при которой

г

Q»? minO^’ (г = 0,…, L), где = lira sup Wt —

/?£С T ->-оо 1

рі-дмин стоимость, отнесенная к единице времени.

Задача 2. Предположим, что ХоФі с вероятностью сліпішім, и / ин’ііннті поглощающим состоянием для всех У? єС и ои, =0, /е = I, …. К І |»чґі> > шчи

Подпись: S& = minSk'* Лес R Подпись: і — 0 L, где Подпись: /-U

определить такую процедуру Rz, при которой

Другими словами, Sjy* есть общая средняя стоимость, спотисп’їиуитіни in менению состояний системы от і до L при использовании рСІІІПічШГЙ процедуры R. Решение задачи 1 содержится в работах [64, 88], задача 2 неііісші и рнГиис [89]. Для решения обеих задач воспользуемся работой Манна |нн|.

Покажем, что процедуры Ri и следует искать внутри клиссн (следи — вательно, и внутри С’), а задачи 1 и 2 можно свести к задачам ліііігПшіін про граммирования.

В работах [72, 80] показано, что при поиске процедур Rі н процедури

С—С’ могут быть отброшены.

Воспользуемся следующей теоремой, доказанной Дерманом [77|

Теорема 3. В классе С" существуют процедуры Rt и Rz такне, чіп (для задачи 1)

Q{fit = rainQ^1 (i = 0,…t L)

и для задачи 2

Сформулируем теперь задачи 1 и 2 как задачи линейного программирования.

Напомним основное предположение: для всех рассматриваемых процедур последовательность состояний {Х(}, /=0, 1,… образует цепь Маркова со стацио­нарными вероятностями переходов {Pij}. Число состояний исследуемой цепи ко­нечно, все состояния принадлежат некоторому классу I. Пусть далее /(/), /є/

■ есть функция, определенная на всех состояниях, a pa{t)—условная вероятность ТОГО, ЧТО Xt =j При условии, ЧТО Xi_ ( = 1 И A’f;ф І для всех О<S<(, где, по опре­делению />,Д0) =0 для всех і и /. Тогда, как известно в теории цепей Марко­ва [49],

г

Пт — V. М|/(Д,)| V я,/ (у) (1.8)

1 ‘ >w-4 АшЛ

/II JU

■ и

2 2 PU (0 / (Л =22 Рч (0 / (/) = я — I V л у / (у), (1.9)

1=0 ус/ уе/с 0 д /

где все {jtj} удовлетворяют неравенствам:

Я/ > 0, я/—2я’РЛ/ = 0. /Є/, 2 я/ = *• (МО)

ІЄ/ УС/

Для использования результатов (1.8—1.10) сделаем дна предположении.

Предположение а: в задаче 1 для каждого Rs. C’ состояния 0,…. / нрщнітдгжнт некоторому классу. Предположение (3: в задаче 2 для каждого R• ( юііоянпс L достигается из состояний 0,…, L—1 путем конечного числа переходив і нероит — ностью единица.

Теорема 4. Если предположения и(р) верны, то індичії I и 2 Мшуі (иль сформулированы как задачи линейного программировании |77|

Рассмотрим еще одну оптимальную процедуру, для чічи ши н’М ионий кри­терий оптимизации. Предположим, что ш, й > 0 и “(А > О (( Ч…………………………………………………………………………………………………………….. I. I,.

К) есть значения введенных НЫШС Средних СІІІІІМІИ ІИІ І 16м ІІІ. ІЧІІМ

■через Wt’ И W", /=0, 1 … соответствующие 01 НОСИ 1РЛЫ1МО • lie ‘I Hill I 11 ill МИСТИ для фиксированной процедуры R.

Рассмотрим критерий стоимости:

т і т

Ф#) = lira sup 2 Wt / 2iri(« = 0,…, L)

r-|-“ <=0 / f=0

при X0~i с вероятностью единица.

Если R^C’ и верно предположение а, то

L К ILK

Ф^ = 2 2 I 2 2 ^‘DikVik (* = 0,…, £),

i=Oft=l I і=0/?-=1

где Лц £=0…….. L, удовлетворяют (1.10). Следовательно, фи(0 можно минимизи­

ровать по R^C’.

Таким образом, получаем интересный результат, который сформулируем в виде теоремы.

Подпись: 1 еорема о. что ф^ = rain ф^*При предположении а существует процедура /?3єС" такая*

Доказательство этой теоремы также имеется в работе [77]. Рассмотрим, опи­раясь иа работу Клейна [86], практическое применение описанных подходов к за­дачам эксплуатации сложных технических систем.

Будем считать, что имеем дело со «стареющей» системой (система в конеч­ном итоге попадает в «поглощающее» состояние L), процесс «старения» кото­рый будем вновь представлять цепью Маркова. В качестве критерия по-прежнему используем средние потери (среднюю стоимость) в единицу времени.

Итак считаем, что процесс «старения» системы является случайным, состоя­ния системы известны только в моменты контроля. После контроля возможны две альтернативы: а) заменить систему и б) сохранить ее в зксплуатаціш. При альтернативе «б» возможны, в свою очередь, два решения: осуществить, если необходимо, немедленный ремонт и отложить принятие решения до следующего момента контроля.

Будем, как и ранее, предполагать, что «старение» системы может быть опи­сано в дискретные моменты времени конечной цепью Маркова и что с помощью процедуры контроля можно определить, в каком состоянии находится система в моменты контроля. Вторым очень важным предположением будет предполо­жение о том, что ремонты могут привести систему в одно из многих возможных состояний (а не только в состояние, соответствующее новой системе).

Покажем, что для выбранного ранее критерия задача нахождения оптималь­ной политики (стратегии) контроля, ремонта или замены системы также может быть сформулирована в терминах линейного программирования. Первой рабо­той, дающей формальное математическое обоснование применения метода ли­нейного программирования к управляемым цепям Маркова (по критерию средней стоимости в единицу времени), была работа Манна [88].

Главное отличие излагаемой ниже задачи от задачи Манна заключается в том, что времена между переходами в цепи зависят от решающей процедуры, а не являются фиксированными величинами, как предполагал Манн.

Будем по-прежиему обозначать состояния системы в любой момент времени t как О, 1,…. L, где 0—начальное, a L — конечное (отказовое) состояние системы. Состояния 1, 2,… L—1 возникают случайно. Предположим, что система начинает эксплуатироваться, находясь в новом, нулевом состоянии, а в процессе эксплуа­тации обязательно попадает в конечное состояние L и остается в нем («старею­щая» система), т. е. изучаемый случайный процесс не может распространяться влево. Это накладывает следующие ограничения иа процесс (рассматриваем для состояний системы до замены или ремонта дискретную цепь Маркова со стацио­нарными вероятностями переходов qij, і, /=0, її, …, L):

Iim q-L (t) =t 1 (/ = 0, 1,…* L— 1); q LL — 1*

t —►со

где qa(t) есть вероятность перехода за t шагов от состояния і в состояние /» /=1, 2 Кроме того, предположим* что <?iz,>0, £=0, 1,…, L—1.

Пусть ds’k(i) обозначает решение изменить состояние системы от НйЧМльної и «состояния і до состояния s и запланировать следующую проверку черга А їм pin дов от момента изменения начального состояния.

Таким образом, можно записать для диапазона состояний системы

і = 0, 1L, Г (I)______________ L{K— 0; k=…………… К

S є S,; Si = {0, 1________ L — 1} u {*’}-

Здесь L(m) означает, что система не будет работать в течение т і’диннц времени. Следует отметить, что номер состояния L(,m) может расти, івк іоіь і m тема может отказать после проверки и остаться в состоянии откати дії г.’іюіум щей проверки. Предполагаем, что самый большой период времени, н ігЧгііін мі торого система может оставаться неработающей, можно задать. Оби кінчим пн через k—І,. Это. говорит о том, что наибольший интервал между пронгрнпмн иг

темы есть k=K (если <?sb=0, ss{0, 1……………. L—1}, то наибольший донупнмый им

тервал проверок становится функцией от s и количество переходом от сиг IПИНИИ s до состояния L может быть минимальным). Отсюда следует: если I (/).

j=0, 1,…. К—I, где s—i, и система не подвергается никаким проі|шлнкітічгскіім действиям, то k должно удовлетворять неравенству j+k<C. K.

Введенное нами обозначение 5, потребовалось для представлення фи иі’іегмі возможных решений: произвести ремонт, осуществить замену или ничего не де дать с системой. Предполагается, что проверки, ремонты и замены системы про­изводятся мгновенно.

Таким образом, класс всех возможных рандомизированных решающих про­цедур (правил) имеет вид:

Д|,г*=р{^)- где 20/s5 = 1 (| = 0- 1—. К*-‘))-

s:k

Из сказанного ясно, что сумма по всем видам индексов {.s : k} ограничена теми величинами s, которые принадлежат классу S,-. Следовательно, все наши решающие процедуры являются такими, что принятие решения в момент каждой проверки зависит только от наблюдаемого состояния. Ранее было показано, что этого достаточно для рассмотрения правил введенного здесь класса. Пусть изме­нения состояний «старейшей» системы с учетом реализации решающего правила образуют новую эргодичсскую (управляемую) цепь Маркова со стационарными вероятностями переходов рц, і, / 0, I ЦК I), имеющими следующий вид:

i, 7=0, I,…, £(к-і);

[Qsj{k ]= 0, I____ L-s= 0, 1,…, L — I; /? = I, 2,…, K

dsL[k— n), s — 0, I, L— I; j = L (/z), n= 1, 2,…, К — П

Подпись: где(Ъ — n) > 0;

I, s = L (m), m = 0, 1………….. К — 2; j = L (n), n= 1, 2,.. •

.. ,K — I> k—n— m > 0, j= s + k, k = l, 2,…, L(K — l) —s« 0 в остальных случаях.

Следует еще раз отметить разницу между переходными вероятностями Цц, і, у=0, 1,…. L и рц, і, /=0, 1,L(K—1). Дело в том, что переходы н унрин. ія емой цепи (переходные вероятности рц) имеют место при каждой нрофнлак і нм — (замена, ремонт), в то время как переходы в неуправляемой цени (принт м рения» с вероятностями переходов Ці,) происходят независимо от ННСІНІНТіІ яме шательства (такого вмешательства просто нет по определении) нрпнптп «п іре ния») и наблюдаются в моменты контроля.

При управлении «стареющими» системами будем иметь дело ш слііуіоіннчи видами стоимости. Во-первых, со стоимостью профилакінкн, г, и іншмпі м. іо pc монта или замены, которая зависит от состояния системы до н ипгле нрофнык-

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)
тики. Например, ремонт (замена) с возвращением системы в исходное состояние обычно существенно зависит от того, отказала перед этим система или нет. Ре­монт (замену) иногда экономически выгоднее проводить до отказа. Другой вид стоимости—стоимость, связанная с проверками системы. Она определяется коли­чеством проверок и зависит от условий работы системы при проверке, когда определение, одних состояний системы может оказаться более трудным, чем дру­гих. Кроме того, при определении — состояний системы могут использоваться различ­ные процедуры проверки, которые зависят от времени, прошедшего с момента предыдущей проверки, и от того, какая профилактика проводилась (или не про­водилась вообще) при предыдущей проверке. И введем, так называемую, штраф­ную стоимость, зависящую от промежутка времени между отказом системы и его обнаружением при проверке.

Стоимость проверки и штрафная стоимость далее будут обозначаться сим­волом t s:k j■

Пусть С;s:k обозначает стоимость, связанную с принятием решения dsk;j(i). Эта стоимость состоит из стоимости профилактики mis, обусловленной решением изменить состояние системы ОТ І ДО S, где ГПго есть стоимость замены системы да отказа, если —1, и есть стоимости замены после отказа, если i>L—1, и тін—

стоимость ремонта, во время которого состояние системы изменяется от і ДО S, если 0<s-<L—її; кроме того, m, s — 0, если і—$фЬ(К—II).

Обозначим вновь среднюю стоимость в единицу времени через У. Этот кри­терий равен средней стоимости проверки (при проверках может быть осуществ­лен ремонт, замена), деленной на среднее время между проверками.

Средняя стоимость проверки С (используется эргодическая теорема для це­пей Маркова)

* 10-225 +25

і sk j l s:k

где вероятности Я;, i=0, 1, …, L(K—vl) удовлетворяют уравнениям:

і— l{k— О; (і. ii)

I

(Іл2>

j

Если обозначить время между проверками через / (это случайная величина, так как решающие правила являются рандомизированными), то среднее время между проверками системы

A4I/]=2S*"’D/,:4

і s :k

при соблюдении условий (1.11) и (1.12).

I’ll 2 2 Яг^*:Л:*Д:А/ + 22 niDis:if is j) /22

Подпись: У =Подпись: (I И) і s:k j і s-.k j і s:k

Следуя идеям, излагаемым в работе Манна [88], положим

Хі, м=Пі°иї

Тогда (1.13) можно переписать в виде:

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР) Подпись: (I И)

2 2

ГДЄ his* = ^tsMiVs:*j + Cls*

Так как Лу = 2 nlPiJ = ^ Я/ 2 Di. s:~kv,:kj —

і і s:k

= 22 = 2 — v.*>

то L+K условий (1.11) запишутся так:

Подпись: (І. 15) (1- 16)2 Vj* 22 а, (у=о.1…………………. ^ (* -‘)).

/ sift

а условие (1.12) примет вид:

УУХ, т = 1 •

_J ^ js:k j s:k

Таким образом, задача заключается в том, чтобы отыскать последователь­ность {xis:k }, /=0, I,…. L(K—1), seSj, /(=1,…, К такую, чтобы минимизиро­вать нелинейную функцию (I. M), подверженную L + K+ 1-му ограничению (1.15) и (1.16).

Сформулированную задачу можно решать методом линейного программиро­вания так, как предложено в [77, 78]. Однако возможен и другой путь решения, который рекомендует Клейн [86]: в целях минимизации (1.14) последовательно применять метод линейного программирования для отыскания минимума числи­теля (при фиксированном знаменателе), подверженного ограничениям (1.15) и (1.16). Эта процедура должна повторяться для всех приемлемых значений зна­менателя, после чего выбирается минимум из всех полученных путем минимиза­ции значений числителя. Этот минимум соответствует оптимальным интервалам между проверками системы. Следует отметить, что знаменатель выражения (1.14) есть среднее время между проверками, поэтому под приемлемыми зна­чениями знаменателя мы должны понимать такие времена (затем подлежащие осреднению) между проверками системы, которые физически осуществимы (с учетом накопленного опыта обслуживания аналогичных систем в эксплуатации).

Кратко остановимся еще на одной разновидности задач зксилуаізціш систем по состоянию, которая будет состоять в отыскании такой решающей процедуры, при которой максимизируется среднее время между заменами (ре­гулировками) системы. Главное отличие ОТ изложенного выше. П|К.»Н)Ч;|1Н я II предположении, что ничего неизвестно о количественных значениях СИНІМО. І пі, которые рассматривались ранее. Предполагается только, что гшими. м. ымс — ны системы намного превосходит стоимость профилактики, я і шнм. н щ. . ни­занные с пребыванием системы в нерабочем состоянии, ннмшно Гниімік. юн — мости замены системы. При ограничении на неронзниті німіцім. и, кми задача сводится к задаче линейного программировании, рсШ1 ИШ’ м приш ито в работе [78].

МОДЕЛИ ЭКСПЛУАТАЦИИ АВИАЦИОННЫХ СИСТЕМ ПО СОСТОЯНИЮ (ОБЗОР)

В заключение отметим, что изложенные выше подходы к задачам эк­сплуатации сложных технических систем по состоянию развиваются далее в ■интересной работе П. Колезара (87], в (81] также содержатся некоторые обоб­щения рассмотренных выше задач.

Все рассмотренные выше модели технического обслуживания относятся к непрерывно работающей системе (если система работает с перерывами, то для использования любой из приведенных моделей необходимо сделать предполо­жение о том, что в перерывах между использованием по назначению в системе отказов не происходит). Однако перерывы в работе и возможность появления (или обнаружения) отказов или неисправностей во время нахождения в не­работающем состоянии присущи авиационным системам. Для учета этих особен­ностей при решении задач эксплуатации по состоянию следует переходить к моделям, в основе которых лежат полумарковские управляемые процессы. Полумарковский процесс (в отличие от марковской цепи первого порядка) задается не только матрицей переходов из состояния в состояние между со­седними (одинаковыми) моментами времени, но и функциями распределений времени пребывания исследуемого процесса в каждом состоянии перехода. Оказывается, что все задачи управления в марковской постановке имеют обобщения (и решения) для полумарковского случая. Интересно отметить, что получаемый при этом характер оптимальной стратегии управления не меняется по сравнению с марковским случаем (стратегия остается однородной и мар­ковской), но меняется величина упреждающего допуска.