О фазовом методе повышения устойчивости сетей связи в условиях возникновения тупиковых ситуаций
Как отмечается во многих источниках, нормальное (устойчивое) функционирование систем связи и АСУ (далее по тексту - систем)
железнодорожного транспорта постоянно подвергается воздействию ряда дестабилизирующих факторов внутреннего и внешнего характеров.
К внутренним дестабилизирующим факторам, снижающим устойчивость функционирования систем, относят сбои и отказы технических
средств, ошибки в программном обеспечении, некоторые архитектурные решения и нестыковки из-за разнотипности и характеристик
устанавливаемого оборудования, неучтенных на стадиях проектирования и развертывания, а также конфликты и тупики из-за некорректного
распределения системных ресурсов, некоторых выбранных механизмов организации информационно-вычислительных процессов, архитектурных
особенностей компонентов систем.
Из внутренних дестабилизирующих факторов, снижающих устойчивость функционирования систем связи железнодорожного транспорта,
к наиболее тяжелым последствиям приводят тупики.
Тупики являются наиболее «коварными» дестабилизирующими факторами, природа возникновения которых лежит в параллельности
выполнения процессов при одновременном использовании одной и той же совокупности ресурсов, и начало их образования исходит
к конфликтам. То есть, если в какой-то момент времени параллельно выполняющимся процессам выделить некоторую запрашиваемую
ими общую совокупность ресурсов, то ситуация до выделения ресурсов является конфликтной, а после выделения - тупиковой.
Как отмечается, все многообразие тупиков можно разделить на три группы:
- тупики протокольного типа;
- тупики ресурсного типа;
- тупики архитектурного типа.
Тупики протокольного типа образуются из-за несовершенства алгоритмов протоколов (например, ранних версий стека протоколов
TCP/IP), а также из-за ошибок в программном обеспечении, реализующем протоколы. Обнаружение и устранение причин возникновения
тупиков протокольного типа называется верификацией протоколов. Для верификации протоколов разработаны и развернуты соответствующие
автоматизированные системы, имитирующие события разного рода, в том числе и тупики, которые протоколы и должны корректно
обрабатывать. Тупики такого рода далее не рассматриваются.
Тупики ресурсного типа образуются при параллельном выполнении процессов, когда имеется общая совокупность сетевых ресурсов,
из-за занятости которых данные процессы не выполняются, ожидая освобождение занятых ресурсов другими процессами, которые
находятся в аналогичной ситуации. Другими словами, каждый из процессов, вовлеченный в тупик, владеет некоторой совокупностью
ресурсов, которые нужны другим, вовлеченным в этот же тупик процессам. В общем случае, в системе может существовать несколько
тупиков, и любой из процессов может быть вовлечен в несколько таких тупиков.
Тупики архитектурного типа порождаются вследствие некоторых выбранных характеристик элементов архитектуры системы (сети),
некоторых выбранных механизмов управления информационными потоками и возникающими при этом сбоями, отказами и переполнениями
буферной памяти узлов системы (сети). На практике чаще всего встречались следующие тупики архитектурного типа: тупики при
управлении темпом, тупики захламления, блокировка сборки, блокировка сборки при наличии резервирования, блокировка из-за
порядка доставки, прямой тупик с промежуточным накоплением, косвенный тупик с промежуточным накоплением. Природа и механизмы
возникновения этих тупиков различны, и необходимы особые методы и средства по обеспечению устойчивости системы в условиях
воздействия тупиков.
Существует множество различных методов защиты от тупиков, каждый из которых имеет свои достоинства и недостатки. Их применение
целесообразно с учетом выбора тех или иных качеств систем. Для систем связи железнодорожного транспорта необходимы комплексные
методы и средства защиты от тупиков, разработка которых должна основываться на особенностях функционирования систем связи.
Одним из таких подходов может быть так называемый фазовый метод повышения устойчивости систем. В его основу может быть положена
идея отслеживания механизмов образования тупиков в зависимости от фазы (времени) и условий их возникновения. Данные фазы
являются поэтапными, то есть основная информация о тупиках передается последовательно соответствующими средствами от фазы
к фазе. К основным фазам защиты от тупиков относятся фаза предотвращения, фаза обнаружения и фаза диагностирования. В такой
логической последовательности реализации фаз предлагаемого метода и заключена комплексность повышения устойчивости, а закладываемые
методы и алгоритмы защиты в каждой из фаз расширяют область устойчивости в условиях воздействия тупиков различного типа.
Предлагаемый метод является перспективным и более эффективным в части обеспечения устойчивости, поэтому по сути данный метод
и называется фазовым.
В основу фазы предотвращения тупиков для систем со стабильным составом процессов положены аналитические зависимости оценки
вероятности возникновения тупиков от значений характеристик элементов архитектуры. Это позволяет:
а) при оценке реализуемости процессов:
• определить совокупность общих (критических) ресурсов для запланированных к параллельному выполнению процессов
на основе вычисления матрицы тупика;
• определить аналитические вероятности возникновения тупиков для определенных критических ресурсов и времен их
использования процессами;
• выбрать такой вариант набора выполняющихся процессов, при котором достигается минимальная вероятность возникновения
тупиков;
• определить такое значение требуемого размера буферной памяти уз лов системы, при котором достигается минимальная
вероятность ее переполнения, а значит и тупиков по этой причине.
б) при модернизации систем:
• определить требуемые значения интенсивностей отказов технических и программных критических ресурсов по заданным допустимым
значениям вероятностей тупиков, выполнения процессов, а также поиск такой совокупности критических ресурсов, которая обеспечивает
минимальную вероятность возникновения тупиков;
• определить требуемые размеры буферной памяти узлов систем (сети) по заданным допустимым значениям вероятности возникновения
тупиков.
В основу фазы обнаружения положены некоторые процедуры так называемого контроля выполнения процессов. Если перед параллельным
выполнением процессов процедура контроля устанавливает безопасное их выполнение при разделении критических ресурсов, то система
управления выделяет запрошенные ресурсы, и процессы выполняются. При опасном выполнении процессов выделение ресурсов задерживается
наименее приоритетным и по времени некритичным процессам.
В фазе диагностирования запускается процедура выбора заблокированных в тупике процессов, которая на основе информации
от процедур контроля выстраивает и выбирает процессы как по приоритетам, так и по количеству запрошенных ресурсов и по времени
их гарантированного завершения. После этого освободившиеся ресурсы используются для завершения остальных вовлеченных в тупик
процессов. Таким образом, использование одной и той же процедуры контроля в фазах недопущения и диагностирования обеспечит
частичное совмещение по времени выполнения, что способствует уменьшению непроизводительных затрат, а значит, и увеличению
устойчивости систем в условиях возникновения тупиков.
Вывод
Предлагаемый фазовый метод повышения устойчивости функционирования систем и сетей связи железнодорожного транспорта обладает
рядом преимуществ, в том числе:
- позволяет на стадии проектирования систем и планирования выполнения процессов оценивать вероятности возникновения тупиков и по этим значениям
принимать решения по предотвращению возникновения тупиков из-за общей совокупности требуемых системных ресурсов, а также
из-за некоторых характеристик элементов архитектуры (например, размеров буферной памяти узлов сети, либо характеристик
надежности используемых системных ресурсов). Это фаза предотвращения;
- на основе предлагаемой процедуры контроля обнаруживать те процессы, которые конфликтуют из-за общей
совокупности, и на этой информации планировать беступиковое их выполнение; это фаза обнаружения;
- если всё же возник тупик, то на основе результатов процедуры контроля определяются совокупности вовлеченных
в тупик процессов и из-за каких ресурсов, и на этой основе строится ряд процессов для их принудительного выполнения путем
изымания ресурсов у процессов с наименьшим приоритетом.
|