Прогнозирование загрузки больших ЭВМ ИВЦ дорог при выполнении web-приложений
Современные методы построения больших информационных систем позволяют создавать приложения, обеспечивающие доступ к базам
данных на основе системы управления базами данных (СУБД) DB2 в режиме тонкого клиента. На ИВЦ дорог работают приложения такого
типа, разработанные (ПКТБ АСУЖТ) и другими организациями в последние годы, такие, как ДО-17, АСОУП-2, АРМ НКП и
др. Они позволяют многим одновременно работающим пользователям получать доступ к информационным ресурсам распределенной базы
данных DB2. Практически любой пользователь системы передачи данных (СПД) может получить доступ к WEB-приложениям. Следовательно,
число пользователей WEB-приложений, и в первую очередь АСОУП-2, будет стремительно возрастать по мере внедрения новых подсистем
этих WEB-приложений.
Поэтому возникает вопрос о том, справятся ли большие ЭВМ, установленные на ИВЦ дорог, с возрастающим потоком запросов
пользователей. Очевидно, что нет возможности организовать натурный эксперимент, в котором на вход большой ЭВМ подавалось
бы ожидаемое количество запросов в единицу времени. Поэтому единственным методом прогнозирования нагрузки является математическое
моделирование.
Так как в ходе работы вычислительной системы (ВС) создаются очереди к ресурсам системы, естественно представление ВС
как сети систем массового обслуживания (СМО).

Рис. 1. WEB-система как разомкнутая сеть систем массового обслуживания.
В работе приводятся различные модели WEB-систем, представляемые как сети систем массового обслуживания. Представим
исследуемую WEB-систему как разомкнутую сеть систем массового обслуживания, имеющую 4 фазы (системы массового обслуживания).
СМО 1 моделирует работу канала, принимающего http-запрос. Входной поток для этой СМО должен иметь то среднее значение,
которое было получено в ходе сбора статистик на реальной системе. Среднее время обслуживания в СМО 1 должно быть равно времени
приема 1 входного сообщения. Число подканалов, одновременно обслуживающих поступающие запросы, равно 255.
СМО 2 моделирует работу процессора по формированию ответной HTML-страницы. Среднее время обслуживания в этой СМО должно
быть равно среднему времени формирования, полученному в результате измерений в работающей WEB-системе. Будем считать, что
с вероятностью, равной 0,5, процессор формирует ответную страницу без обращения к диску (после чего следует обращение к СМО
4), и что с вероятностью 0,5 производится обращение к диску - запрос передается в СМО 3.
СМОЗ имитирует работу жесткого диска, к которому идет обращение для формирования ответной HTML-страницы. Среднее время
обслуживания в СМО 3 равно среднему времени выборки данных с жесткого диска. После окончания работы диска вновь работает
процессор.
СМО 4 моделирует работу канала по передаче ответной HTML-страницы. Среднее время обслуживания в СМО 4 равно среднему
времени передачи выходного сообщения, составляющего ответную страницу. Число подканалов, одновременно обслуживающих выдаваемые
ответные сообщения, равно 255.
Будем считать, что случайные величины - длительность интервалов входного потока и времена обслуживания во всех СМО, составляющих
сеть, есть экспоненциально распределенные случайные величины. Это обосновывается результатами натурных измерений: в процессе
работы одного из WEB - приложений, работавшего на IBM - 9672, была собрана и обработана статистическая информация, позволившая
построить групповой статистический портрет пользователя, работающего в режиме тонкого клиента. Статистическая обработка результатов
измерений показала, что гипотеза об экспоненциальном распределении интервалов входного потока (между моментами поступления
запросов), а также гипотезы об экспоненциальных распределениях времен работы устройств вычислительной системы могут быть
приняты с высоким уровнем доверительной вероятности.
Для WEB - приложений, работающих в корпоративной сети железных дорог, наиболее важными критериями эффективности работы
являются коэффициенты загрузки устройств вычислительной системы, а также время отклика - время, измеряемое от начала передачи
запроса до момента начала выдачи ответа пользователю.
На основании алгоритма вычисления искомых временных характеристик и коэффициентов загрузки фаз обслуживания - систем
массового обслуживания, имитирующих устройства ВС, приведенного в [3], была разработана программа расчета. Приведем результаты
расчета по разработанной математической модели. В качестве исходных данных возьмем данные, собранные на Московской железной
дороге - наиболее загруженной Дороге среди всех дорог России (таблица 1).

Рис. 2. Время отклика WE В-приложения.
Таблица 1. Объем входной и выходной информации АСОУП
Дорога | Кол-во | Кол-во | Кол-во | Кол-во | Объем | Объем |
| исполненных запросов | выходных документов | выходных документов |
входных сообщений по ф.1,2,3,6 | исходной информации (ф.1,2,3,6) | выходной информации |
| (ф.4) | (ф.5) | (итог) | тыс. зн. | (ф.4,5), |
| | | | | тыс. зн. |
Nзис | Идз | Идр | Nвх | Vисх | Vвых |
| 18К79 | 31490 | 187892 | 71526 | 56011.9 | 331118,6 |
На этой дороге установлен один из самых мощных мэйнфреймов, и собранные статистические данные о входных и выходных сообщениях
характеризуются самыми большими объемами. Средняя длина входного сообщения в байтах для действующего варианта АСОУП-1:
56011900/71526 =783байт
Скорость работы канала при приеме сообщений равна 4,5 Мгб. При приеме сообщений по http-протоколу передача идет с использованием
Unicode, поэтому будем считать, что средняя длина входного сообщения равна 1566 байт. Следовательно, среднее время работы
канала по приему одного входного сообщения равно:
1566/4500000 = 0,000348 c
Средняя длина выходного сообщения в байтах равна:
331118600/187892 = 1762байт.
Скорость работы канала при выдаче сообщений равна 4,5 Мгб/с. При передаче выходных сообщений по http-протоколу передача
идет с использованием Unicode, поэтому будем считать, что средняя длина входного со общения равна 3524 байта. Следовательно,
среднее время работы канала по выдаче одного выходного сообщения равно:
3512 / 4 500 000 = 7,8*10 -4 с
Средняя длина входного интервала - интервала между моментами поступления входных запросов - равна:
1440*60/71526=1,2 с
Среднее время работы процессора по обработке запроса примем равным 1,5*(49/360) с = 0,2 с.
Среднее время работы СМО, имитирующей работу дисковой подсистемы, примем равным 0.01 с.
На рисунке 1 приведен график времени отклика системы в предположении, что интенсивность входного потока (величина, обратно
пропорциональная длительности входного интервала между моментами поступления запросов) изменяется в интервале от 0.2 с-1
до 2.00 с-1. Это означает, что при самой малой загрузке поступает в среднем 1 запрос в 5 секунд, а при самой большой
загрузке 1 запрос поступает в среднем за 0.5 секунды.
Во всем диапазоне изменения входной загрузки время отклика можно считать приемлемым. Однако, хотя при поступлении в среднем
1 запроса в полсекунды время отклика равно 2 секундам, коэффициент загрузки процессора системы при этом весьма велик, на
рис. 2 приведена зависимость коэффициента загрузки процессора от интенсивности входного потока.

Рис. 2. Коэффициент загрузки процессора.
Коэффициенты загрузки входного и выходного каналов настолько малы, что их не имеет смысла приводить в виде графика.
Диски также мало загружены работой, связанной с обработкой WEB - запросов (рис. 3).

Рис. 3. Коэффициент загрузки дисковой подсистемы.
Как видим, узким местом в системе является процессор системы, который будет практически полностью загружен только обработкой
WEB-приложений при интенсивности входного потока, равной 2 с-1.
....................................................................................................
|