
|
Анализ работы программного комплекса АСОУП статистическими методами
Введение
Для рационального распределения имеющихся вычислительных мощностей между многими одновременно решаемыми задачами на ЭВМ
дорожных ИВЦ нужно уметь рассчитывать потребные мощности ЭВМ ИВЦ дорог для конкретных программных комплексов при различных
величинах вагонопотоков.
Одним из таких комплексов является автоматизированная система оперативного управления перевозками (АСОУП). Работая в
реальном масштабе времени, АСОУП формирует банк данных, основной составляющей которого является модель перевозочного процесса
на полигоне дороги.
Функционирование АСОУП происходит при наличии случайных факторов. Прежде всего, случайными являются моменты ввода сообщений
в систему, что обусловливает заранее непредсказуемое время нахождения сообщений в различных очередях в процессе обработки.
Случайным является число вагонов, поступающих в поездах в соответствии с утвержденным графиком и подлежащих переработке.
Кроме того, одновременно с программами АСОУП в ЭВМ выполняется большое количество других программ, моменты запуска которых
также случайны.
Статистическая информация о работе АСОУП собирается с помощью стандартных сервисных и общесистемных средств, входящих
в состав программного комплекса АСОУП. Основным источником информации является системный журнал АСОУП.
Для анализа процесса функционирования АСОУП естественно применение статистических методов, причем целью исследования
будет построение математической зависимости, связывающей один из основных показателей эффективности работы системы — количество
машинных операций, затрачиваемых на реализацию программного комплекса (в миллионах операций в секунду, MIPs), с такими параметрами
системы, как объем оперативной памяти (ОП) в мегабайтах
(Мб), общее число сообщений в среднем, прошедших через систему за сутки, среднее число вагонов в сутки, а также среднее
время обработки сообщения. Одним из таких методов является метод регрессионного анализа.
Возможность применения метода регрессионного анализа обуславливается тем, что выполняются основные предпосылки:
1. Количество машинных операций в секунду, затрачиваемых на реализацию АСОУП
(выходная величина У), является случай ной величиной, имеющей нормальное распределение.
2. Исследования показали, что выборочные оценки дисперсии ве личины 7однородны.
3. Независимые переменные, которые целесообразно ввести в рас смотрение для
построения математической модели процесса функционирования АСОУП, измеряются абсолютно точно, или же с ошибкой, пренебрежимо
малой по сравнению с ошибкой измерения зависимой величины.
Введем в рассмотрение следующую кодировку переменных (табл. 1):
Таблица 1 Переменные математической модели
Переменная | Наименование переменной |
Х1 | Объем ОП, Мб |
Х2 | Всего сообщений |
Х3 | Среднее число вагонов в сутки |
Х4 | Среднее время обработки сообщения |
Y | Количество операций, MIPs |
Данные, собранные на дорогах России и СНГ для АСОУП дорожного уровня, базирующихся на вычислительных установках с приблизительно
одинаковыми дисковыми подсистемами, можно представить в виде матрицы эксперимента (табл.2).
Были вычислены матрицы частных и парных коэффициентов корреляции, необходимых для построения нелинейной регрессионной
модели (табл.3 и 4).
Частные коэффициенты корреляции показывают степень взаимосвязи двух переменных между собой с учетом того, что имеет место
влияние всех других переменных.
Таблица 2 Матрица эксперимента
№п/п | Дорога | Х1 | Х2 | Х3 | Х4 | Y |
1 | Дальневосточная | 256 | 36384 | 37253 | 1.14 | 18.24 |
2 | Октябрьская | 512 | 54320 | 62622 | 1.08 | 42.80 |
3 | Южно-Уральская | 512 | 47440 | 32577 | 0.77 | 16.34 |
4 | Северная | 1024 | 64836 | 39450 | 0.71 | 47.52 |
5 | Сахалинская | 512 | 3520 | 1669 | 0.48 | 0.98 |
6 | Горьковская | 256 | 44052 | 30058 | 1.29 | 25.80 |
7 | Куйбышевская | 512 | 51532 | 34637 | 0.81 | 18.62 |
8 | Восточно-Сибирская | 512 | 31360 | 24557 | 0.74 | 10.26 |
9 | Свердловская | 512 | 55110 | 51610 | 1:31 | 31.92 |
10 | Красноярская | 512 | 23774 | 19422 | 1.07 | 9.28 |
11 | Московская | 256 | 21979 | 53807 | 1.14 | 9.28 |
12 | Калининградская | 512 | 4436 | 2465 | 0.62 | 0.96 |
13 | Западно-С ибирская | 1024 | 62309 | 60346 | 0.68 | 43.12 |
14 | Забайкальская | 512 | 21974 | 25720 | 0.71 | 8.10 |
15 | Белорусская | 256 | 27524 | 40000 | 1.06 | 6.50 |
16 | Западно-Казахстанская | 512 | 13318 | 25000 | 0.66 | 3.24 |
17 | Алма-Атинская | 512 | 12224 | 25000 | 0.71 | 3.20 |
Таблица 3 Матрица парных коэффициентов корреляции
| Y | Х1 | Х2 | Х3 | Х4 |
Y | 1.000000 | 0.566647 | 0.921277 | 0.726362 | 0.287210 |
Х1 | 0.566647 | 1.000000 | 0.450373 | 0.159090 | -0.524694 |
Х2 | 0.921277 | 0.450373 | 1.000000 | 0.740879 | 0.352360 |
Х3 | 0.726362 | 0.159090 | 0.740879 | 1.000000 | 0.524752 |
Х4 | 0.287210 | - 0.524694 | 0.352360 | 0.524752 | 1.000000 |
Данные, приведенные в табл.3, показывают, что все введенные в рассмотрение независимые переменные существенным образом
влияют на зависимую переменную Y.
Матрица частных коэффициентов корреляции, показывающих степень взаимосвязи переменных при условии, что влияние всех других
переменных исключено, приведена в табл.4.
Таблица 4 Матрица частных коэффициентов корреляции
| | Х1 | Х2 | Х3 | Х4 |
Y | 1.000000 | 0.613238 | -0.673966 | 0.219734 | -0.427243 |
Х1 | 0.613238 | 1.000000 | -0.027497 | 0.058065 | -0.834154 |
Х2 | -0.673966 | -0.027497 | 1.000000 | 0.179979 | -0.046732 |
Х3 | 0.219734 | 0.058065 | 0.179979 | 1.000000 | 0.196800 |
Х4 | -0.427243 | -0.834154 | -0.046732 | 0.196800 | 1.000000 |
Значения в матрицах коэффициентов корреляции позволяют сделать вывод о том, что для некоторых независимых переменных
коэффициент корреляции весьма высок. При формировании нелинейной регрессионной модели для таких переменных целесообразно
ввести дополнительные члены в виде произведения этих переменных.
После анализа значений коэффициентов корреляции было сделано предположение о том, что теоретическая зависимость
у = f(x1, х2, х3, х4 ) имеет вид:

Где у — расчетные значения зависимой переменной — количества машинных операций, необходимых для реализации программного
комплекса АСОУП.
Статистический анализ с использованием t-критерия Стьюдента показал, что все коэффициенты bi,
i=0,1,2,3,..,14 являются статистически значимыми. Относительная ошибка аппроксимации экспериментальных значений
Y составила 11%, что представляет вполне приемлемую для инженерных расчетов величину.
При расчете коэффициентов, входящих в уравнения регрессии, производился отсев аномальных измерений в соответствии с рекомендациями,
изложенными в работе.
Значения коэффициентов уравнения регрессии (1) приведены в табл. 5.
Полученное уравнение можно рассматривать как компактное представление табл.2. Оно позволяет вычислять количество машинных
операций в секунду, затрачиваемых на реализацию программного комп-лекса АСОУП для значений независимых переменных, приведенных
в табл.2. Однако как при интерполировании, так и тем более
при экстраполировании данное уравнение дает не вполне приемлемые результаты, если независимые переменные принимают значения,
выходящие за границы диапазона значений, приведенных в матрице эксперимента. Прежде всего это объясняется тем, что число
строк матрицы эксперимента мало. Увеличение числа строк матрицы эксперимента практически невозможно, поэтому возникает вопрос
о том, как, задавшись значением какой-либо независимой переменной, вычислить значение всех остальных независимых переменных
и затем значение зависимой переменной. Поэтому были получены функции одной переменной xi =φ(xj),
i=1,2,3,4, j=1,2,3,4, i ≠ j с помощью метода регрессионного анализа. Для всех
i и j искомая зависимость аппроксимировалась функцией:
Таблица 5 Расчетные значения коэффициентов уравнения регрессии
bi | Значение коэффициента |
b0 | -1.22279673769332E+02 |
b1 | 8.43757356233727E-02 |
b2 | 3.51044448647730E-04 |
b3 | 4.36516035174086E-03 |
b4 | -6.9488167543547Ш-06 |
b5 | -1.28558018133930E-08 |
b6 | 8.55780597259514E-04 |
b7 | -3.22609120557463E-06 |
b8 | 1.46690289674948E-08 |
b9 | 9.50385925867873E-09 |
b10 | -3.90901383095662E+00 |
b11 | 4.79245867221413E-03 |
b12 | -2.87794457914743E-05 |
b13 | -4.14267621132665E-04 |
b14 | 6.30798250398828E-07 |

где i=1,2,3,4, j=1,2,3,4, i ≠ j.
Так как общее количество уравнений весьма велико, приведем лишь значения коэффициентов для уравнений, связывающих независимые
переменные с переменной X2, для которой коэффициент корреляции с зависимой величиной наибольший (табл.6).
Таблица 6 Значения коэффициентов уравнения регрессии
d | x1=φ(x2) | x3 = φ (x2) |
x4= φ (x2) |
d0 | -2.59326001848860E+05 | -4.23668312918067E+04 | -2.49700998165166E+02 |
d1 | 3.56932531759397E+04 | 0 | 0 |
d2 | -1.59366349096276E+03 | 9.5787048786091E+02 | 9.27500905320958E-01 |
d3 | 1.15068153742818E+00 | -3.79830214897089E+00 | -2.16416565813513E-03 |
d4 | 0 | 2.35781166683907E-05 | 6.16381997048796E-09 |
d5 | 0 | 0 | 2.53921553997914E+03 |
d6 | 5.94898127461057E+06 | 0 | -7.53302256633062E+03 |
d7 | -8.75247965408713E+07 | 0 | 0 |
Для расчета значений Y при значениях Х1, Х2 Х3
и Х4 не совпадающих со значениями, приведенными в табл. 1, были получены функции одной переменной:

где у=1,2,3,4.
Значения коэффициентов Сk, k=1,2,..,6 приведены в табл.7.
Если необходимо рассчитать количество MIPs для некоторого значения независимой переменной хj,
то тогда вначале нужно пересчитать значения всех остальных независимых переменных по формулам (2), а затем вычислить
значения y по формулам (3). Так как и уравнения (2), и уравнения (3) были получены с определенной ошибкой при аппроксимации
исходных данных уравнениями регрессии, по 4 расчетным значениям зависимой переменной, полученным по формулам (3) для Х1,
Х2 Х3 и Х4 вычисляется среднее.
Выбирая вводимые значения независимой переменной, например, такой как среднее время обработки сообщения, нужно помнить
о том, что менее 0,3-0,5 секунд оно не может быть, так как всегда существуют обращения к дисковой подсистеме.
Приведем пример расчета для Х2=40000:
Таблица 7 Значения коэффициентов сk для уравнений (3)
k | y=ψ(x1) | y=ψ(x2) | y=ψ(x3) |
y=ψ(x4) |
0 | 1.04169696969697 E+01 | 1.38721499236389 E+00 | 9.99770529364021 E-01 | 2.14307237547705 E+04 |
1 | 0 | 0 | 0 | -3.18524504518330 E+04 |
2 | 0 | 0 | 2.44794371078178 E-06 | 1.61554700841398 E+04 |
3 | 4.78534781055533 E-05 | 1.05342322581895 E-08 | 0 | 0 |
4 | 5.69237610389610 E+03 | 0 | 0 | 0 |
5 | 0 | 0 | 0 | -1.3435970861084 E+04 |
6 | 0 | 0 | 0 | 7.72801591164554 E+03 |

В матрице эксперимента строка 6 содержит значение Ху равное 44052, и значение MIPs, равное 25.8. Результат,
полученный по формуле (1) для среднего числа сообщений, равного 40000, дает меньшее значение, равное 18.57.
Расчетные значения MIPs, вычисленные по функциям одной переменной, дают наибольшее значение для
среднего времени обработки — чем меньше время обработки сообщения, тем большая производительность ЭВМ требуется. Среднее,
вычисленное по 4 интерполяционным значениям зависимой переменной, равно 18.74. Параметры доверительной области для расчетного
значения MIPs могут быть вычислены по методике, описанной Д. Химмельблау. Одновременно при расчете 7 выдаются и значения
необходимого объема ОП, среднее число вагонов, при обработке которых возникнет введенное количество сообщений в сутки, и
ожидаемое время обработки сообщения. Это позволяет обоснованно решать проблемы, возникающие при решении задачи гибкой модернизации
комплекса технических средств и прежде всего ответить на вопрос — достаточна ли мощность имеющейся в наличии ЭВМ для реализации
всех программ АСОУП.
Разработанная методика может быть применена и при исследовании других программных комплексов, например, таких как ДИСКОР,
МПП-99 на основе DB2 и т.п., программы которых выполняются на одной и той же ЭВМ одновременно с программами АСУОП.
|

|