Анализ работы программного комплекса АСОУП статистическими методами

Введение

Для рационального распределения имеющихся вычислительных мощностей между многими одновременно решаемыми задачами на ЭВМ дорожных ИВЦ нужно уметь рассчитывать потребные мощности ЭВМ ИВЦ дорог для конкретных программных комплексов при различных величинах вагонопотоков.

Одним из таких комплексов является автоматизированная система оперативного управления перевозками (АСОУП). Работая в реальном масштабе времени, АСОУП формирует банк данных, основной составляющей которого является модель перевозочного процесса на полигоне дороги.

Функционирование АСОУП происходит при наличии случайных факторов. Прежде всего, случайными являются моменты ввода сообщений в систему, что обусловливает заранее непредсказуемое время нахождения сообщений в различных очередях в процессе обработки. Случайным является число вагонов, поступающих в поездах в соответствии с утвержденным графиком и подлежащих переработке. Кроме того, одновременно с программами АСОУП в ЭВМ выполняется большое количество других программ, моменты запуска которых также случайны.

Статистическая информация о работе АСОУП собирается с помощью стандартных сервисных и общесистемных средств, входящих в состав программного комплекса АСОУП. Основным источником информации является системный журнал АСОУП.

Для анализа процесса функционирования АСОУП естественно применение статистических методов, причем целью исследования будет построение математической зависимости, связывающей один из основных показателей эффективности работы системы — количество машинных операций, затрачиваемых на реализацию программного комплекса (в миллионах операций в секунду, MIPs), с такими параметрами системы, как объем оперативной памяти (ОП) в мегабайтах (Мб), общее число сообщений в среднем, прошедших через систему за сутки, среднее число вагонов в сутки, а также среднее время обработки сообщения. Одним из таких методов является метод регрессионного анализа.

Возможность применения метода регрессионного анализа обуславливается тем, что выполняются основные предпосылки:

1. Количество машинных операций в секунду, затрачиваемых на реализацию АСОУП (выходная величина У), является случай ной величиной, имеющей нормальное распределение.

2. Исследования показали, что выборочные оценки дисперсии ве личины 7однородны.

3. Независимые переменные, которые целесообразно ввести в рас смотрение для построения математической модели процесса функционирования АСОУП, измеряются абсолютно точно, или же с ошибкой, пренебрежимо малой по сравнению с ошибкой измерения зависимой величины.

Введем в рассмотрение следующую кодировку переменных (табл. 1):

Таблица 1 Переменные математической модели

ПеременнаяНаименование переменной
Х1Объем ОП, Мб
Х2Всего сообщений
Х3Среднее число вагонов в сутки
Х4Среднее время обработки сообщения
YКоличество операций, MIPs

Данные, собранные на дорогах России и СНГ для АСОУП дорожного уровня, базирующихся на вычислительных установках с приблизительно одинаковыми дисковыми подсистемами, можно представить в виде матрицы эксперимента (табл.2).

Были вычислены матрицы частных и парных коэффициентов корреляции, необходимых для построения нелинейной регрессионной модели (табл.3 и 4).

Частные коэффициенты корреляции показывают степень взаимосвязи двух переменных между собой с учетом того, что имеет место влияние всех других переменных.

Таблица 2 Матрица эксперимента

№п/пДорогаХ1Х2Х3Х4Y
1Дальневосточная25636384372531.1418.24
2Октябрьская51254320626221.0842.80
3Южно-Уральская51247440325770.7716.34
4Северная102464836394500.7147.52
5Сахалинская512352016690.480.98
6Горьковская25644052300581.2925.80
7Куйбышевская51251532346370.8118.62
8Восточно-Сибирская51231360245570.7410.26
9Свердловская51255110516101:3131.92
10Красноярская51223774194221.079.28
11Московская25621979538071.149.28
12Калининградская512443624650.620.96
13Западно-С ибирская102462309603460.6843.12
14Забайкальская51221974257200.718.10
15Белорусская25627524400001.066.50
16Западно-Казахстанская51213318250000.663.24
17Алма-Атинская51212224250000.713.20

Таблица 3 Матрица парных коэффициентов корреляции

YХ1Х2Х3Х4
Y1.0000000.5666470.9212770.7263620.287210
Х10.5666471.0000000.4503730.159090-0.524694
Х20.9212770.4503731.0000000.7408790.352360
Х30.7263620.1590900.7408791.0000000.524752
Х40.287210- 0.5246940.3523600.5247521.000000

Данные, приведенные в табл.3, показывают, что все введенные в рассмотрение независимые переменные существенным образом влияют на зависимую переменную Y.

Матрица частных коэффициентов корреляции, показывающих степень взаимосвязи переменных при условии, что влияние всех других переменных исключено, приведена в табл.4.

Таблица 4 Матрица частных коэффициентов корреляции

Х1Х2Х3Х4
Y1.0000000.613238-0.6739660.219734-0.427243
Х10.6132381.000000-0.0274970.058065-0.834154
Х2-0.673966-0.0274971.0000000.179979-0.046732
Х30.2197340.0580650.1799791.0000000.196800
Х4-0.427243-0.834154-0.0467320.1968001.000000

Значения в матрицах коэффициентов корреляции позволяют сделать вывод о том, что для некоторых независимых переменных коэффициент корреляции весьма высок. При формировании нелинейной регрессионной модели для таких переменных целесообразно ввести дополнительные члены в виде произведения этих переменных.

После анализа значений коэффициентов корреляции было сделано предположение о том, что теоретическая зависимость

у = f(x1, х2, х3, х4 ) имеет вид:

Где у — расчетные значения зависимой переменной — количества машинных операций, необходимых для реализации программного комплекса АСОУП.

Статистический анализ с использованием t-критерия Стьюдента показал, что все коэффициенты bi, i=0,1,2,3,..,14 являются статистически значимыми. Относительная ошибка аппроксимации экспериментальных значений Y составила 11%, что представляет вполне приемлемую для инженерных расчетов величину.

При расчете коэффициентов, входящих в уравнения регрессии, производился отсев аномальных измерений в соответствии с рекомендациями, изложенными в работе.

Значения коэффициентов уравнения регрессии (1) приведены в табл. 5.

Полученное уравнение можно рассматривать как компактное представление табл.2. Оно позволяет вычислять количество машинных операций в секунду, затрачиваемых на реализацию программного комп-лекса АСОУП для значений независимых переменных, приведенных в табл.2. Однако как при интерполировании, так и тем более при экстраполировании данное уравнение дает не вполне приемлемые результаты, если независимые переменные принимают значения, выходящие за границы диапазона значений, приведенных в матрице эксперимента. Прежде всего это объясняется тем, что число строк матрицы эксперимента мало. Увеличение числа строк матрицы эксперимента практически невозможно, поэтому возникает вопрос о том, как, задавшись значением какой-либо независимой переменной, вычислить значение всех остальных независимых переменных и затем значение зависимой переменной. Поэтому были получены функции одной переменной xi =φ(xj), i=1,2,3,4, j=1,2,3,4, i ≠ j с помощью метода регрессионного анализа. Для всех i и j искомая зависимость аппроксимировалась функцией:

Таблица 5 Расчетные значения коэффициентов уравнения регрессии

biЗначение коэффициента
b0-1.22279673769332E+02
b18.43757356233727E-02
b23.51044448647730E-04
b34.36516035174086E-03
b4-6.9488167543547Ш-06
b5-1.28558018133930E-08
b68.55780597259514E-04
b7-3.22609120557463E-06
b81.46690289674948E-08
b99.50385925867873E-09
b10-3.90901383095662E+00
b114.79245867221413E-03
b12-2.87794457914743E-05
b13-4.14267621132665E-04
b146.30798250398828E-07

где i=1,2,3,4, j=1,2,3,4, i ≠ j.

Так как общее количество уравнений весьма велико, приведем лишь значения коэффициентов для уравнений, связывающих независимые переменные с переменной X2, для которой коэффициент корреляции с зависимой величиной наибольший (табл.6).

Таблица 6 Значения коэффициентов уравнения регрессии

dx1=φ(x2) x3 = φ (x2) x4= φ (x2)
d0-2.59326001848860E+05-4.23668312918067E+04-2.49700998165166E+02
d13.56932531759397E+0400
d2-1.59366349096276E+039.5787048786091E+029.27500905320958E-01
d31.15068153742818E+00-3.79830214897089E+00-2.16416565813513E-03
d402.35781166683907E-056.16381997048796E-09
d5002.53921553997914E+03
d65.94898127461057E+060-7.53302256633062E+03
d7-8.75247965408713E+0700

Для расчета значений Y при значениях Х1, Х2 Х3 и Х4 не совпадающих со значениями, приведенными в табл. 1, были получены функции одной переменной:

где у=1,2,3,4.

Значения коэффициентов Сk, k=1,2,..,6 приведены в табл.7.

Если необходимо рассчитать количество MIPs для некоторого значения независимой переменной хj, то тогда вначале нужно пересчитать значения всех остальных независимых переменных по формулам (2), а затем вычислить значения y по формулам (3). Так как и уравнения (2), и уравнения (3) были получены с определенной ошибкой при аппроксимации исходных данных уравнениями регрессии, по 4 расчетным значениям зависимой переменной, полученным по формулам (3) для Х1, Х2 Х3 и Х4 вычисляется среднее.

Выбирая вводимые значения независимой переменной, например, такой как среднее время обработки сообщения, нужно помнить о том, что менее 0,3-0,5 секунд оно не может быть, так как всегда существуют обращения к дисковой подсистеме.

Приведем пример расчета для Х2=40000:

Таблица 7 Значения коэффициентов сk для уравнений (3)

ky=ψ(x1)y=ψ(x2)y=ψ(x3) y=ψ(x4)
01.04169696969697 E+011.38721499236389 E+009.99770529364021 E-012.14307237547705 E+04
1000-3.18524504518330 E+04
2002.44794371078178 E-061.61554700841398 E+04
34.78534781055533 E-051.05342322581895 E-0800
45.69237610389610 E+03000
5000-1.3435970861084 E+04
60007.72801591164554 E+03

матрица эксперимента

В матрице эксперимента строка 6 содержит значение Ху равное 44052, и значение MIPs, равное 25.8. Результат, полученный по формуле (1) для среднего числа сообщений, равного 40000, дает меньшее значение, равное 18.57. Расчетные значения MIPs, вычисленные по функциям одной переменной, дают наибольшее значение для среднего времени обработки — чем меньше время обработки сообщения, тем большая производительность ЭВМ требуется. Среднее, вычисленное по 4 интерполяционным значениям зависимой переменной, равно 18.74. Параметры доверительной области для расчетного значения MIPs могут быть вычислены по методике, описанной Д. Химмельблау. Одновременно при расчете 7 выдаются и значения необходимого объема ОП, среднее число вагонов, при обработке которых возникнет введенное количество сообщений в сутки, и ожидаемое время обработки сообщения. Это позволяет обоснованно решать проблемы, возникающие при решении задачи гибкой модернизации комплекса технических средств и прежде всего ответить на вопрос — достаточна ли мощность имеющейся в наличии ЭВМ для реализации всех программ АСОУП.

Разработанная методика может быть применена и при исследовании других программных комплексов, например, таких как ДИСКОР, МПП-99 на основе DB2 и т.п., программы которых выполняются на одной и той же ЭВМ одновременно с программами АСУОП.










Системы передачи данных

 


Комплексные проектные решения

 


Управление распределенными системами

 


Автоматизированные рабочие места

 


Системы и средства обеспечения безопасности движения

 


Цифровые сети технологической связи

 


Информационные системы управления движением

 


Автоматизированное управление разработками проектов

 




Здоровый образ жизни - советы по правильному питанию.

 


Квартиры в Сургуте

 



Copyright (c) 2008, Infotest, Inc.