Нормировка значений функции "Хи-квадрат”.


Владельцы патента RU 2275847:

Изобретение относится к области медицины, а именно к функциональной диагностики. Измеряют показатели частоты сердечных сокращений, систолического и диастолического артериального давления, роста, веса, частоты дыхания, максимальной задержки дыхания на вздохе или на выдохе после приседаний. Затем значения измеренных показателей нормируют по формуле: K i =(H i,max -H i)/(H i,max -H i,н) при H i /H i,н ≥1, K i =(H i -H i,min)/(H i,н -H i,min) при H i /H i,н ≤1, где K i - нормированный показатель; H i - значение измеренного показателя; H i,н - значение измеренного показателя, принятого за норму; H i,max и H i,min - максимальные и минимальные значения нормы измеренных показателей. После чего нормированный показатель здоровья (К) рассчитывают по формуле: где K i - нормированный показатель; П - произведение нормированных показателей; N - количество измеренных нормированных показателей. Способ расширяет арсенал средств, используемых для интегральной оценки динамики состояния здоровья. 1 ил.

Изобретение относится к функциональной диагностике и позволяет оценивать здоровье человека количественно.

Известен «Способ определения функционального состояния организма человека» (Россия, пат. № 2204318, Бюл. № 14, 20.05.2003, МКИ: 7 А 61 В 5/02, 5/16).

При определении функционального состояния человека измеряют частоту сердечных сокращений (ЧСС) в состоянии покоя и после тестовой физической нагрузки и определяют разницу значений ЧСС до и после нагрузки. Производят измерение ЧСС в состоянии покоя и после тестовой физической нагрузки производят до и после психоэмоционально-физического воздействия в виде какого-либо рода деятельности, в качестве тестовой нагрузки применяют легкую физическую нагрузку, равную 10-30% от максимальной. Влияние психоэмоционально-физического воздействия в виде какого-либо рода деятельности на функциональное состояние организма человека оценивают как положительное, если разница значений ЧСС после тестовой нагрузки и в состоянии покоя до психоэмоционально-физического воздействия равна или больше аналогичной разницы после психоэмоционально-физического воздействия, и как отрицательное, если разница значений ЧСС после тестовой физической нагрузки и в состоянии покоя до психоэмоционально-физического воздействия меньше аналогичной разницы после психоэмоционально-физического воздействия.

Наиболее близким к заявляемому является «Способ оценки состояния функциональной реактивности сердечно-сосудистой системы» (Россия, пат. № 2207044, Бюл. № 18, 27.04.2000, МКИ: 7 А 61 В 5/02, 5/16). Оценивают состояние функциональной реактивности сердечно-сосудистой системы по ритму сердца до и во время нагрузочной работы. Во время проведения постоянно возрастающей психоэмоциональной нагрузки производят ежеминутную регистрацию параметров гемодинамики: артериального давления систолического (Дв), артериального давления диастолического (Дн), артериального давления среднего динамического (Дср.дин) и частоты сердечных сокращений (ЧСС), определяют величину показателя функциональной реактивности (ПФР), являющегося произведением АД среднего динамического на ЧСС, вычисляют относительное приращение значения ПФР при выполнении нагрузки по сравнению со значением в покое (ΔПФР) и по величине значений ΔПФР оценивают тип функциональной реактивности сердечно-сосудистой системы: при значении ΔПФР более чем 20 усл.ед. - реактивность оценивают как гиперфункциональную, при значении ΔПФР не менее 10 усл.ед. - реактивность оценивают как гиперфункциональную и при значении ΔПФР от 10 до 20 усл.ед. - тип функциональной реактивности оценивают как нормальный.

Недостаток известных способов определения здоровья - сложность реализации и необходимость в использовании сложной медицинской электронной аппаратуры и невозможность оценивать здоровье человека количественно.

Предложенный способ устраняет эти недостатки. Это достигается путем измерения в состоянии покоя человека таких показателей как частота сердечных сокращений (ЧСС), систолического и диастолического артериального давления, частоты дыхания в минуту, максимальной задержки дыхания тотчас после нескольких приседаний и спустя несколько минут после них, роста, веса и др. Нормирования измеренных показателей и определения их среднегеометрического значения.

Известно, что измерением называется процесс сравнения путем физического эксперимента данной величины с некоторым ее значением, принятым за единицу. За единицу измеренных показателей, принимаем существующие нормы этих показателей, например, нормы систолического и диастолического артериального давления соответственно равны 120 и 80 мм рт.ст.

Нормированные значения показателей K i будем определять по формулам (1) и (2):

K i =(H i,max -H i)/(H i,max -H i,н), при H i /H i,н ≥1 (1)

K i =(H i -H i,min)/(H i,н -H i,min), при H i /H i,н ≤1, (2)

где K i - нормированный i-ный показатель (i=1, 2, ..., N; где N - количество измеренных показателей);

H i - значение измеренного i-го показателя;

H i,н - значение измеренного i-го показателя, принятое за норму;

H i,max и H i,min - принятые за максимальные или минимальные возможные значения измеренных i-ных показателей.

Нормированный показатель здоровья определим как среднее геометрическое нормированных показателей обследуемого человека. Аналитически это определение можно записать в виде формулы (3) измерения нормированного показателя здоровья косвенным способом, через измеренные показатели:

где К - нормированный показатель здоровья (значения К изменяются от 0 до 1);

K i - нормированный i-ный показатель (значения K i изменяются от 0 до 1);

П - знак произведения N показателей K i ;

N - количество измеренных показателей.

При всех показателях, равных их норме, их нормированные значения равны единице, и как следует из формулы (3), единице будет равен нормированный показатель здоровья - его максимально возможное значение. Показатели здоровья могут изменяться в определенных пределах, меньше или больше которых организм человека не будет иметь резервов. При максимально и минимально возможных значениях показателей, нормированные показатели равны нулю. В этом случае, как следует из формулы (3), нормированный показатель здоровья будет равен нулю, если хотя бы один из нормированных показателей равен нулю. Таким образом, нормированный показатель здоровья может изменяться от единицы для здорового человека, у которого все показатели равны их норме, до нуля для человека, находящегося на стадии нетрудоспособности.

Пример осуществления способа определения нормированного показателя здоровья

Для определения нормированного показателя здоровья по формуле (3) составим формулы для расчета нормированных показателей K i: пульса, артериального давления - верхнего и нижнего, частоты дыхания, устойчивости организма к кислородной задолженности и веса.

Человек, который решил всерьез заняться восстановлением своего здоровья, для отслеживания его изменения во времени, должен приобрести: напольные весы, тонометр - прибор для измерения артериального давления, научиться им пользоваться, и часы с секундной стрелкой.

1. Нормированный показатель веса

За норму веса тела человека в кг примем его значение, равное росту человека в см минус 100.

За максимально допустимый вес тела человека примем полтора значения нормального веса. В этом случае из формулы (1) следует, что нормированный показатель веса K 1 рассчитывается по формуле (4)

K 1 =3-2В/Вн; (4)

где В - вес тела человека;

Вн - показатель нормального веса (рост в см. минус 100).

Из формулы (4) следует, что при весе тела человека, равном его норме, нормированный показатель веса будет равен единице. При максимально допустимом весе (полторы нормы), нормированный показатель веса будет равен нулю.

2. Нормированный показатель пульса

Частота сердечных сокращений (ЧСС) - пульс (П) в покое (сидя) является одним из важнейших показателей. За норму пульса П принято считать 60 сердечных сокращений в минуту. За максимально допустимую частоту пульса в покое примем значение 90 ударов в минуту (уд/мин). В этом случае из формулы (1) следует, что нормированный показатель пульса К 2 рассчитывается по формуле (5):

К 2 =3-П/30 (5)

где П - частота пульса обследуемого человека (удары в мин).

Из формулы (5) следует, что при пульсе, равном 60 уд/мин, нормированный показатель пульса будет равен единице. При максимально допустимом пульсе в покое равном 90 уд/мин, нормированный показатель пульса будет равен нулю.

3. Нормированные показатели систолы и диастолы

Артериальное давление: систола - Дс и диастола - Дд, как и частота пульса, являются важными показателями. Наиболее опасным заболеванием, связанным с повышенным артериальным давлением, является гипертония. Ее последствия - либо инсульт и паралич, либо смерть.

За нормальное значение систолы принимается значение Дсн=120 мм рт.ст., а диастолы Ддн=80 мм рт.ст. За максимальное значение систолы принимаем значение Дс max =180 мм рт.ст., за максимальное значение диастолы - Дд max =90 мм рт.ст. В этом случае из формулы (1) следует, что нормированные показатели систолы и диастолы рассчитываются по формулам (6) и (7):

К 3 =3-Дс/60 (6)

К 4 =0,1(90-Дд) (7)

где Дс - систола обследуемого человека;

Дд -диастола обследуемого человека.

4. Нормированный показатель частоты дыхания

Частота дыхания человека в покое может много сказать о его здоровье. Если человек дышит редко 5-8 раз в минуту, то можно с уверенностью сказать, что такой человек практически здоров. Другое дело, когда частота дыхания человека в покое равна 20 раз в минуту и более, такой человек не блещет здоровьем.

Для определения нормированного показателя частоты дыхания необходимо измерить частоту дыхания А обследуемого человека, находящегося в покое - сидя. Примем за норму частоты дыхания Ан человека в покое 8 раз в минуту. За максимально допустимую частоту дыхания A max в покое примем 24 раза в минуту. В этом случае из формулы (1) следует, что нормированный показатель частоты дыхания К 5 рассчитывается по формуле (8):

К 5 =(24-А)/16 (8)

где А - частота дыхания в минуту обследуемого человека.

По формуле (8) нетрудно убедиться, что при частоте дыхания, равной 8 раз в мин, нормированный показатель частоты дыхания будет равен единице. При максимально возможной частоте дыхания, равной 24 раза в мин, нормированный показатель частоты дыхания равен нулю.

5. Нормированный показатель кислородной задолженности

У здорового человека после физической нагрузки быстро компенсируется кислородная задолженность, которая образовалась в процессе такой нагрузки. Время для ликвидации кислородной задолженности исчисляется единицами минут. У человека со слабым здоровьем это время составляет 10 и более минут. Для определения показателя кислородной задолженности обследуемого человека по формуле (9) необходимо измерить максимальную задержку дыхания (апноэ-1) на выдохе тотчас после 10 приседаний и максимальную задержку дыхания (апноэ-2) на выдохе, спустя несколько минут (например, 4 мин) после приседаний. За норму значения апноэ-2 принято 30 сек. Возвести значение апноэ-2 в квадрат, и разделить значение (апноэ-2) 2 на 60 значений апноэ-1.

К 6 =(апноэ-2) 2 /60(апноэ-1) (9)

За норму нормированного показателя кислородной задолженности примем его значение, равное единице, а его неудовлетворительное значение - 0,5.

Нормированный показатель здоровья при измеренных шести показателях обследуемого человека определяют по формуле (3) путем вычислений. Перемножают все шесть нормированных показателей (K 1 ×К 2 ×К 3 ×К 4 ×К 5 ×К 6) и извлекают из произведения корень шестой степени 1/6 .

Для упрощения определения значений нормированных показателей по их значениям можно воспользоваться номограммой, изображенной на чертеже. На оси ординат номограммы отложены искомые значения шести нормированных показателей: K 1 , К 2 , К 3 , К 4 , К 5 , К 6 . На шести осях абсцисс отложены показатели:

Частота сердечных сокращений, уд/мин;

Систола, мм рт.ст.;

Диастола, мм рт.ст.;

Частота дыхания в мин;

Отношение апноэ-2/апноэ-1;

Отношение вес/норма веса.

Для определения значений нормированных показателей на каждой оси абсцисс поочередно откладывают значения измеренных показателей (ЧСС, давления и т.д.), восстанавливают перпендикуляр от каждой оси абсцисс до пересечения с наклонной прямой номограммы, значения координат точек их пересечения и есть значения нормированных показателей. Отсчитанные значения нормированных показателей подставляются в формулу (3) и производят вычисление нормированного показателя здоровья.

Проиллюстрируем значение использования норм на примере широко известной методики К.Томаса. Напомним, что в ней вывод о доминирующей стратегии поведения в конфликтной ситуации делается с опорой на числовые данные. А именно, после подсчета суммарных баллов по каждой шкале, нужно выявить шкалу имеющую наибольший балл. Соответствующая шкале стратегия интерпретируется как доминирующая в конфликтной ситуации. Подсчитанные статистики показывают, что средние величины шкальных оценок по абсолютной величине различны. Они варьируют у мужчин от 5,25 балла до 7,25 балла и у женщин от 3,71 до 7,65 баллов (см. табл. 11).

Табл. 11. Первичные статистики шкальных оценок методики Томаса

Мужчины (n=56)

Женщины (n=71)

Стратегия

Напористость

Сотрудничество

Компромисс

Избегание

Уступчивость

Примечание.

Средн. - средние величины;

950% и +95.0% - доверительные интервалы средних величин;

Выделены наибольшие средние величины.

Таким образом, если не учитывать нормативные данные, полученные на российской выборке (или проверенные на российской выборке), то в интерпретации результатов можно придти к неверным выводам. В самом деле, мужчинам и женщинам свойственно предпочтение стратегии избегания. В руководстве к методике не говорится о том, что доминирование одной из пяти стратегий является транскультуральной характеристикой личности. По контексту можно понять, что автор исходит из предположения о равной вероятности предпочтения каждой из пяти стратегий. Поскольку между шкальными показателями существуют статистически значимые корреляционные связи, вряд ли можно говорить о равной вероятности следования каждой из пяти стратегий. В такой ситуации, когда отсутствуют нормативные данные и сведения о характере распределения величин, надежнее опираться на подсчитанные для своей выборки статистики. В частности - для оценки выраженности доминирования одной из стратегий использовать сигму и доверительные интервалы. Добавим, что нормы целесообразно рассчитать отдельно для мужчин и женщин. По представленным данным видно, что в двух шкалах из пяти показатели значимо различаются у разных полов. При сравнении групп или подгрупп, эта половая специфичность может оказаться переменной, влияние которой нельзя не учитывать.

Вычислять нормы целесообразно и в других случаях. Полученные при сборе данных начальные (первичные) оценки выполнения экспериментальных заданий далеко не всегда удобно использовать в дальнейшей работе. Их тем или иным способом преобразуют. Наиболее частыми преобразованиями являются центрирование и нормирование среднеквадратическими отклонениями. Под центрированием понимается линейная трансформация величин признака, при которой средняя величина распределения определенного признака становится равной нулю. Направление шкалы и ее единицы остаются при этом неизменными.

Суть нормирования состоит в переходе к другому масштабу - стандартизированным единицам измерения. При стандартизировании результатов тестовых испытаний нормирование чаще всего осуществляется с помощью среднеквадратических отклонений. Стандартизирование производится при нормальном распределении тестовых оценок или близком к нему по виду.

В психологии существует целый ряд шкал, основанных на нормальном распределении и имеющих разные значения М и . Например, в шкале отклонений интеллекта IQ: М=100,  =15; в шкале Векслера М=10, = 3. Распределения различных измеренных в эксперименте признаков имеют разные величины М и  . Переводя полученные первичные оценки разных признаков к распределению с одними и теми же М и , мы получаем больше возможностей для оценки и сопоставления их варьирования. Сделать это нам позволяет использование нормированного отклонения. Нормированное отклонение показывает, на сколько сигм отклоняется та или иная варианта от среднего уровня варьирующего признака (средней арифметической), и выражается формулой:

где V - значение признака (в начальных баллах).

С помощью нормированного отклонения можно оценить любое полученное значение по отношению к группе в целом, взвесить его отклонение и одновременно освободиться от именованных величин. Для того чтобы избавиться от отрицательных чисел к полученной величине t можно прибавить какую-либо константу. Удобно, если все числа, с которыми вы оперируете имеют одинаковое количество знаков. С учетом этих соображений весьма удобна шкала Т-оценок. Для этой шкалы принято нормальное распределение, имеющее М=0, =10. Для пересчета берется константа равная 50. Формула преобразования начальных баллов в Т-оценки следующая:

t = 50 + 10 -------

Смысл процедуры нормирования рассмотрим на примере. Предположим, нас интересуют некоторые связи коммуникативной умелости продавцов с особенностями расположения магазина в крупном городе. Чтобы составить некоторую интегральную оценку коммуникативной умелости конкретного продавца, мы можем через наблюдение получить по каждому испытуемому ряд параметров, характеризующих его общение с покупателем. Например, мы можем измерить среднюю длительность контакта глазами, среднее количество улыбок в фиксированный интервал времени, количество грубых, неприветливых обращений и т.д. Можно охарактеризовать преимущества и недостатки расположения магазина в городе (насколько "бойкое место" и т.п.). Для этого можно подсчитать количество маршрутов городского транспорта, имеющих остановки в непосредственной близости от магазина, оценить его удаленность от станций метро, учесть число расположенных поблизости магазинов другого профиля и т.д.

Для того чтобы вывести некоторый обобщенный коммуникативный показатель невозможно складывать число улыбок с длительностью контакта глазами и вычитать из этой суммы количество выражений, свидетельствующих о низкой речевой культуре. Бессмысленно складывать число автобусных маршрутов с числом соседних магазинов и вычитать из суммы величину расстояния до ближайшего метро. Лучше собрать необходимый массив количественных данных, проводя исследование в ряде магазинов, подсчитать первичные статистики для всех этих показателей, а затем, после преобразования начальных данных, получить Т-баллы по каждому показателю.

При нормировании из каждого полученного при сборе данных значения в начальных единицах вычитают среднюю арифметическую, а разность делят на сигму. Полученную величину умножают на 10, затем прибавляют к 50 или вычитают из 50. Выбором последнего арифметического действия (сложение или вычитание) мы можем задать направление вклада, который делает этот параметр в высчитываемую интегральную оценку, т.е. можем задавать направленность преобразования, учитывая специфику данного параметра. Если конкретное значение в начальных единицах превышает среднюю арифметическую, мы можем нормированное отклонение (разность, деленную на сигму) приплюсовать к 50. Это будет соответствовать большей выраженности оцениваемого психического качества у данного испытуемого, чем в среднем по нашей выборке.

Например, большее у конкретного продавца количество улыбок на одну сигму (чем в среднем) количественно теперь будет выражено: 60 Т-баллами. Количественную оценку признаков высокой речевой культуры в нормированных отклонениях следует прибавлять к 50 Т-баллам, а низкой речевой культуры - вычитать из 50 Т-баллов. Если, например, количественная оценка некоторого признака отрицательной направленности (в начальных баллах), превышает среднюю величину на полсигмы, то в Т-баллах она будет равна 45. После такого рода преобразований, подсчитывая интегральный показатель коммуникативной умелости для конкретного испытуемого, мы можем прибавлять одни Т-баллы к другим.

Форму стандартизирования данных целесообразно выбирать с учетом размаха полученных начальных оценок и числа градаций. Если в начальных баллах число градаций 7-15, то могут оказаться вполне подходящими стенайны 2 . Если же число градаций достигает 30 и более при небольшой скошенности распределения (асимметрии), то переводя эти показатели в стенайны мы будем огрублять баллы, т.е. терять некоторую долю точности произведенного измерения. Если есть основания считать, что ваши измерения достаточно эффективны (например, есть данные о хорошей ретестовой надежности, обнаружены высокие корреляции полученных в измерениях показателей с ясными и надежными внешними критериями валидизации и т.д.), то оправданным будет использование стандартизированых единиц имеющее такое же или даже несколько большее число градаций.

Полученные при сборе данных сырые (первичные) оценки выполнения экспериментальных заданий далеко не всœегда удобно использовать в дальнейшей работе. Их тем или иным способом преобразуют. Наиболее "‣‣‣детым!! преобразованиями являются,центрирование и нормирование средкеквадратическими отклонениями. Под центрированием принято понимать линœейная трансформация величин признака, при которой средняя величина распределœения определœенного признака становится равной нулю. Направ­ление шкалы и ее единицы остаются при этом неизменными

Суть нормирования состоит в переходе к доугому масштабу - стан-дарти".ированным (стандартным) единицам измерения. Прʼʼ стандартизи-ровании результатов тестовых испытаний нормирование чаще всœего осу­ществляется с помощью среднеквадратическнх отклонений. Стандартизи-рование производится при нормальном распределœении тестовых оценок (ши близком к нему по виду.

В психологии существует целый ряд шкал, основанных на нормаль­ном распределœении и имеющих разные значения М и о. К примеру, в шка-."е отклонений инюл.покта SQ: М-100, с." -15: в шкале Векслера М---!0, о-" ^. Распределœения различных измеренных в эксперименте пршнпкоБ имеют рпзные величины М п с; Переводя полученные первичнън? ."-"цепки разных i;w"!h;ikob is распределœению с отнп?ли и теми же \" 1 "i ""7, мы пол\"".аем,"":";лыие возможностей для оценки и сопоставления их варьирования Сде­лать это нам позволяет псподь яванце нормированного о^-доненчя Нор­мированное отклонение показывает, на сколько сигм отклоняется та ц-ш гнш варианта от среднего уровня варьирующего признака (средней ариф­метической";. и выражается формулой:

где V - значение признака (в сырмх оценках;

С помощью нормированного отклонения можно оценить любое по­лученное значение по отношению к группе в целом, взвесить его отклоне­ние и одновременно освободиться от именованных величин. Для того что--т i

бы избавиться от отрицательных чисел к полученной величинœе t можно прибавить какую-либо константу. Удобно, в случае если всœе кисла, с которыми вы оперируете имеют одинаковое количество знаков С учетом этих сообра­жений. весьма удобна шкала Т-оценок. Для этой шкалы принято нормаль­ное распределœение, имеющее М^О, ст -=10. Дня пересчета берется констан­та равная 50. Формула преобразования сырых оценок в Т-оценки следую­щая:

Смысл процедуры нормирования рассмотрим на примере. Предполо­жим, нас интересуют некоторые связи коммуникативной умелости продав­цов с особенностями расположения магазина в крупном городе. Чтобь составить некоторую интегральную оценку коммуникативной умелосп конкретного продавца, мы можем через наблюдение получить по каждом} испытуемому ряд параметров, характеризующих его общение с покупате­лем К примеру, мы можем измерить среднюю длительность контакта гла­зами. среднее количество улыбок в фиксированный интервал времени. количество грубых, непривечливых обращений и т.д. Можно охарактери­зовать преимущества и недостатки расположения магазина в городе (на­сколько "бойкое место" и т.п) Для этого можно подсчитать количестве маршрутов городского транспорта͵ имеющих остановки в непосредствен­ной близости от магазина, оценить его удаленность от станций метро. участь число расположенных поблизости магазинов другого профиля и т.д.

Для того чтобы вывести некоторый обобщенный коммуникативный показатель невозможно складывать число улыбок с длительностью контак­та глазами и вычитать из этой суммы количество выражений. св1Едетельст-вующрх о ндзкой речевой культуре. Бессмысленно складывать число авто­бусных маршрутов с числом сосœедних магазинов и вычитать из С}тиМ;ы велугару расстояния до ближайшего метро. Лучше собрать необходимый массив количественных данных, проводя исследование в ряде магазинов, подсчитать первичяые статистики для всœех этих показателœей, а затем, по­сле преобразования сырых данных, получить Т-баллы по каждому показа­телю.

При нормировании нз каждого полученного при сборе данных значе­ния в сырых единицах вычитают q-eninoic арифметическую, а разность делят на сигму. Полученную величину умножают на i0, затем прибавля­ют к 50 или вычитают из 50. Выбором последнего арифметического дей­ствия (сложение или вычитание) мы можем задать направление вклада, который делает данный параметр в высчитываемую интегральную оценку, ᴛ.ᴇ.

можем задавать направленность преобразования, учитывая специфику данного параметра. В случае если конкретное значение в сырых единицах превы­шает среднюю арифметическую, мы можем нормированное отклонение (разность, делœенную на сигму) приплюсовать к 50. Это будет соответство­вать большей выраженности оцениваемого психического качества у данно­го испытуемого, чем в среднем по нашей выборке.

К примеру, большее у конкретного продавца количество улыбок на одну сигму (чем в среднем) количественно теперь будет выражено: 60 Т-баллами. Количественную оценку признаков высокой речевой культуры в нормированных отклонениях следует прибавлять к. 50 Т-баллам, а низкой речевой культуры - вычитать из 50 Т-баллов. В случае если. к примеру, количест­венная оценка некоторого признака отрицательной направленности (в сы­рых баллах), превышает среднюю величину на полсигмы. то в Т-баллах ока будет равна 45. После такого рода преобразований, подсчитывая инте­гральный показатель коммуникативной умелости.для конкретного испы­туемого, мы можем прибавлять одни Т-баллы к другим.

Форму стандартизирования данных целœесообразно выбирать с учетом размаха полученных сырых оценок и числа градаций. В случае если в сырых ow.h-ках число градаций 7-! 5, то могут оказаться вполне подходящими стенай-ньᴦ. В случае если же число градаций достигает 30 н более при небольшой скошен­ности распределœения (асимметрии), то переводя эти показатели в стенайны мы будем огрублять оценки, ᴛ.ᴇ. терять некоторую долю точности произве­денного измерения В случае если есть основания считать что ваши измерения дос­таточно эффективны (к примеру- есть данные о хорошей ретестовой надеж­ности, обнаружены высокие корреляции полученных в измерениях показа­телœей с ясными и надежными внешними критериями валᴦ.дизации и т.д.), то оправданным будет использование стандартных единиц имеющее такое же или даже несколько большее число градаций.

Нормирование (стандартизация) и унификация данных

Нормированные (стандартизованные) данные. В ряде задач бывает удобно или даже необходимо перейти от исходных наблюдений, где i = 1, 2,.... п, к нормированным (стандартизованным), которые введем далее. Пусть имеются данные, на основании которых получены

Нормированными (стандартизованными ) называют данные вида

– безразмерные величины, удовлетворяющие условию

Покажем, что средняя арифметическая нормированных данных равна нулю:

а дисперсия равна единице:

При этом если нормированная величина больше нуля (.г* > 0), то наблюдаемое значение больше среднего ; > х). Если же х" < 0, то х, < х.

Стандартизация (нормирование) данных является необходимым начальным этапом преобразования данных при использовании многих многомерных статистических методов – снижения размерности признакового пространства (факторный, компонентный анализ, см. гл. 5), классификации объектов (кластерный анализ, см. гл. 6) и др., особенно если переменные измерены в шкалах, существенно различающихся в величинах (микроны единиц – миллиарды единиц).

Вследствие распространенности и востребованности в статистических пакетах процедура нормирования (стандартизации) обычно вынесена в меню (рис. 1.31).

Рис. 1.31. Вызов процедуры нормирования (стандартизации) данных в меню пакета STA TISTICA (StatSoft)

Унификация данных (унифицированная шкала). При построении интегральных обобщающих показателей часто возникает ситуация, когда нормирование данных не дает нужного результата. Например, нам необходимо построить интегральный показатель качества жизни в стране (регионе) , включающий в себя три исходные переменные – продолжительность жизни, младенческую смертность и уровень безработицы. При этом, даже переведя эти три показателя в единую шкалу (например, со значениями от 0 до 1 или от 0 до N), мы будем иметь конфликт в интерпретации переменных следующего плана.

Первая переменная – продолжительность жизни – характеризуется тем, что чем большие значения она принимает, тем выше качество жизни в стране (регионе). Напротив, вторая переменная – младенческая смертность – при повышении значений понижает качество жизни. Третья переменная – безработица – имеет свой некоторый оптимум (примерно 5% обеспечивает нормальное функционирование и развитие экономики ). И, соединив все три признака в один интегральный показатель, мы будем иметь отсутствие адекватной интерпретации полученного показателя. Чем он выше, тем выше продожительность жизни (лучше), выше младенческая смерность (хуже), выше безработица (непонятно). Для разрешения таких проблем и существует при анализе данных способ, позволяющий это сделать, – приведение всех переменных, участвующих в построении интегрального показателя, к единой унифицированной шкале.

Унифицированная шкала – используемая при построении интегральных показателей из различных переменных шкала, принимающая значения от 0 до N имеющая единую систему интерпретации: чем выше значения переменной в унифицированной шкале, тем выше значение интегрального показателя. При N = получаем шкалу от 0 до 1.

Переменные первого типа – чем выше показатель, тем лучше (продолжительность жизни) – приводятся к унифицированной шкале следующим образом:

где Xj – значение переменной для г-го наблюдения; amin и атах – соответственно наименьшее и наибольшее наблюдаемые значения переменной.

Согласно этой формуле если x t amin, то а" =0, а если.г, – апт, то х] = N, т.е. чем больше значение переменной а, тем выше (лучше) ее значение в унифицированной шкале а*.

2. Переменные второго типа – чем выше показатель, тем хуже (младенческая смертность) – приводятся к унифицированной шкале следующим образом:

Согласно этой формуле если а, = ат|1), го х = N, а если а,- = а„их, то а* = 0, т.е. чем больше значение переменной а, тем ниже (хуже) ее значение в унифицированной шкале X/.

3. Переменные третьего типа – показатель имеет некий оптимум аопт, это значение наилучшее, чем больше отклонения от него, тем хуже (уровень безработицы) – приводятся к унифицированной шкале следующим образом:

Согласно этой формуле если x t = аопт, то х] = N. Если же а, имеет максимально возможное отклонение оташп, то а," =0. Например, если (ашах – а,шт) > > (aOMT-amin) и а, = атах, то а" =0. Таким образом, чем больше значение переменной а, отклоняется от оптимального, тем ниже (хуже) значение а* в унифицированной шкале, а чем ближе значение а, к этому аопт, тем лучше.

  • Айвазян С. А. Анализ качества и образа жизни населения // ЦЭМИ РАН. М.: Наука, 2012. (Экономическая наука современной России).
  • Там же.

Сбор информации и получение оценок показателей

Сбор информации может быть выполнен разными способами. Наиболее популярным способом являются полевые опросы. Однако прежде, чем приступать к сбору информации, необходимо определить аудиторию, на мнение которой можно будет опираться в процессе построения рейтинга. Во-первых, опрашиваемые должны иметь достаточную квалификацию для ответа на вопросы. Во-вторых, их оценка должна быть беспристрастной. При этом может возникнуть ряд неожиданных сложностей. Например, составляя рейтинг вузов, часто опрашивают студентов или выпускников этих организаций. Однако такой подход может быть неверным по следующим причинам. Во-первых, далеко не всегда человек готов признать, что его выбор был ошибочным и что другие университеты лучше того, в который он поступил или который окончил. Во-вторых, студенты редко могут провести сравнительную оценку вузов, ведь обучение они проходят лишь в одном, редко в двух заведениях.

Другим способом получения исходные данные является анализ вторичной информации (например, данных Госкомстата). Основная проблема, с которой сталкивается исследователь в этом случае – неполнота информации. Если же рейтинг основывать на данных СМИ, то велика вероятность оценить не сами компании, а работу их PR-отделов.

Разумным подходом представляется использование сводной информации о характеристиках объекта, публикуемой в различных периодических изданиях (журналы «Эксперт», «Коммерсант» и др.).

Под нормированием критериев понимается приведение локальных критериев оптимальности к единому безразмерному виду.

В качестве методов нормирования в домашнем задании применятся наиболее общеупотребляемый способ приведения критериев к безразмерному виду - линейная трансформация.

f 1 предпочтительно максимальное значение, то формула перехода от ненормированного значения показателя x 1 к нормируемому имеет вид:

,

где f 1 min и f 1 ma x – соответственно минимальное (наихудшее) и максимальное (наилучшее) значение показателя на множестве допустимых альтернатив.

Если для некоторого показателя f 1 предпочтительно минимальное значение, то формула перехода запишется в виде:

.