Chapter III. Evaluations and Estimations Глава III. Измерения и оценки

Мы очень много говорили в предыдущей главе о важности оценок. Но:

• как эти оценки конструировать?

• какие они бывают?

• что они вообще значат?

Об этом мы и поговорим сейчас.

III.0. Scales and estimations Шкалы и единицы оценивания

Главное, что я усвоил в жизни: никогда не стоит оценивать самого себя. Скорее всего, Вы будете заблуждаться…

Йоханн Ламонт, шотландский физик и астроном

Для осуществления любых измерений используются так называемые измерительные шкалы, далее будем называть их просто шкалами.

Как и всякая модель целевого объекта, шкалы должны корректно отражать его изучаемые характеристики и, следовательно, иметь те же свойства.

III.0.1. The lesser evil Меньшее зло

Любое измерение, в частности не только из-за конечной точности, но даже согласно принципу неопределенности Гейзенберга, приводит к потере информации и даже искажению измеряемого объекта. В частности поэтому сам процесс измерения делят на разрушающие методы измерения и неразрушающие.

Разрушающими именуются методы измерения, при применении которых происходит существенное изменение структуры объекта, его функционала и/или значений измеряемых характеристик.

Примеры разрушающих измерений – краш-тесты автомобилей, биопсии кист и опыты над мышами.

Неразрушающими, в свою очередь, называются такие методы измерения, которые не приводят к существенным изменениям в объекте – скажем, данные изменения должны не превышать погрешность самого измерения.

К неразрушающим измерениям относятся измерения линейкой, осциллографом или УЗИ-аппаратом.

Какие их этих измерений являются лучшими? Сложно сказать, но, отказавшись от биопсии, погибли многие, кто руководствовался лишь УЗИ. А виртуальная симуляция повреждений далеко не то же самое, что может произойти с автомобилем. Особенно в страховом случае «тотал».

III.0.2. Error source Источник ошибок

Ошибок измерений в каждом случае встречается огромное количество. Они определяются используемым инструментарием измерения, условиями окружающей среды, длительностью эксперимента, опытностью наблюдателя.

Допустим, при измерении показателей достаточно распространенного датчика – акселерометра, предназначенного для измерения ускорений; только основных видов ошибок, не связанных с инструментом или наблюдателем, насчитывается порядка семи.

III.0.3. Data types Типы данных измерительных шкал

Различают четыре основных типа измерительных шкал.

1. Шкала наименований (номинальная).

2. Шкала порядка (ранговая).

3. Интервальная шкала.

4. Шкала отношений.

Данный список составлен не произвольно, а по мере увеличения мощности шкал: более мощные шкалы обладают всеми возможностями шкал менее мощных. Так, при увеличении мощности:

• качественные измерения сменяются количественными;

• возрастают возможности оценки свойств объектов, их различий и отношений;

• увеличиваются возможности применения арифметических операций, статистических мер и критериев;

• расширяются пределы инвариантности измерений.

Тем не менее далеко не всегда шкалы большей мощности предпочтительнее.

Так, количество верно выполненных заданий (что соответствует шкале отношений) в тесте на интеллект гораздо выгоднее представить в стандартизированных баллах IQ (шкале интервалов).

Точно так же интенсивность разнообразных поведенческих реакций лучше оценивать не в баллах (ранговой шкале), а в типе темперамента (шкале наименований).

Таким образом, на выбор типа измерительной шкалы могут оказывать влияние многие факторы – как достоинства самой шкалы, так и специфика самого объекта измерений.

III.1. Quality and quantity Качество и количество

Идеал – когда количество сбалансировано с качеством.

Амит Рэй, индийский писатель и гуру

III.1.1. In between Сходства и различия

В силу того что символы, присваиваемые объектам в соответствии с порядковыми и номинальными шкалами, не обладают числовыми свойствами, даже если записываются с помощью цифр, эти два типа шкал получили общее название качественных, в отличие от количественных шкал интервалов и отношений.

Шкалы интервалов и отношений имеют общее свойство, отличающее их от качественных: они предполагают не только определенный порядок между объектами или их классами, но и наличие некоторой единицы измерения, позволяющей определять, насколько значение признака у одного объекта больше или меньше, чем у другого. При этом символы, приписываемые объектам в соответствии с количественными измерительными шкалами, могут быть только числами.

Необходимо заметить, что количественные шкалы делятся на дискретные и непрерывные:

дискретные измеряются в результате счета: число детей в школе, количество решенных задач, порядковый номер изделия;

непрерывные при этом предполагают, что измеряемое устройство изменяется непрерывно, как температура на ртутных градусниках, сила натяжения динамометра или давление в колесе автомобиля.

III.1.2. Crucial definitions Необходимые определения

Мы уже неоднократно говорили о неких измерительных инструментах. Так вот, ими могут быть любые объекты реального мира либо абстракции, позволяющие обеспечивать процесс измерения и фиксацию его результата.

Любой инструмент характеризуется точностью, чувствительностью и надежностью, при этом надо сказать следующее.

Точность инструмента – его соответствие существующему в данной области эталону (стандарту).

Например, точность весов соответствие реальному весу в килограммах; точность определения местоположения – соответствие реального местоположения предполагаемому в метрах; точность оценки успеваемости – соответствие реальных знаний учащегося к его средневзвешенной оценке успеваемости.

Чувствительность инструмента – это величина наиболее малой возможной величины измерения. В зависимости от природы объекта и типа инструмента это могут быть микроны, паскали или люмены.

Надежность инструмента – его способность к воспроизведению полученных результатов при повторяющихся экспериментах.

Инструменты делятся на производящие первичные и вторичные измерения.

Первичные получают в результате непосредственного измерения характеристик объекта: длины, ширины и массы; светимости или плотности; оценки теста; количестве строк кода.

Вторичные являются результатом некоторых манипуляций с первичными измерениями, обычно с использованием логико-математических конструкций; примерами таковых являются площадь прямоугольника, демографические коэффициенты смертности, рождаемости и естественного прироста, зачисление или незачисление в институт по результатам вступительных экзаменов.

III.2. Scales review Шкалы и их свойства

Медицина есть общественная наука, а политика – та же медицина, только больше.

Рудольф Вирхов, немецкий ученый и политический деятель

III.2.1. Important names Шкала наименований

Данная шкала используется только для обозначения принадлежности объекта к одному из нескольких непересекающихся классов.

Приписываемые объектам символы, которые могут быть цифрами, буквами, словами или специальными обозначениями, представляют собой только метки соответствующих классов.

Характерной особенностью номинальной шкалы является принципиальная невозможность упорядочить классы по измеряемому признаку, к ним нельзя применять суждения типа «больше-меньше», «лучше-хуже» и другие отношения.

Единственным отношением, определенным на шкале наименований, является отношение тождества: объекты, принадлежащие к одному классу, считаются тождественными, к разным классам – различными.

Примерами номинальных шкал являются:

• пол и национальность;

• специальность соответственно полученному образованию;

• марка сигарет;

• предпочитаемый цвет;

• название учебной специальности.

Частным случаем шкалы наименований является дихотомическая шкала, с помощью которой фиксируют наличие у объекта определенного качества или его соответствие некоторому требованию: например, полноприводные автомобили отмечаются единицей, а не обладающие полным приводом – нулем.

Как первая по мощности, шкала наименований позволяет осуществлять следующие статистические операции и логические преобразования:

Статистические операции – число индивидов данного класса, относительные частоты, моды (наиболее часто встречающиеся значения). Допустимые преобразования – любое взаимно однозначное преобразование, из одного множества именований в другое (совпадающей размерности).

III.2.2. Ordnung muss sein Шкала порядка

Шкала порядка – или ранговая шкала – позволяет не только разбивать объекты на классы, но и упорядочивать классы по возрастанию (убыванию) изучаемого признака.

Об объектах, отнесенных к одному из классов, известно не только то, что они тождественны друг другу, но и то, что они обладают измеряемым свойством в большей или меньшей степени, чем объекты из других классов. При этом порядковые шкалы не могут ответить на вопрос: насколько (или во сколько) изучаемое свойство выражено сильнее или слабее у объектов одного класса, чем у объектов из другого класса?

Примерами шкал порядка являются: уровень образования, военные и академические звания, тип поселения (большой, средний, малый город, село), некоторые естественно-научные шкалы (твердость минералов, сила шторма).

Так, можно сказать, что шестибалльный шторм заведомо сильнее, чем четырехбалльный, но нельзя определить насколько.

Чаще всего упорядоченные классы нумеруют в порядке возрастания (убывания) измеряемого признака. Однако в силу того, что различия в значении признака точному измерению не поддаются, к шкалам порядка, также как к номинальным шкалам, действия арифметики не применяют.

Тем не менее в этом правиле есть исключение – т. н. оценочные шкалы, при использовании которых объект получает (или сам выставляет) оценки, исходя из определенного числа баллов. К таким шкалам относятся, например, средний балл в дипломе, оценка качества обслуживания или степень состояния предмета искусства при оценке на аукционе.

Строго говоря, хотя подобные шкалы и являются частными случаями порядковых (нельзя определить, насколько различаются знания троечника и отличника), но с ними часто обращаются как с шкалой большей мощности – шкалой интервалов.

Необходимо заметить, что чаще всего в порядковых квалиметрических (измеряющих выраженность какой-то субъективной оценки) шкалах присутствует от 5 до 10 градаций. Это связано с тем, что большинство людей одновременно может различать от 7 ± 2 градаций непрерывных признаков различных видов, отсюда пошли:

• 7 тонов радуги;

• 7 тонов хроматической гаммы рояля;

• 7 степеней видимой яркости звезд;

• 5, 7 и 9 градаций шкалы интенсивности мнений в социологии.

Как вторая по мощности, шкала порядка позволяет осуществлять те же статистические операции и логические преобразования, как у школы наименований, а также дополнительно:

– статистические операции – медиана, квантили, ранговая корреляция;

– допустимые преобразования – преобразования по любой монотонной функции, например из линейной шкалы в логарифмическую.

III.2.3. Strength of simple continuum Интервальная шкала

В отличие от двух предыдущих шкал в шкале интервалов существует единица измерения либо реальная (физическая), либо условная, при помощи которой возможно установить количественные различия между объектами в отношении измеряемого свойства.

Равные разности чисел в этой шкале будут соответствовать равным различиям в количествах измеряемого свойства, как у разных объектов, так и у одного и того же объекта в различные моменты времени.

В шкале интервалов может быть задействована вся числовая ось, но при этом ноль не указывает на отсутствие измеряемого свойства, т. к. нулевая точка часто является произвольной (яркий пример – шкала температуры по Цельсию).

Примерами шкал интервалов являются календарное время, температурные шкалы Цельсия и Фаренгейта, шкала прочности материалов (шкала Мооса).

Как третья по мощности, шкала интервалов позволяет осуществлять те же статистические операции и логические преобразования, как у ранговой шкалы, а также дополнительно:

Статистические операции – мат. ожидание, стандартное отклонение, вычисление коэффициентов асимметрии. Не допускается вычисление коэффициента вариации, т. к. нулевая точка выбирается произвольно.

Допустимые преобразования – операция «на сколько»; операции сложения и вычитания.

III.2.4. Lesser infinity Шкала отношений

Шкала отношений позволяет дать ответ на вопрос: во сколько раз одно значение больше или меньше другого? В шкале отношений, как и в шкалах интервалов, существует единица измерения, при помощи которой объекты возможно упорядочить в отношении измеряемого свойства и установить количественные различия между ними.

В шкале отношений обязательно присутствует ноль, который говорит об отсутствии измеряемого свойства.

Примеры шкал отношений – большинство используемых в физике шкал являются шкалами отношений: температурная шкала по Кельвину, шкала длины, массы, времени, освещенности и проч.

Как максимальная по мощности, шкала отношений позволяет осуществлять все типы статистических и арифметических операций, включая умножение и деление.

Загрузка...