Отправляет email-рассылки с помощью сервиса Sendsay

Эконометрика

  Все выпуски  

Эконометрика - выпуск 32


Служба Рассылок Subscribe.Ru проекта Citycat.Ru

Здравствуйте, уважаемые подписчики!

   Этот выпуск от 5 марта 2001 года посвящен двум методам, применяемым в эконометрике - методу социально-экономического прогнозирования и методу согласования кластеризованных расшифровок.
   Автор материалов рассылки и статей на сайте http://antorlov.chat.ru - профессор А.И.Орлов. Поддержка рассылки осуществляется А.А.Орловым.
   Все вышедшие выпуски Вы можете посмотреть в Архиве рассылки по адресу http://www.subscribe.ru/archive/science.humanity.econometrika.

*      *      *

Методы социально-экономического прогнозирования

   Кратко рассмотрим различные методы прогнозирования (предсказания, экстраполяции), используемые в социально-экономической области.
   Существует научная и учебная дисциплина "Математические методы прогнозирования". Ее целью является разработка, изучение и применение современных математических методов эконометрического (в частности, статистического, экспертного, комбинированного) прогнозирования социально-экономических явлений и процессов, причем методы должны быть проработаны до уровня, позволяющего их использовать в практической деятельности инженера и менеджера. К основным задачам этой дисциплины относятся разработка, изучение и применение современных математико-статистических методов прогнозирования (в том числе непараметрических методов наименьших квадратов с оцениванием точности прогноза, адаптивных методов, методов авторегрессии и др.), развитие теории и практики экспертных методов прогнозирования, в том числе методов анализа экспертных оценок на основе математики объектов нечисловой природы, методов прогнозирования в условиях риска и комбинированных методов прогнозирования с использованием совместно экономико-математических и эконометрических (как статистических, так и экспертных) моделей. Теоретической основой методов прогнозирования являются математические дисциплины (прежде всего, теория вероятностей и математическая статистика, дискретная математика, исследование операций), экономическая теория, экономическая статистика, менеджмент, социология, политология и другие социально-экономические науки.
   Рассмотрим методы прогнозирования несколько подробнее. Как общепринято со времен основоположника научного менеджмента Анри Файоля, прогнозирование и планирование - основа работы менеджера. Сущность эконометрического прогнозирования состоит в описании и анализе будущего развития, в отличие от планирования, при котором директивным образом задается будущее движение. Например, вывод прогнозиста может состоять в том, что за час мы сможем отойти пешком от точки А не более чем на 5 км, а указание плановика - в том, что через час необходимо быть в точке Б. Ясно, что если расстояние между А и Б не более 5 км, то план реален (осуществим), а если более 10 км - не может быть осуществлен в заданных условиях. Необходимо либо отказаться от нереального плана, либо перейти на иные условия его реализации, например, двигаться не пешком, а на автомашине. Рассмотренный пример демонстрирует возможности и ограниченность методов прогнозирования. А именно, эти методы могут быть успешно применены при условии некоторой стабильности при развитии ситуации и отказывают при резких изменениях.
   Один из вариантов применения методов прогнозирования - выявление необходимости изменений путем "приведения к абсурду". Например, если население Земли каждые 50 лет будет увеличиваться вдвое, то нетрудно подсчитать, через сколько лет на каждый квадратный метр поверхности Земли будет приходиться по 10000 человек. Из такого прогноза следует, что закономерности роста численности населения должны измениться.
   Учет нежелательных тенденций, выявленных при прогнозировании, позволяет принять необходимые меры для их предупреждения, а тем самым помешать осуществлению прогноза. Прогнозирование - частный вид моделирования как основы познания и управления.
   Роль прогнозирования в управлении страной, отраслью, регионом, предприятием очевидна. Необходимы учет СТЭП-факторов (социальных, технологических, экономических, политических), факторов конкурентного окружения и научно-технического прогресса, а также прогнозирование расходов и доходов предприятий и общества в целом (в соответствии с жизненным циклом продукции - во времени и по 11-и стадиям международного стандарта ИСО 9004). Проблемы внедрения и практического использования математических методов эконометрического прогнозирования связаны прежде всего с отсутствием в нашей стране достаточно обширного опыта подобных исследований, поскольку в течение десятилетий планированию отдавался приоритет перед прогнозированием.

Статистические методы прогнозирования

   Простейшие методы восстановления зависимостей в детерминированном случае исходят из заданного временного ряда, т.е. функции, определенной в конечном числе точек на оси времени. Задачам анализа и прогноза временных рядов посвящена большая литература. Временной ряд при этом часто рассматривается в рамках вероятностной модели, вводятся иные факторы (независимые переменные), помимо времени, например, объем денежной массы (агрегат М2). Временной ряд может быть многомерным, т.е. число откликов (зависимых переменных) может быть больше одного. Основные решаемые задачи - интерполяция и экстраполяция. Метод наименьших квадратов в простейшем случае (линейная функция от одного фактора) был разработан К.Гауссом в 1794-1795 гг. Могут оказаться полезными предварительные преобразования переменных.
   Опыт прогнозирования индекса инфляции и стоимости потребительской корзины накоплен в Лаборатории эконометрических исследований МГИЭМ (ту). При этом оказалось полезным преобразование (логарифмирование) переменной - текущего индекса инфляции. Характерно, что при стабильности условий точность прогнозирования оказывалась достаточно удовлетворительной - 10-15 %. Однако спрогнозированное на осень 1996 г. значительное повышение уровня цен не осуществилось. Дело в том, что руководство страны перешло к стратегии сдерживания роста потребительских цен путем массовой невыплаты зарплаты и пенсий. Условия изменились - и статистический прогноз оказался непригодным. Влияние решений руководства Москвы проявилось также в том, что в ноябре 1995 г. (перед парламентскими выборами) цены в Москве упали в среднем на 9,5%, хотя обычно для ноября характерен более быстрый рост цен, чем в другие месяцы года, кроме декабря и января.
   Наиболее часто используется метод наименьших квадратов при произвольном числе факторов. Метод наименьших модулей и другие методы экстраполяции применяются реже, хотя их статистические свойства зачастую лучше. Большую роль играет традиция и общий невысокий уровень знаний о методах прогнозирования.
   Оценивание точности прогноза - необходимая часть квалифицированного прогнозирования. При этом обычно используют вероятностно-статистические модели восстановления зависимости, например, строят наилучший прогноз по методу максимального правдоподобия. Разработаны параметрические (обычно на основе модели нормальных ошибок) и непараметрические оценки точности прогноза и доверительные границы для него (на основе Центральной Предельной Теоремы теории вероятностей). Так, нами предложены и изучены методы доверительного оценивания точки наложения (встречи) двух временных рядов и их применения для оценки динамики технического уровня собственной продукции и продукции конкурентов, представленной на мировом рынке.
   Применяются эвристические приемы: метод скользящих средних, метод экспоненциального сглаживания. Адаптивные методы прогнозирования позволяют оперативно корректировать прогнозы при появлении новых точек. Речь идет об адаптивных методах оценивания параметров моделей и об адаптивных методах непараметрического оценивания. Отметим, что с развитием вычислительных мощностей компьютеров проблема сокращения объемов вычисления теряет свое значение.
   Многомерная регрессия - основной на настоящий момент математико-статистический аппарат прогнозирования. Подчеркнем, что нереалистическое предположение о нормальности погрешностей измерений и отклонений от линии (поверхности) регрессии использовать не обязательно. Однако для отказа от предположения нормальности необходимо опереться на иной математический аппарат, основанный на многомерной центральной предельной теореме и технологии линеаризации. Он позволяет проводить точечное и интервальное оценивание параметров, проверять значимость их отличия от 0 в непараметрической постановке, строить доверительные границы для прогноза.
   Весьма важна проблема проверки адекватности модели, а также проблема отбора факторов. Дело в том, что априорный список факторов, оказывающих влияние на отклик, обычно весьма обширен, желательно его сократить, и крупное направление современных статистических исследований посвящено методам отбора "информативного множества признаков". Однако эта проблема пока еще не решена. Проявляются необычные эффекты. Так, А.И.Орловым установлено, что обычно используемые оценки степени полинома имеют геометрическое распределение. Перспективны непараметрические методы оценивания плотности вероятности и их применения для восстановления регрессионной зависимости произвольного вида. Наиболее общие постановки в этой области получены с помощью подходов статистики объектов нечисловой природы.
   К современным статистическим методам прогнозирования относятся также модели авторегрессии, модель Бокса-Дженкинса, системы эконометрических уравнений, основанные как на параметрических, так и на непараметрических подходах.
   Для установление возможности применения асимптотических результатов при конечных (т.н. "малых") объемах выборок полезны компьютерные статистические технологии. Они позволяют также строить различные имитационные модели. Отметим полезность методов размножения данных (бутстреп-методов). Системы прогнозирования с интенсивным использованием компьютеров объединяют различные методы прогнозирования в рамках единого автоматизированного рабочего места прогнозиста.
   Прогнозирование на основе данных, имеющих нечисловую природу, в частности, прогнозирование качественных признаков основано на результатах статистики объектов нечисловой природы. Нами разработан регрессионный анализ на основе интервальных данных, включающий, в частности, определение и расчет нотны и рационального объема выборки. Основы регрессионного анализа нечетких данных разработаны А.И.Орловым в брошюре 1980 г.
   Общая постановка регрессионного анализа в рамках статистики объектов нечисловой природы и ее частные случаи - дисперсионный анализ и дискриминантный анализ (распознавание образов с учителем), давая единый подход к формально различным методам, полезна при программной реализации современных статистических методов прогнозирования.

Экспертные методы прогнозирования.

   Необходимость и общее представление о применении экспертных методов прогнозирования при принятии решений на различных уровнях управления - на уровне страны, отрасли, региона, предприятия - вытекает из рассмотрений предыдущей главы. Отметим роль экологических экспертиз, экспертиз при сравнении и выборе инвестиционных и инновационных проектов, при управлении проектами. Роли лиц, принимающих решения (ЛПР), и специалистов (экспертов) в процедурах принятия решений, критерии принятия решений и роль экспертных оценок рассмотрены выше. В качестве примеров конкретных экспертных процедур укажем метод Делфи., методы распределения финансирования научно-исследовательских работ, метод сценариев.
   В соотнесении с задачами прогнозирования напомним о некоторых аспектах планирования и организации экспертного исследования. Должны быть сформированы Рабочая группа и экспертная комиссия. Основные этапы проведения экспертного исследования рассмотрены в главе 1. Весьма ответственными являются формирование целей экспертного исследования (сбор информации для ЛПР и/или подготовка проекта решения для ЛПР и др.) и формирование состава экспертной комиссии (методы списков (реестров), "снежного кома", самооценки, взаимооценки) с предварительным решением проблемы априорных предпочтений экспертов. Различные варианты организации экспертного исследования, различающиеся по числу туров (один, несколько, не фиксировано), порядку вовлечения экспертов (одновременно, последовательно), способу учета мнений (с весами, без весов), организации общения экспертов (без общения, заочное, очное с ограничениями ("мозговой штурм") или без ограничений) позволяют учесть специфику конкретного экспертного исследования. Компьютерное обеспечение деятельности экспертов и Рабочей группы, экономические вопросы проведения экспертного исследования важны для успешного проведения экспертного исследования.
   Экспертные оценки могут быть получены в различных математических формах. Наиболее часто используются количественные или качественные (порядковые, номинальные) признаки, бинарные отношения (ранжировки, разбиения, толерантности), нечеткие множества, результаты парных сравнений, тексты и др. Основные понятия (репрезентативной) теории измерений: основные типы шкал, допустимые преобразования, адекватные выводы и др.- важны применительно к экспертному оцениванию. Необходимо использовать средние величины, соответствующие основным шкалам измерения. Применительно к различного вида рейтингам репрезентативная теория измерений позволяет выяснить степень их адекватности прогностической ситуации, предложить наиболее полезные для целей прогнозирования.
   Например, анализ рейтингов политиков по степени их влиятельности, публикуемый "Независимой газетой", показал, что из-за неадекватности используемого математического аппарата лишь первые 10 мест, возможно, имеют некоторое отношение к реальности (они не меняются при переходе к другому способу анализа данных, т.е. не вполне зависят от субъективизма даже не экспертов, а членов Рабочей группы), остальные - "информационный шум", попытки опираться на них при прогностическом анализе могут привести лишь к ошибкам. Что же касается начального участка рейтинга "Независимой газеты", то он также может быть подвергнут сомнению, но по более глубоким причинам, например, связанным с составом экспертной комиссии.
   Статистика объектов нечисловой природы - математический аппарат теории экспертных оценок. Она основана на использовании расстояний в пространствах нечисловых данных, в частности, расстояния Кемени между бинарными отношениями. Аксиоматическое введение расстояния между множествами осуществлено А.И.Орловым в 70-х годах. Для эмпирических и теоретических средних в пространствах произвольной природы, определенных как решения оптимизационных задач минимизации средних расстояний, справедливы законы больших чисел. В случае таких бинарных отношений, как упорядочения, используют медиану Кемени и среднее по Кемени. Теория непараметрических оценок плотности распределения вероятностей в пространствах произвольной природы и подходы к их использованию для решения задач регрессионного и дискриминантного анализа также разработаны в статистике объектов нечисловой природы, занимающей важное место в современной прикладной статистике.
   Основными процедурами обработки экспертных оценок являются проверка согласованности, кластер-анализ и нахождение группового мнения.
   Проверка согласованности мнений экспертов, выраженных ранжировками, проводится с помощью коэффициентов ранговой корреляции Кендалла и Спирмена, коэффициента ранговой конкордации Кендалла и Бэбингтона Смита. Используются параметрические модели парных сравнений - Терстоуна, Бредли-Терри-Льюса - и непараметрические модели теории люсианов. В 1996-98 гг. разработаны методы согласования ранжировок и классификаций; построения согласующих бинарных отношений по ГОГ- методу (методу Горского-Орлова-Гриценко).
   При отсутствии согласованности разбиение мнений экспертов на группы сходных проводят методом ближайшего соседа или другими методами кластерного анализа (автоматического построения классификаций, распознавания образов без учителя). Классификация люсианов осуществляется на основе вероятностно-статистической модели.
   Используют различные методы построения итогового мнения комиссии экспертов. Своей простотой выделяется метод средних рангов. Компьютерное моделирование, проведенное В.Н.Жихаревым, позволило установить ряд свойств медианы Кемени, часто рекомендуемой для использования в качестве итогового (обобщенного, среднего) мнения комиссии экспертов. Интерпретация закона больших чисел для нечисловых данных в терминах теории экспертного опроса такова: итоговое мнение устойчиво, т.е. мало меняется при изменении состава экспертной комиссии, и при росте числа экспертов приближается к "истине". При этом предполагается, что ответы экспертов можно рассматривать как результаты измерений с ошибками, все они - независимые одинаково распределенные случайные элементы, вероятность принятия определенного значения убывает по мере удаления от некоторого центра - "истины", а общее число экспертов достаточно велико.

Проблемы применения методов прогнозирования в условиях риска

   Многочисленны примеры ситуаций, связанных с социальными, технологическими, экономическими, политическими, экологическими и другими рисками. Именно в таких ситуациях обычно и необходимо прогнозирование. Известны различные виды критериев, используемых в теории принятия решений в условиях неопределенности (риска). Из-за противоречивости решений, получаемых по различным критериям, очевидна необходимость применения оценок экспертов.
    Основы теории риска мы рассматриваем по В.Г.Горскому. В конкретных задачах прогнозирования необходимо провести классификацию рисков, поставить задачу оценивания конкретного риска, провести структуризацию риска, в частности, построить деревья причин (отказов) и деревья последствий (событий). Центральной задачей является построение групповых и обобщенных показателей, например, показателей конкурентоспособности и качества, в том числе экологического состояния окружающей среды, безопасности технологий, экологической опасности промышленных и иных объектов. Метод сценариев незаменим применительно к анализу последствий аварий.
   Имеется некоторая специфика применения методов прогнозирования в ситуациях, связанных с риском. Велика роль функции потерь и методов ее оценивания, в том числе в экономических терминах. В конкретных областях используют вероятностный анализ безопасности (для атомной энергетики) и другие специальные методы.
   Перспективны интерактивные методы прогнозирования с использованием баз эконометрических данных, имитационных (в том числе на основе применения метода Монте-Карло, т.е. метода статистических испытаний) и экономико-математических динамических моделей, сочетающих экспертные, статистические и моделирующие блоки. Обратим внимание на сходство и различие методов экспертных оценок и экспертных систем. Можно сказать, что экспертная система моделирует поведение эксперта путем формализации его знаний по специальной технологии. Но интуицию "живого эксперта" нельзя заложить в ЭВМ, а при формализации мнений эксперта (фактически - при его допросе) наряду с уточнением одних его представлений происходит и огрубление других.
   Обратим внимание на возможность использования в прогнозировании производственных функций, статистически описывающих связь выпуска с факторами производства, на различные способы учета научно-технического прогресса, в частности, на основе анализа трендов и с помощью экспертного выявления точек роста. Примеры экономических прогнозов всех видов имеются в литературе и будут рассмотрены ниже. К настоящему времени разработаны компьютерные системы и программные средства комбинированных методов прогнозирования. Одна из первых таких систем была создана в 70-е годы в ИМЭМО АН СССР под руководством С.А.Петровского.

Профессор, доктор технических наук А.И.Орлов

*      *      *

Метод согласования кластеризованных ранжировок

   Рассматриваемая проблема состоит в выделении наиболее подробного частичного порядка, общего для набора кластеризованных ранжировок (на статистическом языке - ранжировок со связями). Этот набор может отражать мнения нескольких экспертов или быть получен при обработке мнений экспертов различными методами. Предлагается метод согласования кластеризованных ранжировок, позволяющий "загнать" противоречия внутрь специальным образом построенных кластеров (групп), в то время как упорядочение кластеров соответствует упорядочениям всех исходных кластеризованных ранжировок.

1. Введение

   В различных прикладных областях возникает необходимость анализа нескольких кластеризованных ранжировок объектов.
   К таким областям относятся технические исследования, экология, менеджмент, экономика, социология, прогнозирование и т.д., особенно те их разделы, что связаны с экспертными оценками (см., например, [1,2]). В качестве объектов могут выступать образцы продукции, технологии, математические модели, проекты, кандидаты на должность и др. Кластеризованные ранжировки могут быть получены как с помощью экспертов, так и объективным путем, например, при сопоставлении математических моделей с экспериментальными данными с помощью того или иного критерия качества. Описанный в настоящей статье метод разработан в связи с проблемами химической безопасности биосферы [3,4] и экологического страхования [5,6].
   Предлагается новый метод построения кластеризованной ранжировки, согласованной (в раскрытом ниже смысле) со всеми рассматриваемыми кластеризованными ранжировками. При этом противоречия между отдельными исходными ранжировками оказываются заключенными внутри кластеров согласованной ранжировки. В результате упорядоченность кластеров отражает общее мнение экспертов, точнее, то общее, что содержится в исходных ранжировках.
   В кластеры заключены объекты, по поводу которых некоторые из исходных ранжировок противоречат друг другу. Для их упорядочения необходимо провести новые исследования. Эти исследования могут быть двух типов. Во-первых, осуществление дополнительной математической обработки экспертных данных (вычисление медианы Кемени, нахождение групового выбора с помощью упорядочения по средним рангам или по медианам и т.п. [1,2]). Во-вторых, привлечение дополнительной информации из соответствующей прикладной области, возможно, проведение прикладных научных работ с целью сравнения объектов из одного кластера.
   Введем необходимые понятия, затем впервые сформулируем алгоритм согласования в общем виде и рассмотрим его свойства.

2. Определение кластеризованной ранжировки

   Пусть имеется конечное число объектов, которые мы для простоты изложения будем изображать натуральными числами 1,2,3,...,k и называть носителем. Под кластеризованной ранжировкой, определенной на заданном носителе, понимаем следующую математическую конструкцию. Пусть объекты разбиты на группы, которые будем называть кластерами. В кластере может быть и один элемент. Входящие в один кластер объекты будем заключать в фигурные скобки. Например, объекты 1,2,3,...,10 могут быть разбиты на 7 кластеров: {1}, {2,3}, {4}, {5,6,7}, {8}, {9}, {10}. Кластеры не имеют общих элементов, а объединение их (как множеств) есть все рассматриваемое множество объектов.
   Вторая составляющая кластеризованной ранжировки _ это строгий линейный порядок между кластерами. Задано, какой из них первый, какой второй, и т.д. Будем изображать упорядоченность с помощью знака < . При этом кластеры, состоящие из одного элемента, будем для простоты изображать без фигурных скобок. Тогда кластеризованную ранжировку на основе введенных выше кластеров можно изобразить так:

А = [ 1 < {2,3} < 4 < {5,6,7} < 8 < 9 < 10 ]

   Конкретные кластеризованные ранжировки будем заключать в квадратные скобки. Если для простоты речи термин "кластер" применять только к кластеру не менее чем из 2-х элементов, то можно сказать, что в кластеризованную ранжировку А входят два кластера {2,3} и {5,6,7} и 5 отдельных элементов.
   Введенная описанным образом кластеризованная ранжировка является бинарным отношением на множестве {1,2,3,...,10}. Его структура такова. Задано отношение эквивалентности с 7-ю классами эквивалентности, а именно, {2,3}, {5,6,7}, а остальные состоят из оставшихся 5 отдельных элементов. Затем введен строгий линейный порядок между классами эквивалентности.
   Введенный математический объект известен в математической статистике как "ранжировка со связями" (см., например, [7, с.48 и др.]). Дж.Кемени и Дж.Снелл используют термин "упорядочение" [8, с.20], Б.Г.Миркин _ "квазисерия" [9, с.37], Ю.А.Шрейдер _ "совершенный квазипорядок" [10, с.127, 130]. Учитывая разнобой в терминологии, мы сочли полезным ввести собственный термин "кластеризованная ранжировка", поскольку в нем явным образом названы основные элементы изучаемого математического объекта _ кластеры, рассматриваемые на этапе согласования ранжировок как классы эквивалентности, и ранжировка _ строгий совершенный порядок между ними (в терминологии [10, гл.IV]).

3. Определение сильной противоречивости

   Следующее важное понятие _ противоречивость. Оно определяется для четверки - двух кластеризованных ранжировок на одном и том же носителе и двух различных объектов _ элементов того же носителя. Мы будем рассматривать два вида противоречивости _ сильную и слабую. Два элемента из одного кластера будем связывать символом равенства = как эквивалентные.
   Пусть А и В _ две кластеризованные ранжировки. Пару объектов (a,b) назовем сильно противоречивой относительно А и В, если эти два элемента по-разному упорядочены в А и В, т.е. a < b в А и a > b в В либо a >b в А и a < b в В. Отметим, что в соответствии с этим определением пара объектов (a,b), эквивалентная хотя бы в одной кластеризованной ранжировке, не может быть сильно противоречивой: эквивалентность a = b не образует "сильного противоречия" ни с a < b, ни с a > b. Совокупность строго противоречивых пар объектов для двух кластеризованных ранжировок А и В назовем ядром сильных противоречий и обозначим S(A,B).
   В качестве примера рассмотрим три кластеризованные ранжировки: А (см. выше), В и С, где

В = [ {1,2} < { 3,4, 5} < 6 < 7 < 9 < {8, 10}],

C = [ 3 < {1, 4} < 2 < 6 < {5, 7, 8} < {9, 10} ].

   Они определены на одном и том же носителе {1, 2, 3,..., 10}. Как нетрудно проверить, ядра сильных противоречий таковы:

S(A,B) = [ (8, 9)], S(A,C) = [ (1, 3), (2,4) ] ,

S(B,C) = [ (1, 3), (2, 3), (2, 4), (5, 6), (8,9) ] .

   Как при ручном, так и при программном нахождении ядра можно в поисках сильно и слабо (см. ниже) противоречивых пар просматривать пары (1,2), (1,3), (1.,4), ...., (1, k), затем (2,3), (2,4), ..., (2, k), потом (3,4), ..., (3, k) и т.д., вплоть до (k-1, k).
   Ядро сильных противоречий можно изобразить графом с вершинами в точках носителя. При этом сильно противоречивые пары задают ребра этого графа. Граф для S(A,B) имеет только одно ребро, оно соединяет вершины 8 и 9, граф содержит одну связную компоненту более чем из одной точки. Граф для S(A,C) имеет 2 ребра, соединяющие вершины 1 и 3, а также 2 и 4, этот граф содержит две связные компоненты более чем из одной точки. В графе для S(B,C) уже 5 ребер, соединяющих вершины 1 и 3, 2 и 3, 2 и 4, 5 и 6, 8 и 9 соответственно. В этом графе три связные компоненты более чем из одной точки, а именно, {1, 2, 3, 4} из четырех точек, {5, 6} и {8, 9} из двух точек каждая.
   Каждую кластеризованную ранжировку, как и любое бинарное отношение на носителе из k элементов, можно задать квадратной матрицей ||x(a,b)|| из 0 и 1 порядка k. При этом x(a,b) = 1 тогда и только тогда, когда a<b либо a = b. В первом случае x(b,a) = 0, а во втором x(b,a) = 1. При этом хотя бы одно из чисел x(a,b) и x(b,a) равно 1. Из определения сильной противоречивости пары (a,b) вытекает, что для нахождения всех таких пар достаточно поэлементно перемножить матрицы ||x(a,b)|| и ||y(a,b)||, соответствующие двум кластеризованным ранжировкам, и отобрать те и только те пары, для которых x(a,b)y(a,b) = x(b,a)y(b,a) = 0, т.е. выделить все пары равных 0 элементов, симметричных относительно главной диагонали.

4. Определение слабой противоречивости

   Пусть А и В - две кластеризованные ранжировки. Пару объектов (a,b) назовем слабо противоречивой относительно А и В, если упорядоченность этих двух элементов в А и В различается, т.е. 1) a<b в А и a>b или a = b в В, либо 2) a>b в А и a<b или a = b в В, либо 3) a = b в А и a<b или a>b в В. Отметим, что в соответствии с этим определением пара объектов (a,b) гораздо чаще оказывается (слабо) противоречивой, чем в случае сильной противоречивости. Так, эквивалентность a = b в одной кластеризованной ранжировке образует "слабое противоречие" и с a<b, и с a>b в другой, и "слабого противоречия" нет тогда и только тогда, когда и во второй кластеризованной ранжировке справедлива эквивалентность a = b.
   Итак, понятия "сильного" и "слабого" противоречия различаются трактовкой эквивалентности a = b. В первом случае она считается совместимой с любым неравенством между объектами и потому исключает противоречие. Следовательно, "сильное противоречие" _ это, так сказать, весьма серьезное противоречие, с которым нельзя справиться, нарушая эквивалентность a = b в ту или иную сторону. Во втором случае любое различие мнений относительно рассматриваемых объектов считается противоречием и эквивалентность a = b в одной кластеризованной ранжировке не противоречит лишь такой же эквивалентности во второй.
   Совокупность слабо противоречивых пар объектов для двух кластеризованных ранжировок А и В назовем ядром слабых противоречий и обозначим Q(A,B). Для рассмотренных выше в качестве примеров трех кластеризованных ранжировок А, В и С имеем

Q(A,B) = [{1,2}, {2,3}, {3,4}, {3,5}, {4,5}, {5,6}, {5,7}, {6,7}, (8,9), {8,10}], Q(A,C) = [(1,3), {1,4}, {2,3}, (2,4), {5,6}, {5,8}, {6,7}, {7,8}, {9,10}] ,

Q(B,C) = [{1,2}, (1,3), (1,4), (2,3), (2,4), {3,4}, {3,5}, {4,5},

(5,6), {5,7}, {5,8}, {7,8}, (8,9), {8,10}, {9,10}] .

   Каждое ядро слабых противоречий содержит соответствующее ядро сильных противоречий. Количество пар, находящихся в отношении слабого противоречия, как и следовало ожидать, существенно больше количества пар, находящихся в отношении сильного противоречия.
   Ядро слабых противоречий также можно изобразить графом с вершинами в точках носителя. При этом слабо противоречивые пары задают ребра этого графа, которых оказывается много больше, чем в случае изучения сильных противоречий. Граф для Q(A,B) имеет 10 ребер, позволяющих выделить две связные компоненты, а именно, {1, 2, 3, 4, 5, 6, 7} и {8, 9, 10}. Граф для Q(A,C) состоит из 9 ребер, образующих три связные компоненты, а именно, {1, 2, 3, 4}, {5, 6, 7, 8} и {9, 10}. В графе для Q(B,C) имеется 15 ребер, связная компонента всего одна, она включает все 10 объектов, образующих носитель).
   Рассмотрим введенные выше матрицы ||x(a,b)|| и ||y(a,b)||, соответствующие двум кластеризованным ранжировкам. Пара (a,b) не является слабо противоречивой тогда и только тогда, когда x(a,b) = y(a,b) и x(b,a) = y(b,a). Поэтому для выделения слабо противоречивых пар достаточно сложить по модулю 2 матрицы ||x(a,b)|| и ||y(a,b)||. Каждая имеющаяся в сумме ||x(a,b)|| + ||y(a,b)|| единица указывает на слабо противоречивую пару. Напомним, что для получения сильно противоречивых пар матрицы ||x(a,b)|| и ||y(a,b)|| надо поэлементно перемножить, причем каждая пара нулевых элементов, симметричных относительно главной диагонали, указывает на сильно противоречивую пару.

5. Алгоритмы согласования

   Предлагаемые алгоритмы согласования некоторого числа кластеризованных ранжировок состоят из трех этапов.
   Этап 1. Выделяются противоречивые пары объектов во всех парах кластеризованных ранжировок. Поскольку выше рассмотрены два вида противоречий _ сильное и слабое, то алгоритмов согласования также два _ сильный и слабый.
   Этап 2. Выделяются кластеры итоговой кластеризованной ранжировки (т.е. классы эквивалентности _ связные компоненты графов, соответствующих объединению попарных ядер противоречий).
   Этап 3. Эти кластеры (классы эквивалентности) упорядочиваются. Для установления порядка между кластерами произвольно выбирается один объект из первого кластера и второй _ из второго, порядок между кластерами устанавливается такой же, какой имеется между выбранными объектами в любой из рассматриваемых кластеризованных ранжировок (корректность подобного упорядочения, т.е. его независимость от выбора той или иной пары объектов, вытекает из доказанных нами теорем, примеры соответствующей математической техники приведены в Приложении). В случае слабого согласования никакие два объекта из разных кластеров не могут быть равны, поэтому описанная выше процедура не встречает препятствий. В случае сильного согласования это не так _ два объекта из разных кластеров согласованной кластеризованной ранжировки могут оказаться эквивалентными в одной из исходных кластеризованных ранжировок (т.е. находиться в одном кластере). В таком случае надо рассмотреть упорядоченность этих объектов в какой-либо другой из исходных кластеризованных ранжировок. Если же во всех исходных кластеризованных ранжировках два рассматриваемых объекта находились в одном кластере, то естественно считать (и это является уточнением к этапу 3 алгоритма), что они находятся в одном кластере и в согласованной кластеризованной ранжировке.
   Результат сильного согласования кластеризованных ранжировок А, В, С,... обозначим f (А, В, С,...), результат их слабого согласования _ F(А, В, С,...). На основе проведенных выше рассуждений о ядрах сильных и слабых противоречий нетрудно получить:

f (А, В) = [ 1 < 2 < 3 < 4 < 5 < 6 < 7 < {8, 9} < 10 ] ,

f (А, С) = [ {1, 3} < {2, 4} < 5 < 6 < 7 < 8 < 9 < 10 ] ,

f (В, С) = [ {1, 2, 3, 4 } < {5, 6} < 7 < {8, 9} < 10 ] ,

f (А, В, С) = f (В, С) = [ {1, 2, 3, 4 } < {5, 6} < 7 < {8, 9} < 10 ] ,

F(А, В) = [ {1, 2, 3, 4, 5, 6, 7}, {8, 9, 10} ] ,

F(А, С) = [ {1, 2, 3, 4} , {5, 6, 7, 8}, {9, 10} ] ,

F(В, С) = [ {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} ] ,

F(А, В, С) = F(В, С) = [ {1, 2, 3, 4, 5, 6, 7, 8, 9, 10} ]

   Полученные результаты показывают весь спектр согласованных кластеризованных ранжировок _ от f (А, В), в которой только два элемента объединены в кластер, до F(В, С), в которой все элементы составляют один кластер. В случае f (А, В) дополнительного изучения с целью упорядочения требуют только объекты 8 и 9. В случае F(В, С) все объекты объединились в один кластер, т.е. кластеризованные ранжировки оказались настолько противоречивыми, что процедура согласования не позволила провести декомпозицию задачи нахождения итогового мнения экспертов, т.е. разбить объекты на группы, каждую из которых можно анализировать отдельно. Наш опыт анализа реальных кластеризованных ранжировок показал, что почти всегда ситуация ближе к случаю f (А, В), чем к случаю F(В, С).

6. Свойства алгоритмов согласования

   6.1. Пусть D = f (А, В, C, ...). Если a < b в сильно согласованной кластеризованной ранжировке D, то a < b или a = b в каждой из исходных кластеризованных ранжировок А, В, C, ... .
   6.2. Пусть D = F (А, В, C, ...). Если a < b в слабо согласованной кластеризованной ранжировке D, то a < b в каждой из исходных кластеризованных ранжировок А, В, C, ... .
   6.3. Построение согласованных кластеризованных ранжировок может осуществляться поэтапно. В частности,

f(A, B, C) = f ( f (A, B), f(A, C), f(B, C)) .

   Это связано с тем, что ядра сильных и слабых противоречий для нескольких кластеризованных ранжировок являются объединениями таких ядер для всех пар рассматриваемых кластеризованных ранжировок.
   6.4. Построение согласованных кластеризованных ранжировок нацелено на выделение общего упорядочения в исходных кластеризованных ранжировках. Однако при этом некоторые общие свойства исходных кластеризованных ранжировок могут теряться. Так, при сильном согласовании кластеризованных ранжировок В и С, рассмотренных выше в качестве примеров, противоречия в упорядочении элементов 1 и 2 нет, пара (1,2) не входит в ядро сильных противоречий S(B,C). В кластеризованной ранжировке В эти объекты входят в один кластер: 1 = 2, в то время как в кластеризованной ранжировке С имеем: 1 < 2. Следовательно, при их отдельном рассмотрении можно было принять упорядочение 1 < 2. Однако в f (В, C) они попали в один кластер, т.е. возможность их упорядочения исчезла. Это связано с поведением объекта 3, который "перескочил" в С на первое место и "увлек с собой в противоречие" пару (1, 2), образовав противоречивые пары и с 1, и с 2. Другими словами, связная компонента графа, соответствующего ядру противоречий, сама по себе не всегда является полным графом. Недостающие ребра при этом соответствуют парам типа (1, 2), которые сами по себе не являются противоречивыми, но "увлекаются в противоречие" другими парами.
   6.5. В согласованной ранжировке могут быть кластеры иного происхождения, не связанные с противоречиями. Если во всех исходных кластеризованных ранжировках два элемента не различаются, например, имеется кластер {1, 3}, то и в согласованной ранжировке будет такой кластер, либо он войдет в более обширный кластер. В согласованной ранжировке сохраняется не только общая для всех исходных кластеризованных ранжировок упорядоченность, но и общая для всех эквивалентность.
    6.6. В наших исследованиях необходимость согласования кластеризованных ранжировок возникла при разработке методики применения экспертных оценок в задачах экологического страхования и химической безопасности биосферы [3 _ 6]. Популярным является метод упорядочения по средним рангам, в котором итоговая ранжировка строится на основе средних арифметических рангов, выставленных отдельными экспертами [1,2]. Однако из теории измерений известно [11, гл.3], что более обоснованным является использование не средних арифметических, а медиан (при обработке порядковых данных типа ответов экспертов применение средних арифметических некорректно, в отличие от медиан). Вместе с тем метод средних рангов весьма известен и широко применяется, так что просто отбросить его нецелесообразно. Поэтому было принято решение об одновременном применении обоих методов. Реализация этого решения потребовала разработки методики согласования двух указанных кластеризованных ранжировок.
   6.7. Область применения рассматриваемого в настоящей статье метода не ограничивается экспертными оценками. Он был с успехом применен для сравнения качества математических моделей процесса испарения жидкости. Имелись данные экспериментов и результаты расчетов по 8 математическим моделям. Сравнивать модели можно по различным критериям качества. Например, по сумме модулей относительных отклонений расчетных и экспериментальных значений. Можно в каждой экспериментальной точке упорядочить модели по качеству, а потом получать единую оценку методами средних рангов и медиан. Использовались и иные методы. Затем применялись методы согласования полученных кластеризованных ранжировок. В результате оказалось возможным упорядочить модели по качеству и использовать это упорядочение при разработке банка математических моделей, используемого в задачах химической безопасности биосферы.

7. Заключение

   В настоящей работе предложен новый метод анализа экспертных оценок, принципиально отличающийся от ранее известных [1,2]. Он позволяет проводить декомпозицию задачи экспертного оценивания, разделяя область согласия экспертов и область противоречий в их ответах. Метод позволяет также проводить согласование результатов применения различных алгоритмов обработки ответов экспертов или иных результатов наблюдений. В соответствии с методологией устойчивости [11] выводы, общие для всех использованных методов, могут отражать свойства реальности, в то время как противоречащие друг другу результаты расчетов демонстрируют лишь влияние субъективизма исследователей, выбравших тот или иной метод. Метод используется в учебном процессе Московского государственного технического университета им.Н.Э.Баумана, начиная со второго курса.

Приложение
Некоторые математические результаты

   Рассмотрим процедуру слабого согласования. С точки зрения теории бинарных отношений ядро слабых противоречий для двух кластеризованных ранжировок можно назвать квазитолерантностью расхождений (КТР). Предположим, что отсутствуют пары (a,b) такие, что a = b для обеих кластеризованных ранжировок (см. п.6.5 выше). Каждую такую пару можно условно заменить одним элементом.
    Отношение КТР является симметричным (если пара (a,b) входит в него, то входит и пара (b,a)) и антирефлексивным (ни одна пара (a,a) не входит в КТР). Свойством транзитивности это бинарное отношение, вообще говоря, не обладает (если пары (a,b) и (b,c) входят в него, то пара (a,c) может входить в КТР, а может и не входить).
   Формально присоединим к КТР все пары вида (a,a). Получим рефлексивное симметричное отношение, т.е. толерантность [10]. Будем называть ее толерантностью расхождений (ТР).
   Построим новое бинарное отношение Зам(ТР) путем транзитивного замыкания (в смысле теории бинарных отношений [10, с.27]) толерантности расхождений. Это означает, что подмножество пар объектов, входящих в ТР, пополняется некоторыми новыми парами. А именно, если a, b и c _ три объекта такие, что пара (a,b) и пара (b,c) входят в ТР, то пару (a,c) включаем в замыкание этой ТР. Для полученного множества пар повторяем описанную операцию. Продолжаем так до тех пор, пока новые пары не перестанут добавляться (процесс не может продолжаться бесконечно, поскольку общее число пар конечно).
   Бинарное отношение Зам(ТР) можно описать и по-другому: пара (a,b) входит в Зам(ТР) тогда и только тогда, когда либо она входит в ТР, либо существует конечная последовательность объектов c, d, e, ..., q такая, что пары (a,c), (c,d), (d,e), ..., (q,b) входят в ТР, т.е. от a к b можно пройти за несколько шагов, каждый из которых _ переход от первого элемента пары, входящей в ТР, ко второму.
   Последнее замечание подсказывает наглядную геометрическую интерпретацию операции замыкания. Представим себе объекты точками на плоскости. Пара (a,b) входит в ТР тогда и только тогда, когда от a до b можно добраться по дороге. Тогда ясно, что пара (a,c) входит в Зам(ТР) в том и только в том случае, когда от a до c можно добраться по дороге, возможно через несколько промежуточных пунктов (объектов).
   Описание структуры Зам(ТР) дает следующая теорема.
   Теорема о структуре замыкания. Замыкание толерантности расхождений _ отношение эквивалентности (рефлексивное симметричное транзитивное отношение), задающее разбиение объектов на кластеры (группы эквивалентных в рассматриваемом смысле объектов). Кластеры между собой упорядочены: все объекты одного кластера одновременно лучше (или одновременно хуже) всех объектов другого кластера сразу по двум упорядочениям, соответствующим обеим кластеризованным ранжировкам. Внутри же кластеров, состоящих более чем из одного элемента, имеются противоречия: для какого-то объекта есть другой из того же кластера такой, что упорядочение по одной кластеризованной ранжировке противоречит упорядочению по другой кластеризованной ранжировке.
   Доказательство. Рефлексивность Зам(ТР) вытекает из рефлексивности ТР - поскольку любая пара (a,a) входит в ТР, то она входит и в Зам(ТР). Симметричность вытекает из симметричности ТР: если из a в b можно добраться по цепочке c, d, e, ..., q, то из b в a - по обратной цепочке q,...,e, d,c, каждые два соседних элемента которой образуют пару, входящую в ТР наряду с "симметричной" парой из прямой цепочки. Транзитивность вытекает из процедуры построения Зам(ТР). В теории бинарных отношений рефлексивное симметричное и транзитивное отношение называется эквивалентностью [10, с.54].
   Известно [10, с.55-56, теорема 2.1], что отношение эквивалентности задает такое разбиение множества объектов на кластеры (классы, группы, подмножества), что пара (a,b) входит в Зам(ТР) тогда и только тогда, когда объекты a и b включены в один и тот же кластер.
   Теперь введем упорядоченность кластеров.
   Лемма. Пусть X = {a, b,...} и Y = {c, d,...} - два кластера. Пусть a меньше c при использовании одной из двух рассматриваемых кластеризованных ранжировок. Тогда a меньше c и при сравнении по второй кластеризованной ранжировке. Более того, любой объект из первого кластера меньше любого объекта из второго кластера в смысле любой из двух кластеризованных ранжировок..
    Докажем лемму. Если бы a было больше или равно c по второй кластеризованной ранжировке, то пара (a,c) входила бы в КТР и ТР, а потому объекты a и c входили бы в один класс разбиения, соответствующего Зам(ТР), что противоречит исходному предположению. Это рассуждение показывает также, что любые два объекта b и d из разных кластеров одинаково упорядочены по двум рассматриваемым кластеризованным ранжировкам.
   Однако совпадает ли упорядоченность b и d (или даже b и c) с упорядоченностью a и c?
   Одну из упорядоченностей, задаваемых кластеризованными ранжировками, обозначим знаком < (т.е. "меньше"; знак > означает здесь "больше или равно"). Может ли быть так, что a<c, но b>c ? Тогда a<c<b. Вторую упорядоченность обозначим знаком //. Тогда в соответствии с рассуждениями предыдущего абзаца a//c//b, следовательно, пара (a,b) не может входить в КТР, а потому и в ТР.
   Поскольку a и b лежат в одном кластере, то существует цепочка a(1)=a, a(2), a(3), ..., a(t) = b такая, что пары (a(p), a(p+1)) входят в КТР, p = 1, 2, 3, ... , t _ 1. Рассмотрим минимальное m такое, что a(m)<c, a(m+1)>c (такое m существует, поскольку a(1)<c, в то время как a(t) > c). Тогда в рассуждениях предыдущего абзаца можно положить a =a(m), b=a(m+1). Получаем, что пара (a(m), a(m+1)) не входит в КТР, что противоречит определению Зам(ТР).
   Итак, доказано, что из a<c вытекает b<c для любого b из кластера, включающего a. Аналогичным образом устанавливается, что b<d для любого d из кластера, включающего c. Лемма доказана.
   Каждый из кластеров, порожденных Зам(ТР), может состоять из одного или нескольких элементов. Внутри кластера из одного элемента противоречий быть не может. Если в кластере несколько элементов, то хотя бы одна пара объектов из этого кластера входит в КТР. Однако некоторые пары могут и не содержать противоречий. Например, если упорядочения имеют вид a<b<c и c//a//b, то пары (b,c) и (a,c) входят в КТР, а пара (a,b) _ нет. Если же второе упорядочение имеет вид c//b//a, то все три пары входят в КТР.
   Теорема о структуре замыкания доказана.
   Другие математические утверждения, содержащиеся в основной части статьи, в частности, касающиеся сильного согласования, а также анализа более чем двух кластеризованных ранжировок и др., могут быть доказаны аналогичным образом. Поскольку доказательства не встречают принципиальных трудностей, но довольно обширны, мы сочли возможным их опустить.

Список литературы

   1. Орлов А.И. Экспертные оценки // Заводская лаборатория. 1996. Т.62. No 1. С.54-60.
   2. Литвак Б.Г. Экспертные оценки и принятие решений. М.: Патент, 1996.
   3. Горский В.Г., Курочкин В.К., Орлов А.И., Швецова-Шиловская Т.Н. О научно-методологическом обеспечении безопасности больших химических систем. // Управление большими системами. Материалы Международной научно-практической конференция (22-26 сентября 1997 г., ИПУ РАН, Москва, Россия). М.: СИНТЕГ, 1997. С.164.
   4. Горский В.Г., Орлов А.И., Курочкин В.К., Гриценко А.А. К проблеме классификации сложных опасных систем. // Управление большими системами. Материалы Международной научно-практической конференция (22-26 сентября 1997 г., ИПУ РАН, Москва, Россия). М.: СИНТЕГ, 1997. С.211.
   5. Горский В.Г., Курочкин В.К., Моткин Г.А. и др. Методологические основы ранжирования и классификации промышленных объектов, подлежащих экологическому страхованию. // Труды Второй всероссийской конференции "Теория и практика экологического страхования". М.: Ин-т проблем рынка РАН, 1996. С.7-12.
   6. Орлов А.И., Горский В. Г., Жихарев В. Н. и др. Экспертные оценки: современное состояние и перспективы использования в задачах экологического страхования. // Труды Второй всероссийской конференции "Теория и практика экологического страхования". М.: Ин-т проблем рынка РАН, 1996. С.20-23.
   7. Холлендер М., Вулф Д. Непараметрические методы статистики. М.: Финансы и статистика, 1983.
   8. Кемени Дж., Снелл Дж. Кибернетическое моделирование. Некоторые приложения. М.: Советское радио, 1972.
   9. Миркин Б.Г. Проблема группового выбора. М.: Наука, 1974.
   10. Шрейдер Ю.А. Равенство, сходство, порядок. М.: Наука, 1971.
   11. Орлов А.И. Устойчивость в социально-экономических исследованиях. М.: Наука, 1979.

В.Г.Горский, д-р техн. наук
(Государственный научный центр РФ "Государственный научно-исследовательский институт органической химии и технологии", Москва),
А.А.Гриценко
(ЗАО "L-Card", Москва),
А.И.Орлов, д-р техн. наук
(Московский государственный технический университет им.Н.Э.Баумана, Москва)

   Работа выполнена при поддержке Международного научно-технического центра (проект No 317) и Российского фонда фундаментальных исследований (проект No 97-06-80033).

*      *      *

   На сайте http://antorlov.chat.ru или его зеркале http://www.newtech.ru/~orlov Вы можете найти полезные макросы для Microsoft Word 97/2000, могущие помочь Вам в работе, например, макросы для создания книжек размером в половину листа, обьединения множества файлов в один, создания каталогов своих файлов или для извлечения из недр Word'а красивых значков. Также представлен учебник профессора А.И.Орлова по менеджменту, статьи А.И.Орлова по актуальным вопросам статистики и экономики. Имеется лекция об устройстве ядерных реакторов.
   Страница рассылки - http://antorlov.chat.ru/ivst.htm или http://www.newtech.ru/~orlov/ivst.htm.
   Если Вы живете в Москве, то для доступа к сайту www.newtech.ru/~orlov Вы можете воспользоваться бесплатным демо-доступом компании NewTech. Телефоны: (095)234-94-49, (095)956-37-46. Login: demo. Password: test. Вход под этим логином абсолютно бесплатный и открыт круглосуточно. Сеанс связи неограничен. Одновременно возможен вход не более 5 пользователей по демо-доступу. Если Вы видите сообщение об отказе в авторизации, значит, Вы - 6-й пользователь, входящий под этим логином, - повторите попытку позже. Доступ с использованием программы Netscape Navigator требует указания DNS: Primary DNS: 212.16.0.1, Secondary DNS: 193.232.112.1. В последнее время увеличилась загрузка бесплатных линий, так что для дозвона рекомендуется использовать какую-нибудь автоматическую программу вроде EDialer. Отказ сервера в принятии пароля не должен служить основанием для прекращения дозвона.
   На сайте http://karamurza.chat.ru представлена книга видного современного философа и политолога С.Г.Кара-Мурзы "Опять вопросы вождям", которая является глубоким научным исследованием современных проблем западного и российского общества. Данная книга может серьезно повысить образовательный уровень интересующихся политологическими и социологическими проблемами.
   Студентам-медикам и врачам может быть интересен сайт http://ambarsum.chat.ru, на котором представлены типовые истории болезней, программы для проверки знаний, медицинские книги и рефераты.

Удачи Вам и счастья!



http://subscribe.ru/
E-mail: ask@subscribe.ru
Поиск

В избранное