ISO, менеджмент, консалтингдобавить в избранное
домой - первая страницапользователи сайтаRSSФОРУМСТАНДАРТЫГОСТ РСЛОВАРЬНАВИГАТОРКОНСУЛЬТАНТЫ
 
Логин : Пароль:   
       [регистрация] [напомнить пароль]

ФОРУМ
• Вакансия. Украина. Киев. 
 16. Мар 01:13 от tetervak
• ISO 8536-8:2015 
 14. Мар 14:26 от DobrozhelatelnyjAA
• Типы несоответствий и коррек... 
 21. Фев 19:03 от swan
• Анекдоты про СМК, аудиты и а... 
 10. Фев 09:25 от LinkeLI





Базис процессов и проекта: почему важна однородность

Страница для печати Отправьте статью другу: Базис процессов и проекта: почему важна однородность 

Жизненный цикл проекта типа DMAIC (определение, измерение, анализ, совершенствование, контроль), доминирующая методология в 6 Сигм для улучшения существующего процесса, предназначен для того, чтобы достичь значительного изменения в поведении исследуемого процесса.

см. также:
  • Тема: Процессы
  • Автор: garin




  • Для того чтобы узнать достигнуты ли поставленные цели, производительность процесса, направленного на их достижение, должна быть выражена измеряемой величиной. Рисунок 1 иллюстрирует это понятие, отображая процесс, который идет от предполагаемой вариации вокруг среднего значения 15 и до предполагаемой вариации (менее изменяющийся) вокруг среднего значения 27.

    Изменения производительности процесса
    Рисунок 1: Изменения производительности процесса

    Для многих процессов, над улучшением которых работают практики, преобладающее количество данных являются данными упорядоченными по времени. Последовательность данных, упорядоченных по времени это важный контекстный элемент, который необходимо принять во внимание при проведении анализа. Для этого необходим другой тип анализа, нежели тот, что может быть использован при клиническом испытании или политическом опросе. В своем главном труде об эмпирической кривой «Теория отбора проб», статистик Э. Деминг говорил:

    “При применении статистической теории, главное соображение не какова форма совокупности, а существует ли какая-либо совокупность вообще. Не может быть принято существование совокупности, нельзя применить статистическую теорию этой книги, если наблюдения не проявляют статистической зависимости. В данном состоянии образцы, накапливаясь в соответствующем интервале времени, дают распределение определенной формы, и эта форма воспроизводится час за часом, день за днем… Наблюдения можно рассматривать в качестве образца совокупности, независимо от его формы. Независимо от того большой он или же малый, он позволяет статистикам делать значимые и полезные предсказания относительно будущего образца. Это наиболее значимое, что может сделать статистическая теория.”

    Тот факт, что Деминг включил это утверждение в книгу, изучающую соотношение различных моделей распределения и данных, подчеркивает его важность. В одном этом высказывании Деминг упоминает взаимосвязь между четырьмя основными вопросами статистики.

    Четыре вопроса анализа данных

    Четыре вопроса анализа данных связаны с:

    • Описанием
    • Вероятностью
    • Выводом
    • Однородностью

    Большинство материалов и научных трудов по статистике, направленные на изучение инженерной или же деловой статистики, детализируют первые три вопроса, однако не учитывают четвертый. Объяснение всех четырех представлено ниже.

    Вопрос первый: Описание

    Учитывая набор чисел, есть ли смысл представлять всю информацию в этом наборе, используя одно или два суммарных значения?

    Что такое средний показатель доходов в государстве? Что такое средний балл SAT для студентов в местной средней школе? Какова средняя цена дома в окрестностях? Каков диапазон стоимости жилья в окрестности? Все эти вопросы — это вопросы, в которых описательная статистика предоставит суммарные значения для оценки и сравнения разных наборов данных.

    Задачей является отобразить те аспекты данных, которые представляют интерес. Интуитивно понятные понятия, такие как итоги, средние значения и пропорции нуждаются в поверхностном объяснении. Другие понятия, которые менее употребляемы, требуют немного большего разъяснения и даже некоторого обоснования, до того, как они обретут смысл. Для того чтобы достигнуть эффективного результата в конечном итоге, описательная статистика должна иметь смысл – она должна переводить некоторые важные характеристики данных в значения, которые являются и целесообразными, и понятными. В любом случае, это преобразование имеет форму некоторой арифметической операции:

    Данные + арифметика = статистика

    При этом станет очевидным, что обоснование для расчёта любой заданной статистики должно исходить из характера самих данных, оно не может исходить ни из арифметики, ни из статистики. Если данные это бессмысленная совокупность значений, то и суммарные статистические данные будут бессмысленными, а арифметическая операция не может волшебным образом создать смысл из бессмыслицы. Например, среднее значение телефонного номера может быть подсчитано, но будет ли в этом смысл? Смысл любой статистики должен исходить их контекста данных, в то время целесообразность любой статистики зависит от предполагаемого использования этой статистики.

    Вопрос второй: Вероятность

    Учитывая известность вселенной, что можно сказать об образцах, взятых из нее?
    Сколько роял-флешей можно вытянуть из стандартной колоды, состоящей из 52 игральных карт? Сколько пар выпадет при раздаче пяти карт? Сколь шестерок, скорее всего, выпадет в 12 турнирах? Сколько нечетных значений, скорее всего, выпадет в 12 турнирах?

    Это мир теории вероятности: дедуктивная логика, оценка возможных результатов и математических моделей. Для простоты объяснения, рассмотрим совокупность, которая является чашей наполненной известным количеством черных и белых шариков, как показано на рисунке 2. Далее рассмотрим различные примеры результатов, которые могут быть извлечены из этой чаши.


    Рисунок 2: Рассмотрение понятия вероятности

    Исходя из общей известной ситуации и для описания специфических результатов, которые в настоящее время не известны, практики используют аргумент, который имеет дедуктивный характер. Дедуктивная логика исходит из обобщений к специфике и всегда дает правильный ответ. Это процесс рассуждения, в котором вывод всегда следует из существующих предпосылок.

    При рассмотрении примера с простой совокупностью, такой как чаша с шариками, можно перечислить все возможные результаты. Исходя из этих перечислений, можно охарактеризовать вероятность различных результатов. Поскольку перечисление результатов быстро утомляет, то ведется поиск более рациональных способов. Используя теорию вероятности, практики могут создавать математические модели, которые позволяют пропустить этап перечисления, перепрыгнув прямо от известной совокупности к подсчету вероятности различных результатов.

    Так как математические модели становятся все более сложными, как и методы вычислений и аппроксимации прогресса вероятности, они могут использоваться для характеристики более сложных проблем – проблем, которые никогда не могли быть обработаны с помощью подхода перечисления. Таким образом, в теории вероятности, практики, фактически, играют в игру – смотря на возможности различных результатов, взятых из известной совокупности, как на знание, которое можно использовать позже. На вступительном этапе, эта игра ограничивается однородной и фиксированной совокупностью.

    До того, как студенты смогут добиться значительного прогресса в теории вероятности, они должны быть знакомы с дедуктивной логикой и математическими моделями – два элемента из иностранного языка статистики. К счастью, в то время как теория вероятности является необходимым этапом в разработке новейших статистических техник, она не является этапом, который должен быть освоен с целью эффективного анализа данных.

    Вопрос третий: Вывод

    Приводя пример об неизвестной совокупности и предполагая, что известно все о природе образца, что можно сказать о характере неизвестной совокупности?
    Если средняя длина 10 образцов ткани из партии составляет 38,5 сантиметра, будет ли равна 38,5 сантиметра средняя длина всех образцов партии? Насколько ошибочным может быть результат этой оценки?

    Проблема в том, что это обратная сторона вероятности. Все что известно, это только то, что содержится в образце, но этого мало для характеристики совокупности. Характеристики образца должны быть экстраполированы к характеристикам совокупности с обоснованием от частного к общему. Это индуктивная логика. К сожалению, вся индуктивная логика таит в себе неопределенность. Это не поиск единого правильного ответа, а скорее всего целого ряда возможных ответов; индуктивная логика не может создать определённость, а только правдоподобие.

    Статистический анализ построен на индуктивных умозаключениях. Это сфера проверки гипотез, доверительных интервалов и регрессии. Эти методы позволяют оценить параметры неизвестной совокупности (например, пропорции, средние значения и стандартные отклонения). Важно заметить, что эти оценки имеют смысл только тогда, когда все образцы получены из одной совокупности. Данное предположение о единой совокупности эквивалентно предположению, что поведение результатов образца описывается единой вероятностной моделью. Как только это предположение сделано, можно использовать вероятностную модель для характеристики и предсказания поведения всех результатов, используя значения параметров модели.

    Поскольку аргументы статистического анализа являются индуктивными, то все оценки будут иметь некоторую долю неопределенности. Чтобы правильно выполнить оценку нужно сделать некоторые предположения. Наиболее важное предположение — это то, что данный образец был взят только из одной совокупности. Если же выборка сделана из партии, состоящей из двух или более совокупностей (например, части взятые из двух и более разных процессов), все попытки использовать описательную статистику для оценки характеристик процесса спутываются, так как существует более чем один набор существующих характеристик процесса.

    Статистический анализ всегда начинается с предположения и заканчивается неопределенным утверждением. Предположением является то, что все результаты вышли из одной совокупности, а неопределенное утверждение сформулировано в терминах интервальной оценки. Если же предположение является некорректным, то ни один из строгих математических методов не приведет к нужному или соответствующему ответу.

    Вопрос четвертый: Однородность

    Имея набор наблюдений, можно ли предположить, что они выбраны из одной совокупности или же они демонстрируют признаки того, что выбраны из многочисленных совокупностей или процессов?

    Описательная статистика, вероятностные модели и статистический анализ – все основываются на однородности. Среднее значение не имеет смысла, когда данные выходят из разных совокупностей. Несмотря на то, что среднее значение может быть подсчитано, оно не описывает ни одного базового свойства, если данные не однородные. Кроме того, если есть несколько совокупностей, то будет и несколько моделей вероятности. И вывод очень сильно зависит от предположения однородности.

    Перед применением методов, созданных для ответа на первые три вопроса, прежде должен быть решен вопрос с однородностью. Однородность можно предположить или же доказать. В теории, предположения полезны для развития дальнейшей теории. На практике, непроверенные предположения опасны, поэтому предположения однородности по возможности должны быть проверены прежде чем приступить к работе с моделью вероятности, логическим выводом или описательной статистикой.

    Почему важно действовать с осторожностью

    Четыре вопроса анализа данных очень важны для всех специалистов по анализу данных. Практикам Лин 6 Сигм обычно поручают управление повышением результата, снижением количества дефектов, проведение измерений до некоторого желаемого уровня и снижение вариаций. Чтобы это сделать, необходимо иметь отправную точку. Каков сегодняшний результат, количество дефектов или измерения? Эта отправная точка, сформулированная в уставе проекта, является основой для проекта. Основа отвечает на вопрос описательной статистики, связанный с изучаемым процессом. Поскольку этапы процесса, как правило, идут последовательно, они, в основном, генерируют данные, упорядоченные по времени. Время является важным контекстом.

    Рассмотрим пример процесса, взятого из специальной публикации «Разум данных» статиста отдела статистики ASQ Девиса Балестрасси.

    Рассмотрим три клиники: А, В и С. «Ежедневная доля звонков на линию медсестры, которые длились в течении двух минут» является выбранным показателем. Что можно сказать про эффективность работы клиник, основываясь на гистограммах и обобщенных данных, показанных на рисунке 3?

    Гистограммы для клиник
    Рисунок 3: Гистограммы для клиник А, В и С

    Все эти гистограммы показывают достаточно симметричные, распределенные в форме колокола данные. Все p-значения для тестов Андерсона-Дарлинга на нормальность являются высокими, указывая на то, что отклонения от нормальности не обнаружены.

    Там нет видимых всплесков. Средний процент для каждой клиники составляет немного больше чем 84%, а стандартные статистические отклонения все приблизительно равняются 2,6%. Являются ли три эти клиники похожими? Использование описательной статистики полностью предполагает, что каждый набор этих данных является однородным. К сожалению, рисунок 3 не предоставляет ни одного надежного способа проверки однородности.

    Как можно определить однородность между наборами данных? Главным инструментом для проверки однородности является карта поведения процесса (также известная как контрольная карта). Рисунок 4 отображает карту Х для клиники А.

    Контрольная карта для клиники
    Рисунок 4: Х-карта для клиники А

    В случае клиники А (где гистограмма имела колоколообразную форму), основной процесс менялся с течением времени. Можно ли подсчитать среднее значение для всех данных? Да, но что оно представляет? Среднее значение не несет пользы в качестве основы, потому что здесь ни одно распределение, а множество. Данные не являются однородными, поэтому среднее значение не характеризирует среднее процесса. Среднее значение не представляет сегодняшнее положение процесса. Не существует единственного значения для «правдивого» среднего процесса, поэтому наблюдение общего среднего статистического значения не представляет никакой значимой информации про основной процесс.

    Заявление, что среднее значение кучи данных представляет фактический результат сродни заявлению, что известно местонахождения урагана, так как были подсчитаны средняя долгота и широта при тропическом шторме у берегов Африки – не переживай о этом сильном ветре и ливне, Флорида; в среднем, буря еще только на полпути через Атлантику!

    Контрольная карта для клиники B
    Рисунок 5: Х-карта для клиники B

    Рассмотрим клинику В (рисунок 5). Что же видно на карте Х рисунка 5, а видно три разные совокупности; процесс смещался и стабилизировался три раза. Однако, если игнорировать порядок времени, то результатом является куча данных, которые не могут быть отделены от данных, полученных от единого нормального распределения как показано на рисунке 3.

    Разделение данных клиники В в точках смещения, как показано на рисунке 6, показывает, что существует три различных периода времени, когда процесс проходил предсказуемо – три разных системы были в работе. Данные свидетельствуют о стабильной производительности на протяжении трех периодов времени. В течении первых 25 дней, среднее значение процесса было 84,0 с естественными пределами процесса от 81,5 до 86,5. Потом что-то произошло, и процесс сместился. В течении следующих 15 дней, средний результат – 81,2 с пределами процесса от 78,5 до 83,8. Далее процесс снова сместился. В это время среднее значение составило 87,1 с пределами от 83,5 и до 90,8.

    Другая контрольная карта для клиники B
    Рисунок 6: другая карта Х для клиники В

    Заметим, что общее среднее значение 84,3 для клиники В не описывает местонахождение процесса между 18 и 60 днями. Недостаточная однородность всегда будет подрывать способность обобщать описательную статистику для характеристики процесса.

    Единственная клиника со стабильным процессом – это клиника С. На карте клиники С (рисунок 7) можно наблюдать регулярное изменение во времени в рамках пределов. Наблюдаемое среднее значение 84,3 характеризирует среднее процесса. Можно спрогнозировать, что если не произойдет каких-нибудь преднамеренных изменений процесса, этот процесс будет продолжать выдавать ежедневно значения между 76 и 92, при этом среднее значение будет примерно 84.

    Контрольная карта для клиники C
    Рисунок 7: Карта Х для клиники С

    Если процесс значительно дрейфует или смещается во времени, так как в случае с клиниками А и В, случайная выборка по сдвигам или изменениям не приведет к выборке, которая может использоваться для представления процесса. Случайная выборка не обладает требуемой однородностью. В то время как описательная статистика будет по-прежнему представлять эту «кучу» данных, куча данных не будет представлять результат единственного процесса с единственным, четко определенным средним и единственным, четко определенным, стандартным отклонением. Таким образом, ошибка не в арифметике, а в неверном предположении однородности.

    Главный вопрос анализа данных

    Главным вопросом анализа данных всегда является вопрос однородности. Если данные однородные или же они объединены в однородные группы, методы статистического вывода могут быть использованы для оценки параметров. Как только есть оцененные параметры, теория вероятности может быть использована для прогнозирования.

    Однородность – это главный вопрос анализа данных
    Рисунок 8: Однородность – это главный вопрос анализа данных

    Учитывая структуру данных, всегда будут места в рамках данных, где данные, как ожидается, будут однородными. Когда данным не удается отобразить однородность в этих местах, причина отсутствия однородности должна быть определена. Когда это случится, то что-то важное ждет своего обнаружения. Отсутствие однородности дает возможность для изменения процесса. Если же отсутствие однородности игнорируется, то и возможность для улучшения будет потеряна.

    Использование хорошего суждения

    Практики 6 Сигм в деле по улучшению процессов, улучшают результаты процессов, а также улучшают системы, которые производят продукцию или предоставляют услуги. Процессы приводят к получению данных, упорядоченных во времени, и некоторая наиболее важная информация о данных, связана в этой временной последовательностью. Именно поэтому суждение является неотъемлемой частью использования карт поведения процесс.

    При объединении данных в подгруппы, практики ставят два значения вместе в одну подгруппу, основываясь на суждении, что эти два значения практически были получены при одних и тех же условиях. На карте должны сравниваться яблоки с яблоками для верного проведения расчетов. Таким образом, суждение должно быть сделано так, чтобы значения вновь были собраны в одинаковых условиях. Название этого использования суждения - рациональная группировка.

    Суждение также играет важную роль при определении частоты сбора данных. Частота должна иметь смысл по отношению к процессу, к пониманию того, как он изменяется и вопросам, на которые предназначены ответить карты результатов. Название этого использования суждения – рациональная выборка.

    Кроме того, когда существует физическая граница (например, нуль при отсчете) и эта граница находится в подсчитанных пределах, суждение показывает, что граница имеет приоритет над подсчитанным пределом, и карта становится односторонней.

    Рациональная группировка и рациональная выборка (или же хорошее суждение) означает, что данные не могут быть просто отображены на карте любым старым способом. Хотя бывают ситуации, когда что-то кроме времени может быть использовано, но эти ситуации должны быть зависимы от контекста. Данные не могут быть отображены на карте случайным образом. Данные могут быть перетасованы, чтобы сделать непредсказуемый процесс предсказуемым, однако перетасовка данных нарушает требования рациональной выборки и рациональной группировки. Если требование рациональности игнорируется с точки зрения контекста данных, то, скорее всего, результат будет полной чушью. Когда это происходит, то это не провал метода, а отсутствие понимания пользователем.

    Конечная цель заключается в принятии мер

    Целью анализа является понимание, а причиной сбора данных является, в конечном итоге, принятие мер. Согласно старой парадигме, проверки использовались с инструкциями для принятия мер по пунктам, которые проверялись. Целью было разделить приемлемые результаты от неприемлемых. Врач, статист и инженер Вальтер Шухарт предложил лучший способ извлечения приемлемого результата: изучить процесс, найти установленные причины изменений и принять меры для улучшения процесса, таким образом, он будет давать лучшие результаты в будущем. С этой целью, он создал карты поведения процесса, чтобы обеспечить понимание, необходимое при анализе данных, а также обеспечить рациональную основу для прогнозирования.

    Если принятие мер в процессе не планируется, то и ничего не будет извлечено из карт поведения процесса. Если же, однако, принятие мер в процессе является желанным, то карты поведения процесса необходимы для определения основы и для обнаружения и оценки результатов действий по улучшению процесса. Как знать, при этом могут быть выявлены несколько определенных проблем, а также могут быть обнаружены некоторые непредвиденные способы улучшения процесса еще до начала проекта.

    авторы:

    Дональд Дж. Уилер, научный сотрудник Американской статистической ассоциации, Американского общества качества, и автор 25 учебников и более 260 статей. В 2010 доктор Уилер был награжден медалью Деминга за «выдающиеся достижения в применении статистики в промышленности по всему миру».

    Рип Стауффер , сертифицированный инженер по качеству, менеджер по качеству, обладатель черного пояса 6 Сигм и Мастер Черного Пояс, старший член Американского общества качества (ASQ), и член отдела статистики ASQ. Работает в Национальном институте стандартов и технической консультативной группе технологии статистических методов (TAG 69). Также он преподает в университет Валдена уже более семи лет, включая следующие дисциплины: международные деловые операции и статистика в курсе MBA, динамика изменения и статистики предприятий в программе BSBA и статистика в сестринском деле программы MS.

    см. также:

    Добавил: garin on 07 Февраля, 2014 г. - 09:23 BT
    анализ данных
      

    менеджмент качества ( процессы | школа качества | нормирование | управление качеством | хассп)
    книги: стандарты | качество | ХАССП | маркетинг | торговля
    управленческий консалтинг ( планирование и контроль | конфликтменеджмент)
    новости и события: пресс-релизы | новые стандарты | новости партнеров | новости | архив новостей, статей
    новая торговля (автоматизация | магазиностроение | маркетинг и экономика)
    интернет-маркетинг (создание сайта | интернет - бизнес)
    финансы & страхование (страхование | бизнес-школа)
    обзоры и интервью: маркетинг | консалтинг | торговля | управление качеством )
    энциклопедия: это интересно | глоссарий | о семье | менеджмент семьи | каталог ресурсов


    [реклама на сайте]

    Мы разрешаем использовать, цитировать, копировать, транслировать и переводить любые наши материалы в сети Интернет
    при условии установки прямой ссылки на этот конкретный материал на сайте KlubOK.net

    Для того чтобы опубликовать свой материал (статью, книгу и т.д.),
    вам достаточно направить его по адресу klubok@klubok.net
    в любом удобном вам формате.
    Copyright © 2003-2016 KlubOK.net, Андрей Гарин


    Рейтинг@Mail.ru Яндекс.Метрика