Что должен знать, как минимум, статист аккредитованной лаборатории?!

1. Анализ данных, как статистическая задача, решаемая экспертом по статистике, предусматривает три следующих один за другим этапа:
a) критическое изучение данных с целью обнаружения и обработки выбросов и других нерегулярностей, а также проверки пригодности модели;
b) расчет предварительных оценок прецизионности и средних значений для каждого уровня раздельно;
c) установление окончательных значений прецизионности и средних значений, в том числе аналитическое представление зависимости между прецизионностью и средним значением — в случаях, когда анализ показывает, что такая зависимость существует.

2. Что касается выбросов, необходимо использовать статистические приемы (тесты), большое многообразие которых представлено в технической литературе, и которые описаны в стандарте ИСО 5725-2, п.7.3.

3. Выбросы — это данные среди исходных результатов измерений, которые настолько отклоняются от сопоставимых данных, что признаются несовместимыми. Опыт показал, что невозможно во всех случаях избежать выбросов, и с ними нужно поступать таким же образом, как с ошибочными данными (явно ошибочные данные должны быть изучены и исправлены или исключены).

4. Наличие отдельных значений, которые представляются несовместимыми со всеми остальными значениями, может изменить оценки, так что решения об исключении данных нужно принимать только после тщательного анализа.
       Имеются два подхода к принятию таких решений:
       a) графический анализ совместимости;
       b) статистическое тестирование выбросов.

5. Графический анализ совместимости
Используют две меры, носящие названия статистики Манделя. Следует отметить, что они позволяют оценить вариабельность (непостоянство результатов) метода измерений.Сначала рассчитывают статистику межсерийной совместимости. Далее рассчитывают статистику внутрилабораторной совместимости путем вычисления внутрисерийного стандартного отклонения. Тестовые характеристики h и k наглядно представляют расхождение результатов в различных сериях испытаний. Это выражается в последовательно высокой или низкой внутрисерийной вариации и/или в последовательно высоких или низких средних значениях в межсерийной вариации. В таком случае, нужно постараться выяснить причину расхождений. Диаграммы Манделя h и k могут отображать пригодность данных для дальнейшего анализа, наличие каких-либо возможных выбросовых значений. Тем не менее, никакие определенные решения на данной стадии не принимают.

6. В диаграммах для можно увидеть различные проявления. В одном случае все результаты имеют как положительные, так и отрицательные значения. В другом случае отдельные данные могут иметь тенденцию к представлению либо только положительных, либо только отрицательных значений, и количество данных с отрицательными значениями, приблизительно равно количеству данных с положительными значениями. Ни одно из этих проявлений не является необычным или требующим изучения, хотя во втором случае может возникнуть мысль о существовании в результатов некоего общего источника систематической погрешности. Однако, если все значения для одной серии анализов имеют один знак, а для прочих — другой, то в этом случае необходимо попытаться найти причину. Также нужно искать причины расхождений, если значения для серии, во-первых, являются сравнительно большими и, во-вторых, неким систематическим образом зависят от уровня концентрации (искомого значения в эксперименте).

7. Если одна из серий выделяется по статистике, имея при этом много больших значений, то должна быть установлена причина этого, указывающая на худшую повторяемость по сравнению с другими сериями.

8. Статистическое тестирование выбросов
а) Для анализа данных на наличие выбросов и идентификации выбросов применяют критерии Кохрена и Граббса, приведенные в п.п.7.3.3 и 7.3.4 ИСО 5725-2:
— если значение меры, определяемой статистическим критерием (значением тестовой статистики), меньше (или равно) 5%-ного критического значения тестовой статистики (критического значения при 5%-ном уровне значимости), то тестируемую позицию признают корректной;
— если значение тестовой статистики больше 5%-ного критического значения и меньше (или равно) 1%-ного критического значения, то тестируемую позицию называют квазивыбросом;- если значение тестовой статистики больше 1%-ного критического значения, то тестируемую позицию называют статистическим выбросом.
b) Далее проводят исследование с целью выяснения, могут ли квазивыбросы и/или статистические выбросы быть объяснены какой-либо технической ошибкой, например:- ошибкой при выполнении измерения;
— ошибкой в расчетах;
— элементарной опиской при переписывании результата измерений;
— анализом не той пробы (образца).

В случае, когда ошибка появилась при расчетах или переписывании, сомнительный результат должен быть заменен правильным значением; когда ошибка являлась следствием анализа не той пробы, результат должен быть помещен в соответствующий ему базовый элемент. После того, как такого рода коррекция будет произведена, исследование на предмет квазивыбросов или выбросов должно быть повторено. В случае, если объяснение технической ошибки таково, что оно свидетельствует о невозможности замены сомнительного результата измерений, он должен быть исключен как «подлинный» выброс, не имеющий отношения к правильно проводимому эксперименту.
c) Когда какие-либо квазивыбросы и/или статистические выбросы остаются необъясненными или исключенными, квазивыбросы сохраняют в качестве корректных позиций, а статистические выбросы исключают, если только эксперт по статистике не решит оставить их, имея на это соответствующие основания.

9. Критерий Кохрена предназначен для обработки внутрилабораторных (внутрисерийных) расхождений результатов измерений и должен применяться в первую очередь, после чего должны быть приняты корректирующие меры, в случае необходимости, с повторением измерений (испытаний).

В стандарте ИСО 5725-2 (п.7.3.3.1) предполагается, что между сериями (или лабораториями) существуют лишь небольшие различия во внутрилабораторных (внутрисерийных) расхождениях. Опыт, однако, показывает, что дело обстоит не всегда так, поэтому для проверки справедливости этого предположения нужна количественная оценка. Для данной цели могли бы быть использованы несколько критериев, но был выбран критерий Кохрена.

10. Строго говоря, критерий Кохрена применяют лишь в случаях, когда все стандартные отклонения исходят из одного и того же количества мезультатов измерений, полученных в условиях повторяемости. В фактических случаях это количество может меняться за счет недостающих или исключенных данных. В настоящем стандарте, тем не менее, предполагается, что в должным образом организованном эксперименте такие изменения в количестве результатов измерений из расчета на базовый элемент будут ограничены и ими можно пренебречь, то есть критерий Кохрена можно использовать применительно к количеству результатов измерений , имеющих место в большинстве базовых элементов.

11. При помощи критерия Кохрена проверяют только наивысшее значение в совокупности стандартных отклонений, и поэтому такая проверка является односторонней. Разброс в дисперсиях может также, разумеется, проявляться в наинизших значениях стандартных отклонений. Однако на малые значения стандартного отклонения может оказывать очень сильное влияние степень округления исходных данных, и поэтому они не очень надежны. Кроме того, представляется нецелесообразным отвергать данные лаборатории из-за того, что ею достигнута более высокая прецизионность в результатах измерений по сравнению с другими лабораториями. Поэтому критерий Кохрена считают адекватным.

12. Если наивысшее значение стандартного отклонения классифицировано как выброс, то оно должно быть исключено, а проверка с использованием критерия Кохрена может быть повторена на оставшихся значениях. Следует заметить, что процедура повторения может привести к излишним исключениям данных в случаях, когда нормальное распределение, принятое за основу, не является достаточно хорошей аппроксимацией. Повторное применение критерия Кохрена предлагается лишь в качестве полезного средства ввиду отсутствия статистического критерия, разработанного для проверки нескольких выбросов вместе. Критерий Кохрена не разрабатывался для данной цели, и выводы при его повторном применении необходимо делать с большой осторожностью.

13. Критерий Граббса главным образом предназначен для обработки межсерийных расхождений, а также может использоваться (если > 2) в случаях, когда проверка с применением критерия Кохрена вызвала подозрение в том, что высокая внутрисерийная вариация обусловлена только одним из результатов измерений.

14. При анализе данных по оценке прецизионности критерий Граббса применяют следующим образом:
a) сначала к средним значениям применяют критерий Граббса для одного выброса.Если обнаруживается, что среднее значение является выбросом, необходимо исключить его и повторить проверку для другого экстремального среднего значения базового элемента (например, если наивысшее значение является выбросом, то тогда следует проверить наинизшее значение, а наивысшее значение при этом исключить), однако при этом не следует применять критерий Граббса для двух выбросов.
б) Этот последний критерий нужно применить в случае, если при проверке с использованием критерия Граббса для одного выброса обнаруживается, что средние значения не имеют выбросов.

15. В зависимости от результатов корректируют или исключают те квазивыбросы и/или статистические выбросы, которые были удовлетворительно объяснены. И только после этого проводят окончательную статистическую обработку результатов.

Библиография
ИСО 5725 (1-6 части): 1994 «Точность (правильность и прецизионность) методов и результатов измерений»
ИСО/ТО 22971: 2005 «Точность, правильность и прецизионность методов и результатов измерений. Практическое руководство по использованию ИСО 5725-2:1994 при планировании, выполнении и статистическом анализе межлабораторной повторяемости и воспроизводимости результатов»
Доерфель К. Статистика в аналитической химии. М., Изд.«Мир», 1969.

Оценка неопределенности измерений как один из основных критериев подтверждения компетентности испытательной лаборатории и соответствия требованиям

ИСО/МЭК 17025

Из истории.

Отсутствие международного  единства в количественной характеристике точности измерений  привело к разработке семью международными организациями:

-     Международное бюро мер и весов (МБМВ);

-     Международная электротехническая комиссия (МЭК);

-     Международная федерация клинической химии (МФКХ);

-     Международная организация по стандартизации (ИСO);

-     Международный союз по чистой и прикладной химии (ИЮПАК);

-     Международный союз по чистой и прикладной физике (ИЮПАП);

-     Международная организация законодательной метрологии (МОЗМ)

международного документа  «Руководство по выражению неопределенности измерения», которое было издано 1993 году.

 Цель Руководства:

-         предоставить основу для международного сличения результатов измерений;

-         обеспечить полную информацию о том, как составлять отчеты о неопределенности измерений.

После издания Руководство приобрело статус неформального международного стандарта, который привнес согласованность во все научные и технологические измерения и всемирное единство в оценке и выражении неопределенности в измерениях.

Неопределенность (измерений) – параметр, связанный с результатом измерений и характеризующий рассеяние значений, которые могли бы быть обоснованно приписаны измеряемой величине.

Неопределенность является количественной мерой точности соответствующего результата измерений и выражает степень доверия, с которой может допускаться, что значение измеренной величины в условиях измерения лежит внутри определенного интервала значений.

 Неопределенность измерения можно назвать мерой:

- наших знаний об измеряемой величине после измерения;

- качества измерения с точки зрения их точности;

- надежности результата измерения, в качестве оценки для знания измеряемойвеличины.

Стандартная неопределенность u(xi) – неопределенность результата измерения xi, выраженная в виде среднеквадратичного отклонения (СКО).

Суммарная стандартная неопределенность uc(y) – стандартная неопределенность результата у, полученного через значения ряда других величин, равная положительному корню квадратному из суммы членов, где членами являются дисперсии или ковариации этих других величин, взвешенными в соответствии с тем, как результат измерения изменяется под влиянием этих величин.

Расширенная неопределенность U– величина, определяющая интервал вокруг результата измерения, в котором, как ожидается, содержится большая часть распределения значений, которые с достаточным основанием могут быть приписаны измеряемой величине.

Примечание – расширенная неопределенность рассчитывается на основании стандартной неопределенности и коэффициента охвата k по формуле

U = k×uc

Коэффициент охвата k – численный коэффициент, используемый как множитель суммарной стандартной неопределенности для получения расширенной неопределенности.

Примечание – коэффициент охвата обычно изменяется в интервале от 2 до 3.

Тип А оценивания (неопределенности) – метод оценивания неопределенности, основанный на статистическом анализе серии наблюдений.

Тип В оценивания (неопределенности) – метод оценивания неопределенности, основанный на отличном от статистического анализе серии наблюдений

Этапы оценивания неопределенности

Определение измеряемой величины

На этом этапе необходимо четко и недвусмысленно знать, что является измеряемой величиной и количественное выражение зависимости значения измеряемой величины от влияющих на нее параметров. Такими параметрами также могут быть и другие измеряемые величины, не входящие явным образом в выражение зависимости или константы.

 Источники неопределенности

Для того чтобы определить возможные источники неопределенности в аналитической процедуре, представляется полезным разбить анализ на ряд общих этапов:

-  пробоотбор;

-  подготовка пробы;

-  представление сертифицированных эталонных материалов в измерительной  системе;

-  калибровка приборов;

-  анализ (получение экспериментальных данных);

-  обработка экспериментальных данных;

-  представление результатов;

-  интерпретация результатов.

Каждый из этих этапов может быть в дальнейшем также разбит на отдельные составляющие неопределенности. Перечень неопределенности представляется в виде причинно-следственной диаграммы (диаграмма ИШИКАВЫ или «елочная диаграмма»).

Вычисление стандартной неопределенности по типу А

Исходными данными для вычисления являются результаты многократных измерений при одинаковых условиях xil,  , xini (= 1, …, m), где ni – число измерений i-ой входной величины.

 Стандартную неопределенность единичного измерения i-ой входной величины вычисляют по формуле

1234

Стандартную неопределенность измерений i-ой входной величины, при которых результат определяют как среднее арифметическое, вычисляют по формуле

12345

Вычисление стандартной неопределенности по типу В

 Исходными данными для вычисления является следующая информация:

-   данные предшествовавших измерений величин, входящих в уравнение измерения;

-   сведения о виде распределения вероятностей;

-   данные, основанные на опыте исследователя или общих знаниях о поведении и  свойствах   

    соответствующих приборов и материалов;

-   неопределенности констант и справочных данных;

-    данные поверки, калибровки, сведения изготовителя о приборе и др.

 Вычисление суммарной стандартной неопределенности

Правило 1

Для математических моделей, в которых фигурируют только сумма или разность величин, например

Y = k(x1+x2+x3…), где k – какая-то постоянная, суммарная стандартная неопределенность uc(y) выражается как

123456

Правило 2

Для математических моделей, в которых фигурируют только произведения или частные,  например                         Y = k(x1*x2*x3…), где k – какая-то постоянная, суммарная стандартная неопределенность uc(y) выражается как

1234567

где u(xi)/xi представляют собой неопределенности параметров, выраженных в виде относительных стандартных отклонений

Составление отчета о расширенной неопределенности

Если не указано особо, результат x должен указываться совместно с расширенной неопределенностью U, рассчитанной с использованием коэффициента охвата k = 2. Рекомендуется следующая форма отчета:

                                                          Результат: (х ± U) (единица измерения),

где указанная неопределенность представляет собой расширенную неопределенность, рассчитанную с использованием коэффициента охвата k = 2 при 95% доверительной вероятности.

Должны быть указаны те значения коэффициента охвата и доверительной вероятности, которые использовались при расчете неопределенности. Численные значения результата измерения и его неопределенности не должны содержать избыточное число разрядов. Для расширенной и стандартной неопределенности редко когда необходимо указывать более двух значащих разрядов.

Следует отметить, что хотя многие документы по оценке неопределенности дают схему оценивания неопределенности, они не могут заменить критическое мышление, интеллектуальную честность и профессиональное мастерство, необходимые при анализе и оценивании неопределенности. А качество и ценность полученной неопределенности  измеряемой величины, в конечном счете, зависит от понимания, критического анализа и честности тех, кто участвует в приписывании ее значения.

Библиография:

«Руководство по выражению неопределенности  измерения», Государственное предприятие «Всероссийский научно-исследовательский институт метрологии  им. Д.И.Менделеева,       

 Санкт-Петербург, 1999