Дискриминационное тестирование - Discrimination testing

Дискриминационное тестирование это техника, используемая в сенсорный анализ чтобы определить, есть ли обнаруживаемая разница между двумя или более продуктами. В тесте используется группа оценщиков (экспертов) со степенью подготовки, соответствующей сложности теста, чтобы различать от одного продукта к другому с помощью одного из множества экспериментальных дизайнов. Несмотря на то, что эти тесты полезны, эти тесты обычно не позволяют количественно оценить или описать какие-либо различия, поэтому для описания различий и оценки значимости различий требуется специально обученная группа в рамках другого дизайна исследования.

Статистическая база

В статистический принцип, лежащий в основе любого теста на дискриминацию, должен заключаться в том, чтобы отклонить нулевая гипотеза (ЧАС0), в котором говорится, что между двумя (или более) продуктами нет заметной разницы. Если есть достаточно доказательств для отклонения H0 в пользу Альтернативная гипотеза, HА: Если разница заметна, то разницу можно записать. Однако неспособность отклонить H0 не следует считать достаточным доказательством для его принятия. ЧАС0 формулируется исходя из предположения, что все оценщики догадались, когда они дали свой ответ. Выбранный статистический тест должен дать вероятность значение, которое результат был получен на основе чисто предположений. Если эта вероятность достаточно мала (обычно ниже 0,05 или 5%), то H0 можно отклонить в пользу HА.

Тесты, используемые для принятия решения об отклонении H0 включают биномиальный, χ2 (Хи-квадрат ), t-тест и Т. Д.

Виды тестов

Ряд тестов можно классифицировать как тесты дискриминации. Если он предназначен для обнаружения разницы, то это тест на распознавание. Тип теста определяет количество образцов, представленных каждому члену комиссии, а также вопросы, на которые им предлагается ответить.

Схематично эти тесты можно описать следующим образом; A и B используются для известных, X и Y используются для разных неизвестных, а (AB) означает, что порядок представления неизвестен:

Парное сравнение
XY или (AB) - два неизвестных образца, заведомо отличающиеся друг от друга, тест, который удовлетворяет некоторому критерию (X или Y); в отличие от других это не равенство тест.
Дуо-трио
AXY - один известный, два неизвестных, тест - какой неизвестный является известным (X = A или Y = A)
Треугольник
(XXY) - три неизвестных, тест является нечетным (Y = 1, Y = 2 или Y = 3).
ABX
ABX - два известных, одно неизвестное, проверка - какое из известных неизвестное (X = A или X = B).
Дуо-трио в режиме постоянного задания
(AB) X - три неизвестных, где указано, что первые два различны, но какой из них не идентифицирован, проверяется, какой из первых двух является третьим (X = 1 или X = 2).

Парное сравнение

В этом типе теста оценщикам представлены два продукта, и их просят указать, какой продукт соответствует определенному условию. Этим условием обычно является какой-либо атрибут, такой как сладость, кислинка, интенсивность вкуса и т. Д. Вероятность того, что каждый эксперт получит правильный ответ путем предположения, составляет

Преимущества

Требуется минимальное количество образцов. Самый простой подход, когда вопрос «Какой образец больше ____?»

Недостатки

Необходимо заранее знать атрибут, который может измениться. Нет статистически мощный при больших размерах панелей, необходимых для получения достаточного уверенность (цитата?).

Дуо-трио

Оценщикам представлены три продукта, один из которых определен как контрольный. Из двух других один идентичен контролю, другой - тестовый продукт. Оценщиков просят указать, какой продукт больше похож на контроль.

Вероятность того, что каждый оценщик получит правильный ответ путем предположения, равна

Преимущества

Быстрая установка и выполнение. Нет необходимости заранее знать природу различий.

Недостатки

Не является статистически мощным, поэтому для получения достаточной уверенности требуются панели относительно большого размера.

Треугольник

Оценщикам представлены три продукта, два из которых идентичны, а другой - другой. Оценщиков просят указать, какой продукт, по их мнению, является лишним.[1]

Вероятность того, что каждый оценщик получит правильный ответ путем предположения, равна

Преимущества

Может быть быстрым в исполнении и предлагает большую мощность, чем парное сравнение или дуэт-трио.

Недостатки

Возможна ошибка:

  • Ошибка ожидания: Эта ошибка возникает, когда участникам панели предоставляется более чем достаточно информации о тесте перед его выполнением. Слишком много фактов или намеков заставляет участников делать суждения на основании ожиданий, а не интуиции. По этой причине важно предоставить только факты, необходимые для завершения теста (например, случайные трехзначные коды на образцах, потому что люди обычно ассоциируют «1» или «A» с «лучшим»).
  • Ошибка стимула: Важно замаскировать все различия между двумя образцами. Это потому, что люди обычно стремятся получить правильный ответ, и любые видимые различия будут «стимулировать» ошибку. Чтобы избежать этой ошибки, необходимо учитывать освещение, однородность размера и формы образцов, использование прозрачных или непрозрачных чашек и т. Д.
  • Логическая ошибка: может побудить членов комиссии оценивать образцы в соответствии с определенными качествами, поскольку они логически связаны с другими характеристиками. Чтобы избежать этой ошибки, до проведения эксперимента необходимо решить проблему единообразия внешнего вида и сокрытия различий.
  • Ошибка снисходительности: Ошибка, основанная на мнении экспертов об исследователях. Тесты должны проводиться организованно и профессионально.
  • Эффект предложения: Эксперты могут влиять друг на друга, высказывая свое мнение или сообщая о своей реакции. Молчание и разделение участников дискуссии перегородками, похожими на кабинку, значительно снижает эффект внушения.
  • Позиционный сдвиг (эффект порядка): Обычно средний образец выбирается как нечетный. Это обычное дело в тесте на треугольник, особенно когда образцы выглядят почти идентичными. Этого можно избежать, представив образцы случайным образом (например, в форме треугольника, чтобы не было среднего образца).
  • Эффект контраста и ошибка конвергенции: Сопоставление двух заметно разных образцов обычно заставляет участников дискуссии преувеличивать контрасты, отсюда и эффект контраста. Но это также может вызвать обратный эффект, когда значительная разница может замаскировать более мелкие несходства - ошибку сходимости. Чтобы исправить и предотвратить эти ошибки, необходимо рандомизированное расположение образцов для каждого члена комиссии, чтобы сбалансировать оба эффекта.
  • Ошибка центральной тенденции: Возникает, когда члены комиссии оценивают выборку на средний уровень, чтобы избежать крайностей. Следовательно, результаты могут указывать на то, что образцы более сопоставимы, чем они есть на самом деле. Это становится очевидным, особенно когда эксперт не знаком с продуктами или процедурой испытаний. Предотвращение этого недостатка может быть достигнуто путем ознакомления членов комиссии с подходом к тестированию и продуктами, а также путем рандомизации порядка расположения образцов.
  • Мотивация: Мотивация членов комиссии влияет на их остроту восприятия. Поэтому важно поддерживать интерес участников дискуссии. Этого можно достичь, просто проведя эксперимент профессионально и под контролем, или даже предложив отчет о его результатах. Обычно обученные участники дискуссии более мотивированы, чем те, кто этого не делает.

Есть много других ошибок, которые могут возникнуть, но перечисленные выше являются основными возможными ошибками. Из приведенной выше информации очевидно, что рандомизация, контроль и профессиональное проведение эксперимента необходимы для получения наиболее точных результатов.

Важный

Используется для содействия исследованиям и разработкам в разработке и изменении состава продуктов. Использование треугольника для определения того, вызывает ли изменение конкретного ингредиента или изменение обработки заметную разницу в конечном продукте. Треугольное испытание вкуса также используется при контроле качества, чтобы определить, соответствует ли конкретный производственный цикл (или продукция различных фабрик) стандарту контроля качества (т.е.не отличается от стандарта продукта в треугольном испытании вкуса с использованием дискриминаторов).

ABX

Оценщикам представлены три продукта, два из которых обозначены как эталон A и альтернатива B, третий - неизвестный X и идентичный либо A, либо B. Оценщиков просят указать, какой из A и B является неизвестным; тест также может быть описан как «сопоставление с образцом» или «дуэт-трио в сбалансированном эталонном режиме» (оба известных критерия представлены как эталоны, а не только один).

ABX-тестирование широко используется для сравнения сжатие звука алгоритмы, но реже используются в пищевой науке.

Тестирование ABX отличается от других перечисленных тестов тем, что испытуемым дают два известных разных образца, и, таким образом, они могут сравнивать их, обращая внимание на различия - существует «фаза проверки». Хотя можно предположить, что это облегчает распознавание, при тестировании ABX не наблюдалось никаких преимуществ по сравнению с другими методами тестирования.[2]

Дуо-трио в режиме постоянного задания

Подобно тестированию треугольником, но третье, как известно, не является лишним. Промежуточное звено между ABX (где указано, какое из первых есть что - что является контролем, что предлагается новым - указано) и треугольником, где любой из трех может отсутствовать.

Степень различия (DoD)

Теория обнаружения сигналов

Экспериментальная конструкция

Примечания и ссылки

  1. ^ ISO 4120: 2004 Органолептический анализ. Методология. Тест треугольника.
  2. ^ Huang, Y.T .; Лоулесс, Х. Т. (1998). «ЧУВСТВИТЕЛЬНОСТЬ ТЕСТА НА ДИСКРИМИНАЦИЮ ABX». Журнал сенсорных исследований. 13 (2): 229. Дои:10.1111 / j.1745-459X.1998.tb00085.x.