Взаимодействия по поводу продажи – заманчивый матери ал для исследователя, потому что каждая встреча имеет классифицируемый результат (заказ, прогресс, отсрочки или отказ). В наших исследованиях взаимодействия менеджмента и координаторов найти такой явный результат оказалось значительно сложнее. В этом случае критерии, основанные на результате индивидуальной встречи, давали более четкие данные, чем критерии на основе общих достижений.
3. Взаимосвязи и причины.
Мы убедительно продемонстрировали десятками исследований с вероятностью ошибки не более 1 %, что описанные типы поведения связаны с успехом, ибо они чаще встречаются во встречах, приводящих к прогрессу и заказам. Но корреляция не является причиной. Существует сильная взаимосвязь между распространенностью венерических заболеваний в порту Ливерпуль в XIX веке и объемом импорта железной руды, однако никто не предполагает, что железная руда явилась при чиной венерических заболеваний. Виновны ли мы в спекуляциях, утверждая, что если типы поведения СПИН высоко коррелируют с успешными встречами, то они являются причиной успеха? Единственная эффективная проверка причин – обучить группу людей типам поведения, которые не используются ими в данный момент, а затем измерить изменения в процессе осуществления продаж этими людьми. Для этого мы и провели бóльшую часть оценочных исследований, описанных в главе 11. Прочие использованные нами способы определения возможных причинных связей включали в себя последовательный анализ поведения продавца и покупателя.
Б
. Процедуры1. Число категорий в одном инструменте.
Мы изучили 116 типов поведения во время продаж. Кросс-оценочная надежность становится все более серьезной проблемой, поскольку увеличивается количество категорий в любом инструменте исследования. По этой причине мы, как правило, ограничивали количество типов поведения до 20 на каждый индивидуальный инструмент.2. Стандартизация.
Первоначальное определение категории было дано членами исследовательской группы Huthwaite в ходе обсуждения конкретного случая. Следующий шаг заключался в анализе расшифровки материала и внесении в список пограничных примеров для спорных категорий. На основе этого мы подготовили стандартные аудиокассеты, учебные разъяснения и примеры пограничных случаев для использования в качестве тестового материала при обучении наблюдателей. Надежность экспертных оценок была достигнута при помощи категоризации живых примеров и расшифровки тысяч типов поведения во время продажи. Для оценки критерия надежности мы подготовили стандартные проверочные кассеты и использовали технику ранговых корреляций суммарных баллов по категориям для изученного инструмента. Индивидуальные исследовательские проекты часто охваты вали обширный период наблюдения (например, около 40 наблюдателей собирали данные в течение пяти месяцев). Чтобы провести стандартизацию наблюдения во времени, мы, как правило, ежемесячно встречались с экспертами. Во время встреч мы проводили оценки надежности вместе с периодической «слепой» категоризацией стандартных аудиокассет, отправленных наблюдателям по почте. Никакая стандартизация не может быть идеальной, однако мы считаем, что смогли поддержать достаточно высокий уровень надежности для наблюдений такого рода.
В
. СтатистикаПри работе с несистематизированными данными неизбежно возникает соблазн воспользоваться методами факторного анализа. Нам удалось этого избежать. Во время пилотной работы с любой системой категорий мы изначально пользовались непараметрическими методами. Хотя эти методы менее действенны, чем их классические параметрические эквиваленты, мы рассудили, что данные, с которыми мы работаем, не попадают под допущение о нормальности (normality assumption) и – в большинстве случаев – непараметрическая статистика будет более уместна. Исключение составляли случаи, когда выборка существенно вырастала. Непараметрические методы становятся все более громоздкими по мере увеличения размера выборки. К тому же предположения о нормальности распределения более правомерны для больших выборок. Всякий раз, когда мы говорили о значимости в дан ной книге:
– уровень значимости был минимум 0.05;
– при анализе материала менее 60 встреч мы обычно использовали критерий Манна – Уитни;
– выборки встреч числом более 60 мы тестировали с по мощью t-критерия;
– в тех исследованиях, где мы делали прямое прогнозирование результатов, были использованы односторонние критерии уровня значимости.