Исследование выборки вместо изучения всего населения имеет много преимуществ. Среди них главными являются экономические факторы. Например, для прогнозирования результатов выборов опросы, проводимые Институтом Гэллапа, радиовещательной компанией «Колумбия» и другими организациями, охватывают представителей тщательно отобранной выборки, включающей от 1,5 тыс. до 2 тыс. человек. Это стоит значительно дешевле, чем интервьюирование всего населения (т. е. всех зарегистрированных избирателей). Кроме того, благодаря выборке процесс исследования сокращается и уменьшается объем данных, которые необходимо обработать. Помимо этого, при очень высокой численности населения сбор и обработка данных могут стать настолько трудными и обременительными, что повышается вероятность ошибок. Хорошо известна тенденция к искажению данных переписи населения (например, иногда неправильно указывается возраст, этническое происхождение людей и другие сведения). Таким образом, в некоторых случаях тщательно составленные выборки становятся источником более точных данных о населении, чем непосредственные результаты переписи.
Как уже отмечалось, выборка должна быть точным отражением структуры всего населения. Однако даже при тщательном составлении выборки существует вероятность, что в некоторых отношениях она будет не совсем точно соответствовать особенностям генеральной совокупности населения. Поскольку мы всегда пытаемся на основе выборки делать обобщения о генеральной совокупности, любое расхождение между данными может считаться ошибкой. Такие ошибки всегда нежелательны, но если выборка соответствует определенным принципиальным целям исследования, мы можем по крайней мере приблизительно подсчитать, в каких пределах они могут быть допущены. Например, согласно опросу избирателей, можно предвидеть, что за кандидата Смита будет подан 31 процент голосов; существует вероятность на 95 процентов, что в действительности за Смита проголосует на 3 процента больше или меньше человек, т. е. примерно от 28 до 34 процентов.
С теоретической точки зрения простая случайная выборка — лучший способ отбора единиц наблюдения. В повседневной речи слово
Процесс создания случайной выборки начинается с составления полного списка всех потенциальных единиц наблюдения. Например, в студенческий справочник вносятся все студенты колледжа. Затем все фамилии в списке нумеруются. После этого на основе данного списка составляется выборка. Обычно при этом используются таблицы случайных чисел, составленные при помощи компьютера. (Они представляют собой страницы со случайно выбранными номерами — каждый номер и сочетание номеров могут быть представлены с одинаковой вероятностью.) Таким образом, если 27 — первая случайно выбранная цифра, то студент, фамилия которого числится под этим номером, станет первым, включенным в выборку.
Основные особенности случайной выборки отличаются простотой, но этот метод не так часто применяется в социологическом исследовании. Главным образом это объясняется тем, что не всегда имеются в распоряжении такие подходящие списки генеральной совокупности, как студенческие справочники. Кроме того, многие исследовательские проекты предусматривают изучение слоев населения, не отмеченных в списках или справочниках, например всех 4-летних детей, охваченных программами дошкольного обучения. Хотя, наверное, можно было бы составить списки таких групп населения, но это потребовало бы больше труда, чем само исследование. Преимущество выборки теряется, если она требует слишком больших усилий.
Списки населения необходимо использовать с большой осторожностью, поскольку в них могло отразиться пристрастное отношение к некоторым слоям населения. Например, студенческий справочник может включать лишь студентов, имеющих телефоны в комнатах общежития; в таком случае из него исключены студенты, которые ездят на занятия из пригорода. Если две группы студентов каким-то образом отличаются друг от друга и это важно для исследования, никакая выборка, исключающая студентов, живущих в пригородах (независимо от способа ее составления), не может быть полностью репрезентативна для всего студенчества.
Случайная выборка стала образцом для создания других моделей выборочного обследования. Каждая из них имеет свои недостатки, но все они оказались полезными для решения различных исследовательских задач. Среди них главными являются следующие типы выборок.