В этой популяции имеющих общее происхождение блюдечек среднее максимальное значение диаметра раковины равно 38,3 мм, а стандартное отклонение равно 2,7 мм (округлили до одной десятой). Если эти значения применить к более крупной популяции блюдечек общего происхождения, то на основе статистики можно предположить, что приблизительно 68% популяции будет иметь диаметр раковины 38,3 мм плюс-минус одно стандартное отклонение (2,7 мм), т. е. размеры раковин будут лежать в интервале от 35,6 до 41,0 мм; приблизительно 95% популяции будут иметь диаметр раковины 38,3 мм плюс-минус два стандартных отклонения (5,4 мм), т. е. диаметры будут лежать в интервале 32,9-43,7 мм, а практически 100% будут лежать в интервале плюс-минус три стандартных отклонения от 38,3 мм.
По величине стандартного отклонения можно судить о разбросе данных. Если стандартное отклонение мало, то, следовательно, разброс (отклонение от среднего) невелик и популяция в значительной степени однородна, как это показано на рис. П.2.16, А С увеличением стандартного отклонения увеличивается степень изменчивости внутри популяции, как показано на рис. П.2.16,2?.
Дисперсия
Дисперсия — это квадрат стандартного отклонения. Дисперсия совокупности значений подсчитывается по следующей формуле:
Дисперсия
где ƒ — число значений в совокупности.
Дисперсию обычно подсчитывают в экологических исследованиях, включающих изучение питания, размножения и поведения, поскольку она служит показателем распределения организмов внутри популяции. Распределение может быть:
а) случайным;
б) групповым;
в) регулярным.
Для того чтобы определить тип распределения организмов внутри популяции, исследуемую площадь делят на квадраты равного размера (см. разд. 13.2) и подсчитывают число организмов этой популяции в каждом квадрате. Исходя из этих данных, подсчитывают значение дисперсии по следующей формуле:
где ƒ — число квадратов, содержащих х организмов. Используя выражение:
Можно выделить три типа распределения (рис. П.2.17).
Рис. П.2.17. Типы распределения
П.2.8.3. Связь между переменными
Данные всегда необходимо представлять таким образом, чтобы можно было выявить связи между двумя или более их совокупностями. Проще всего это сделать с помощью графика или диаграммы, показывающих связь между переменными. Но это целесообразно только в том случае, если одна из переменных (независимая переменная) находится под контролем экспериментатора, как, например, в случае, приведенном на рис. П.2.8.
В других случаях, когда обе переменные являются независимыми, составляют таблицу, в которой значение одной помещают под соответствующим значением другой, как, например, в случае данных о росте и массе 20 студентов шестого курса, приведенных на рис. П.2.18, А. На основе этих данных вычерчивают график (рис. П.2.18, Б), который называется диаграммой рассеяния. По внешнему виду графика видно, что эти две переменные связаны между собой некоторым образом, но эту связь невозможно описать более точно до тех пор, пока они не будут представлены в виде прямой линии, проходящей через точки графика.
Рис. П.2.18. Данные о массе и соответствующем росте 20- и 16-летних студентов мужского пола представлены в виде таблицы (А) и диаграммы рассеяния (Б). Построена кривая регрессии
Эта линия называется "линией наибольшего соответствия", или линией регрессии. Мера приближения точек к линии указывает на степень корреляции между двумя переменными. Линия наибольшего соответствия должна проходить через точку, соответствующую среднему значению массы и роста (
Корреляция
Описанную выше связь между двумя переменными х и у можно обозначить термином корреляция. Между х и у могут существовать различные степени корреляции, как это показано на диаграммах рассеяния на рис. П.2.19.
Рис. П.2.19. Типы корреляции; А — положительная корреляция; Б — отрицательная корреляция; В-корреляция отсутствует
С помощью диаграммы рассеяния нельзя точно продемонстрировать значимость между совокупностями данных, так как этот способ субъективен. Значимость корреляции можно представить с помощью статистического критерия, называемого коэффициентом корреляции. Его величина может изменяться от -1 до +1; -1 означает полностью отрицательную корреляцию, например отрицательную корреляцию между давлением кислорода в атмосфере и скоростью открывания дыхалец у насекомых; 0 означает отсутствие корреляции, например отсутствие корреляции между размерами плодов томатов и числом семян; +1 означает полностью положительную корреляцию, например положительную корреляцию между возрастом и длиной тела у саранчи.
Приложение 3. Классификация