3.4.Обработка данных эксперимента
Обработка дашіьіх экспериментального психологического исследования производится на основе качественных и количественных методов.
Качественные (описательные, содержательные) методы обработки включают:
— первичный анализ — выделение и рассмотрение каждого отдельного случая, исключение данных, далеко выходящих за рамки основного массива полученных данных;
— первичный синтез — установление связей между данными первичного анализа и выдвинутой гипотезой;
— сравнительный (вторичный) анализ — выделение устойчиво повторяющихся фактов;
— вторичный синтез — объединение этих фактов, сопоставление с гипотезой и нахождение существующих закономерностей.
Количественные (математические) методы обработки данных эксперимента предполагают получение числовых показателей измерения психических явлений. Однако получение числовых значений психических явлений связано с рядом трудностей, приводящих к специфике использования математики в психологии:
— проблематичным является выделение точки отсчета (нуля). Действительно, трудно определить точку отсчета знаний учащегося, эмоционального состояния человека;
— определенную трудность представляет и выбор оперативных единиц измерения. Например, объем кратковременной памяти определяется числом 7 ± 2, но в качестве единиц измерения могут выступать и буквы, и слоги, и слова, и целые предложения;
— измерение опосредовано, т.е. измеряются не сами психические явления (образы, мысли), а характеристики поведения, физиологические проявления, называемые показателями;
— измерения носят вероятностный характер в связи с тем, что психические закономерности определяются большим количеством факторов, учесть которые практически невозможно; кроме того, причинно-следственные связи носят случайный характер. Например, настроение человека зависит и от состояния его здоровья, и от погодных условий, и от сиюминутных обстоятельств (кто-то не так посмотрел), и от особенностей социальной микросреды (неполадки в семье), макросреды (общая обстановка в стране) и др.;
— измерения базируются не на единичном факте, а на множестве показателей этого факта, т.е. носят статисти
ческий характер, поэтому исследователь обрабатывает, как правило, большое количество показателей (минимум 30) психологического факта, полученных на выборочных совокупностях (выборках) в процессе сбора психологических фактов;
— само понятие “измерение” носит условный характер, поскольку объект измерения нестабилен, вариативен. Действительно, если испытуемым при оценке умения классифицировать предложить из 5 слов, обозначающих растения (например, пшеница, чечевица, кукуруза, бамбук, ячмень), выделить слова, объединенные общим признаком, и исключить слова, не соответствующие этому признаку, то далеко не всегда за указанное время все испытуемые справятся с этой задачей, так как у одних испытуемых оценивается действительно умение классифицировать (выделение злакбвых, к которым относятся пшеница, кукуруза, бамбук, ячмень и исключение чечевицы, относящейся к семейству бобовых), у других — знания (далеко не все знают, что чечевица и бамбук принадлежат к разным семействам, и исключают чаще всего бамбук в силу его отличий от других растений по внешним признакам), у третьих — темп работы (при выделении достаточно длительного промежутка времени испытуемый, обратившись к справочной литературе или поразмыслив, выяснит, что бамбук — злаковое, а чечевица — бобовое растение, и правильно осуществит классификацию).
Кроме того, числовое значение лишает процесс измерения качественной оценки, в этом отношении измерительный инструментарий нельзя признать универсальным, отражающим реалии. Так, при решении 5 из 10 задач двумя испытуемыми у обоих показатель успешности составляет 0,5, хотя типы решаемых задач и степень их сложности могут быть разными. В связи с этим важное значение при обработке данных приобретает выбор измерительного инструментария, т.е. шкалы.
Шкала - это алгоритм, с помощью которого каждому наблюдаемому объекту соответствует некоторое число.
Чаще всего в процессе измерения и обработки данных измерения используют следующие шкалы [12].
Шкала наименований (номинативная, классификации), предполагающая распадение объекта измерения на
множество классов, взаимно исключающих друг друга (если не А, то В), каждому классу дается наименование, числовое обозначение которого является одним из шкальных значений. В качестве классов могут выступать половые различия испытуемых (мужчина — женщина), результаты деятельности (решил — не решил) и др. При построении шкал наименований следует руководствоваться двумя правилами: каждый член некоторого множества объектов может быть отнесен лишь к одному классу объектов, ни один из объектов не может быть отнесен к двум и более классам. Таким образом, шкала наименовании подчеркивает скорее качественные, а не количественные различия. Поэтому никаких арифметических операций с членами производить нельзя.
Шкала порядка (ординальная, ранговая) предполагает упорядочение объектов относительно измерительного свойства. Так, если при измерении объема кратковременной памяти результат одного испытуемого равен 8, другого — 5, третьего — 7, четвертого — 6, пятого — 7, шестого — 9, седьмого — 8, восьмого — 7, девятого — б, то при расположении полученных результатов в порядке возрастания данная шкала будет представлена рядом: 5,
6, 6, 7, 7, 7, 8, 8, 9. Испытуемому, показавшему наилучший результат в измерении объема памяти (9), присваивается ранг 1, показавшим результат несколько ниже (8) — среднее значение тех рангов, которые были бы присвоены каждому из них при отсутствии совпадения, т.е. (2+3)/2 = 2,5, и т.д. Шкалы порядка отображают монотонное возрастание (убывание) признака. Поэтому числа, отражающие величину этого признака, можно лишь сравнивать (gt;, lt;, =), помня при этом, что числа имеют относительное, а не абсолютное значение, поскольку неизвестна начальная (нулевая) точка отсчета. Поэтому для ранговых шкал допустимы любые преобразования типа X' = f(x), где f(x) - любое монотонное преобразование, не изменяющее последовательности элементов, т.е. числа, выражающие величину признака, можно возводить в степень, извлекать корень, умножать, делить на постоянное число и т.д., но нельзя пользоваться арифметическими действиями — сложением, вычитанием, делением, умножением этих чисел.
Шкалы интервалов — это шкалы, которые наряду с отношениями равенства, неравенства и порядка между числами сохраняют отношение равенства и порядка между их разностями. Шкалы интервалов имеют равные единицы измерения, но способ их определения является произвольным, следовательно, и сами единицы произвольны. При этом неизвестна абсолютная величина отдельных значений по шкале, так как шкала не имеет естественной нулевой точки отсчета, т.е. в интервальной шкале нуль шкалы, величина единицы измерения и направление изменений являются произвольными. Так, оценка успеваемости учащихся в странах СНГ производится по 5-балльной системе с интервалом в 1 балл, причем меньшему уровню знаний соответствует и меньший балл, в Германии же началом отсчета уровня знаний является наиболее высокий балл (5) в той же 5-балльной системе при том же интервале в 1 балл, а во французском лицее при сдаче выпускных экзаменов результаты оцениваются по 20-балльной системе (от 0 до 20). Довольно распространены и 15-балльные шкалы, используются оценки по 10- и 100-балльной системе.
Таким образом, при конструировании шкалы интервалов используют три произвольные операции: установление величин единиц измерения, определение нулевой точки и определение направления, в котором ведется отсчет по отношению к нулевой точке. С интервальными шкалами допускают любые линейные преобразования типа Х'= ах + в для аgt;0.
Шкалы отношений отличаются от предыдущих наличием постоянной естественной нулевой точки отсчета. Поэтому числа соответствуют реальным значениям измеряемого свойства, что позволяет производить над ними любые арифметические действия — оперировать суммами, произведениями, частными, т.е. осуществлять любые преобразования типа X' = ах для любых аgt;0. Однако недопустимо прибавление или вычитание константных величин, что приводит к сдвигу точки отсчета. Шкалы отношений используются при непосредственном измерении психического процесса, например, оценка величин и непосредственная оценка их отношений. При этом в качестве измерительного инструмента выступает сам испытуемый, оценивающий количественные отношения между раздражителями.
Все методы математико-статистической обработки данных измерения условно делятся на первичные и вторичные.
Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Применение первичных методов обработки данных экспериментального исследования дает возможность получения первичных результатов эксперимента на основе решения задач математической статистики:
— определения центральной тенденции выборочной совокупности измерений (выборочного среднего);
— оценки среднестатистического отклонения измеряемой величины от ее центральной тенденции (выборочного среднего).
Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. В практике психологических исследований наибольшую значимость приобретают следующие типы задач:
— определение динамики изучаемого психического явления на основе применения методов дисперсионного и регрессионного анализа;
— установление и оценка степени статистических связей, существующих между психологическими переменными величинами, исследуемыми в данном эксперименте, на основе применения методов корреляционного анализа, факторного анализа, сравнения выборочных данных.
Расчет и оценка среднестатистического значения измеряемой величины
В качестве центральної"! тенденции измеряемой величины чаще всего принято рассматривать моду, медиану, среднее арифметическое, реже — среднее геометрическое, среднее гармоническое и др. [13].
Модой (Мо) называется количественное значение чаще всего встречающейся в выборке измеряемой величины.
Так, в упорядоченной последовательности значений измерения кратковременной памяти 5, 6, 6, 7, 7, 7, 8, 8,
9 модой является величина 7. Мода является централь
ной тенденцией номинальной (номинативной) шкалы. Определяется она после подсчета абсолютных или относительных частот встречаемости того или иного результата в каждом классе изучаемых признаков.
Медиана (Me) — это количественное значение изучаемого признака, соответствующее середине упорядоченной последовательности измеряемых величин. Например, в рассматриваемом нами ряду измерения показателей кратковременной памяти, состоящему из 9 членов, средним будет пятый, который соответствует числу 7. Это и есть медиана. При четном количестве членов, например десяти, медианой будет среднее, взятое как полусумма величин двух центральных показателей ряда. Так, для упорядоченной последовательности 5, 6, 6, 7, 7, 7, 7, 8, 8, 9 медианой будет значение, полученное путем вычисления полусуммы значений, занимающих 5-е и 6-е места ряда, т.е. (7+7)/2=7.
Медиана характеризует центральную тенденцию порядковой (ранговой) шкалы.
Среднее арифметическое значение (выборочное среднее) как статистический показатель представляет собой среднюю оценку изучаемого в эксперименте психологического свойства.
Среднее арифметическое (выборочное среднее) значение определяется по формуле
Mx = X=-txi,(1)
где Мх =Х — выборочная средняя величина, или среднее арифметическое значение для полученной выборки; п - число полученных значений, т.е. объем выборки (число показателей, испытуемых и т.д.); х, — единичное (частное) значение показателя изучаемого психического явления; X — оператор суммирования; ]Г х•— сумма всех х; с индексом ОТ 1 ДО И. /”1
Например, для последовательности полученных данных измерения объема кратковременной памяти у 10 испытуемых (5, 6, 6, 7, 7, 7, 7, 8, 8, 9) среднее значение будет равно
Мх = X = 1/Ю • (5+6 • 2+7 • 4+8 • 2+9)=7.
Выборочное среднее может быть применено для выявления центральной тенденции при использовании шкал интервалов и шкал отношений.
Определение среднестатистического значения показателя важно не только для выявления центральной тенденции измерения признака, но и для оценки распределения частных значений изучаемого признака. При совпадении значения медианы и среднего арифметического значения или их небольшом отличии друг от друга есть все основания утверждать, что полученное выборочное распределение признаков подчиняется так называемому нормальному закону распределения, при котором частота встречаемости частных значений f(x) в выборке симметрична относительно среднего значения (X, Me,), что поясняется графически (рис. 1).
{foto} Рис. 1. Нормальное распределение
Если выборочное распределение признаков нормально, то к нему можно применять методы вторичных статистических расчетов, основанные на нормальном распределении данных. В противном случае (при значительном отличии X и Me) этого делать нельзя, так как в расчетах могут появиться серьезные ошибки, данные расчетов могут быть недостоверными [111-
Оценка стандартного отклонения
Оценка среднестатистического отклонения измеряемой величины от выборочного среднего значения производится на основе расчета дисперсии, определяемой по формуле
о2=-?(х,-г)2,
Л1-1
где а2 — выборочная дисперсия или просто дисперсия; п — количество испытуемых в выборке или первичных зна
чений, по которым вычисляется дисперсия; Е(х-х)2 - выражение, означающее, что для всех частных значений от первого до последнего необходимо вычислить разности между частными и средними значениями, возвести эти разности в квадрат и просуммировать их.
Выражение (2) справедливо для средних и больших выборок. В случае, если количество полученных данных небольшое (в пределах малой выборки), знаменатель уменьшается на единицу и формула приобретает вид
о2 =—-—Шхі~ *)2 • (3)
п-1 ,-1 w
Для выявления разброса частных данных относительно средней используют произвольную от дисперсии величину, называемую средним квадратичным отклонением или выборочным отклонением, определяемым по следующей формуле (для малых выборок, когда гаlt;10):
(4)
В случае нормального распределения измеряемых величин 68 % объема выборки находится в интервале х±о и практически весь объем выборки (99 %) в интервале х±Зо (золотое правило трех сигм) [7].
При необходимости оценки относительной величины разброса рассчитывается коэффициент вариации по формуле
У = - 100, (5)
д:
где V — относительная величина разброса данных измерения, выраженная в процентах.
Так, для нашего примера
(5 — 7)2+2(6 - 7)2+4(7 - 7)2+2(6 - 7)2+(9 - 7)2 _ 112
= 1,09.
10 \ 10
Как видно из примера, даже при небольшом количестве данных операция вычисления с довольно трудоемкая. Поэтому иногда используют ускоренный способ расчета а по формуле
о =максимальное и минимальное значения переменной .г в выборочной совокупности; dn — табличное значение коэффициента, зависящее от числа измерений (испытуемых) п в выборке.
Для нашего случая *шах = 9, .rmin = 5, dn = 3,08 (определено по таблице, приведенной в [1, с. 12]).
_ 9-5 _ 4
Тогда °— 1,14.
д 3,08 3,08
Видно, что значение о, полученное путем ускоренного расчета, несколько больше значения о, полученного способом точного расчета, т.е. имеется полная гарантия того, что точное значение среднего квадратичного отклонения не превысит его значения, полученного прибли- женпым способом расчета.
Вычисленное нами среднее арифметическое объема кратковременной памяти, равное 7, является точечной оценкой, т.е. представляет собой одно числовое значение — точку на числовой оси. В силу случайного характера измерений эта точка должна находиться в определенном интервале, величину которого можно определить с помощью вычисления стандартной ошибки среднего [13, с. 27] по формуле
m~V (7)
где т — стандартная ошибка среднего; ст — среднее квадратичное отклонение (стандартное отклонение); п — количество числовых значений показателя (количество испытуемых). ^
Для нашего примера т ~ =0,34 gt; те среднее
арифметическое значение объема кратковременной памяти находится в пределах от 7 — 0,34 до 7 + 0,34.
Стандартная ошибка среднего служит мерой надежности в том смысле, что чем она меньше, тем надежность отдельного среднего арифметического как точечной оценки больше, и наоборот. Из формулы (7) видно, что навеличину стандартной ошибки влияют два фактора: разброс данных и количество измерений (или испытуемых). Чем больше разброс данных относительно среднего арифметического и, следовательно, чем больше стандартное отклонение, тем больше величина стандартной ошибки среднего и тем меньше вероятность, что при повторении опыта будут получаться близкие по величине средние арифметические. С другой стороны, чем меньше число данных (испытуемых), на основании которых вычислялось среднее арифметическое, тем, как правило, больше стандартная ошибка среднего и тем меньше мы можем полагаться на это среднее.
Оценка динамики изучаемого психического явления
Динамика психического процесса может быть оценена на основе сравнения выборочных средних величин. Сравнение абсолютных значений этих величин можно осуществлять применением ^-критерия Стьюдента:
{foto} формула
х-у
(8)где х — среднее значение переменной по одной выборке данных; у — среднее значение переменной по другой выборке данных; тх, т — показатели отклонений частных значений из выборок переменных х и у от соответствующих им средних величин, вычисляемые по формулам:
где ох — выборочная дисперсия по выборке переменной X; о у — выборочная дисперсия по выборке переменной Y; пх, пу — число частных значений переменной в выборке X и Y соответственно.
Алгоритм оценки статистической достоверности различий выборочных средних сводится к следующему:
— по формуле (8) рассчитать показатель t;
— определить число степеней свободы (пх+пц-2);— задаться вероятностью допустимой ошибки (она может быть 0,05; 0,01 и 0,001);
- найти табличное значение t для заданного числа степеней свободы и избранной вероятности допустимой ошибки (табл. 1);
- сравнить найденное табличное значение t с расчетным;
— если вычисленное значение t больше или равно табличному, то сравниваемые средние значения из двух выборок действительно статистически достоверно различаются с вероятностью допустимой ошибки, меньшей или равной избранной.
Вероятность допустимой ошибки, равная или меньшая 0,05, считается достаточной для научно убедительных выводов. Чем меньше эта вероятность, тем точнее и убедительнее делаемые выводы. Например, избрав вероятность допустимой ошибки, равную 0,05, мы допускаем ошибку, не превышающую 5 %, а выбор вероятности допустимой ошибки 0,001 гарантирует точность расчетов, превышающую или равную 99,9 %, или ошибку, меньшую или равную 0,1 %.
Пример. Пусть имеем две выборки экспериментальных данных 4, 7, 8, 3, 4, 6, 7, 5, 6, 6 и 5, 6, 6, 7, 7,
7, 7, 8, 8, 9. Определим их средние арифметические значения:
3 + 4 2 + 5 + 6 3 + 7 2 + 8 _ .
М = = 5,6,
10
.. 5 + 6-2 + 7 4 + 8-2 + 9 _
М = = 7.
у 10
На первый взгляд кажется, что они существенно отличаются друг от друга. Но так ли это и насколько статистически достоверны эти различия? На этот вопрос можно ответить, определив f-критерии Стьюдента.
Определим выборочные дисперсии для двух сравниваемых выборок: „
2 (-2,6)2 -fa2(—1,6)2 + (-0,6)2 + 0,42 • 3 + 1,42 - 2+ 2,4*к 00
о. = ! z,о,
10
а2 =1,2. 40
Вычислим показатель t, подставив найденные значения х, у, о] и а2у в формулу (7):
*- ±?^--±±-2.3.
2,3 t 1,2 °.б
V 10 10
Таблица 1
Критические значения f-критерня Стьюдента
Сравним полученное значение с табличным (см. табл. 1) для числа степеней свободы 10+10—2=18. Зададим вероятность допустимой ошибки, равную 0,05, и убедимся в том, что значение t должно быть не меньше, чем 2,1. У нас этот показатель равен 2,3, следовательно, выборочные средние статистически достоверно отличаются друг от друга с вероятностью допустимой ошибки не более 5 %.
Нередко возникает задача сравнения не абсолютных средних значений, а частных (например, процентных) распределений данных. В этом случае можно воспользоваться статистикой, именуемой ^-критерий:
х* _ (9)
*=1 Гк
где Рк — частоты результатов наблюдений до эксперимента; Vk — частоты результатов наблюдений после эксперимента; S — общее число групп, на которые разделились результаты наблюдений.
Полученное расчетным путем значение сопоставляется с табличным (табл. 2) и в случае его превышения или равенства делается вывод о значимости различий с определенной вероятностью допустимой ошибки.
Таблица 2
Граничные (критические) значения /--критерия
Например, из 100 испытуемых, отобранных для эксперимента по оценке динамики объема кратковременной памяти, до начала эксперимента 30 человек показали результаты ниже средних, 50 —средние и 20 - выше средних. После проведения формирующего эксперимента результаты распределились следующим образом: 20 человек показали результаты ниже среднего, 40 — средние и 40 — выше среднего уровня.
Можно ли, опираясь на эти данные, утверждать, что формирующий эксперимент, направленный на увеличение объема кратковременной памяти, удался?
Для ответа на данный вопрос воспользуемся формулой (9). В данном примере переменная Р,. принимает значение 30 %, 50 %, 20 %, a Vk - 20 %, 40 %, 40 %. Подставив эти значения в формулу (9), получим
2 _ (204-30)» + (40 - 50): + (*0 - 20)2 = 3,33 + 2 + 20 = 25,33.
30 50 20
Воспользуемся теперь табл. 2, где для заданного числа степеней свободы (S—1=3—1=2) можно определить степень значимости различий объема кратковременной памяти до и после эксперимента. Полученное нами значение 25,33 больше соответствующего табличного значения (13,82) при вероятности допустимой ошибки меньше 0,1 %. Следовательно, эксперимент удался, и мы можем это утверждать, допуская ошибку, не превышающую 0,1 %.
Нередко в психологическом эксперименте возникает задача сравнения дисперсий двух выборок с целью выявления различий между ними. Такого рода задачи решаются при помощи критерия Фишера:
2
F(rii — 1,л2 — 1)=—1-,(Ю)
о;
где nv п2 — количество значений признака в первой и второй из сравниваемых выборок соответственно; (/г j—1, п2—1) — число степеней свободы; а'*, о? ~ дисперсия по первой и второй выборке соответственно.
Вычисленное с помощью этой формулы значение F-критерия сравнивается с табличным (табл. 3) и если оно
превосходит табличное для данного числа степеней свободы и избранной вероятности допустимой ошибки, то делается вывод о том, что гипотеза о наличии различий в дисперсиях подтвердилась. В противном случае такая гипотеза отвергается и дисперсии считаются равными.
Таблица 3
Граничные значення F-критерия для вероятности допустимой ошибки 0,05
Например, имеем два ряда значений объема внимания: 4, 6, 5, 7, 3, 4, 5, 6 и 2, 7, 3, б, 1, 8, 4, 5. Средние значения для двух этих рядов соответственно равны 5,0 и 4,5. Их дисперсии составляют 1,5 и 5,25. Частное отделения большой дисперсии на меньшую составляет 3,5 (показатель F). Сравнивая его с табличным значением для п1=п2=8 (оно равно 3,44), приходим к выводу о различиях в дисперсиях выборок на уровне значимости более 95 %, или с вероятностью допустимой ошибки не более 5 %.
Выявление и оценка степени статистических взаимосвязей между переменными
Связь между двумя рядами экспериментальных данных устанавливается применением метода корреляции, дающим возможность установить, каким образом одно явление влияет на другое или связано с ним. Подобного рода зависимости существуют, например, между величинами, находящимися в причинно-следственных связях друг с другом.
Существует несколько разновидностей данного метода: линейный, ранговый, парный и множественный. Линейный корреляционный анализ позволяет устанавливать прямые связи между величинами по их абсолютным значениям и может быть использован при применении шкалы интервалов и шкалы отношений.
Коэффициент линейной корреляции (коэффициент Пирсона) определяется по формуле
П(11)
?(д:-х){Уі-у)
г,
_ 1-Ігде гху — коэффициент линейной корреляции (критерий Пирсона), принимающий значения [0+1]; х, у — средние выборочные значения сравниваемых величин; п — общее число величин в сравниваемых рядах показателей; ог, о(/ — средние квадратические отклонения сравниваемых величин X И у.
Пример. Пусть имеем 2 ряда показателей объема внимания испытуемого: 2, 4, 4, 5, 3, 6, 8 и 2, 5, 4, 6, 2, 5, 7. Определим коэффициент линейной корреляции между ними. Средние значения этих рядов составляют 4,6 и
4,4 соответственно. Их дисперсии равны 3,4 и 3,1. Подставив эти данные в формулу (j$). получим результат, равный 0,92. Полученное значение свидетельствует о существовании между рядами объема внимания явно выраженной положительноіі связи, поскольку коэффициент корреляции близок к единице.
где R — коэффициент ранговой корреляции, принимающий значения [0+1]; с?, — разность рангов показателей в упорядоченных рядах; п — число данных (например, свойств испытуемых) в коррелируемых рядах.
{foto} (12)
Ранговая корреляция используется в том случае, когда необходимо установить прямые связи не между абсолютными значениями переменных, а между порядковыми местами, или рангами, занимаемыми ими в упорядоченном по величине ряду. Коэффициент ранговой корреляции (критерий Спирмена) определяется по формуле
Пример. Пусть экспериментатора интересует степень влияния интереса учащихся к учебному предмету на их успеваемость. Предположим, что с помощью некоторой психодиагностической методики удалось измерить величину интереса к предмету и выразить его для 10 учащихся в виде ряда оценок по 9-балльной шкале: 5, 6, 7,
8, 2, 4, 8, 7, 2, 9. Допустим также, что с помощью другой методики были определены средние оценки этих же учащихся по данному предмету по 5-балльной шкале и представлены соответственно в виде ряда: 3,2; 4,0; 4,1; 4,2; 2,5; 5,0; 3,0; 4,8; 4,6; 2,4.
Упорядочим оба ряда оценок и припишем каждому из учащихся по два ранга: один — по месту в ряду интереса к учебному предмету, другой — по успеваемости, причем учащимся, показавшим одинаковые результаты, присваивается один и тот же ранг, равный полусумме занимаемых ими порядковых номеров (табл. 4). Определив сумму квадратов различий в рангах (Sc?2), подставив полученное значение в чиститель формулы и произведя соответствующие вычисления по формуле (12), получим значение коэффициента ранговой корреляции, равное 0,97, свидетельствующее о том, что между интересом к учебному предмету и успеваемостью учащихся существует достаточно сильная положительная связь.
Таблица 4
Данные ранжировании
Качественные (описательные, содержательные) методы обработки включают:
— первичный анализ — выделение и рассмотрение каждого отдельного случая, исключение данных, далеко выходящих за рамки основного массива полученных данных;
— первичный синтез — установление связей между данными первичного анализа и выдвинутой гипотезой;
— сравнительный (вторичный) анализ — выделение устойчиво повторяющихся фактов;
— вторичный синтез — объединение этих фактов, сопоставление с гипотезой и нахождение существующих закономерностей.
Количественные (математические) методы обработки данных эксперимента предполагают получение числовых показателей измерения психических явлений. Однако получение числовых значений психических явлений связано с рядом трудностей, приводящих к специфике использования математики в психологии:
— проблематичным является выделение точки отсчета (нуля). Действительно, трудно определить точку отсчета знаний учащегося, эмоционального состояния человека;
— определенную трудность представляет и выбор оперативных единиц измерения. Например, объем кратковременной памяти определяется числом 7 ± 2, но в качестве единиц измерения могут выступать и буквы, и слоги, и слова, и целые предложения;
— измерение опосредовано, т.е. измеряются не сами психические явления (образы, мысли), а характеристики поведения, физиологические проявления, называемые показателями;
— измерения носят вероятностный характер в связи с тем, что психические закономерности определяются большим количеством факторов, учесть которые практически невозможно; кроме того, причинно-следственные связи носят случайный характер. Например, настроение человека зависит и от состояния его здоровья, и от погодных условий, и от сиюминутных обстоятельств (кто-то не так посмотрел), и от особенностей социальной микросреды (неполадки в семье), макросреды (общая обстановка в стране) и др.;
— измерения базируются не на единичном факте, а на множестве показателей этого факта, т.е. носят статисти
ческий характер, поэтому исследователь обрабатывает, как правило, большое количество показателей (минимум 30) психологического факта, полученных на выборочных совокупностях (выборках) в процессе сбора психологических фактов;
— само понятие “измерение” носит условный характер, поскольку объект измерения нестабилен, вариативен. Действительно, если испытуемым при оценке умения классифицировать предложить из 5 слов, обозначающих растения (например, пшеница, чечевица, кукуруза, бамбук, ячмень), выделить слова, объединенные общим признаком, и исключить слова, не соответствующие этому признаку, то далеко не всегда за указанное время все испытуемые справятся с этой задачей, так как у одних испытуемых оценивается действительно умение классифицировать (выделение злакбвых, к которым относятся пшеница, кукуруза, бамбук, ячмень и исключение чечевицы, относящейся к семейству бобовых), у других — знания (далеко не все знают, что чечевица и бамбук принадлежат к разным семействам, и исключают чаще всего бамбук в силу его отличий от других растений по внешним признакам), у третьих — темп работы (при выделении достаточно длительного промежутка времени испытуемый, обратившись к справочной литературе или поразмыслив, выяснит, что бамбук — злаковое, а чечевица — бобовое растение, и правильно осуществит классификацию).
Кроме того, числовое значение лишает процесс измерения качественной оценки, в этом отношении измерительный инструментарий нельзя признать универсальным, отражающим реалии. Так, при решении 5 из 10 задач двумя испытуемыми у обоих показатель успешности составляет 0,5, хотя типы решаемых задач и степень их сложности могут быть разными. В связи с этим важное значение при обработке данных приобретает выбор измерительного инструментария, т.е. шкалы.
Шкала - это алгоритм, с помощью которого каждому наблюдаемому объекту соответствует некоторое число.
Чаще всего в процессе измерения и обработки данных измерения используют следующие шкалы [12].
Шкала наименований (номинативная, классификации), предполагающая распадение объекта измерения на
множество классов, взаимно исключающих друг друга (если не А, то В), каждому классу дается наименование, числовое обозначение которого является одним из шкальных значений. В качестве классов могут выступать половые различия испытуемых (мужчина — женщина), результаты деятельности (решил — не решил) и др. При построении шкал наименований следует руководствоваться двумя правилами: каждый член некоторого множества объектов может быть отнесен лишь к одному классу объектов, ни один из объектов не может быть отнесен к двум и более классам. Таким образом, шкала наименовании подчеркивает скорее качественные, а не количественные различия. Поэтому никаких арифметических операций с членами производить нельзя.
Шкала порядка (ординальная, ранговая) предполагает упорядочение объектов относительно измерительного свойства. Так, если при измерении объема кратковременной памяти результат одного испытуемого равен 8, другого — 5, третьего — 7, четвертого — 6, пятого — 7, шестого — 9, седьмого — 8, восьмого — 7, девятого — б, то при расположении полученных результатов в порядке возрастания данная шкала будет представлена рядом: 5,
6, 6, 7, 7, 7, 8, 8, 9. Испытуемому, показавшему наилучший результат в измерении объема памяти (9), присваивается ранг 1, показавшим результат несколько ниже (8) — среднее значение тех рангов, которые были бы присвоены каждому из них при отсутствии совпадения, т.е. (2+3)/2 = 2,5, и т.д. Шкалы порядка отображают монотонное возрастание (убывание) признака. Поэтому числа, отражающие величину этого признака, можно лишь сравнивать (gt;, lt;, =), помня при этом, что числа имеют относительное, а не абсолютное значение, поскольку неизвестна начальная (нулевая) точка отсчета. Поэтому для ранговых шкал допустимы любые преобразования типа X' = f(x), где f(x) - любое монотонное преобразование, не изменяющее последовательности элементов, т.е. числа, выражающие величину признака, можно возводить в степень, извлекать корень, умножать, делить на постоянное число и т.д., но нельзя пользоваться арифметическими действиями — сложением, вычитанием, делением, умножением этих чисел.
Шкалы интервалов — это шкалы, которые наряду с отношениями равенства, неравенства и порядка между числами сохраняют отношение равенства и порядка между их разностями. Шкалы интервалов имеют равные единицы измерения, но способ их определения является произвольным, следовательно, и сами единицы произвольны. При этом неизвестна абсолютная величина отдельных значений по шкале, так как шкала не имеет естественной нулевой точки отсчета, т.е. в интервальной шкале нуль шкалы, величина единицы измерения и направление изменений являются произвольными. Так, оценка успеваемости учащихся в странах СНГ производится по 5-балльной системе с интервалом в 1 балл, причем меньшему уровню знаний соответствует и меньший балл, в Германии же началом отсчета уровня знаний является наиболее высокий балл (5) в той же 5-балльной системе при том же интервале в 1 балл, а во французском лицее при сдаче выпускных экзаменов результаты оцениваются по 20-балльной системе (от 0 до 20). Довольно распространены и 15-балльные шкалы, используются оценки по 10- и 100-балльной системе.
Таким образом, при конструировании шкалы интервалов используют три произвольные операции: установление величин единиц измерения, определение нулевой точки и определение направления, в котором ведется отсчет по отношению к нулевой точке. С интервальными шкалами допускают любые линейные преобразования типа Х'= ах + в для аgt;0.
Шкалы отношений отличаются от предыдущих наличием постоянной естественной нулевой точки отсчета. Поэтому числа соответствуют реальным значениям измеряемого свойства, что позволяет производить над ними любые арифметические действия — оперировать суммами, произведениями, частными, т.е. осуществлять любые преобразования типа X' = ах для любых аgt;0. Однако недопустимо прибавление или вычитание константных величин, что приводит к сдвигу точки отсчета. Шкалы отношений используются при непосредственном измерении психического процесса, например, оценка величин и непосредственная оценка их отношений. При этом в качестве измерительного инструмента выступает сам испытуемый, оценивающий количественные отношения между раздражителями.
Все методы математико-статистической обработки данных измерения условно делятся на первичные и вторичные.
Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Применение первичных методов обработки данных экспериментального исследования дает возможность получения первичных результатов эксперимента на основе решения задач математической статистики:
— определения центральной тенденции выборочной совокупности измерений (выборочного среднего);
— оценки среднестатистического отклонения измеряемой величины от ее центральной тенденции (выборочного среднего).
Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности. В практике психологических исследований наибольшую значимость приобретают следующие типы задач:
— определение динамики изучаемого психического явления на основе применения методов дисперсионного и регрессионного анализа;
— установление и оценка степени статистических связей, существующих между психологическими переменными величинами, исследуемыми в данном эксперименте, на основе применения методов корреляционного анализа, факторного анализа, сравнения выборочных данных.
Расчет и оценка среднестатистического значения измеряемой величины
В качестве центральної"! тенденции измеряемой величины чаще всего принято рассматривать моду, медиану, среднее арифметическое, реже — среднее геометрическое, среднее гармоническое и др. [13].
Модой (Мо) называется количественное значение чаще всего встречающейся в выборке измеряемой величины.
Так, в упорядоченной последовательности значений измерения кратковременной памяти 5, 6, 6, 7, 7, 7, 8, 8,
9 модой является величина 7. Мода является централь
ной тенденцией номинальной (номинативной) шкалы. Определяется она после подсчета абсолютных или относительных частот встречаемости того или иного результата в каждом классе изучаемых признаков.
Медиана (Me) — это количественное значение изучаемого признака, соответствующее середине упорядоченной последовательности измеряемых величин. Например, в рассматриваемом нами ряду измерения показателей кратковременной памяти, состоящему из 9 членов, средним будет пятый, который соответствует числу 7. Это и есть медиана. При четном количестве членов, например десяти, медианой будет среднее, взятое как полусумма величин двух центральных показателей ряда. Так, для упорядоченной последовательности 5, 6, 6, 7, 7, 7, 7, 8, 8, 9 медианой будет значение, полученное путем вычисления полусуммы значений, занимающих 5-е и 6-е места ряда, т.е. (7+7)/2=7.
Медиана характеризует центральную тенденцию порядковой (ранговой) шкалы.
Среднее арифметическое значение (выборочное среднее) как статистический показатель представляет собой среднюю оценку изучаемого в эксперименте психологического свойства.
Среднее арифметическое (выборочное среднее) значение определяется по формуле
Mx = X=-txi,(1)
где Мх =Х — выборочная средняя величина, или среднее арифметическое значение для полученной выборки; п - число полученных значений, т.е. объем выборки (число показателей, испытуемых и т.д.); х, — единичное (частное) значение показателя изучаемого психического явления; X — оператор суммирования; ]Г х•— сумма всех х; с индексом ОТ 1 ДО И. /”1
Например, для последовательности полученных данных измерения объема кратковременной памяти у 10 испытуемых (5, 6, 6, 7, 7, 7, 7, 8, 8, 9) среднее значение будет равно
Мх = X = 1/Ю • (5+6 • 2+7 • 4+8 • 2+9)=7.
Выборочное среднее может быть применено для выявления центральной тенденции при использовании шкал интервалов и шкал отношений.
Определение среднестатистического значения показателя важно не только для выявления центральной тенденции измерения признака, но и для оценки распределения частных значений изучаемого признака. При совпадении значения медианы и среднего арифметического значения или их небольшом отличии друг от друга есть все основания утверждать, что полученное выборочное распределение признаков подчиняется так называемому нормальному закону распределения, при котором частота встречаемости частных значений f(x) в выборке симметрична относительно среднего значения (X, Me,), что поясняется графически (рис. 1).
{foto}
Оценка стандартного отклонения
Оценка среднестатистического отклонения измеряемой величины от выборочного среднего значения производится на основе расчета дисперсии, определяемой по формуле
о2=-?(х,-г)2,
Л1-1
где а2 — выборочная дисперсия или просто дисперсия; п — количество испытуемых в выборке или первичных зна
чений, по которым вычисляется дисперсия; Е(х-х)2 - выражение, означающее, что для всех частных значений от первого до последнего необходимо вычислить разности между частными и средними значениями, возвести эти разности в квадрат и просуммировать их.
Выражение (2) справедливо для средних и больших выборок. В случае, если количество полученных данных небольшое (в пределах малой выборки), знаменатель уменьшается на единицу и формула приобретает вид
о2 =—-—Шхі~ *)2 • (3)
п-1 ,-1 w
Для выявления разброса частных данных относительно средней используют произвольную от дисперсии величину, называемую средним квадратичным отклонением или выборочным отклонением, определяемым по следующей формуле (для малых выборок, когда гаlt;10):
(4)
В случае нормального распределения измеряемых величин 68 % объема выборки находится в интервале х±о и практически весь объем выборки (99 %) в интервале х±Зо (золотое правило трех сигм) [7].
При необходимости оценки относительной величины разброса рассчитывается коэффициент вариации по формуле
У = - 100, (5)
д:
где V — относительная величина разброса данных измерения, выраженная в процентах.
Так, для нашего примера
(5 — 7)2+2(6 - 7)2+4(7 - 7)2+2(6 - 7)2+(9 - 7)2 _ 112
= 1,09.
10 \ 10
Как видно из примера, даже при небольшом количестве данных операция вычисления с довольно трудоемкая. Поэтому иногда используют ускоренный способ расчета а по формуле
о =максимальное и минимальное значения переменной .г в выборочной совокупности; dn — табличное значение коэффициента, зависящее от числа измерений (испытуемых) п в выборке.
Для нашего случая *шах = 9, .rmin = 5, dn = 3,08 (определено по таблице, приведенной в [1, с. 12]).
_ 9-5 _ 4
Тогда °— 1,14.
д 3,08 3,08
Видно, что значение о, полученное путем ускоренного расчета, несколько больше значения о, полученного способом точного расчета, т.е. имеется полная гарантия того, что точное значение среднего квадратичного отклонения не превысит его значения, полученного прибли- женпым способом расчета.
Вычисленное нами среднее арифметическое объема кратковременной памяти, равное 7, является точечной оценкой, т.е. представляет собой одно числовое значение — точку на числовой оси. В силу случайного характера измерений эта точка должна находиться в определенном интервале, величину которого можно определить с помощью вычисления стандартной ошибки среднего [13, с. 27] по формуле
m~V (7)
где т — стандартная ошибка среднего; ст — среднее квадратичное отклонение (стандартное отклонение); п — количество числовых значений показателя (количество испытуемых). ^
Для нашего примера т ~ =0,34 gt; те среднее
арифметическое значение объема кратковременной памяти находится в пределах от 7 — 0,34 до 7 + 0,34.
Стандартная ошибка среднего служит мерой надежности в том смысле, что чем она меньше, тем надежность отдельного среднего арифметического как точечной оценки больше, и наоборот. Из формулы (7) видно, что навеличину стандартной ошибки влияют два фактора: разброс данных и количество измерений (или испытуемых). Чем больше разброс данных относительно среднего арифметического и, следовательно, чем больше стандартное отклонение, тем больше величина стандартной ошибки среднего и тем меньше вероятность, что при повторении опыта будут получаться близкие по величине средние арифметические. С другой стороны, чем меньше число данных (испытуемых), на основании которых вычислялось среднее арифметическое, тем, как правило, больше стандартная ошибка среднего и тем меньше мы можем полагаться на это среднее.
Оценка динамики изучаемого психического явления
Динамика психического процесса может быть оценена на основе сравнения выборочных средних величин. Сравнение абсолютных значений этих величин можно осуществлять применением ^-критерия Стьюдента:
{foto}
(8)где х — среднее значение переменной по одной выборке данных; у — среднее значение переменной по другой выборке данных; тх, т — показатели отклонений частных значений из выборок переменных х и у от соответствующих им средних величин, вычисляемые по формулам:
где ох — выборочная дисперсия по выборке переменной X; о у — выборочная дисперсия по выборке переменной Y; пх, пу — число частных значений переменной в выборке X и Y соответственно.
Алгоритм оценки статистической достоверности различий выборочных средних сводится к следующему:
— по формуле (8) рассчитать показатель t;
— определить число степеней свободы (пх+пц-2);— задаться вероятностью допустимой ошибки (она может быть 0,05; 0,01 и 0,001);
- найти табличное значение t для заданного числа степеней свободы и избранной вероятности допустимой ошибки (табл. 1);
- сравнить найденное табличное значение t с расчетным;
— если вычисленное значение t больше или равно табличному, то сравниваемые средние значения из двух выборок действительно статистически достоверно различаются с вероятностью допустимой ошибки, меньшей или равной избранной.
Вероятность допустимой ошибки, равная или меньшая 0,05, считается достаточной для научно убедительных выводов. Чем меньше эта вероятность, тем точнее и убедительнее делаемые выводы. Например, избрав вероятность допустимой ошибки, равную 0,05, мы допускаем ошибку, не превышающую 5 %, а выбор вероятности допустимой ошибки 0,001 гарантирует точность расчетов, превышающую или равную 99,9 %, или ошибку, меньшую или равную 0,1 %.
Пример. Пусть имеем две выборки экспериментальных данных 4, 7, 8, 3, 4, 6, 7, 5, 6, 6 и 5, 6, 6, 7, 7,
7, 7, 8, 8, 9. Определим их средние арифметические значения:
3 + 4 2 + 5 + 6 3 + 7 2 + 8 _ .
М = = 5,6,
10
.. 5 + 6-2 + 7 4 + 8-2 + 9 _
М = = 7.
у 10
На первый взгляд кажется, что они существенно отличаются друг от друга. Но так ли это и насколько статистически достоверны эти различия? На этот вопрос можно ответить, определив f-критерии Стьюдента.
Определим выборочные дисперсии для двух сравниваемых выборок: „
2 (-2,6)2 -fa2(—1,6)2 + (-0,6)2 + 0,42 • 3 + 1,42 - 2+ 2,4*к 00
о. = ! z,о,
10
а2 =1,2. 40
Вычислим показатель t, подставив найденные значения х, у, о] и а2у в формулу (7):
*- ±?^--±±-2.3.
2,3 t 1,2 °.б
V 10 10
Таблица 1
Критические значения f-критерня Стьюдента
Число степенен свободы (л^+л^-2) |
Вероятность допустимом ошибки |
||
0.05 |
0,01 |
0,001 |
|
4 |
2.78 |
5,60 |
8.61 |
5 |
2.58 |
4,03 |
6.87 |
6 |
2.45 |
3,71 |
5,96 |
7 |
2,37 |
3,50 |
5,41 |
8 |
2,31 |
3,36 |
5,01 |
9 |
2,26 |
3,25 |
4,78 |
10 |
2,23 |
3,17 |
4,59 |
11 |
2,20 |
3,11 |
4,44 |
12 |
2,8 |
3,05 |
4,32 |
13 |
2,16 |
3,01 |
4,22 |
14 |
2,14 |
2,98 |
4,14 |
15 |
2,13 |
2,96 |
4,07 |
16 |
2,12 |
2.92 |
4,02 |
17 |
2,11 |
2,90 |
3,97 |
18 |
2,10 |
2,88 |
3,92 |
19 |
2,09 |
2,86 |
3.88 |
20 |
2,09 |
2,85 |
3,85 |
21 |
2,08 |
2,83 |
3.82 |
22 |
2,07 |
2,82 |
3,79 |
23 |
2,07 |
2,81 |
3.77 |
24 |
2,06 |
2,80 |
3,75 |
25 |
2,06 |
2,79 |
3,73 |
26 |
2,06 |
2,78 |
3,71 |
27 |
2,05 |
2,77 |
3,69 |
28 |
2,05 |
2,76 |
3,67 |
29 |
2,05 |
2,76 |
3,66 |
30 |
2,04 |
2,75 |
3,65 |
40 |
2,02 |
2,70 |
3,55 |
50 |
2,01 |
2,68 |
3.50 |
60 |
2,00* |
2,66 |
3,46 |
80 |
1,99 |
2,64 |
3.42 |
100 |
1,98 |
2,63 |
3,39 |
Сравним полученное значение с табличным (см. табл. 1) для числа степеней свободы 10+10—2=18. Зададим вероятность допустимой ошибки, равную 0,05, и убедимся в том, что значение t должно быть не меньше, чем 2,1. У нас этот показатель равен 2,3, следовательно, выборочные средние статистически достоверно отличаются друг от друга с вероятностью допустимой ошибки не более 5 %.
Нередко возникает задача сравнения не абсолютных средних значений, а частных (например, процентных) распределений данных. В этом случае можно воспользоваться статистикой, именуемой ^-критерий:
х* _ (9)
*=1 Гк
где Рк — частоты результатов наблюдений до эксперимента; Vk — частоты результатов наблюдений после эксперимента; S — общее число групп, на которые разделились результаты наблюдений.
Полученное расчетным путем значение сопоставляется с табличным (табл. 2) и в случае его превышения или равенства делается вывод о значимости различий с определенной вероятностью допустимой ошибки.
Таблица 2
Граничные (критические) значения /--критерия
Число степеней свободы (S— 1) |
Вероятность допустимой ошибки |
||
0.05 |
0,01 |
0,001 |
|
1 |
3.84 |
6,64 |
10,83 |
2 |
5.99 |
9,21 |
13,82 |
3 |
7,81 |
11,34 |
16,27 |
4 |
9,49 |
13,23 |
18,46 |
5 |
11,07 |
15,09 |
20,52 |
6 |
12,59 |
16,81 |
22,46 |
7 |
14.07 |
18,48 |
24,32 |
8 |
15,51 |
20,09 |
26,12 |
9 |
16,92 |
21,67 |
27,88 |
10 |
18,31 |
23,21 |
29,59 |
Например, из 100 испытуемых, отобранных для эксперимента по оценке динамики объема кратковременной памяти, до начала эксперимента 30 человек показали результаты ниже средних, 50 —средние и 20 - выше средних. После проведения формирующего эксперимента результаты распределились следующим образом: 20 человек показали результаты ниже среднего, 40 — средние и 40 — выше среднего уровня.
Можно ли, опираясь на эти данные, утверждать, что формирующий эксперимент, направленный на увеличение объема кратковременной памяти, удался?
Для ответа на данный вопрос воспользуемся формулой (9). В данном примере переменная Р,. принимает значение 30 %, 50 %, 20 %, a Vk - 20 %, 40 %, 40 %. Подставив эти значения в формулу (9), получим
2 _ (204-30)» + (40 - 50): + (*0 - 20)2 = 3,33 + 2 + 20 = 25,33.
30 50 20
Воспользуемся теперь табл. 2, где для заданного числа степеней свободы (S—1=3—1=2) можно определить степень значимости различий объема кратковременной памяти до и после эксперимента. Полученное нами значение 25,33 больше соответствующего табличного значения (13,82) при вероятности допустимой ошибки меньше 0,1 %. Следовательно, эксперимент удался, и мы можем это утверждать, допуская ошибку, не превышающую 0,1 %.
Нередко в психологическом эксперименте возникает задача сравнения дисперсий двух выборок с целью выявления различий между ними. Такого рода задачи решаются при помощи критерия Фишера:
2
F(rii — 1,л2 — 1)=—1-,(Ю)
о;
где nv п2 — количество значений признака в первой и второй из сравниваемых выборок соответственно; (/г j—1, п2—1) — число степеней свободы; а'*, о? ~ дисперсия по первой и второй выборке соответственно.
Вычисленное с помощью этой формулы значение F-критерия сравнивается с табличным (табл. 3) и если оно
превосходит табличное для данного числа степеней свободы и избранной вероятности допустимой ошибки, то делается вывод о том, что гипотеза о наличии различий в дисперсиях подтвердилась. В противном случае такая гипотеза отвергается и дисперсии считаются равными.
Таблица 3
Граничные значення F-критерия для вероятности допустимой ошибки 0,05
Л1 Л2 |
3 |
4 |
5 |
6 |
8 |
12 |
16 |
24 |
50 |
3 |
9,28 |
9,91 |
9,01 |
8,94 |
8,84 |
8,74 |
8.69 |
8,64 |
8,58 |
4 |
6,59 |
6,39 |
6.26 |
6,16 |
6.04 |
5,91 |
5,84 |
5,77 |
5,70 |
5 |
5,41 |
5,19 |
5,05 |
4,95 |
4,82 |
4,68 |
4,60 |
4,58 |
4,44 |
6 |
4,76 |
4,53 |
4,39 |
4.28 |
4,15 |
4,00 |
3,92 |
3^84 |
3,75 |
8 |
4,07 |
3,84 |
3,69 |
3,58 |
3.44 |
3,28 |
3,20 |
3,12 |
3,03 |
12 |
3,49 |
3,26 |
3,11 |
3,00 |
2,85 |
2,69 |
2,60 |
2,50 |
2,40 |
16 |
3,24 |
3,00 |
2,85 |
2,74 |
2,59 |
2,42 |
2,33 |
2,24 |
2,13 |
24 |
3,01 |
2,78 |
2,62 |
2,51 |
2,36 |
2,18 |
2,09 |
1,98 |
1,86 |
50 |
2,79 |
2,56 |
2,40 |
2,29 |
2,13 |
1,95 |
1,85 |
1,74 |
1,60 |
Например, имеем два ряда значений объема внимания: 4, 6, 5, 7, 3, 4, 5, 6 и 2, 7, 3, б, 1, 8, 4, 5. Средние значения для двух этих рядов соответственно равны 5,0 и 4,5. Их дисперсии составляют 1,5 и 5,25. Частное отделения большой дисперсии на меньшую составляет 3,5 (показатель F). Сравнивая его с табличным значением для п1=п2=8 (оно равно 3,44), приходим к выводу о различиях в дисперсиях выборок на уровне значимости более 95 %, или с вероятностью допустимой ошибки не более 5 %.
Выявление и оценка степени статистических взаимосвязей между переменными
Связь между двумя рядами экспериментальных данных устанавливается применением метода корреляции, дающим возможность установить, каким образом одно явление влияет на другое или связано с ним. Подобного рода зависимости существуют, например, между величинами, находящимися в причинно-следственных связях друг с другом.
Существует несколько разновидностей данного метода: линейный, ранговый, парный и множественный. Линейный корреляционный анализ позволяет устанавливать прямые связи между величинами по их абсолютным значениям и может быть использован при применении шкалы интервалов и шкалы отношений.
Коэффициент линейной корреляции (коэффициент Пирсона) определяется по формуле
П(11)
?(д:-х){Уі-у)
г,
_ 1-Ігде гху — коэффициент линейной корреляции (критерий Пирсона), принимающий значения [0+1]; х, у — средние выборочные значения сравниваемых величин; п — общее число величин в сравниваемых рядах показателей; ог, о(/ — средние квадратические отклонения сравниваемых величин X И у.
Пример. Пусть имеем 2 ряда показателей объема внимания испытуемого: 2, 4, 4, 5, 3, 6, 8 и 2, 5, 4, 6, 2, 5, 7. Определим коэффициент линейной корреляции между ними. Средние значения этих рядов составляют 4,6 и
4,4 соответственно. Их дисперсии равны 3,4 и 3,1. Подставив эти данные в формулу (j$). получим результат, равный 0,92. Полученное значение свидетельствует о существовании между рядами объема внимания явно выраженной положительноіі связи, поскольку коэффициент корреляции близок к единице.
где R — коэффициент ранговой корреляции, принимающий значения [0+1]; с?, — разность рангов показателей в упорядоченных рядах; п — число данных (например, свойств испытуемых) в коррелируемых рядах.
{foto}
Ранговая корреляция используется в том случае, когда необходимо установить прямые связи не между абсолютными значениями переменных, а между порядковыми местами, или рангами, занимаемыми ими в упорядоченном по величине ряду. Коэффициент ранговой корреляции (критерий Спирмена) определяется по формуле
Пример. Пусть экспериментатора интересует степень влияния интереса учащихся к учебному предмету на их успеваемость. Предположим, что с помощью некоторой психодиагностической методики удалось измерить величину интереса к предмету и выразить его для 10 учащихся в виде ряда оценок по 9-балльной шкале: 5, 6, 7,
8, 2, 4, 8, 7, 2, 9. Допустим также, что с помощью другой методики были определены средние оценки этих же учащихся по данному предмету по 5-балльной шкале и представлены соответственно в виде ряда: 3,2; 4,0; 4,1; 4,2; 2,5; 5,0; 3,0; 4,8; 4,6; 2,4.
Упорядочим оба ряда оценок и припишем каждому из учащихся по два ранга: один — по месту в ряду интереса к учебному предмету, другой — по успеваемости, причем учащимся, показавшим одинаковые результаты, присваивается один и тот же ранг, равный полусумме занимаемых ими порядковых номеров (табл. 4). Определив сумму квадратов различий в рангах (Sc?2), подставив полученное значение в чиститель формулы и произведя соответствующие вычисления по формуле (12), получим значение коэффициента ранговой корреляции, равное 0,97, свидетельствующее о том, что между интересом к учебному предмету и успеваемостью учащихся существует достаточно сильная положительная связь.
Таблица 4
Данные ранжировании