Наиболее простым и распространенным способом определения надежности валидность частей теста является метод расщепления на парные / нечетные задания (деление пополам). Достаточно одного выполнения теста в одной выборке испытуемых. Затем, во время обработки результатов, подсчитывают не общую сумму баллов по тесту у каждого испытуемого, а отдельные суммы по двум равноценными половинами теста. Коэффициент корреляции между половинами теста покажет надежность теста.
Как характеризуется валидность исследования?
Если эти две составляющие будут некачественными и при этом начнут взаимодействовать, валидность будет оценена очень низко. В их числе обоюдная интерференция как следствие того, что один и тот же объект подвергается одновременному воздействию нескольких методов. Если предмет исследования видоизменяет свою восприимчивость после того, как проведен предварительный этап, может возникнуть так называемый реактивный эффект. Например, проведению экспериментов могут препятствовать различные объективные обстоятельства, происходящие вокруг, а также природные, естественные преобразования окружающей действительности. С помощью внутренней валидности устанавливается, насколько выводы по результатам экспериментального исследования достоверны, если их сопоставлять с так называемыми итогами идеальных экспериментов. В ходе исследования проводится практическая работа, итоги которой подлежат оценке.
Что определяет валидность исследования?
В США к пониманию необходимости этого пришли спустя около 30 лет. При этом и в Японии, и в США полиграфологи работают исключительно на приборах отечественного производства. В Украине же отдельные «знатоки» до сих пор считают, что контроль приборов, которые часто оказываются неизвестного происхождения, не прошедшие процедуру растаможивания, не имеют надлежащего технического сопровождения со стороны дилеров. В результате имеем позор на всю страну – публичное тестирование с «щербатым» прибором, в котором отсутствует треть предусмотренных производителем датчиков. В РФ при проведении судебных экспертиз используют различные методики, в том числе авторские, даже противоречивую методику Лосева-Миллера, а не только две упомянутые выше.
Отправляйте нам заявку на тестирование и консультацию
На корректный HTML ставили метку «соответствует веб стандартам» или попросту называли валидным. Проверить корректность HTML кода можно с помощью онлайн валидатора. Валидация — проверка соответствия чего-то определенным критериям, правилам, требованиям.
Где σt – стандартная ошибка измерения, σr – стандартное отклонение корреляции задач внутри теста и k – количество заданий в тесте, rt – коэффициент надежности теста. Существует несколько способов исследования надежности методики. Основной статистический метод проверки надежности – корреляционный анализ, выбор метода которого зависит от шкалы измерения, на которой построен тест.
Важно можно ли с помощью теста разделить испытуемых на эти две группы. Важно, что тест или отдельное его задание успешно (с высокими баллами) проходят «эффективные», а неуспешно (с низкими баллами) «неэффективные». В случае, когда группы отличаются друг от друга только по одной переменной, причина дифференциации бывает понятна.
Изменение научных приоритетов, а именно поворот к идеографическим методам, вместе с увеличением внимания к роли ситуации в формировании внутреннего мира и поведения человека – две основные современные тенденции мировой психологической науки. Х.Томе резко отрицательно относится ко всем стандартизированным опросникам и проективным тестам и называет их «выстрелами из засады». По его мнению исследователь и респондент – равноправные партнеры психологического взаимодействия и искусство психолога заключается в том, чтобы в честной беседе вместе с партнером искать причины его психологических проблем или изучать человеческую природу. 5 Олпорт утверждает необходимость доверия к испытуемому, когда он рассказывает о принципиальных аспектах своей жизни. Он пишет, что проективные тесты не могут применяться в отрыве от направленных методов, поскольку мы не можем проинтерпретировать полученные с их помощью результаты, если нам неизвестно, согласованы они с представлением о себе или противоречат ему.
Таким образом, вероятность правильного ответа зависит от сочетания степени выраженности данной черты у исследуемого и способности задания выявить эту черту. Кроме того факторному анализу могут подвергаться тесты, созданные другими способами, благодаря чему проверяется факторная структура теста – однородность, наличие субшкал, выявляются некачественные задания. Различают так называемый разведывательный (эксплораторный) факторный анализ, по которому Р. Кеттелл построил тест “Шестнадцать личностных факторов”, и проверочный (конфирматорний) факторный анализ, по которому Г. Одним из первых тестов личности был крепелиновський вариант теста свободных ассоциаций, применен им для обследования больных с психическими отклонениями (1892). Кеттеллом стандартизированных анкет и шкал ранжирования, которые в дальнейшем стали использоваться для создания личностных тестов.
И наоборот, если человек может справиться с определенной задачей, ему предлагаются более сложные задачи пока он сможет их решать. Таким образом, быстро определяется уровень способностей испытуемого, тестирование становится более коротким и менее фрустрирующим для испытуемого. Заданиям предшествует название теста, которое должно быть нейтрального характера для того чтобы, с одной стороны не вскрыть истинную валидность теста, а с другой – создать необходимую очевидную валидность. Мы рекомендуем разрабатывать два названия – настоящее, для специалистов, и маскировочное – для испытуемых, оно должно находиться на бланке теста, или сообщаться устно, если тест не бланковый, а предметный. После названия размещается инструкция, объясняющая способ выполнения теста, временные ограничения и примеры решения типовых задач, если это тесты интеллекта, способностей, достижений. Однако вместо того, чтобы запретить тесты (как это было сделано в СССР – перефразируя высказывание «классика» – «нет тестов – нет проблемы»), в западной психологии были проанализированы причины критики в адрес психологического тестирования.
- В 20-х годах стало ясно, что большинство созданных тестов интеллекта, являются тестами способности к обучению.
- Для этого используют методы декомпозиции задачи (варьирования предъявления задач частично и полностью, с различными инструкциями и подсказками), а также анализ протоколов – гласный синхронный перевод того, что человек думает при решении задач.
- Если тест не может дать тот же результат для некоторого исследуемого (при условии, что этот испытуемый не изменился) в различных условиях – значит его надежность неудовлетворительная, или его прогноз очень скоротечный, т.е.
- Соответствующие обследования конца 1920-х годов показали, что IQ советских учащихся в среднем на 7% ниже, чем американских школьников.
- Ниже мы укажем те методы, которые могут оказаться очень полезными при изучении индивидуальности, хотя по своей природе они близки к количественным методам.
Проведение этих математических процедур позволило одной группе исследователей доказать континуальность данной черты [45]. При разработке теста формулируется ряд гипотез о том, как будет связан исследуемый тест с другими тестами, измеряющими подобные, противоположно направленные или независимые психологические явления. Эти гипотезы выдвигаются на основании теоретических представлений об измеряемых свойствах, как о психологических конструктах.
Авторы использовали ее также в исследовании, посвященном динамике моральных установок, в частности при сравнительном анализе установок в стабильных странах и тех, которые недавно пережили революцию. Методы, направленные на изучение «человека вообще» называются номотетическими, поскольку они проводят обобщения специфических особенностей отдельных лиц, определяют среднее арифметическое и затем сравнивают каждую новую личность изучаемого с этим «средним». К ним относятся все стандартизированные тесты, то есть тесты, оснащенные нормами.
Урбиной пишет, что на Западе купить психологический тест сложнее чем пистолет. В заключении в первую очередь должны быть отражены отличительные свойства индивида, то есть черты, результаты обследования по которым были или заметно низкими, или заметно высокими, а не те черты, по которым индивид имел показатели, близкие к среднему. Вывод эффективен, если он может быть применен только к данному индивида, а не просто к людям, демографические характеристики которых подобны характеристикам этого обследуемого. На таких универсальных и размытых интерпретациях базируются всевозможные сомнительные виды диагностики – гороскопы, гадания и т.п..
Имеются трудности в доказательстве того, что обе формы – параллельные наборы заданий – являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Ещё один недостаток повторного тестирования — это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.
IT курсы онлайн от лучших специалистов в своей отросли https://deveducation.com/ .