Fiabilidade e validade dos resultados Flashcards

1
Q

O que nos diz a fiabilidade dos resultados e quais os dois significiados habituais?

A

Fiabilidade dos resultados
A fiabilidade dos resultados numa prova diz-nos sobre o grau de confiança ou de exatidão que podemos ter na informação obtida. Apresenta dois significados no contexto mais habitual:
* o teste avalia o mesmo quando aplicado em dois momentos diferentes aos mesmos sujeitos (sentido de estabilidade e constância dos resultados)
* os itens que compõem o teste apresentam-se como um todo homogéneo (consistência interna).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais os metodos usados para o elemento da constancia

A

Para o 1º podemos o método do teste-reteste ou reteste com formas-paralelas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quais os metodos usados para o elemento da hmogeneidade

A

Para o 2º caso podemos recorrer ao método da bipartição dos itens e ao da consistência interna dos itens.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Em que consistem o metodo de teste-reteste e reteste com versao paralela

A

Teste-reteste: Refere-se à consistência de um instrumento de medida ao longo do tempo. Nesse método, o mesmo teste é administrado duas vezes aos mesmos participantes em dois momentos diferentes, e a correlação entre os resultados é calculada. Uma correlação alta sugere que o instrumento é estável ao longo do tempo.
Teste-reteste com versão paralela: Similar ao teste-reteste, mas em vez de administrar exatamente o mesmo teste duas vezes, são usados dois testes paralelos, que medem a mesma coisa, mas são formulados de maneira diferente. Isso ajuda a reduzir o efeito de familiaridade com o teste na segunda administração.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Em que consistem o teste da biparticação

A

Bipartição: É uma técnica usada para estimar a consistência interna de um instrumento de medida, como um questionário. O instrumento é dividido em duas partes, e a correlação entre as pontuações obtidas em cada parte é calculada. Uma correlação alta sugere que as duas partes do instrumento são equivalentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Em que consiste o coeficiente de speraman brown e qual a sua relacao com o metodo da biparticao

A

Coeficiente de Spearman-Brown de correção: É uma medida estatística que ajusta a confiabilidade de um teste ao adicionar ou remover itens. Geralmente é usado quando se deseja estimar como a confiabilidade de um teste mudaria se o teste fosse mais longo ou mais curto. Este coeficiente é frequentemente usado em testes de consistência interna, como o alfa de Cronbach.
A relação entre o Coeficiente de Spearman-Brown e a bipartição dos itens está na ideia de que, ao dividir um teste em duas partes e calcular a correlação entre essas partes, você está, de certa forma, avaliando a confiabilidade do teste como um todo. O Coeficiente de Spearman-Brown é usado para ajustar a estimativa da confiabilidade de um teste com base na consistência dos itens quando um teste é dividido em partes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

O que se entende por consistencia interna dos itens

A

Entende-se por consistência interna o grau de uniformidade ou de coerência existente tenras as respostas dos sujeitos a cada um dos itens que compõem a prova.
Requer apenas uma única aplicação da prova – valores próximos de 1 indicam uma boa uniformidade e de coerência de respostas. Valores abaixo de 0.7 são rejeitáveis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Em que medidas se baseia a consistencia interna dos itens

A

Alfa de Cronbach e Omega de mcdonald – é estimada com recurso a variabilidade no teste – desvio padrão (ao quadrado da variância dos resultados) – vão analisar se a soma da variância item a item se vai dar a variância total – quanto mais próximo de 1 mais consistente com a variância do teste, quanto mais próximo de 0 menos perfeito nunca deve ser a baixo de .70 ou .75
Sentido de acordo de juízes – técnicas qualitativas – se coincide com aquilo que é analisado, se aquilo que é relatado é corroborado pelos dados. Se os resultados de dois investigadores não forem iguais, temos que ter em conta que as grelhas de observação não são coerentes. Se a checklist (grelha) for muito ambígua haverá uma dispersão de resultados face ao mesmo problema – caso seja adequada o resultado é efetivamente o mesmo Superior a 80%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quais os dois sentidos para o construto de validade

A
  • Correspondência face à teoria ou expetativa de partida (válido quando sabemos o que estamos a medir) – sentido mais teórico – o nosso teste inclui-se neste modelo mais teórico – querem saber se a prova mede mesmo aquele construto
  • Previsão de um comportamento (válido quando mede aqui que é suposto avaliar) – sentido mais pratico – validade de implicação – tem de ter raciocínio apto, aprender melhor
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Em que consiste a validade do conteudo

A

Validade de conteúdo – tem a ver com o grau de adequação dos itens em relação à dimensão do comportamento avaliada pela prova. Como o proprio nome deixa a antever, procura-se apreciar em que medida o conteúdo da prova cobre os aspetos mais relevantes do construto – bipartido em dois conceitos: representatividade e coerência.
Representatividade – se o conteúdo compreende elementos de vários tipos, esse elemento tem de estar efetivamente presentes (o teste tem de constituir grande parte dos elementos de aula)
Coerência – se existe uma coerência entre a relevância de conteúdos e aquele que ta a ser testado

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quais os elementos a avaliar para a validade de conteúdo

A
  1. Relevância: Refere-se à importância ou significância das dimensões a serem avaliadas em relação aos objetivos do teste. Por exemplo, se o teste é de matemática, as questões de matemática terão maior relevância do que as questões de história.
  2. Representatividade/Abrangência: Indica o quão bem as dimensões selecionadas representam o espectro completo do conteúdo que está sendo avaliado. Por exemplo, se o teste de ciências abrange apenas biologia, mas deixa de fora química e física, sua representatividade é limitada.
  3. Ponderação: Refere-se à atribuição de pesos ou importância relativa a diferentes dimensões ou itens dentro do teste. Por exemplo, se a matemática é considerada mais importante que a história neste teste, as questões de matemática podem receber um peso maior.
  4. Validade Facial (Face Validity): Este conceito diz respeito à aparência superficial ou evidência de validade de um teste. Em outras palavras, parece para os participantes e observadores que o teste está medindo o que se propõe a medir. Por exemplo, se um teste de matemática parece incluir apenas problemas de matemática e não contém perguntas aparentemente irrelevantes, ele tem validade facial.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Em que consiste a validade empirica ou de criterio

A

A validade empírica esta intimamente ligada ao primeiro conceito a que a expressão validade parece associado (o grau de que o teste mede aquilo que é suposto medir). Este tipo de validade baseia-se na comparação entre os resultados obtidos no teste em questão e os resultados de algum critério externo que se acredita representar a característica que está sendo medida.
Por exemplo, se um teste é projetado para medir o desempenho acadêmico em matemática, os pesquisadores podem usar as notas finais dos alunos em matemática como critério externo. A validade empírica ou de critério seria estabelecida pela correlação entre as pontuações dos alunos no teste e suas notas finais em matemática.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quais os dopis conceitos em que se divide a validade empírico

A

Pode ser subdividido em dois conceitos – validade externa preditiva e valida concomitante ou concomitiva
Concomitante – falamos neste tipo de validade quando se verifica uma simultaneidade no tempo entre a aplicação, do teste e a obtenção das notas reportas ao critério. Por exemplo, se você estiver desenvolvendo um teste de habilidade matemática para alunos do ensino médio, você pode administrar o teste para um grupo de alunos e, ao mesmo tempo, coletar suas notas finais de matemática. Em seguida, você calcularia a correlação entre as pontuações no teste e as notas de matemática.
Preditiva – coeficientes obtidos através de estudos onde a informação relativa a prova e ao critério não são obtidas em simultâneo e, por norma, a informação do critério externo é posterior Por exemplo, a capacidade de um teste de admissão universitária de prever o desempenho acadêmico futuro dos estudantes na universidade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

indica e explicita em que quatro pontos se assenta a validade empírica

A
  1. Significado e Relevância: A validade externa ou de critério é significativa porque avalia até que ponto os resultados do teste estão relacionados a resultados em critérios externos, como desempenho acadêmico, sucesso no trabalho, comportamento social, entre outros. A relevância dessa validade está em garantir que os resultados do teste tenham aplicabilidade e valor prático além do contexto específico do teste.
  2. Correlação / Diferença de Grupos no Critério Externo: A validade externa pode ser estabelecida pela correlação entre as pontuações do teste e os resultados em um critério externo. Quanto mais alta a correlação, mais forte é a evidência de validade externa. Além disso, diferenças significativas nos resultados do critério externo entre grupos que pontuam alto e baixo no teste também podem indicar validade externa.
  3. Método Temporal de Cálculo: Preditiva e Concorrente: Existem dois métodos temporais para calcular a validade externa: preditiva e concorrente.
    * Validade Preditiva: Neste método, o teste é administrado primeiro, e os resultados são posteriormente comparados com os resultados em um critério externo que ocorre no futuro. Por exemplo, a pontuação em um teste de admissão universitária pode ser usada para prever o desempenho acadêmico dos alunos na universidade.
    * Validade Concorrente: Neste método, o teste e o critério externo são medidos simultaneamente, e a correlação entre eles é calculada. Este método é frequentemente usado quando é impraticável ou impossível realizar uma medida preditiva.
  4. Critérios Externos de Validação: Diversidade e Escolha: É importante considerar uma variedade de critérios externos para validar um teste, especialmente se o construto medido pelo teste tem múltiplas dimensões ou aspectos. Além disso, os critérios externos devem ser escolhidos com cuidado para garantir que sejam relevantes, confiáveis e válidos em relação ao construto sendo medido pelo teste.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Em que consiste a validade interna

A

É a expressão mais recente no estudo da validade de resultados e tem vários pontos que podem integrar a sua definição. Mas basicamente o que está em causa é o grau de consonância entre os resultados do teste, a teoria a prática para o proposto das dimensões em avaliação.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quais os elementos que fazem parte da validade interna

A
  1. Análise Fatorial ou Componentes: A análise fatorial é uma técnica estatística que visa identificar os padrões subjacentes (fatores) entre um conjunto de variáveis observadas. Ela procura reduzir a dimensionalidade dos dados ao agrupar variáveis semelhantes em fatores latentes ou componentes. A análise de componentes principais é uma variação comum da análise fatorial – parte-se das intercorrelações entre os itens ou entre resultados num conjunto de provas para se identificarem as componentes gerais que possam explicar a variância comum neles encontrada
  2. Análise Fatorial Exploratória e Confirmatória: Na análise fatorial exploratória, o pesquisador não possui hipóteses específicas sobre a estrutura subjacente dos dados e busca identificar os padrões de forma exploratória. Já na análise fatorial confirmatória, o pesquisador testa um modelo pré-especificado de como as variáveis estão relacionadas aos fatores.
  3. Dimensionalidade do Constructo: Refere-se ao número de fatores ou dimensões que são necessários para representar adequadamente a estrutura subjacente dos dados. Determinar a dimensionalidade correta do constructo é essencial para uma interpretação precisa dos resultados da análise fatorial.
  4. Número de Fatores: Valor-Próprio e Variância Explicada: O número de fatores pode ser determinado examinando-se o valor-próprio (eigenvalue) de cada fator. O valor-próprio é uma medida da variância total explicada por cada fator. Além disso, a quantidade total de variância explicada pelo modelo fatorial também é importante para avaliar a adequação do número de fatores.
  5. Comunalidade e Saturação: A comunalidade é uma medida da proporção de variância em uma variável que é explicada pelos fatores comuns. Uma comunalidade alta indica que a variável está bem representada pelos fatores. A saturação é uma medida da correlação entre uma variável observada e um fator latente. Quanto maior a saturação, mais a variável está associada ao fator.
17
Q

Nos testes referenciados a normas indica o que sao as conversoes lienrares, explica recorrendo ao teste de qi

A

Os resultados dos testes referenciados a normas são geralmente convertidos em escalas padronizadas, como percentis, scores Z (pontuações que indicam quantos desvios padrão um determinado resultado está acima ou abaixo da média). Calculado com recurso a média, ao dp e a nota obtida. No final obtém-se um determinado valor que indica quantos desvios padrão está, acima ou abaixo. Pessoas com características especiais tem desvio padrão de dois ou mais para qualquer dos sentidos
Os resultados dos testes de QI são frequentemente convertidos em uma escala padronizada, onde a média é definida como 100 e o desvio padrão como 15. Isso significa que a pontuação média de QI é considerada 100 e a maioria das pessoas (cerca de 68%) tem um QI entre 85 e 115, que está dentro de um desvio padrão da média.
A conversão linear é realizada para padronizar os resultados e facilitar a interpretação. Por exemplo, uma pessoa que obtém um QI de 130 está dois desvios padrão acima da média, enquanto alguém com um QI de 70 está dois desvios padrão abaixo da média.

18
Q

Qual a forma do calculo da nota z

A

xi - nota
dp - desvio padrao
M - média
Nota z = (xi - media)/dp