O que é a confiabilidade (ou fidedignidade) de um teste
A confiabilidade é o grau em que um teste mede de forma consistente: se repetido em condições semelhantes, daria um resultado parecido e não casual.
A confiabilidade — também chamada de fidedignidade — é o grau em que um teste mede de forma consistente: se fosse repetido em condições semelhantes, daria um resultado parecido e não dependente do acaso. É uma das duas propriedades-chave de qualquer avaliação séria, junto com a validade. Responde a uma pergunta simples: este resultado é estável, ou mudaria se a pessoa fizesse o teste outra vez?
Confiabilidade e fidedignidade: o mesmo conceito
Antes de avançar, um esclarecimento que evita confusão: confiabilidade e fidedignidade são a mesma coisa. Ambas traduzem o termo em inglês reliability. São formas diferentes de nomear o mesmo conceito, sem nenhuma diferença técnica entre elas.
Por que importa: a margem de erro
Nenhum teste psicológico mede sem erro. O cansaço, a concentração do dia, uma pergunta mal interpretada ou o simples acaso introduzem variação. A confiabilidade estima quanto de um resultado é sinal estável e quanto é ruído. Quanto mais confiável é um teste, mais confiança podemos ter de que a pontuação reflete algo real e não o momento pontual.
A relação com a validade
Confiabilidade e validade não são a mesma coisa, e convém não confundi-las:
| Confiabilidade | Validade | |
|---|---|---|
| Pergunta | Mede de forma consistente? | Mede o correto? |
| É | Consistência | Pertinência |
| Relação | Necessária para a validade | Requer confiabilidade, mas também algo mais |
Um teste pode ser consistente e ainda assim inválido, mas não pode ser válido se não for consistente. Por isso a confiabilidade é o primeiro requisito, não o último. Complementa-o o que é a validade de um teste.
Veja como construímos testes pensados para dar sinal estável.
Ver a ciência por trásEm resumo
A confiabilidade (ou fidedignidade) é a consistência com que um teste mede: se fosse repetido, daria um resultado parecido. Estima quanto de uma pontuação é sinal estável e quanto é ruído, por isso convém ler os resultados como faixas, não como cifras exatas. É distinta da validade — consistência frente a pertinência — e é um requisito prévio para ela. No Kokoro, os testes da biblioteca são pensados para entregar sinal estável e comparável; você pode ver a abordagem em a ciência por trás.