Glossario
Indice dei termini utilizzati
A
È il più noto coefficiente di attendibilità che valuta la consistenza interna di un test psicologico composto da item a scelta multipla. È stato proposto da Cronbach nel 1951.
Insieme delle procedure utili alla valutazione degli item di un test. Viene svolta attraverso il calcolo degli indici statistici di difficoltà, valore medio, deviazione standard, selettività, attendibilità e validità. L'insieme complessivo degli item viene esaminato mediante l'analisi della distribuzione e si opera una scelta degli item che offrono un maggior contributo riguardo all'attendibilità di un test.
E' un insieme di tecniche statistiche facenti parte della statistica inferenziale che permettono di confrontare due o più gruppi di dati attraverso la comparazione delle loro medie aritmetiche. Analizza infatti la variabilità dei valori medi all'interno di ciascun gruppo e tra i gruppi stessi. Quest'analisi permette di indagare l'effetto della variazione dei fattori sulla variabilità dei risultati sperimentali del sistema sotto osservazione, determinando quale variazione è imputabile ai fattori stessi e quale ad effetti casuali (ad esempio: valutare il peso dei soggetti rispetto alla loro origine geografica).
Tecnica multivariata (che prende in esame più variabili insieme) di analisi dei dati che consente, partendo dalle intercorrelazioni tra le variabili considerate, di individuare fattori comuni non direttamente misurabili ma che sono spiegati dalle variabili osservate. In questo modo è possibile ridurre le dimensioni in gioco perché le variabili tendono ad assemblarsi in fattori numericamente inferiori. L'analisi fattoriale ha contribuito a capire l'organizzazione e le componenti dell'intelligenza, degli atteggiamenti e della personalità.
E' un indice che mira a valutare quanto una distribuzione è simmetrica intorno al valore medio. Per convenzione se i valori si distribuiscono su una coda più lunga verso i valori inferiori alla media, si parla di asimmetria negativa, se invece la coda è più lunga verso i valori alti ci sarà un'asimmetria positiva. L'asimmetria nulla caratterizza una distribuzione normale.
E' il grado di affidabilità con cui il test misura e la costanza delle sue misurazioni, che devono fornire risultati identici quando il reattivo viene somministrato ripetutamente allo stesso individuo nelle stesse condizioni. Si parla di attendibilità riferendosi a strumenti in cui l'errore di misura è insignificante, gli item risultano equivalenti ed è presente un buon livello di consistenza interna.
B
Un certo numero di test somministrati ad un soggetto per ottenere un report che delinea varie caratteristiche psicologiche.
C
E' un sottoinsieme di una popolazione sul quale si conduce una ricerca, dal momento che spesso è impossibile o troppo costoso condurla sull'intera popolazione. Il campione deve essere rappresentativo della popolazione alla quale il test si riferisce e può essere: a) casuale (random), quando ciascun elemento (e ciascuna combinazione di elementi) ha uguale probabilità di essere selezionato; b) stratificato (stratified), quando la popolazione viene prima divisa in strati (ad esempio: studenti del 1°, 2°, 3° anno) e successivamente si effettua un campionamento casuale all'interno di ciascun strato; c) sistematico (systematic), quando viene selezionato un soggetto ogni k soggetti (di solito non il primo soggetto scelto casualmente), dove k è una qualsiasi costante.
Valuta la differenza tra distribuzioni di frequenze. Serve a stabilire se la distribuzione di dati a livello nominale in più di due classi sia dovuta al caso o alla presenza di una qualsiasi influenza. Permette inoltre di verificare l'esistenza di una relazione tra due o più distribuzioni classificate secondo due o più categorie.
Coefficiente di correlazione, tra due somministrazioni di un test, che misura il grado di attendibilità di un test. Tale correlazione può essere calcolata rispetto all'attendibilità di forme parallele, test- retest, ecc.
Un coefficiente di consistenza interna che si basa sulla correlazione tra i punteggi ottenuti alle due metà del test. Tale correlazione deve essere corretta con la formula di Spearman-Brown.
Si ottiene dalla somministrazione di uno stesso test una seconda volta allo stesso gruppo dopo un intervallo di tempo e dalla correlazione dei due punteggi.
Un indice di attendibilità di punteggi ad un test derivati da intercorrelazioni statistiche di risposte fra risposte o punteggi ad item in parti separate di un test.
Indice del grado di relazione tra due variabili o tra due misure registrate sullo stesso campione di individui. L'indice varia da -1 (perfetta correlazione negativa, vale a dire al crescere della variabile 1 corrisponde il decrescere della variabile 2) a +1 (perfetta correlazione positiva, vale a dire le due variabili variano nello stesso modo, ad esempio: al crescere della prima cresce anche la seconda), con 0 che significa assenza di relazione. L'indice può essere interpretato in termini di grado di somiglianza tra due misure.
La tendenza di alcuni valori o livelli di una variabile ad associarsi ad alcuni valori o livelli di un'altra variabile.
Il concetto o la caratteristica che il test intende misurare.
E' un indice che mira a rilevare quanto una distribuzione è piatta oppure appuntita rispetto a quella normale. È un indice che varia da -3 a 3, in cui il valore 0 corrisponde a una distribuzione normale o mesocurtica. Distribuzioni con picchi piatti e code ampie sono chiamate "platicurtiche" (e l'indice è negativo), mentre quelle con picchi alti e code piccole sono chiamate "leptocurtiche" (e l'indice è positivo).
D
Valori numerici ricavati dalla fase di raccolta dei dati, non ancora sottoposti ad elaborazioni né a trasformazioni.
Uno dei nove punteggi che divide una distribuzione in dieci parti, ognuna contenente un decimo di tutti i punteggi dei casi; ogni decimo percentile. Il primo decile è il 10° percentile, l'ottavo decile è l'80° percentile, ecc.
La tendenza, da parte di chi risponde ad un test, a cercare di apparire migliore e socialmente "più desiderabile" di quello che realmente è. È una variabile presente soprattutto nell'analisi della personalità.
Somma dei quadrati degli scarti dalla media.
Una misura della variabilità o dispersione di una distribuzione di punteggi; più questi si trovano vicino al valore medio, più piccola sarà la DS. È la misura di dispersione di una distribuzione di scale ad intervalli o a rapporti più usata. La DS è la radice quadrata della varianza.
Organizzazione dei punteggi in una tabella in cui accanto a ciascun valore di una variabile viene mostrato il numero di volte in cui tale valore si presenta (frequenza) nel gruppo della popolazione data.
E' una famiglia di distribuzioni di frequenze che assume la forma a campana più o meno schiacciata al variare dei valori della media e della varianza. È nota anche come gaussiana o curva di Gauss ed ha le seguenti proprietà: 1) è simmetrica intorno al valore della media; 2) la moda, la mediana e la media coincidono tra loro e corrispondono all'apice della curva; 3) l'area compresa al di sotto della curva è uguale a 1 e la frequenza dei valori decresce allontanandosi dalla media.
E
E' la stima della deviazione standard dei punteggi osservati di un soggetto dopo infinite somministrazioni ad un test (o a forme parallele di un test) nelle stesse identiche condizioni. Poiché tali dati non possono essere generalmente misurati, l'errore standard di misura è generalmente stimato a partire da un gruppo di dati.
Consiste in una stima dell'età cronologica che un certo soggetto dovrebbe avere sulla base del confronto della sua prestazione con quella media di un campione rappresentativo di individui tra loro della medesima età. Ad esempio un bambino di otto anni ha una età mentale di 10 nel senso che risolve compiti che sono risolti usualmente da bambini di 10 anni (e non di 8).
F
Qualsiasi variabile, reale o ipotetica, che è un aspetto di un concetto o di un costrutto. Nella teoria della misurazione, una dimensione statistica definita dall'analisi fattoriale che sintetizza un numero di variabili più vasto (ad esempio: il tratto mentale che è spiegato da variabili come la capacità verbale, numerica, ecc.).
Due test che hanno uguale media, varianza, intercorrelazione tra gli item e validità, ma item diversi pur dello stesso tipo.
Coefficiente di valutazione della consistenza interna di un test psicologico composto da item dicotomici.
G
Rappresentano il numero di possibilità che i dati che compongono un campione hanno di variare liberamente.
E' un gruppo di soggetti, scelto in maniera casuale, al quale non viene somministrato lo stimolo sperimentale. I dati raccolti dal gruppo di controllo vengono confrontati con quelli rilevati dal gruppo sperimentale al fine di rilevare se sussistono le differenze significative tra i due.
E' il gruppo a cui viene somministrato lo stimolo sperimentale. Si procede poi confrontando i dati ottenuti con quelli del gruppo di controllo o di un altro gruppo sperimentale che ha avuto uno stimolo sperimentale diverso, al fine di valutare eventuali differenze.
I
Il valore medio del cambiamento nei punteggi ad un test che avviene oltre un intervallo di tempo specifico per soggetti con determinate caratteristiche individuali, come l'età o il livello scolastico.
Un'interpretazione di un punteggio basata sul confronto della performance di una persona ad un test rispetto a quelle di altre persone in una specifica popolazione di riferimento.
Un intervallo o un range di valori che ha specifica probabilità di contenere il valore o l'oggetto di stima; i più usati sono il 95% e il 99%.
Metodo basato su domande e interazioni verbali in cui l'intervistatore lascia rispondere liberamente l'intervistato per raccogliere informazioni. Può essere di vari tipi: a) non strutturata (unstructured), in cui l'intervistatore specifica soltanto l'argomento senza indagare con precisione alcuna particolare domanda o modalità di risposta prefissata; b) semistrutturata (semistructured), in cui l'intervistatore gode di una certa discrezionalità nel decidere quali domande porre e quale tipo di modalità di risposta utilizzare; c) strutturata (structured), in cui l'intervistatore pone una serie di domande già predisposte nel contenuto, nell'ordine e nella modalità di risposta.
Lista di domande o affermazioni poste a soggetti che devono indicare il grado di accordo o di disaccordo per studiarne la personalità, gli atteggiamenti e gli interessi.
E' la singola unità di cui è costituito un test. In psicologia, i problemi, le domande, i compiti sottoposti agli individui vengono genericamente chiamati in questo modo.
M
Un termine generale applicato a varie misure di tendenza centrale. Le tre medie più comunemente usate sono la media aritmetica (mean), la mediana e la moda. Quando il termine "media" è usato senza designare una tipologia, l'assunzione più facile da fare è che si tratti di media aritmetica.
E' ottenuta dividendo la somma di un gruppo di punteggi per il loro numero.
Il punteggio centrale in una distribuzione o in un gruppo di punteggi ordinati che divide il gruppo in due parti uguali, lasciando metà gruppo o popolazione alla sua sinistra e l'altra metà alla sua destra. Ad essa corrisponde il 50° percentile (il valore al di sopra e al di sotto del quale si trova il 50% dei punteggi).
Il punteggio o il valore che capita più frequentemente in una distribuzione.
Cambiamenti fatti nel contenuto, nell'impaginazione e/o nella procedura di somministrazione di un test per somministrarlo a persone che non sono in grado di svolgerlo in condizioni standard.
N
Il simbolo comunemente usato per rappresentare il numero di casi in un gruppo.
Il simbolo comunemente usato per rappresentare il numero di casi di sottogruppi del gruppo generale.
Lista di punteggi di vario tipo che riassume la distribuzione della performance in un test per uno o più gruppi (ad esempio: per soggetti di varie età e livello scolastico). Le norme generalmente sono rappresentative di popolazioni più ampie. Il gruppo esaminato rappresentato dalle norme è denominato "popolazione di riferimento".
O
Modalità di rilevazione dei dati basata sull'annotare la frequenza di un particolare evento, spesso di tipo comportamentale. Può essere sperimentale, vale a dire progettata e caratterizzata dal controllo delle variabili oppure naturale, in cui le condizioni dell'osservazione non sono programmate. Si parla anche di osservazione partecipante nel caso in cui il ricercatore fa parte del gruppo di indagine e partecipa a tutte le attività.
P
I percentili sono valori di posizione che dividono una distribuzione di frequenze osservate in cento parti uguali (con lo stesso numero di casi). I punteggi variano da 1 a 99 e il valore di 50 corrisponde alla mediana. Ad esempio, se il 30% dei soggetti di un campione esaminato in una certa prova ha raggiunto un punteggio inferiore o uguale a 74 punti, in questo caso il rango percentile di 74 è 30 e 74 corrisponde al 30° percentile.
La popolazione di persone che ha risposto ad un test rappresentata dalle norme del test. Il campione sul quale sono basate le norme deve permettere una stima accurata della distribuzione del punteggio al test per la popolazione di riferimento. La popolazione di riferimento può essere definita in termini di età, livello scolastico, status clinico al momento della compilazione del test o in base ad altre caratteristiche.
Rappresentazione grafica dei punteggi standardizzati di una persona ottenuti ad un test, più test o prove.
Una serie di attributi intercorrelati (ad esempio: comportamenti, atteggiamenti, valori) che sono inclusi nella definizione di un costrutto.
Qualsiasi numero specifico risultante dalla valutazione di una persona.
Un punteggio che deriva dalla combinazione di alcuni punteggi secondo una specifica formula.
Un punteggio in cui i punteggi grezzi sono convertiti con una trasformazione numerica (ad esempio: conversione di punteggi grezzi in ranghi percentili o punteggi standardizzati).
Punteggio ottenuto dal soggetto in un test scaturito dalla correzione dello stesso, prima di subire qualsiasi trasformazione (ad esempio: numero di risposte esatte date da un soggetto). Ad esempio, se un test ha 59 item e lo studente ha risposto correttamente a 23 item il punteggio grezzo è di 23. I punteggi grezzi presi come tali hanno un significato minimo o nullo, pertanto devono essere trasformati in altri tipi di punteggio (ad esempio: rango percentile, stanine, ecc.) per essere interpretati.
E' un punteggio derivato da un punteggio grezzo originale in un test. I punteggi ponderati possiedono proprietà matematiche che li rendono misurabili in più modi. Generalmente questi punteggi hanno la caratteristica di essere equidistanti tra di loro.
Un tipo di punteggio derivato cosicché la distribuzione di questi punteggi per una specifica popolazione possiede valori conosciuti partendo dalla media e dalla deviazione standard. Il termine è qualche volta usato per indicare una media di 0 e una deviazione standard di 1.
Un punteggio derivato da un test in cui la trasformazione numerica è stata scelta in modo tale che la distribuzione del punteggio si avvicina molto alla distribuzione normale per una specifica popolazione (punti T, sten, punti z)
Nella teoria classica dei test, la media dei punteggi che dovrebbe ottenere una persona in un numero indeterminato di forme perfettamente parallele dello stesso test. Nella teoria di risposta agli item, il valore di errore-libero della capacità di una persona.
E' un punteggio ottenuto come trasformazione lineare dei punti z in modo da avere per convenzione media 50 e deviazione standard 10.
E' un punteggio che esprime la distanza di un punteggio grezzo dalla media (che assume il valore 0), utilizzando come unità di misura la deviazione standard. Si ottiene sottraendo la media del gruppo dal punteggio grezzo del soggetto e dividendo il risultato per la DS.
Q
Un insieme di domande che riguardano comportamenti, opinioni interessi o sentimenti a cui il soggetto può rispondere in modo libero (domande aperte) oppure scegliendo tra risposte alternative (domande chiuse).
E' il rapporto (da qui il termine quoziente) tra età mentale ed età cronologica moltiplicato per 100. Può anche essere ottenuto come trasformazione lineare dei punti z in modo da avere media 100 e deviazione standard 15 o 16. Il QI è utilizzato nei test di intelligenza.
R
Assegnazione casuale dei soggetti ad un esperimento.
Indica la posizione che un punteggio occupa nella distribuzione trasformata in percentuali. Rango 30° significa che il 30% dei punteggi ottenuti sono uguali o minori a quello (graduatorie, scale ordinali).
Procedura matematica applicata all'analisi fattoriale che permette la riduzione dell'ambiguità di interpretazione e la migliore definizione dei fattori, trovando le saturazioni più alte di ciascuna variabile con un solo fattore.
S
Indica il livello di correlazione tra una variabile e ciascun fattore in un'analisi fattoriale.
E' una serie di item o subtest usati nella misurazione ed è diversa da un test nel tipo di caratteristiche che vengono misurate. La caratteristica o proprietà che viene così valutata è considerata unidimensionale e se ne ricava solitamente un punteggio quantitativo. Può anche indicare un livello di misura in cui i valori assumono significati diversi e che possiede proprietà formali e matematiche specifiche. Le più usate in psicologia sono: a) nominale (nominal scale), in cui i numeri hanno valori di etichette (ad esempio: sesso, regione di provenienza, ecc.); b) ordinale (ordinal scale), che offre la possibilità di ordinare gli oggetti o i soggetti in base ad una determinata caratteristica secondo la grandezza (ad esempio: livello di scolarità); c) a intervalli (interval scale), che permette di conoscere la quantità di differenza esistente tra soggetti o eventi relativamente alla variabile misurata; ha come origine il valore 0 e una unità di misura, entrambi convenzionali (ad esempio: temperatura, test d'intelligenza); d) a rapporti (ratio scale), in cui le variabili hanno di convenzionale solo l'unità di misura e in cui 0 significa assenza di proprietà (ad esempio: peso, distanza, età, ecc.).
Scala a più punti rispetto alla quale si deve indicare il grado di accordo agli item o la frequenza di determinati comportamenti o vissuti (da "sempre" a "mai").
Scala standardizzata di punteggi che variano da 1 a 9 con media uguale a 5 e deviazione standard uguale a 2.
T
Procedura statistica che valuta probabilisticamente la differenza fra medie.
1) Nella somministrazione di un test, mantenere costante l'ambiente dove si somministra il reattivo e condurre il test in accordo con specifiche regole, cosicché tali condizioni siano le stesse per tutti i soggetti;
2) Nello sviluppo del test, stabilire norme di valutazione basate sulla performance al test di un campione rappresentativo di soggetti.
Una misura di tendenza centrale fornisce un singolo punteggio rappresentativo di un gruppo di punteggi; il "trend" di un gruppo di misure come indicato da un tipo di media, usualmente la media o la mediana. È il modo di indicare la tendenza delle frequenze di una distribuzione a disporsi attorno al centro della distribuzione stessa. Le più comuni misure di tendenza centrale sono le cosiddette "misure di locazione" che comprendono le medie, la mediana e la moda. La rappresentatività della misura di centralità rispetto all'intera distribuzione è valutabile in funzione della variabilità: quanto più variabile è la distribuzione, tanto meno rappresentativa è la misura di centralità.
Strumento per la misura di variabili psicologiche.
Un test somministrato ad una persona che ha un tempo prestabilito per compilarlo.
Un test che stima la performance futura in alcuni settori che non necessariamente hanno una evidente similarità con i compiti presenti nel test. I test attitudinali sono spesso utili ad indicare la predisposizione di una persona ad apprendere o a sviluppare competenze in alcune aree particolari se vengono forniti un'educazione o un training. I test attitudinali non differiscono per forma o sostanza dai test di profitto, ma possono essere diversi nell'uso e nell'interpretazione.
L'uso di test standardizzati per valutare la performance di una persona nell'ambito cognitivo, psicomotorio o della funzionalità fisica.
Un test che misura il livello di performance non soggetto alla velocità della risposta. Gli item sono ordinati in base alla difficoltà crescente.
Un test per valutare il livello di conoscenza o di abilità di una persona in un determinato contesto oggetto di studio.
Un test in cui la performance è misurata da un numero di compiti svolti in un determinato tempo. Esempi sono i test di velocità di battitura e velocità di lettura o di velocità e precisione.
Un test che permette a chi lo usa di interpretare i punteggi in relazione al livello funzionale della performance, distinguendosi da quelle interpretazioni che sono fatte in relazione alla performance di altri.
V
Il processo attraverso il quale viene verificata la validità di un'interpretazione di punteggi ad un test.
E' la capacità di uno strumento di misurare la caratteristica che si vuole misurare.
Un test ha validità di contenuto quando è composto da item che comprendono tutti i comportamenti relativi alla caratteristica psicologica che si vuole misurare.
Il grado in cui le variabili misurano i costrutti presi in esame. Se un test ha validità di costrutto deve correlare in modo positivo o negativo con altre caratteristiche che sono legate al costrutto che il test ha l'obiettivo di misurare.
La capacità di un test di predire un comportamento futuro.
Rappresenta la percentuale di studenti che hanno risposto ad un determinato item in modo corretto al di fuori di un particolare gruppo della popolazione. Può essere calcolato per un campione nazionale, per una classe o per un livello scolastico dove un test è stato somministrato. Si calcola dividendo il numero di risposte corrette ad un item per il totale degli studenti testati. Potrebbe essere espresso come un valore decimale o come una percentuale (moltiplicando il valore decimale per 100).
Un metodo di calcolo del punteggio in cui ogni dimensione critica di performance è giudicata e misurata separatamente ed i valori ottenuti vengono successivamente combinati in un unico punteggio. In alcuni casi, i punteggi di dimensioni separate possono anche essere usati nell'interpretazione della performance. Ad esempio, una valutazione analitica di un tema di storia potrebbe includere le seguenti dimensioni: uso di conoscenze pregresse, applicazione corretta di principi, uso di fonti originali come materiale di supporto alla propria argomentazione, stesura scritta. Tutte queste dimensioni possono successivamente influire su un punteggio globale.
Il processo di raccolta sistematica dei punteggi ad un test e dei relativi dati al fine di preparare giudizi sulla performance di una persona in varie attività mentali coinvolte nei processi di acquisizione, ritenzione, concettualizzazione e organizzazione delle informazioni sensoriali, percettive, verbali, spaziali e psicomotorie.
Un metodo per ottenere un punteggio ad un test o ad un item di un test, basato sul giudizio della performance completa usando criteri specifici. Si contrappone a quella analitica.
Caratteristica che può assumere valori diversi sia di tipo numerico sia categoriale.
E' un indice di dispersione in quanto è nulla solo nei casi in cui tutti i valori sono uguali tra di loro (e pertanto uguali alla loro media) e cresce con il crescere delle differenze reciproche dei valori. Si calcola sommando i quadrati delle differenze ottenute sottraendo la media da ogni valore e dividendo il risultato per la numerosità del campione. Estraendo la radice quadrata della varianza, si ottiene la deviazione standard. Trattandosi di una somma di valori (anche negativi) al quadrato, è evidente che la varianza non sarà mai negativa.















