Psicometria 2 B Flashcards

Question

Come scegliamo quanti fattori estrarre?

Answer 1

* Criterio di Kaiser --> estraiamo tutti i fattori con autovalore superiore a 1--> si basa sul fatto che fattoi con autovalori inferiori di 1 non sono in grado di spiegare nemmeno la varianza di una singola variabile. Tuttavia questo metodo tende a sovrafattorializzare quando ci sono molte variabili e a sottofattorializzare quando ce ne sono poche. è sconsigliato il suo uso di default. * Scree test--> una rappresentazione della curva decrescente degli autovalori. SI individua l'autovalore oltre il quale la curva si appiattisce e si conservano solo gli autovalori precedenti * Analisi parallela--> vengono calcolati autovalori in dati casuali con lo stesso numero di variabili in un numero sufficientemente ampio di campioni casuali. Dunque si confrontano gli autovalori simulati con quelli osservati e si conservano solo quelli che superano i valori della simulazione casuale. * Criteri teorici --> es. nella teoria dei big five la teoria vuole che ci siano 5 fattori

Answer 2

Unicità: indica la quota di varianza non spiegata dalle componenti per la singola variabile Comunalità: 1-unicità--> cioè la quota di varianza che i fattori riescono a spiegare

Answer 3

Lettura orizzontale: per variabili--> posso dire quale componente cattura maggiore quota di variabilità per una data variabile Lettura verticale: per componenti--> possiamo capire che cosa rappresentano le varie componenti

Answer 4

Berlett: Test di adeguatezza del campione, se è significativo ho un numero di casi sufficientemente elevato per applicare la mia tecnica di analisi KMO: indica il grado di correlazione tra una variabile e tutte le altre. Non ha senso procedere con tecniche di riduzione dei dati se le variabili non sono affatto correlate tra loro. Il cut-off deve essere quanto più vicino possibile a 1, è accettabile se raggiunge almeno lo 0.60. Se la variabile non raggiunge questo livello, quell’item non correla con le altre (quindi non ha senso supporre che sia sotteso insieme ad altre variabili dallo stesso fattore)

Answer 5

Una matrice delle componenti principali ottenuta dall’estrazione spesso NON si presta a facile interpretazione, così i contenuti della matrice R rimangono oscuri. La rotazione serve a produrre una matrice delle componenti che sia interpretabile. Matrice estratta e matrici (potenzialmente infinite) ruotate sono matematicamente equivalenti. Il criterio privilegiato per la rotazione è noto come STRUTTURA SEMPLICE: ogni componente deve essere definita da poche saturazioni elevate, mentre le restanti devono approssimarsi a 0 ovvero ogni variabile deve presentare una saturazione elevata su una sola componente e saturazioni basse (max .30) sulle altre componenti.

Answer 6

Esistono: -metodi analitici di rotazione (ciechi, si basano su un algoritmo matematico): • Varimax--> rotazione che preserva l’ortogonalità degli assi. • Oblimin--> soddisfa le regole della struttura semplice ma rompendo il vincolo di indipendenza tra i fattori, si rompe il vincolo di ortogonalità, i fattori possono risultare correlati tra di loro (devo comunque assicurarmi che siano il più indipendenti possibile gli uni dagli altri). La conseguenza di una rotazione obliqua OBLIMIN è che la saturazione fattoriale non riflette più solo il legame unico che intercorre tra la variabile e la componente, ma anche quella che esiste tra le due componenti. Se le due componenti sono molto legate tra loro, possiamo presupporre che potrebbero racchiudere un unico fattore. -rotazioni grafiche e manuali: • L’angolo di rotazione viene scelto da chi analizza i dati, in accordo con una struttura teorica attesa o teoricamente sensata, anche in violazione del principio della struttura semplice.

Answer 7

l’obbiettivo di questa tecnica è di spiegare le covariazioni che individuiamo tra le variabili analizzando la parte di varianza comune, togliendo la parte di varianza inaffidabile e se possibile togliendo la parte di varianza che non viene condivisa. Se le variabili ancora correlano tra di loro, questo accade in virtù del fatto che c’è un fattore latente che è responsabile per la loro covariazione, che nei modelli più forti è visto in termini causali. Nel caso dell’analisi fattoriale la scomposizione della varianza è differente. Si lavora sui valori messi in diagonale sulla matrice delle intercorrelazioni. Ricordiamo che nell’analisi delle componenti principali, lungo la diagonale ci sono i valori di 1, il che significa inserire il 100% della varianza osservata di quella variabile, sia quella comune, sia quella valida ma specifica (ovvero non condivisa), sia la parte inaffidabile del punteggio. Nell’analisi fattoriale lavoriamo sui valori da inserire nella diagonale, che non sarà più 1, ma che potrà invece essere un coefficiente di correlazione multiplo o un coefficiente Alpha di Cronbach. - se inseriamo lungo la diagonale l’Alpha di Croanbach (indicatore quantitativo per l’affidabilità sulla coerenza interna, quando abbiamo un'unica misurazione) vuol dire che stiamo inserendo la quota di varianza affidabile che quella variabile condivide con le altre variabili, togliendo la variabilità che è inaffidabile, che invece nelle analisi delle componenti viene mantenuta. - Se inseriamo un coefficiente di correlazione multiplo lungo la diagonale vuol dire che inseriamo solo la parte della varianza comune (es: fattorializzo quella parte di variabilità di X1 che X2 e X3 sono in gradi di spiegare eliminando quella parte di variabilità di X1 che X2 e X3 non sono in grado di spiegare). Scelgo di mettere in analisi solo quella parte di varianza che ogni singola variabile condivide con le altre. In questo modo elimino tutta la variabilità unica che non viene condivisa tra gli stimatori.

Answer 8

il criterio della minima correlazione residua e della massima verosimiglianza. Questi due criteri costituiscono un altro modo per decidere quante componenti estrarre (al di là dello scree test e dell’analisi parallela), usato nelle tecniche di analisi confermative. Si considera la differenza che corre tra la matrice originale delle intercorrelazioni e quella che siamo in gradi di riprodurre. Se le tecniche di analisi fattoriale si propongono di ridurre l’informazione delle variabili attraverso i fattori, il problema rimane: quanto bene abbiamo riprodotto la matrice originale da poter pensare di aver recuperato da essa la maggior informazione possibile? Così confronto R con R*. La differenza tra le due produrrà una terza matrice (matrice dei residui) che rappresenta ciò che non sono riuscita a catturare, a spiegare attraverso la soluzione fattoriale. Se estraiamo tante componenti quante sono le variabili, allora tramite una moltiplicazione possiamo riprodurre completamente la matrice R. • AA+=R Se moltiplico la matrice fattoriale (A), cioè delle componenti estratte nel caso in cui abbia estratto tante componenti quante sono le variabili con tecnica delle analisi delle componenti, con la sua trasposta (A+), che sarebbe la matrice R rovesciata (le colonne diventano righe e viceversa), ottengo la matrice R. Se invece non estraggo tante componenti quante sono le variabili, ma mi fermo prima, moltiplicando A (estratta e ruotata in modo ortogonale, Varimax) per A+ ottengo una matrice R* che non replicherà completamente quella originale perché ho lasciato fuori un po’ di varianza. Se invece prendessi il modello dell’analisi fattoriale (cioè quello che non ha gli 1 sulla diagonale) sempre nel caso in cui ho estratto tante componenti quanto sono le variabili, per poter riprodurre la matrice R non mi basta moltiplicare A per A+, devo aggiungere anche U, ovvero quella quota di variabilità unica che viene esclusa dall’analisi fattoriale, quella che è stata scorporata Criterio della minima correlazione residua: mi dice quando fermare l'estrazione di componenti, ovvero quando la matrice dei residui non presenta più valori statisticamente differenti dallo zero. Criterio della massima verosimiglianza: si testa l'ipotesi H0: R=R* Abbiamo degli indici quantitativi di fit per testare l’ipotesi. Se questi indicatori raggiungono o superano dei livelli prestabiliti possiamo respingere l’ipotesi nulla, il che in questo caso è un male, perché vuol dire che le due matrici sono diverse e quindi c’è una buona parte di varianza che non ho catturato con la mia soluzione fattoriale.

Answer 9

Goodness of fit si basa sul chi quadro. per un buon fit deve essere superiore a .90 / .95 GFI per un buon fit deve essere superiore a .90 / .95 AGFI (adjasted of goodness) per un buon fit deve essere superiore a .90 / .95 RMSEA (root mean square error) per respingere H0 deve superare il cut off di 0.08. più è piccolo, migliore la soluzione fattoriale. Fit perfetto=0 TLI per un buon fit deve essere superiore a .90/ 0.95 il chi quadro viene trascurato come indice di fit, perché il chi quadro è sensibile ai gradi di libertà, e quindi al numero di variabili fattorializzate. Perciò se lavoriamo con molte variabili fattorializzate, soprattutto se abbiamo un grande campione, è facile che il p value del chi quadro risulti sempre significativo.

Answer 10

1-Dalla matrice R si calcola il 1° vettore di prova (Ua1) 2-Dal Ua1 si calcola la 1° radice caratteristica 3-Dividendo Ua1 per la 1° radice caratteristica si ottiene il 1° vettore caratteristico (Va1) 4-Si moltiplica Va1 per la matrice R da cui si ottiene il 2° vettore di prova (Ua2) 5-Da Ua2 si calcola la 2° radice caratteristica 6-Dividendo Ua2 per la 2° radice caratteristica si ottiene un 2° vettore caratteristico (Va2) 7-Si controlla se Va1 e Va2 coincidono, se non coincidono si procede con gli stessi procedimenti di cui al punto 4 finché non si trovano due vettori caratteristici che coincidono. 8-Il primo vettore caratteristico della matrice, o autovettore, è il primo da cui segue un vettore identico. E la radice generata dal vettore di prova da cui è stato calcolato l'autovettore è l'autovalore, o radice caratteristica della matrice. Quindi se l'autovettore è Va3, l'autovalore è stato ricavato da Ua3

Answer 11

Variabile moderatrice: la relazione tra X e Y si dice moderata da Z: L’intensità della relazione tra Y e X varia in funzione dei livelli di VMod (Z) Variabile interveniente: la relazione tra VD e VI (Y e X) è indiretta: X si associa a Y per la variabile interveniente (Z) che si associa a entrambe e precede entrambe logicamente. La parte di variabilità che X spiega di Y in realtà è dovuta a Z Variabile mediatrice: la relazione tra VD e VI (Y e X) è indiretta: X agisce su Y (almeno in parte) attraverso la variabile mediatrice (Z). Quindi in questo caso, X precede logicamente Z, non il contrario. X ha un impatto su Z e Z trasferisce il suo effetto su Y.

Answer 12

Se voglio parzializzare Z da X e Y basta calcolare la componente indiretta di Z (moltiplicando la correlazione semplice che ha con X, con la correlazione che Y ha con X) e poi sottrarre dalla correlazione che Z ha con Y la componente indiretta.

Answer 13

1-R2 --> la quota di varianza che X e Y non condividono

Answer 14

Devianza dovuta alla regressione: sommatoria di Y atteso meno Y medio alla seconda Devianza residua: sommatoria degli errori di stima (Yi osservato – Y atteso) alla seconda Devianza totale: sommatoria di Y osservato meno Y medio alla seconda

Answer 15

- Dare sempre una spiegazione delle risposte aperte - Quando chiede l'eq. di previsione dobbiamo esplicitare chi è cosa: Y=a+ b associato alla depressione, rappresenta la relazione tra depressione e VD, ripulito dell'età + b associato all'età, rappresenta la relazione tra età e VD, ripulito della depressione - Quando chiede che stimatore guarderemmo per trovare un'informazione, dobbiamo sempre concludere che guarderemmo quel dato stimatore "se fosse statisticamente significativo" - Aggiungere sempre se la relazione è positiva o negativa quando possiamo inferirlo - Nell'output indicare esplicitamente a che indicatori ci si sta riferendo - in modello di regressione multipla, quando parliamo della variabilità spiegata (o non spiegata) da una variabile, dobbiamo sempre concludere con "rispetto alle altre variabili" (es: la variabile età non aggiunge una quota di varianza significativa rispetto alle altre variabili) - "Interazione" è una trappola. non l'abbiamo studiata, non usare questa parola e se ti chiede se qualcosa interagisce la risposta è sempre no.