domande statistica Flashcards

1
Q

in una distribuzione asimmetrica positiva, la media e la mediana dove si trovano?

A

a dx della moda
ordine nella distribuzione asimmetrica:
MODA-MEDIANA-MEDIA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

quando in un raggruppamento scegliamo a caso un punto iniziale e successivamente ogni k-esimo elemento, che tipo di campionamento utilizziamo?

A

campionamento sistematico

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

quando in un campionamento almeno due gruppo (o strati) condividono le stesse caratteristiche:

A

campionamento stratificato

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

quale variabile può essere definita quantitativamente DISCRETA?

A

numero di posti letto in un ospedale

no: età, peso, glicemia

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

data la sequenza di distribuzione. 10, 3,8, 10,10,8,7,2,1

il valore 8 è?

A

la mediana
MEDIANA
si ordinano i numeri (n) in ordine crescente (o decrescente);
se il numero di dati è dispari, la mediana corrisponde al valore centrale, ovvero al valore che occupa la posizione (n + 1) / 2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

un ricercatore presenta la pressione di 70 pazienti, come presenta le misure per poter fornire informazioni efficaci?

A

media e deviazione standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

il limite della mediana è:

A

può assumere un valore che non appartiene al campione

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

il limite della media è:

A

nel calcolo risente dei valori estremi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

studio di 4 genotipi differenti, qual è la probabilità che venga estratto il genotipo Aa?

A

lo spazio campionario è dato da 4 genotipi, quindi la probabilità a priori se gli eventi che possono verificarsi sono tutti equiprobabili, allora la probabilità è 1/4

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

probabilità che la macchina venga colpita da un meteorite

A

probabilità soggettiva, si basa su un’osservazione

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

in un sondaggio sui danni del fumo passivo su 1038 adulti, 52 hanno dichiarato che il fumo è innocuo, qual è la probabilità che un adulto dichiari che il fumo passivo è innocuo?

A

probabilità A POSTERIORI, bisogna analizzare i risultati.

52/1038=5%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

probabilità di avere un gruppo sanguigno A o 0?

A

p(A) + p(0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

probabilità 2% che sangue sia infetto e epatite virale. paziente riceve dal pool di sangue 45 trasfusioni. probabilità di sviluppare epatite?

A

erano evidenziate due risposte
0.597
1-(o.98)^45 (commento di matte: probabilità di almeno 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quale informazione pratica permette di dedurre la definizione di curva di distribuzione di una variabile?

A

calcolare la probabilità di un evento
La curva di distribuzione più appropriata ci permette di calcolare la probabilità di un evento, cioè che probabilità ho quando la variabile aleatoria assume un determinato valore

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Da uno studio è emerso che negli ospedali del Nord Italia per una patologia A si resta ricoverati
in media 4.5 giorni, con una deviazione standard di 2.1 giorni, con quale probabilità si potrà trovare
un ospedale in cui la degenza è inferiore ai 2.4 giorni? p26

A

16%

il valore dista dalla media di 1 ds quindi si può dire che c’è una probabilità del 68%, però i valori devono essere inferiori, quindi si fa (100-68): 2 e si trova la probabilità nella coda.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Valore medio pressione popolazione sana è 120 mmHg e in questa popolazione la probabilità
di trovare oggetti con P compresa tra 120 e 140 mmHg è del 47.5%. dispersione?

A

10 mmHg

moltiplicando per 2 la p di 47.5% si ottiene 95% per cui sappiamo che in una distribuzione normale corrisponde alla media + o - 2 σ per cui avendo 140-120= 20 => 1σ= 10 mmHg.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

probabilità di un risultato insolitamente alto?

A

p<0.05

p minore del numero più piccolo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

la distribuzione binomiale è determinata da:

A

dalla taglia del campione n e dalla probabilità p

N.B. La distribuzione binomiale si usa quando voglio vedere la probabilità di x successi in n prove.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

la distribuzione di poisson è determinata da:

A

solo dalla media

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

la distribuzione normale o gaussiana è determinata da:

A

media e deviazione standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

mediana, range e ds sono:

A

stimatori distorti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

media, varianza e proporzione sono:

A

stimatori non distorti

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

errore standard indica:

A

la variabilità delle medie campionarie intorno alla media

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Popolazione con N soggetti e media M. Estraendo da essa tutti i possibili gruppi di numerosità k
e calcolando su ciascuno di essi la media, che valore potrà avere la media di tutte le k medie così
definite?

A

uguale alla media M

La media delle medie coincide con la media della popolazione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Significato IC 90%?

A

L’intervallo di valori all’interno dei quali cade il valore vero della popolazione con una
probabilità del
90%

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Definizione IC di una media: diminuisco la dimensione del campione di studio, cosa
succede?

A

l’ampiezza dell’intervallo aumenta di conseguenza

Se diminuisce la taglia n del campione di studio, di conseguenza aumenta il margine di errore, quindi aumenta anche l’IC.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Stima di un parametro con ds (deviazione standard) nota, campione casuale semplice di n<30, parametro distribuito
normalmente, cosa usiamo? (p. 38)

A

distribuzione normale (z)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Stima di un parametro con ds ignota, campione casuale semplice di n<30, parametro distribuito
normalmente, cosa usiamo?

A

distribuzione t di Student

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

per stimare la varianza di una popolazione:

A

distribuzione normale (z)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

i valori critici della distribuzione normale z variano al variare:

A

NON VARIANO

N.B. I valori critici sono i 2 valori di “z” che determinano l’area al 95 %. Nella distribuzione normale sono fissi. Quindi,
si trova sempre che al 90% il mio valore critico vale ±1,645; al 95% ± 1,96 (α=0.05); al 99% ± 2,57.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

i valori critici della distribuzione t variano al variare:

A

dei gradi di libertà

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

i valori critici entrano in gioco per:

A

calcolare gli intervalli /regione di confidenza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

i valori critici entrano in gioco:

A

definire la regione /intervallo di accettazione (o confidenza)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

la probabilità beta indica:

A

la probabilità di NON RIFIUTARE l’ipotesi nulla, quando andrebbe rifiutata

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

la probabilità alfa indica:

A

la probabilità di ERRORE nel rifiutare l’ipotesi nulla, quando andrebbe rifiutata

36
Q

come si misura la correlazione tra due variabili distribuite in modo normale?

A

coefficiente r di Pearson (valori vicini a -1 o a 1 indicano che esiste una buona correlazione
(positiva o negativa) e valori vicini a 0 indicano che non esiste correlazione

37
Q

Un coefficiente di regressione di -1.3 che significa?

A

significa che al crescere unitario della variabile indipendente, la variabile dipendente cresce
mediamente di -1, 3 unità

NB: decresce mediamente di 1.3 unità (-1:
relazione inversa).

38
Q

A cosa serve t Student applicato al coefficiente di regressione?

A

due possibili risposte:

A valutare se l’inclinazione della retta stimata dal modello è significativamente
diversa da 0

A valutare se i dati sono attendibili

39
Q

Quale differenza c’è tra il coefficiente di regressione e il coefficiente di
correlazione?

A

entrambi indicano la forza dell’associazione, ma il coefficiente di correlazione è bidirezionale
(non cambia se si inverte la variabile dipendente con quella indipendente), mentre quello di
regressione è unidirezionale

40
Q

nella regressione lineare la relazione è inversa se:

A

b<0

41
Q

) Da uno studio e emerso che negli ospedali del Nord Italia per una patologia A si resta ricoverati
in media 5,8 giorni, con una deviazione standard di 1.4 giorni, con quale probabilità si potrà trovare
un ospedale in cui la degenza e inferiore ai 3 giorni?

A

16 %
gaussiana
68% –> media e deviazione
32:2=16 –> le estremità

(risposta segnata 2.5%)

42
Q

l’ANOVA evidenzia una differenza significativa tra h gruppi (h>2), ma non tra quali. Il test di Bonferroni evidenzia tra quali. Quando applico il test di Bonferroni il livello di significatività:

A

deve essere corretto per il numero di confronti αh = α/h

43
Q

Le coorti fisse sono costituite da soggetti che:

A

entrano nella coorte in un certo istante e ne escono quando divengono casi

44
Q

quale di queste e una misura standardizzata della dimensione dell’effetto del T di student?

A

d di cohen

45
Q

quale metodo andrebbe utilizzato per confrontare un parametro, che segue la distribuzione normale, tra due gruppi indipendenti?

A

a. il test t per dati appaiati
b. il test di mann-whitney
c. il test di wilcoxon

GIUSTA: nessuna delle precedenti

46
Q

per verificare se una variabile in studio segue la distribuzione normale usiamo:

A

test Kolmogorov – Smirnov

47
Q

il coefficiente b della retta di regressione significa che: per ogni incremento unitario in:

A

x, y varia di una certa quantità costante

48
Q

se in una distribuzione asimmetrica i valori alti sono nella coda abbiamo

A

asimmetria positiva

49
Q

Quale dei seguenti indici non costituisce una misura di tendenza centrale:

A

campo di variazione

50
Q

Se si volesse studiare la relazione tra lo stress e la qualià della vita togliendo l’influenza della depressione si dovrebbe usare:

A

Correlazione parziale

51
Q

Quale differenza c’e tra il coefficiente di regressione e il coefficiente di
correlazione?

A

entrambi indicano la forza dell’associazione, ma il coefficiente di correlazione è bidirezionale (non cambia se si inverte la variabile dipendente con quella indipendente), mentre quello di regressione è unidirezionale

52
Q

L’incidenza di una malattia misura:

A

La proporzione di partecipanti allo studio in cui e insorta la malattia in un determinato periodo di tempo

53
Q

Se l’intervallo di confidenza del OR=1,71 è (1,51-1,95), allora:

A

il fattore di esposizione favorisce l’evento

or>1 –> fattore di rischio
or<1 –> fattore protettivo

se i due parametri sono entrambi negativi o entrambi positivi è accettabile

54
Q

se uso il test del chi-quadrato per verificare l’indipendenza tra i risultati di due parametri in scala nominale. Qual è l’ipotesi nulla del test?

A

i risultati dei due parametri sono indipendenti

55
Q

Se l’ipotesi di ricerca è dimostrare che la pressione arteriosa è più alta nei maschi rispetto alle femmine che tipo di ipotesi sperimentale è:

A

un’ ipotesi a una coda

56
Q

Si pensi alla definizione di intervallo di confidenza di una media; immaginando di aumentare la dimensione del campione in studio, cosa succede?

A

l’ampiezza dell’intervallo diminuisce di conseguenza

57
Q

Si ipotizzi di avere un dataset di dimensioni elevate e di avere dati mancanti “random” nelle
variabili età altezza e peso. Qual’è la misura più appropriata di tendenza centrale da usare:

A

la media

58
Q

Se l’ipotesi sperimentale è che i livelli medi di uricemia nei maschi siano più alti che nelle
femmine, quale sarà l’ipotesi nulla?

A

Non c’è differenza tra maschi e femmine nei valori medi di uricemia

59
Q

) Quale utilità hanno i gradi di liberta nelle analisi inferenziali parametriche?

A

Permettono di evitare che la numerosità campionaria influenzi i risultati

60
Q

in un box- plot la lunghezza della scatola rappresenta:

A

lo scarto interquartile

61
Q

Se IC del RR=1.71 è (1.51 􀂱 1.95) allora:

A

Il fattore di esposizione favorisce l’evento

62
Q

Si ipotizzi di avere un dataset di dimensioni ridotte, che i dati non siano distribuiti normalmente e di
avere dati mancanti nelle variabili età altezza e peso. Qual è la misura più appropriata di tendenza
centrale da usare?

A

la mediana

63
Q

i disegni correlazioni riguardano:

A

relazioni tra variabili

64
Q

Quale delle seguenti è una misura standardizzata della dimensione dell’effetto per il test di chiquadrato:

A

V di Cramer

65
Q

Da uno studio è emerso che negli ospedali del Nord Italia per una patologia A si resta ricoverati in media
5,8 giorni, con una deviazione standard di 1,4 giorni, con quale probabilità si potrà trovare un ospedale in cui
la degenza è inferiore ai 7,2 giorni?

A

16 %

5,8 + 1,4 = 7,2 (68%) 100-68 = 32/2 = 16 %

66
Q

Un predittore è anche noto come:

A

variabile esplicativa

67
Q

Un gruppo di ricercatori ha preso come riferimento il valore medio della pressione sistolica in una
popolazione sana μ= 120 mmHg e ha calcolato che in questa popolazione la probabilità di trovare
soggetti con una pressione compresa tra 120 e 150 mmHg è del 49,5%. Qual è la dispersione media
delle osservazioni nella popolazione considerata:

A

10 mmHg

68
Q

La probabilità beta indica:

A

la probabilità di NON RIFIUTARE l’ipotesi nulla, quando andrebbe rifiutata

69
Q

un gruppo di ricerca studia 3 gruppi di pazienti; ogni gruppo soffre di una malattia rara e così il numero di partecipanti è piccolo e i valori non sono distribuiti normalmente. Qual è il test per verificare la differenza?

A

test di Kruskall-Wallis

70
Q

distribuzione binomiale determinata da:

A

taglia del campione n e dalla probabilità p

71
Q

Se gli intervalli di confidenza di due gruppi non si sovrappongono, quale potrebbe essere una
conclusione ragionevole?

A

È probabile che ci sia una differenza tra le medie dei due gruppi nella popolazione

72
Q

se l’ipotesi di ricerca è dimostrare che la pressione arteriosa è diversa nei maschi rispetto alle femmine che tipo di ipotesi sperimentale è

A

un ipotesi a due code

73
Q

Se gli intervalli di confidenza di due gruppi si sovrappongono, quale potrebbe essere una
conclusione ragionevole?

A

E IMPROBABILE che ci sia una differenza tra le medie dei due gruppi

74
Q

Quale percentuali di soggetti/valori ricade tra il primo e terzo quartile?

A

50%

75
Q

Le coorti fisse sono costituite da soggetti che:

A

entrano nella coorte in un certo istante e ne escono quando diventano casi

76
Q

Sulla base del processo di ricerca, come si decide se esiste evidenza a favore di una certa ipotesi di ricerca?

A

si disegna uno studio, si raccolgono ed analizzano dati in modo da verificare le ipotesi

77
Q

quale metodo andrebbe utilizzato per confrontare un parametro, che non segue la distribuzione
normale, tra due gruppi indipendenti?

A

il test di mann-whitney

78
Q

In uno studio caso-controllo prospettico si puo calcolare:

A

Risk Ratio

79
Q

l’ANOVA evidenzia una differenza significativa tra h gruppi (h>2), ma non tra quali. Il test di Bonferroni evidenzia tra quali. Quando applico il test di Bonferroni il livello di significatività:

A

deve essere corretto per il numero di confronti αh = α/h

80
Q

Se IC del RR=1.71 e (0.85 – 2.95) allora:

A

Il fattore di esposizione e ininfluente sull’evento

81
Q

un test molto specifico

A

Individua bene i veri negativi, ma puo avere falsi positivi

82
Q

Quale delle seguenti è una misura standardizzata della dimensione dell’effetto per la regressione lineare:

A

R^2

83
Q

qual’ è l’ipotesi nulla del test Kolmogorov – Smirnov?

A

la variabile segue la distribuzione normale

84
Q

Se l’ipotesi sperimentale è che i livelli medi di uricemia nei maschi siano più bassi che nelle
femmine, quale sarà l’ipotesi nulla?

A

Non c’è differenza tra maschi e femmine nei valori medi di uricemia

85
Q

I valori critici nella distribuzione z variano al variare:

A

non variano

86
Q

il coefficiente b della retta di regressione significa che: per ogni incremento unitario in:

A

x, y varia di una certa quantità costante

87
Q

In una distribuzione SIMMETRICA, la media e la mediana si trovano :

A

moda, mediana e media si sovrappongono