inferenza Flashcards

1
Q

distribuzione campio degli stimatori - univariato

A

se x1,..,xn è un c.c.s di dim n da una normale univariata
- xi distr N1(µ, σ^2)
- xbar distrib N1(µ, σ^2/n)
- (n-1)Su^2/σ^2 distrib Chiquadro^2 (n-1)
- xbar e Su^2 indip

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

distribuzione campio degli stimatori - multivariato

A

se x1,..,xn (xi v) è un c.c.s di dim n con xi (v) distrib Np(µ, Σ):
- xbar (v) distrib Np(µ, Σ/n)
- (n-1)Su (m) distrib Wishart (n-1) con matr di scala Σ
- xbar e Su indip

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

distribuzione di Wishart

A

Q distrib W(Σ, m)
con Σ e m gdl
se la quantità Q= somm a m di xi*t(xi)
= somma di prodotti di vett casuali normali multivar xi (v) distrib Np(0,Σ)

E(Q) = somm a m di E(xi*t(xi)) = mΣ

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

proprietà distrib di Wishart

A
  1. se A1 distrib W(Σ,m) indip A2 distriv W(Σ,n)
    allora A1 + A2 distrib W(Σ, m+n)
  2. se A distrib W(Σ, m)
    allora CAt(C) distriv W(CΣt(C), m)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

distribuzione T2 di Hotelling

A

se x distr Nq(µ, Σ) indip M distrib W (Σ, m)

τ = t(x - µ) %% solve(M/n) %% (x - µ)
τ distrib T2(q,m)
con q parametri (dim(x)) e m gld di M

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Verifica ipotesi caso multi H0: µ = µo

A

allora sqrt(n)(xbar - µo) distr Np(0,Σ)
statistica test: T2
T2 = n
t(xbar - µo) %% solve(Su) %% (xbar - µo)
con Su <- var(x)(n/(n-1))
T2 distrib (p, n-1)
distrib (((n-1)
p)/(n-p))*F p,n-p

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

relazione T2 di Hotelling e Fisher

A

In generale T2(q,m) = (m*q/m-q+1)Fq,m-q+1
con Fq,m-q+1 distrivuzione di Fisher risalata

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

proprietà dustribuzione di Hotelling

A

Invarianza rispetto a trasfo lineari
y=CX + d
con C matr singolare e X distrib Np(µ, Σ)
c.c.s. x1, …, xn (v)
y distirb (Cxbar+d, CSx*t(C))

H0: µx = µxo == µy = µyo
T2 = nt(xbar - µxo)%%solve(Sx)%%(xbar - µxo)
= n
t(ybar - µyo)%%solve(Sy)%%(ybar - µyo)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

assenza di assunzione di oss provenienti da una variab casuale normale

A

Risultati per grandi campioni - TLC

se x1, … , xn oss indip da pop con a µ e Σ finita
per n suff grande >=10p

sqrt(n)(xbar - µ) distrib approx Np(0,Σ)
sostitnuendo Σ con Su non modifica molto l’approssimazione
n
t(xbar-µ) %% solve(Su) %% (xbar-µ) distr approx Chiquadro^2 p

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

idc per le medie marginali µi
e conclusione

A

insieme di valori plausibili
µ = [µ1,µ2,..,µ4]
se le oss sulle p (=4) variabili provenissero da normali indip, costruendo un idc fi livello 1-α, per ciascuna µi basato sul test t si otterebbe
P[Ii<µi<ui, i=1,..,p] =(1-α)**(1-α) = (1-α)^p
con (1-α)^p < (1-α)

si considerano tutte le variabili e si costruisce una regioine di confidenza

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Regione di confidenza per µ

A

per specifici valori di xbar e S si possono definire regioini di condifenza
P[nt(xbar-µo) %% solve(Su) %% (xbar - µo) =< ((n-1)p)/(n-p))Fp,n-p(1-α)] =1-α

Appartengono alla regione di confidenza tutti i vettori µ t.c. nt(xbar-µ) %% solve(Su) %% (xbar - µ) =< ((n-1)p)/(n-p))Fp,n-p(1-α)

le regioni di confidenza sono degli elissoidi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

idc simultanei

A

basati su F

obb: tutte le affermazioni valgono simultaneamente con una predefinita probabilità

x distrib Np(µ, Σ)
combo lineare: z =a1x1,…,apxp distrib N(t(a)µ, t(a)Σa)
se x1,..xm c.c.s x distrib N(t(a)
xbar, t(a)Sxa)

con a fissato, idc per µz si basa su
t= sqrt(n)(zbar-µz)/sqrt(Sz)
= sqrt(n)
(t(a)xbar-t(a)µ)/sqrt(t(a)Sxa)
estremi che contengono t(a)µ:
t(a)
xbar +- tn-1(1-α/2)sqrt((t(a)Sx*a)/n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

idc simultanei problemi con a fissato e soluzione

A

fissato a, ciascun intervallo è di livello 1-α, ma non vale per tutti gli intervalli simultaneamente

Per trovare la quantità c tale per cui P(n(t(a)xbar-t(a)µ)^2/t(a)Sxa =< c) = 1-α per ogni a; si determina il max rispetto ad a dell’espessione
ossia n
t(xbar-µ)%%solve(Sx)%%(xbar-µ) distrib T2 di Hotelling
con c quantile di Hotelling

se x1,..,xn c.c.s. distrib Np(µ, Σ), allora simultanemanete per ogni a l’idc per la media t(a)µ con probabilità 1-α, ha come estremi t(a)xbar +- sqrt(((n-1)p/n(n-p)Fp,n-p(1-α))t(a)%%Sx%*%a)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

idc naive - per sulle singole medie

A

basate sulla distrib t
xbar +-tn-1(1- α/2)*sqrt(Si/n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

idc di Bonferroni

A

applicare il metodo di Bonferroni per i confronti multipli

aplha <- 1 - 0.99
xbar +- tn-1((1-(aplha/2)/p))*sqrt(Si/n)
con p numero di variabili

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

inferenza per grandi campioni - no assunzione sulla distribuzione

A

sia x1,…,xn un c.c.s. da una popolazione con (µ, Σ), con n-p grande
H0: µ=µo
H0 rifiutata alivello α approssimato
nt(xbar - µo) %% solve(Su) %*% (xbar -µo) > Chiq^2p(1-α)

quantile di (1-α) della F e della Chiq molto vicine

17
Q

inf grandi campioni - idc simultanei

A

per n-p grande, con probabilità (1-α), t(a)µ è contenuto in
t(a)
xbar +- sqrt(Chiq^2p(1-α) * (t(a)Sua)/n)

18
Q

inf grandi campioni - idc singoli per le medie

A

xbar i +- z(1-α/2)*sqrt(Si/n)

19
Q

inf grandi campioni - idc simultanei per le m=p medie con la correzione di Bonferroni

A

xbar i +- z(1-α/2/p)*sqrt(Si/n)

20
Q

test bilaterale verifica di ipotesi H0:µ0=µ

A

hotteling.test <- function(Y, mu0=0){
# verifica d’ipotesi H0: mu=mu0
# varianza ignota e stimata dai dati
n <- dim(Y)[1] # numero di osservazioni
p <- dim(Y)[2] # numero di variabili
M <- var(Y)/n # distribuzione Wishart
d <- colMeans(Y) - mu0 # distribuzione normale N(0,M)
T2 <- t(d)%%solve(M)%%d #distribuzione T2 di Hotelling(p, n-1)
stat.test <- T2*(n-p)/(n-1)/p
pvalue <- 1-pf(stat.test, p, (n-p))
data.frame(“T2”= T2, “F.statistic”= stat.test, “pvalue”= pvalue)
}

hotteling.test(dati, c(175,15))

21
Q

funzione e disegno della regione di confidenza per 0.95 di mu

A

regione.conf <- function(Y, mu0=0, livello){
#livello: livello del test
n <- nrow(Y)
p <- ncol(Y)
xbar <- colMeans(Y)
S <- var(Y)
nt(xbar-mu0)%%solve(S)%%(xbar-mu0) <= ((p(n-1)/(n-p))*qf(livello,p,n-p))
}
regione.conf(dati,c(175,15),0.95)

considerando un insieme di vettori appartententi alla regio
m1 <- seq(65,250, by=0.4)
m2 <- seq(9, 24, by=0.2)
mus <- as.matrix(expand.grid(m1,m2))
confs <- rep(0,dim(mus)[1])
for(i in 1:dim(mus)[1])
confs[i] <- re.conf(mus[i,],dati,0.95)
plot(mus,col=confs,pch=19)

22
Q

ciclo per costruzione di più intervalli

A

idc simultanei T2 per 0.95 per le medie
p <- length(ybar)
n <- 61
ybar[1] + c(-1,1)sqrt(qchisq(0.95, p)Sy[1,1]/n)
idc.tcl <- matrix(rep(0), ncol=2, nrow=6)
for (i in 1:6)
idc.tcl[i,] <- ybar[i] + c(-1,1)sqrt(qchisq(0.95, p)Sy[i,i]/n)

23
Q

calcolo dell’elisse di variab 1 e variab 2

A

nt(xbar i − µi xbar k − µk) %%
solve(sii sik, sik skk) %*% (xbar i − µi xbar k − µk) ≤ χ^2p (1 − α)

24
Q
A