Lezione 2 Flashcards
Creare spazio grafico
x11()
Creo Istogramma con più argomenti possibili
hist(dati$peso, prob=T, breaks=25, col=’cyan’, main = ‘Istogramma di Porva’, xlab=’X’,ylab=’Y’)
Traccio linea su plot
abline(v=median(dati$peso), col=’orange’)
Frequenza Assoluta
Frequenza Relativa
Densità
Quante volte appare in tutto
Quante volte appare/ numero di dati
Freq Relativa / Ampiezza
A cosa serve boxplot
eventuali asimmetrie della distribuzione e/o la presenza di eventuali
identificare eventuali asimmetrie della distribuzione e/o la presenza di eventuali valori estremi (outlier).
Step per costruire boxplot
- si costruisce un rettangolo con basi inferiore e superiore uguali,
rispettivamente, al primo e al terzo quartile e che quindi conterrÃil 50% centrale delle osservazioni - all’interno del rettangolo di traccia una linea in corrispondenza della mediana
- si considera il limite superiore uguale a Q3 +1.5*IQR e si traccia un baffo che collega la base superiore del rettangolo all’osservazione più alta contenuta all’interno del limite superiore
- si considera il limite inferiore uguale a Q1 - 1.5*IQR e si traccia un baffo che collega la base inferiore del rettangolo all’osservazione più bassa contenuta all’interno del limite superiore.
- eventuali valori maggiori del limite superiore o minori di quello inferiore vengono segnati singolarmente con un cerchio sul grafico e vengono chiamati outlier (superiori o inferiori).
define plot area as four rows and two columns
par(mfrow = c(4, 2))
Quali grafici per variabili categoriche e quali per continue
Categoriche:
- pie
- barplot
Continue:
- istogrammi
- boxplot
Come stampare a video dati di colesterolo di pazienti?
dati$Colesterolo (case sensitive)
c()
Combine into vectors or list
How does the breaks histogram argument work
Default: Sturges’ Rule = roundnearest( (log2(n)+1 )
breaks argument is only a suggestion
breaks=seq(min(dati$Colesterolo),max(dati$Colesterolo), length.out=n+1)
table(dati$Sesso)
Table with count of males and female (chr or factor variable)
Metodo safe per fass e frel
fass = table(vettore)
frel=prop.table(fass)
Dividere i dati di colesterolo tra pazienti maschi e femmine
colm=dati$Colesterolo[dati$Sesso==’M’]
colf=dati$Colesterolo[dati$Sesso==’F’]
Indici di posizione e di dispersione
posizione:
media
mediana
min
max
range
quantili
dispersione:
varianza
deviazione standard
IQR