Föreläsning 4 - Ordered probit, count data, multinomial and Tobit 1 Flashcards
Give examples of different ordered outcome variables
Employment: unemployd, part time, full time.
Grades: A, B, C, D…..
Credit rankings: AAA, AA, A, BBB…….
Utfallsvariablen är alltså ordinaldata. ska vara 3 eller mer.
Sett upp en ordered probit using the latent variable approach with 3 outcomes. use y*=X’B
Se koncept 4.
What is the marginal effect in the ordered model?
Se concept 4.
What is example of count data?
The number of times someone has been arrested over a year. Count variable = {0,1,2,……}. y ≥ 0. most often = 0. so we have a skweed distribution.
How do you set up a count data regression?
Assign RHS to a exponential distribution so E(Y|X) = exp(X’B) which is offcoure bigger then zero.
How do you estimate a count data regression?
Since it is non-linier we do use MLE instead of OLS. SInce the assumption regarding normal distribution only applies to continuous variables that can take on any value, we instead use the Poisson distribution.
Thus, we let exp(X’B) be lambda in the poisson dist and estimate the log likelihood. Here we have no closed form solution. Just as in the case with probit and logit, we can directly interpret the coefficients.
A assumption in the poisson dist is that mean = variance = lambda. If we find out the the variance is not equal to the mean, we have to inflate the SEs.
What is overdispersion? Why is it a problem and how do we solv it?
See concept 4.
What is a Multinomial Logit?
A model where the dependent variable is a categorical variable ≥ 3.
Formulate the multinomial model
See concept 4.
Show the tobit model when the dependent variable is censured from below.
See concept 4.
Show the bias when we have censoring due to top coding and when we have a conrner solution in the case of reservation wages.
See concept 4.
Why do we use tobit model?
Det finns två huvudsakliga användingar av dessa modeller.
- Truly censord application. I USA är den mesta datan top-codad ovanför en viss inkomstnivå. Vi kan inte observera ett utfall ovanför t.ex $10000. Det är ju ett stort no no att bara studera de vi kan observera! Vi får ett biased estimat. Vi är censorerar mer troligt höga nivåer. Detta ger oss biaset. Dont do that! Istället ska vi använda metoder fölr detta!
- Den andra anledningen är pga Corner solution outcomes. ….se engelkurvcan. x är inkomst. Vid något tillvälle kommer man sluta röka ekker dricka…. vi börjar se nollor på den beroende variablen. Det beytuder inte att man är okänslig för….. kommer man ovanför tröskeln börjar man se vad som häner…. ett annat exempel är labour supply. X = wage offer. Wj = houers of workl. Får vi wage offer under tröskeln är vi inte med i labour force, är vi ovanför så börjar vi erbjuda positiva nummer av timmar.
Derive the tobit model.
See concept 4.
What do the deriven tobit model look like?
See concept 4.
What is the inverse mills ratio?
See concept 4.
Show the definition of truncated vs censoring
See concept 4.