Algunas tecnicas basicas

Report
Algunas técnicas básicas
Luis Rosero Bixby
University of California at Berkeley
Las técnicas
1. Agregación
2. Suavizamiento
3. Ajuste a control macro
4. Normalización
(La mayoría son en realidad consejos de
programación)
1. Agregación
• Para pasar de micro-datos a promedios por edades
• Comando Stata para promedios ponderados:
collapse (mean) x y z [weight=facexpan], by(age)
• “facexpan” son los factores de expansión de la muestra
(pudimos modificarlos para reproducir la estimación de la
pob. por edades simples)
• Para tener también el número de observaciones y la
población en cada edad:
generate unos = 1
Collapse (rawsum) unos (sum) fexpan (mean)….
2. Suavizamiento (Apéndice B)
• Para reducir el ruido del muestreo por trabajar con
edades simples
• Se suavizan los niveles más bajos (ejemplo: YE y YS)
• Los niveles mas altos se obtienen por suma (YL no se
suaviza!)
• No sobre-suavizar picos, valles y ceros reales
• Los valores falsos negativos deben reemplazarse con
ceros
• No incluir en el suavizamiento edades que por
definición tienen ceros (ej. niños en YL)
2. Suavizamiento con Stata
• Se trabaja con el archivo de promedio de edades
• Se usa la técnica de regresión local (lowess)
lowess Y age, bw(0.1) gen(Ysua)
• Jugar con valores alternativos de band width (bw)
• Debido a que lowess no permite weight se usa el truco de
expandir la muestra (p. ej. una línea por cada 10
observaciones) antes de suavizar.
gen obs10 = round(nobs/10)
expand obs10, gen(duplicada)
lowess.....
drop if duplicada==1
3. Ajuste a control macro
Cálculo del factor de corrección
Cálculo perfiles ajustados
3. Ajuste a control macro en stata
* control macro
gen yle_macro = 15542
* agregados crudos (con valores suavizados)
egen double yle_tot = total(pob2006/1000000 * yle_sua)
*Factor de correccion
gen fyle = yle_macro / yle_tot
*Valores ajustados al control
gen YLE = fyle * yle_s
4. Normalización
Porque al comparar
perfiles,
nos interesa más la
forma que el nivel
de la curva.
4. Cómo se normaliza
• Se calcula el promedio YL edades 30-49 (unidad de
ingreso):
egen YL3049 = mean(YL) if edad>=30 & edad<=49
replace YL3049 = YL3049[35] if YL3049==.
(Esta es una constante para todas las edades)
• YL normalizado es el YL relativo al de edades 30-49:
gen YL_nor = YL/YL3049
Laboratorio 4. Técnicas básicas
Aplicar las técnicas básicas de:
1.
2.
3.
4.
Agregación
Suavizamiento
Ajuste a control macro
Normalización
Para completar la estimación del ingreso laboral
(Código para hacerlo con Ecuador 2006 en:
YL-ECua-Part2.do)

similar documents