domingo, 21 de septiembre de 2008

Polémica sobre desigualdad y encuestas de hogares: Comentarios de Francke y Matuk

A partir del post que escribiera criticando a Raul Mauro y su réplica, Pedro Francke y Farid Matuk han hecho comentarios interesantes que responderé en otro post. Aquí pongo sus comentarios para los interesados.

Stanislao

Pedro Francke

Hola Stany. Algunos comentarios:

Tus càlculos sobre el tamaño de muestra y sus efectos sobre la confiabilidad de las cifras, comparando INEI e Ipsos-Apoyo solo tratan el problema del llamado "error muestral". El punto planteado por Mauro, como por otros (incluyendo yo mismo), es que existe un importante "error no muestral": simplemente los muy ricos no contestan la encuesta, por lo cual aun cuando en el procedimiento de la encuesta sean reemplazados por otros, ese reemplazo es "sesgado" y los resultados no son confiables. Por tratarse de un error no muestral, no hay forma de establecer un paràmetro de confiabilidad de los datos.

El problema es que en todos los calculos usuales de la pobreza, incluyendo los ùltimos que escribiste y pusiste en tu blog, suponen implìcitamente otra hipòtesis no falseable (hasta donde yo conozco para el Perù): que los errores no muestrales son cero.

No tenemos una forma exacta de calcular el tamaño de este error no muestral, aunque una aproximacion simple indica que el consumo total privado segun las encuestas de hogares solo llega a un 60 a 70% del consumo privado de las Cuentas Nacionales. Es evidente que el error no muestral es muy grande, aunque no sabemos a que grupo social corresponde el consumo "faltante". Creo que esta evidencia es suficiente para demostrar que el supuesto "error no muestral = 0" es falsa.

¿Es entonces cientifico suponer que, si bien hay un error no muestral, ese error no muestral seria el mismo a lo largo del tiempo y por lo tanto no cambia la direccion de las variaciones en la distirbucion? Tampoco, si comparas como evoluciona la suma del consumo privado de las ENAHO con las Cuentas nacionales, veràs que tampoco hay una relaciòn estable.

Finalmente, sabemos que en los ùltimos 3 años solo las empresas mineras han elevado sus ganancias en mas de 15 mil millones de soles anuales. He comparado en varios articulos la relacion entre eso y los aumentos de consumo de todos los pobres, y estas sobreganancias son 8 veces màs. Mi hipòtesis es que eso ha modificado sustancialmente la distribuciòn del ingreso en el Perù (aunque en parte se refiere en estricto a rentas de actores del exterior que no se consideran parte del ingreso nacional). Esas ganancias de un centenar de familias no està registrado en las ENAHOs, lo que es obvio si uno compara como evolucionan los ingresos del percentil superior en las ENAHO.

¿Podrìas producir evidencia que contradiga mi hipòtesis?


Farid Matuk
Hola Stanislao:

Escribí unos comentarios a la nota de Raúl en su blog, y los copie en MacroPerú.

Respecto a los tamaños de muestra, la ENAHO es alrededor de 20,000 al año desde el 2001, y Lima tiene 1,600 y los departamentos 600.

Como he afirmado numerosas veces, comparar Ginis en términos absolutos sin intervalos de confianza, es comparar ruido con ruido.

Por ello el Montecarlo que haces con 3,000 simulaciones me suena perfectamente razonable.

El otro tema es que el estrato A de Apoyo es 5%, que si la memoria no me falla es el porcentaje de los hogares que tenían automóbil en el censo de 1961, y que Webb lo tomó como umbral, creo recordar que justamente su definición de clase media era ese 5%.

Una base de datos mas interesante, que tiene un sesgo a priori, es el millón de hogares que el MEF encargo a CUANTO entrevistar para el SISFOH. Algunos análisis están incluidos en el último MMM:

Saludos, Farid

Postdata. Respecto a la manipulación de datos de la pobreza por parte del INEI creo que es fehaciente, por ejemplo:


1) En el 2006 la poblacion de referencia fue ubicada entre el 20% y 50% de la muestra y en 2007 entre el 18% y 48% de la muestra.

2) La imputación de no respuesta se efectuó únicamente para los cuatro primeros meses de 2006

3) Los resultados publicados para 2004-2005-2006-2007 no son replicables, y por ello carecen de transparencia.

No hay comentarios.: