x

La pérdida de valor de las credenciales educativas en el mercado de trabajo Argentino 1995-2001. Una respuesta desde los métodos estadísticos.

En este trabajo se sostiene que durante la segunda mitad de la década de 1990 se desarrolló un proceso de pérdida de valor de las credenciales educativas de los trabajadores con nivel de estudios secundario completo o mayor. Como a su vez en el período se incrementó la desigualdad salarial se sostiene que lo que se observa es un fenómeno de dos aristas: de devaluación educativa y segmentación del mercado de trabajo. Para realizar estas afirmaciones se utilizan regresiones lineales múltiples para el cálculo de premios salariales. Dado que la fuente utilizada es una muestra y el universo es pequeño se utilizan pooles de datos para ampliar la cantidad de muestra disponible y mejorar las estimaciones. Se desarrolla una metodología cuyo objetivo es poder decidir desde el punto de vista estadístico si los pooles de datos pueden ser utilizados o no en cada problema de trabajo y como trabajar con ellos, y así poder utilizar los recursos disponibles bajo el control de métodos estadísticos.

x

Los docentes en la Encuesta Permanente de Hogares. Notas metodológicas para su identificación y estudio.

El estudio de los docentes como colectivo laboral en Argentina puede ser realizado con precisión a partir de los Censos Nacionales de Docentes. Estas fuentes de información son específicas del sector educativo y, por lo tanto, las más idóneas para la caracterización detallada de los cargos, horas, funciones, trayectorias y formación de los docentes. Sin embargo, sus principales limitaciones son la periodicidad decenal y las dificultades para comparar a los docentes con otros grupos laborales. La Encuesta Permanente de Hogares, fuente diseñada para caracterizar y monitorear la inserción laboral de la población, permite suplir las limitaciones mencionadas en el estudio de los ocupados en las actividades de enseñanza. Sin embargo, tiene ciertas características y limitaciones que resultan importantes tener en cuenta al utilizarla para estudiar el colectivo docente. Este artículo analiza la fuente en cuanto sus potencialidades para el estudio de este grupo laboral. Concluye que es consistente para el estudio de la evolución del empleo docente.

x

Especificación del modelo, datos faltantes y casos atípicos: la “trastienda” de una investigación basada en el análisis de la varianza.

El artículo está centrado en la discusión de aspectos metodológicos de la investigación de tesis de la autora. En el campo de los estudios sobre la distribución personal del ingreso y los mercados de trabajo resulta habitual el análisis de la regresión del ingreso personal contra diversos atributos de los perceptores y sus ocupaciones. Este análisis tiene por requisito la resolución de cuestiones referidas a: la definición del modelo en que estará basado, el tratamiento que se dará a los casos sin información y los procedimientos mediante los que se evaluará y, eventualmente, corregirá la influencia de los casos extremos sobre los parámetros estimados. El artículo refiere qué decisiones fueron tomadas en la investigación a este respecto, fundamentando las razones y describiendo su impacto sobre los resultados obtenidos.

x

¿Qué son los Indicadores? Perspectivas y usos diferentes.

El presente artículo tiene como objetivo presentar las diferentes perspectivas y usos de los indicadores, por un lado, desde las ciencias sociales y por otro desde lo que se denominó “Movimiento de Indicadores Sociales”. En términos generales, el uso de los indicadores ha sido utilizado desde el enfoque de las ciencias sociales para medir empíricamente conceptos teóricos que permitan el abordaje empírico a los fenómenos sociales. Sin embargo, los indicadores son también utilizados desde una perspectiva más pragmática, principalmente por los organismos de estadística y organismos internacionales. A través del artículo se presentan los diferentes recorridos realizados por las perspectivas mencionadas. En la primera parte se describe la medición empírica de conceptos a través de indicadores en los principales referentes de las ciencias sociales. En la segunda parte se describe el contexto de surgimiento y el desarrollo de lo que se denominó “Movimiento de Indicadores Sociales” como otra forma de aproximación al estudio de la realidad social a través de indicadores. En la tercera se problematiza las diferencias de ambas perspectivas en cuanto a los objetivos y el método que utilizan y se presenta como conclusión la importancia de vincular ambas perspectivas.

x

Aportes al estudio de la opinión pública en las elecciones presidenciales 2007 en Argentina.

El presente trabajo intenta explorar la creciente importancia que los estudios de opinión pública han comenzado a tener durante las últimas décadas. En este sentido, se busca brindar un aporte a la investigación dentro de una actividad que siempre ha estado más bien alejada del ámbito académico, en especial en los estudios relacionados con los procesos electorales. Asimismo, el trabajo intenta develar la notable injerencia que los medios de comunicación tienen en los procesos electorales de los últimos años, demostrándose que se trata de una tendencia que va tomando cada vez más impulso. Finalmente, se analizaran cuestiones que resultan un aporte para diagnosticar los cambios en las percepciones de la ciudadanía durante la etapa previa y posterior a una elección.

x

Construcción de un índice del nivel socioeconómico del hogar urbano en la República Argentina mediante el análisis de correspondencia múltiple y escalamiento óptimo.

El trabajo presenta la construcción de un índice que tiene como finalidad asignar a cada hogar urbano de la República Argentina un nivel socioeconómico. Se piensa al índice como una variable latente (no observable) y se aplica el análisis de correspondencia múltiple, método exploratorio de estadística multivariada, para obtener los ponderadores (pesos) de las modalidades de las doce variables seleccionadas.

El índice se compone de variables relativas a las características de la vivienda, la condición laboral y educativa del jefe de hogar y del cónyuge. La metodología se aplica a la Encuesta Nacional de Gasto de los Hogares 2012/2013 (Instituto Nacional de Estadísticas y Censos). Una vez estimados los puntajes de la variable latente para los hogares urbanos, se establecen los quintiles socioeconómicos y se asigna a cada hogar un quintil. Finalmente, se analizan las características de cada uno de los quintiles obtenidos y se indican las fortalezas y limitaciones de la metodología.

x

Orientaciones de futuro laboral y educativo de estudiantes secundarios. Análisis multivariado en un diseño muestral complejo.

En este artículo se analizan las orientaciones de futuro laboral y educativo de los estudiantes que a fines de 2008 cursaban el último año de estudio en las escuelas estatales de la Ciudad Autónoma de Buenos Aires. En primer lugar, se describen las orientaciones de futuro hallándose una prevalencia de proyectos educativo-laborales entre los estudiantes y una anticipación de obstáculos que resulta más pronunciada en el plano laboral que en el educativo. Luego, mediante un análisis de regresión logística multivariada, se compara la influencia relativa de distintos atributos sociales, escolares, biográficos y de la oferta educativa sobre los objetivos de tipo profesional. Entre los principales resultados se halla que las diferencias de género muestran contundencia en la priorización de un objetivo profesional. La modalidad del plan de estudios también emerge como un aspecto clave en los horizontes de futuro, observándose un hiato entre la formación bachiller-comercial y la técnica, donde prevalecen expectativas de inserción laboral directa luego del egreso. Otro hallazgo es que en el plano educativo los horizontes de profesionalización adquieren una difusión más amplia e independiente del origen social educacional, como reflejo de un contexto donde están dadas ciertas condiciones para el acceso masivo a la educación superior. Por otra parte, en el trabajo se enfatiza la importancia de considerar la complejidad del diseño muestral en la instancia de análisis de los datos. Para ello se comparan los resultados obtenidos con estimadores que consideran la complejidad de diseño muestral con otros “naive”, reflexionando acerca de las implicancias epistemológicas que esto conlleva en la puesta a prueba de hipótesis en el análisis bivariado y multivariado.

x

“Condiciones de socialización, entorno y trayectoria asociados a la reincidencia en el delito”.

En la actualidad el delito y la punición son analizados desde diferentes enfoques, ya que además de estar en crisis son temas a los cuales se les busca encontrar respuestas y soluciones. Es sabido entre los expertos que estudian estos tópicos que dentro de las cárceles la población es mayoritariamente joven, con bajos niveles de educación y provenientes de clases socioeconómicas medias/bajas y bajas, caracterizadas, entre otras cosas, por los bajos niveles de ingreso.

Teniendo en cuenta estas características podría pensarse que la vinculación explicativa de una conducta delictiva está dada por la asociación entre la condición de pobreza de un hogar y/o de sus integrantes y las probabilidades de comisión de delitos y la reincidencia en los mismos. Sin embargo, en este documento proponemos la existencia de una relación mucho más compleja. Por lo tanto, cabe preguntarse en relación al delito y a la reincidencia en el mismo, ¿qué tan asociados están esos factores a quienes incurren nuevamente en una conducta delictiva y al nivel de violencia al momento de perpetrar un delito?, finalmente, ¿qué factores son estos?

Para responder a estas preguntas se realizó un modelo de análisis multivariado basado en una regresión logística, en el cual se incorporaron variables relacionadas con los entornos o contextos de socialización temprana de los sujetos así como la trayectoria en instituciones como los institutos de menores. Los datos utilizados pertenecen a la Encuesta a Población en Reclusión de 2013, en la cual para Argentina se aplicaron más de mil encuestas personales a presos condenados por la justicia federal y ordinaria de la Capital así como por la justicia de la Provincia de Buenos Aires. Cabe destacar, además, que este fue un estudio que abarcó un conjunto de otros cinco países de la región: Brasil, Chile, El Salvador, México y Perú.

x

Un ejemplo de diseño cuasi experimental: uso de la regresión logística binaria en la construcción de un grupo de comparación para la evaluación de impacto de un programa social.

Este artículo trata acerca del empleo de la regresión logística binaria para la construcción de un grupo de comparación útil para la evaluación de impacto de un programa social. Se basa en una experiencia de aplicación real de tal procedimiento.

En la primera parte se aborda brevemente la problemática que plantea la implementación de diseños puramente experimentales en el caso de la evaluación de políticas públicas de contenido social y la alternativa de emplear modelos cuasi experimentales con un grupo de comparación construido estadísticamente. También se ponen en consideración algunas cuestiones inherentes a los diseños con doble medición, al tiempo que se abordan las dificultades que plantea la frecuente ausencia de una línea de base en el caso de los programas sociales. Asimismo, se explicitan los requisitos que debieran cumplimentar los grupos de comparación construidos mediante modelación estadística.

La segunda parte se refiere a las características del procedimiento estadístico empleado (la regresión logística binaria) y su utilidad específica para la obtención de grupos de comparación, con las limitaciones e inconvenientes que plantea, las alternativas posibles para sortearlos y los recaudos a adoptar. Finalmente, en la última parte se exponen los resultados provenientes del ejemplo de aplicación de este procedimiento conjuntamente con la interpretación de los mismos.

x

METODOLOGIA ESTADISTICA PARA LA ESTIMACION DE LAS SUPERFICIES SEMBRADAS CON CULTIVOS EXTENSIVOS - METODO DE SEGMENTOS ALEATORIOS.

El conocimiento de la superficie sembrada con cultivos extensivos es de relevancia estratégica para el país y necesita ser estimada en forma objetiva dos veces al año para las principales Provincias Argentinas. El método aquí propuesto es el de observar –con el significado literal de la palabra- una muestra de segmentos que se definen, como relativamente pequeñas áreas que toman la forma de polígonos rectangulares, sin consultar a los dueños de las tierras, a los productores ni a ninguna persona relacionada con las explotaciones que contiene el segmento.

La selección original es de puntos aleatorios dentro de estratos de uso homogéneo del suelo, que luego se los transforma en segmentos. Es obvio que gran parte de los puntos caerán en lugares que no se pueden acceder con un vehículo y para poder llevar a cabo la observación es necesario trasladar el punto hasta el camino más próximo y allí conformar el segmento. Desde el punto de vista de la teoría del muestreo se reconoce que el procedimiento de trasladar origina un sesgo el cual es un error no debido al muestreo.

La contrapartida es que el método tiene importantes ganancias, entre ellas: a) muy alta confiabilidad de los datos por provenir de observaciones “in situ” hechas por expertos, b) no hay error en la medida de las superficies por utilizar tecnología satelital, c) una vez definido el segmento el Sistema de Posicionamiento Global (GPS) permite controlar el operativo y anula el error de ubicación de los segmentos en futuros operativos, d) las muestras son altamente comparables en el tiempo, e) los resultados se obtienen en breve tiempo, en general no más de tres meses, f) reducción notable del presupuesto al no existir revisitas.

El método incorpora nuevas tecnologías, entre ellas: imágenes satelitales, Sistemas de Información Geográfica (GIS), el GPS, el uso del Índice de Vegetación de Diferencia Normalizada (NDVI), programas de procesamiento de la información y protocolos estrictos de procedimientos.

x

Desempeño de las PyME industriales argentinas, 2005-2011: Medición de eficiencia en la producción a través de un enfoque no-paramétrico.

Este trabajo mide la eficiencia en la producción de las PyME industriales argentinas a partir de la productividad total de los factores, para el período 2005-2011, utilizando datos a nivel empresa, y aplicando el enfoque Análisis Envolvente de Datos (DEA por sus siglas en inglés) basado en el trabajo de Farrell (1957) y las extensiones introducidas por Charnes et al (1978) y Banker et al (1984). Se busca generar un aporte desde el punto de vista metodológico, como antecedente en lo referido a cómo puede medirse la eficiencia de las PyME industriales argentinas en base a información estadística disponible, y explorar cuáles son los factores determinantes de la misma, ya que hasta el momento hay un vacío de información en este sentido. A partir de esto, se explora la asociación de este nivel de eficiencia con factores exógenos a las empresas o internos a las mismas como potenciales determinantes del mismo. Se encuentra que las PyME localizadas en las regiones del país de mayor desarrollo relativo y concentración de la actividad económica tienen un nivel de eficiencia en promedio mayor al resto. Mientras que, sorprendentemente, no hay evidencia suficiente para suponer que el sector de actividad de pertenencia está relacionado con el nivel de eficiencia en la producción. Por otro lado, contrariamente a lo esperado, las empresas más grandes, que exportan, y que solicitan y obtienen créditos bancarios, registran en promedio menores niveles de eficiencia que el resto, aunque esto podría explicarse por el hecho de que estas firmas están más capitalizadas, lo que, al incrementar su dotación del factor de producción capital, impacta negativamente en su eficiencia técnica de producción.

x

Análisis multivariado aplicado a la generación de escenarios complejos en torno a concepciones de sexualidad y género en alumnos de escuelas medias.

En el presente artículo se exponen aspectos analíticos y metodológicos de la aplicación de diversas técnicas de análisis de datos multivariados empleadas en una investigación sobre salud sexual y reproductiva y educación sexual. Se propone la categoría de escenarios complejos como construcción analítica que permite poner en vinculación concepciones, creencias y actitudes sobre sexualidad, diversidad sexual, género y aborto en base a un relevamiento por encuestas estructuradas en mujeres y varones adolescentes escolarizados en el nivel medio de Argentina realizado durante el segundo semestre del 2012. Dicho relevamiento tuvo como propósito principal indagar y explorar las formas en que determinadas concepciones sobre la sexualidad y el género de los alumnos se vinculan con modelos de educación sexual, las temáticas priorizadas en dichos abordajes, las formas en que se establecen los vínculos con docentes y adultos, los vínculos afectivos intrageneracionales, y las instancias de subjetivación juvenil. Se aplicaron una serie de técnicas estadísticas multivariadas: análisis de componentes principales, análisis de cluster por el método de K-medias y, fundamentalmente, el análisis de correspondencias múltiples para la generación de los escenarios complejos.

x

Las elecciones a Presidente de Argentina en 2011 y 2015.

La elección a Presidente en Argentina de 2011 tuvo como ganadora a la candidata por el Frente para la Victoria Cristina Kirchner con una amplia diferencia respecto al segundo. El triunfo de la candidata tiene diferentes explicaciones causales desde el punto de vista de las motivaciones del voto por parte del electorado. A través de la presente investigación se intenta identificar las variables condicionantes y jerarquizarlas. Las características socio demográficas del ciudadano no tienen la influencia de otros momentos. En cambio, variables relacionadas con la gestión, el posicionamiento de los candidatos y el vínculo entre Néstor Kirchner y su esposa adquieren mayor protagonismo como condicionantes del voto.

El triunfo de Mauricio Macri en la elección presidencial de 2015 también tiene sus explicaciones causales. Sin entrar en la profundidad de la elección de 2011, se encontraron aspectos ideológicos y vinculados al consumo como elementos motivadores del voto.

x

Las estadísticas educativas y los desafíos futuros: un sistema de información por alumno.

Este trabajo analiza tanto los antecedentes como las características actuales del sistema de información estadística del sistema educativo argentino. Se plantea también el camino futuro de este sistema, teniendo en cuenta los cambios tecnológicos que tuvieron lugar en nuestro país en los últimos años.

Actualmente, el sistema nacional de información educativa está basado, principalmente, en el Relevamiento Anual, operativo censal que recoge con un corte anual la información consolidada a nivel nacional sobre las principales variables del sistema educativo, exceptuando las universidades. Este sistema garantiza una información homogénea y comparable para todo el ámbito nacional.En la actualidad el sistema de información educativa enfrenta nuevos desafíos producto de un sistema educativo complejo y en constante transformación. Además, el Relevamiento Anual presenta varias limitaciones y solo permite analizar en forma parcial los nudos críticos del sistema educativo. Para paliar estas limitaciones, durante los años 2013 y 2015, se desarrolló un Sistema Integral de Información Digital Educativa —SInIDE—, basado en información nominal de los alumnos. Este nuevo sistema articula y compatibiliza los requerimientos de información de las distintas instancias de gestión en los niveles nacional y jurisdiccional y permite que las instituciones educativas desarrollen a través de este sistema sus propios procesos administrativos y pedagógicos. Su potencialidad radica en la posibilidad de acelerar todos los procesos y de recoger datos adicionales para diagnosticar el funcionamiento del sistema educativo y las trayectorias educativas de los alumnos, tanto a nivel de los establecimientos como a nivel provincial o nacional. Además, permite la construcción de nuevos indicadores para evaluar la situación del sistema educativo en todo el país, fortaleciendo las políticas que se llevan a cabo en el marco de la Ley de Educación Nacional.

x

El análisis de redes sociales como herramienta para focalizar la intervención en entornos rurales a través de políticas públicas.

Este trabajo muestra los resultados mediante la aplicación de un instrumento de recolección de datos reticulares para un estudio de línea de base y evaluación de políticas públicas en entornos rurales, a fin de describir, medir y comparar las formas de las asociaciones entre los agentes involucrados de dos cooperativas.

Los objetivos de la ponencia radican en describir y caracterizar las redes de asociaciones de pequeños productores rurales en un contexto social delimitado, y evaluar la viabilidad de complementar los análisis estadísticos cuantitativos tradicionales con la metodología del análisis de redes sociocéntricas, para focalizar las formas de intervención y detectar asociaciones latentes y potenciales.

Los resultados obtenidos al aplicar este instrumento en dos agrupaciones de pequeños productores rurales del Noroeste argentino, beneficiarios de un programa social en el año 2014, muestran dos grafos multiplexados diferenciados. Mientras que en la primera red la forma de las asociaciones para movilizar recursos estratégicos se encuentra restringida por la autoridad de los referentes de la organización, en la segunda se observa una distribución más equitativa y menos autoritaria de los vínculos, así como una intermediación menos centralizada.

Se concluye que esta metodología ha sido adecuada para describir las fuerza, dirección y circulación de las relaciones entre los nodos de las agrupaciones relevadas, así como la existencia de asociaciones potenciales que no sean efectivizado. De esta forma la toma de decisiones se ve beneficiada al disponer de información específica, que permite detectar la necesidad de fortalecer vínculos, así como la posibilidad de identificar nodos y subgrupos que centralizan la intermediación y los recursos o que pueden desarrollar una mejor circulación de los mismos a causa de sus posiciones estratégicas en las redes.

x

Las clases sociales según los censos de población de 1991 y 2001.

El artículo presenta una metodología para la reconstrucción de las series del Nomenclador de Condición Socio-Ocupacional y el esquema de clases de Torrado a lo largo del período 1980-2001, durante el cual los cambios en los sistemas clasificatorios de las variables involucradas en su construcción presentaron importantes cambios. Se utilizaron los datos secundarios del estudio “Estructura Social Argentina” del Consejo Federal de Inversiones para el censo de 1980 y los datos publicados por el Instituto Nacional de Estadística y Censos de los censos de población de 1991 y 2001, para el Total del País.

La investigación aborda tanto las cuestiones metodológicas enfrentadas a la realidad de la oferta estadística en Argentina así como también aspectos teóricos sobre la temática de la estructura social. Se realiza un detallado análisis de las fuentes existentes que permiten la construcción de series lo más homogéneas posibles en términos metodológicos con el objetivo de que muestren los cambios de la estructura social entre fines de los cuarenta y la actualidad. Se analizan también los resultados alcanzados. En lo que hace a este aspecto, sin embargo, la profundidad de la indagación es menor.

El aporte permite continuar y armonizar, con las dificultades y advertencias metodológicas que implica, los trabajos de Germani (1955) y Torrado (1992) y el análisis de la estructura social Argentina según datos secundarios cuantitativos.

Palabras clave: Condición Socio-Ocupacional; clases sociales; censos de población; estructura social argentina; mercado de trabajo; ocupación; empleo.

RAESTA 2 - año 2 (2015)

Artículos

Construcción de un índice del nivel socioeconómico del hogar urbano en la República Argentina mediante el análisis de correspondencia múltiple y escalamiento óptimo.

María Fernanda Artola1 / Iván Redini Blumenthal2

Introducción

El artículo presenta la construcción de un índice que tiene como finalidad asignar a cada hogar urbano de la República Argentina un nivel socioeconómico en base a los datos provistos por la Encuesta Nacional de Gasto de los Hogares que se realizó en áreas urbanas de todo el país, entre marzo de 2012 y marzo de 2013 (ENGHO 2012/2013).3

Dicho índice se integra en el marco de un estudio que comenzó a desarrollarse en el año 2014 y que tiene como fin estimarla relación de costo-efectividad de la vacuna contra el rotavirus y su impacto en el gasto de bolsillo de los hogares urbanos. La estimación del gasto de bolsillo, requirió efectuar un relevamiento a familias con niños menores de cinco años con gastroenteritis aguda en un grupo de centros de salud. Ante la dificultad de incluir en dicho cuestionario preguntas relativas al nivel de ingreso del hogar, resultó necesario construir un índice socioeconómico. Se aplicó el análisis de correspondencia múltiple (ACM), técnica exploratoria dentro de los métodos multi-variados estadísticos de interdependencia, utilizada para identificar relaciones sistemáticas entre variables donde a priori no hay una hipótesis respecto a la naturaleza de dichas relaciones y se utilizaron los resultados para obtener los pesos óptimos de las variables que componen el índice.

A continuación, se presenta la metodología utilizada, los pasos seguidos para su aplicación y los resultados encontrados. Por último, a modo de discusión, se menciona el alcance de la metodología, limitaciones y las consideraciones para su aplicación.4

Metodología utilizada

El análisis de correspondencia es una técnica exploratoria de interdependencia desarrollada por Jean-Paul Benzécri (Benzécri, 1973) cuyo objetivo es resumir una gran cantidad de datos en un número reducido de dimensiones, con la menor pérdida de información posible. Esta técnica basada en la descomposición de una matriz en valores singulares, puede presentarse en términos geométricos a través de visualizaciones gráficas así como también de forma analítica construyendo escalas de las categorías de las variables categóricas bajo análisis. Su objetivo es similar al de los métodos factoriales, aunque a diferencia de éstos, se aplica sobre variables categóricas.

Cuando el análisis contempla sólo dos variables o una tabla de doble entrada se denomina análisis de correspondencia simple (ACS) y cuando se aplica a más de dos variables se denomina análisis de correspondencia múltiple (ACM).

El ACM en su versión asimétrica contempla utilizar una matriz binaria asimétrica (tabla disyuntiva). Para construir dicha matriz, se recodifican las variables categóricas como variables binarias y para cada modalidad de cada variable hay sólo dos respuestas posibles: [0 = el encuestado no elige esa modalidad; 1 = el encuestado elige dicha modalidad]. Esta matriz es de dimensión (N X J), donde N es el tamaño de la muestra y J es el número total de modalidades asociadas a las P preguntas (variables). La suma de cada una de las filas es P y la suma de cada una de las columnas es la cantidad de individuos que asume la modalidad respectiva.

En el caso particular analizado, la dimensión de la tabla disyuntiva es de 20.960 X 39 donde las filas representan la cantidad de hogares encuestados en la ENGHO 2012/13 y 39 son el total de las modalidades asociadas a las 12 variables finalmente seleccionadas. Una vez aplicado el ACM a la tabla disyuntiva completa, los resultados se presentan en coordenadas estándares para las columnas mientras que para las filas se presentan como coordenadas principales. La inercia indica la calidad de representación y este valor varía entre 0% y 100%, indicando el 100% una perfecta representación.

El ACM en su versión simétrica consiste en construir la tabla simétrica de Burt a partir de la matriz binaria, con todos los cruces de las categorías de las P variables, resultando en una matriz de orden (J X J), siendo de orden 39 en este caso. Cada bloque de la matriz de Burt es una submatriz formada por tablas de contingencia de las variables dos a dos, excepto los bloques que están en la diagonal principal que son las tablas de contingencia de cada variable consigo misma.

De acuerdo a lo indicado por Michael Greenacre, el ACM efectuado mediante una matriz binaria asimétrica (tabla disyuntiva completa) es equivalente a aquel efectuado con la tabla de Burt (Greenacre, 2008).

Por otro lado, el “escalamiento óptimo” comprende un conjunto de métodos multivariados que buscan obtener la máxima discriminación entre las categorías de las variables mediante la construcción de pesos óptimos.

El escalamiento óptimo se vincula con el ACM en su forma asimétrica como simétrica. En el primer caso, a partir de la tabla disyuntiva completa, se puede pensar al ACM como un método de escalamiento óptimo, o en otras palabras, una técnica para la cuantificación de las categorías de las variables y la maximización de la distancia entre las mismas. A los fines de obtener los pesos óptimos, se asignan a las J modalidades dicotómicas de la tabla disyuntiva completa los pesos αihk,…,πm5 y luego se maximiza la varianza de las puntuaciones de las observaciones6 (combinaciones lineales de las filas):

7

donde ci ,cj, ck es la masa8 de la columna i,h,k, respectivamente.

Dado que la varianza máxima coincide con el valor que asume la inercia de la primera dimensión del ACM asimétrico y, además, los pesos óptimos obtenidos a partir de la maximización de la varianza coinciden con las coordenadas estándares, utilizaremos el ACM asimétrico para obtener los pesos óptimos del índice socioeconómico.

Aplicación del método

Como se mencionó previamente, a los fines de estudiar el impacto de la vacuna de rotavirus en los hogares de diferentes estratos socioeconómicos, se encuestaron a los familiares de los niños menores de cinco años con gastroenteritis aguda en las salas de espera de centros de salud en Ciudad de Buenos Aires, San Salvador de Jujuy y la ciudad de Salta durante el primer semestre del año 2014.

Dicha encuesta estuvo compuesta de cinco secciones. Las primeras dos eran relativas a los cuidados hospitalarios, medicamentos y gastos no habituales vinculados a la enfermedad de rotavirus. Las restantes secciones fueron destinadas a relevar información relacionada con la composición del hogar y sus características físicas, situación ocupacional y nivel educativo del jefe del hogar y del cónyuge.

Al respecto, no pudieron ser incluidos todos los aspectos del hogar y del jefe del hogar que incorpora la ENGHO 2012/2013 en la encuesta de gastroenteritis aguda ni en el índice socioeconómico debido a la posible sensibilidad de los encuestados, quienes se encontrarían en las salas de espera de los centros de salud.

Tomando en consideración las limitaciones mencionadas, se procedió a buscar diferentes alternativas para clasificar los hogares por estratos de ingresos o socioeconómicos a partir de los datos obtenidos por la encuesta de rotavirus.

Revisando estudios sobre pobreza, se observó que la misma es usualmente abordada bajo dos enfoques: el directo y el indirecto. La aproximación directa implica analizar la pobreza estructural (inercial) relevando aspectos vinculados a la calidad de la vivienda, condición habitacional, el acceso a servicios y a la educación. Por otro lado, el enfoque indirecto efectúa un relevamiento de la pobreza coyuntural (pauperización) vinculada a los niveles de ingresos. Cuando se presentan situaciones de pobreza tanto bajo el enfoque directo como indirecto, se denomina pobreza crónica o total. Sin embargo, pueden existir sub-universos cuando no son coincidentes las aproximaciones.

Clasificar a los hogares de los hogares de los encuestados según su nivel de ingreso, requería identificar los ingresos familiares de los encuestados para luego asignarles un quintil de ingreso en base a los quintiles construidos por el INDEC para la Encuesta Nacional de Gastos de los Hogares (2012/2013)9 o la Encuesta Permanente de Hogares. Sin embargo, este camino resultaba poco recomendable tanto por el posible rechazo por parte de los encuestados a brindar información como por la posible distorsión de la información brindada por un segmento relevante de quienes responden. Una alternativa frecuentemente utilizada para sortear dicha dificultad consiste en solicitar a las personas que indiquen el rango donde se ubica el ingreso total del hogar. Sin embargo, dicha alternativa no resultaba suficiente para resolver las limitaciones mencionadas anteriormente.

Tomando en consideración las limitaciones señaladas en el párrafo anterior respecto a los ingresos, se procedió a clasificar a los hogares por nivel socioeconómico, lo cual implicó construir una variable compleja y multidimensional no observada (latente) que la denominamos nivel socioeconómico.

En cuanto al software utilizado para aplicar el método se emplearon los paquetes estadísticos Foreign, Ca y principalmente FactoMineR del software libre R Project for Statistical Computing y para procesar las bases se utilizó Stata SE 11.1 e IBM SPSS Statistics 19.10

Resultados y discusión

En base a las variables incluidas tanto en la encuesta de gastroenteritis aguda como en la ENGHO 2012/2013, se aplicó el ACM en su forma asimétrica a la ENGHO 2012/2013 ponderado por los expansores muestrales.

Luego de probar distintas combinaciones de variables y analizar los resultados en términos de la inercia relativa, signos de coordenadas estándares, contribuciones y coseno al cuadrado de cada modalidad, el índice finalmente obtenido11 estuvo compuesto por las siguientes variables:

1. características del baño
2. características del piso
3. disponibilidad de cloacas
4. disponibilidad de teléfono fijo
5. pavimento en la cuadra
6. tipo de combustible utilizado para cocinar
7. cobertura médica del jefe del hogar
8. nivel de educación del jefe de hogar
9. nivel educativo del cónyuge
10. jefe de hogar de género femenino
11. situación laboral del jefe del hogar
12. hogar nuclear o extendido con niños menores de 14 años

A partir de los resultados obtenidos del análisis de correspondencia múltiple, se observa que la inercia de la primera componente alcanzó 0,2856 explicando el 12,71% de la inercia total mientras que las tres primeras componentes en conjunto explican el 25,91% y a partir de la 17° dimensión en conjunto se explica el 79,24% de la inercia. (Ver Cuadro N°1 del Anexo: Inercias principales). A pesar de los bajos valores de la inercia explicada tanto por el primer factor como por los tres primeros, el scree plot que se presenta a continuación indica una disminución importante en la pendiente a partir de la tercera dimensión lo que da cuenta que a partir de la cuarta dimensión, cada dimensión adicional aporta muy poco en términos individuales.

Gráfico 1: Scree Plot

Fuente: Elaboración propia.

Si analizamos la correlación al cuadrado de cada variable con cada dimensión, surge que las variables que caracterizan al hogar como ser el tipo de pisos, la presencia o no de pavimento en la cuadra de la vivienda, el tipo de desagote en el baño, la disponibilidad de cloacas, teléfono fijo y cobertura explícita del JH son las que están más correlacionadas con el primer eje. Por otro lado, las variables que hacen referencia a la situación laboral del Jefe de Hogar (JH), nivel educativo del cónyuge y el sexo del JH, se correlacionan principalmente con los ejes 2 y 3. Por último, las variables hogar nuclear con niños menores de 14 años y nivel educativo del JH se correlacionan tanto con la primera como con la segunda dimensión.

Lo anterior se puede ver con más detalle al analizar las contribuciones por modalidad y el grado de representación de cada modalidad por parte de cada una de las dimensiones. En términos generales, se observa que la inercia en la primera dimensión está explicada principalmente por las variables que caracterizan al hogar mientras que la inercia de la segunda y tercera dimensión se concentra en las características laborales y nivel educativo del jefe del hogar y del cónyuge (Tabla N°2 , Tabla N°3 y Gráfico N° 1 del Anexo).

Por otro lado, los coeficientes de las coordenadas estándares (pesos óptimos del escalamiento) en la primera dimensión indican que se reducen (incrementan) a medida que las características del hogar y/o del JH y su cónyuge son más favorables (menos favorables). A partir de la segunda y tercera dimensión no se observa una consistencia entre los signos de las diferentes variables y esto se puede explicar porque los otros ejes dan cuenta del comportamiento de un grupo más reducido de variables inherentes al jefe del hogar y del cónyuge. Esta situación nos impulsó a trabajar únicamente con la primera dimensión, además del hecho de que los pesos obtenidos en el escalado óptimo en su versión asimétrica coinciden con las coordenadas estándares del primer eje principal obtenidas a partir del ACM.

En línea con lo anterior, fue considerado el alfa de Cronbach que permite evaluar la fiabilidad de la prueba y testear dicha fiabilidad si se excluyera un determinado ítem. Esta medida está basada en el promedio de las correlaciones de las variables que forman parte de una misma dimensión teórica (componente principal), obteniendo como resultado 0,77 para la primera dimensión. En general, el valor mínimo aceptable es de 0,6 aunque hay autores que sugieren un valor mínimo de 0,7, lo cual indicaría que en este caso los resultados son aceptables.

A diferencia de la escala original de las variables, la escala óptima para la primera dimensión no sitúa a las categorías de cada variable a distancias iguales. Por ejemplo, en el caso que la vivienda esté ubicada en una calle con pavimento la puntuación es negativa (-0,32), de lo contrario la puntuación es positiva (+0,98). El mismo comportamiento se observa en la variable pisos donde la puntuación es negativa (-0,3117) cuando el piso es de cerámica, madera, baldosa, mosaico, mármol o alfombra y suma (+1,4) puntos si es de cemento, ladrillo fijo y (+2,22) puntos cuando es de ladrillo suelto o de tierra.

A partir de los valores de escala óptimos, se procedió a calcular el puntaje total para cada unos de los hogares encuestados en la ENGHO 2012/2013 y se observó que cuanto más bajo es el índice, más alto es el estrato socioeconómico del hogar, confirmándose el comportamiento individual de las variables bajo análisis. Finalmente, a partir de los puntajes totales, se construyeron los quintiles a nivel hogar como se detalla en la Tabla N°1.

Tabla 1: Quintiles socioeconómicos

Fuente: elaboración propia en base a ENGHO 2012/2013. Procesado con SPSS.

El cuadro N° 4 del Anexo: Cantidad de hogares por modalidad y por quintil socioeconómico indica que el comportamiento de cada variable es consistente con cada quintil socioeconómico construido. A continuación, se presentan a modo de ejemplo la forma en la cual varían ciertas variables a lo largo de los quintiles construidos a partir del índice socioeconómico.

Gráfico 2: Distribución de los hogares por presencia de pavimento y quintil socioeconómico

Fuente: elaboración propia en base a índice socioeconómico y ENGHO 2012/2013.

En el caso de la variable “presencia de pavimento en la cuadra”, mientras que en el primer quintil muy pocos hogares poseen pavimento en su cuadra, en el quinto quintil la mayoría lo tienen, según se pone de manifiesto en el Gráfico Nº 2. Por otro lado, el tipo de pisos cambia a medida que uno avanza de quintil, mientras que en el primer quintil el 48% de los hogares tiene cemento o ladrillo fijo, dicho porcentaje se reduce a 19% en el segundo quintil y a menos de 1% en el quinto quintil.

Gráfico 3: Distribución de los hogares según tipo de pisos y nivel socioeconómico

Fuente: elaboración propia en base a índice socioeconómico y ENGHO 2012/2013.

Por otro lado, la cantidad de hogares con alto nivel educativo del jefe del hogar y el cónyuge se incrementa a medida que mejora el nivel socioeconómico. Como se observa en el Gráfico 4, en el primer quintil, el 61% de jefes de hogar no alcanzó a finalizar la secundaria y sólo un 37% la finalizó mientras que, en el quinto quintil, un 66% de los jefes de hogar alcanzaron un nivel educativo de superior/universitario incompleto o más y un 23% de los jefes de hogar finalizaron los estudios secundarios.

Gráfico 4: Distribución de los hogares según nivel educativo del jefe del hogar y quintil socioeconómico

Fuente: elaboración propia en base a índice socioeconómico y ENGHO 2012/2013.

Similar comportamiento se observa en el caso de la educación del cónyuge según se ilustra en el gráfico N° 5.

Gráfico 5: Distribución de los hogares según nivel educativo del cónyuge y quintil socioeconómico

Fuente: elaboración propia en base a índice socioeconómico y ENGHO 2012/2013.

En el caso de la situación laboral del jefe del hogar, a pesar de que esta variable contribuye poco a la inercia de la primera dimensión, se puede apreciar que la participación de la relación de dependencia con descuentos para jubilación y obra social sube a lo largo de los quintiles en detrimento de la relación de dependencia sin descuentos. Por otro lado, los cuenta propistas pierden participación y los patrones incrementan su participación pero no a gran escala. Algo interesante para señalar es que la proporción de desocupados se incrementa a medida que mejora el quintil. A pesar del bajo poder explicativo de esta variable se podría indagar acerca de las características (duración, motivo, etc.) de dicho desempleo en cada uno de los quintiles.

Gráfico 6: Distribución de los hogares según condición laboral del jefe del hogar y quintil socioeconómico

Fuente: elaboración propia en base a índice socioeconómico y ENGHO 2012/2013.

Por otro lado, si se analizan los gastos e ingresos promedios de cada quintil socioeconómico, se observa que a medida que se avanza de quintil, se incrementan tanto el ingreso y gasto en términos totales y per cápita.

Tabla 2: Quintiles socioeconómicos

Fuente: elaboración propia en base a ENGHO 2012/2013. Procesado con SPSS.

Finalmente, al comparar los quintiles del gasto per cápita del hogar que surgen de ENGHO 2012/2013 con los quintiles construidos a partir del índice socioeconómico, se observa que hay más coincidencias en los quintiles de los extremos que en los centrales. Esto puede deberse a que, a pesar de que ambas variables miden la pobreza desde un enfoque directo, la definición empleada de pobreza no sea exactamente la misma. Por otro lado, este bajo nivel de coincidencia podría estar reflejando una limitación de la metodología empleada producto de haber considerado únicamente la primera dimensión del análisis de correspondencia múltiple.

Tabla 3: Quintiles socioeconómicos y quintiles de gasto per cápita del hogar

Fuente: elaboración propia en base a ENGHO 2012/2013. Procesado con SPSS.
Consideraciones finales

En este artículo se presentó el proceso de construcción de un índice que permite clasificar a los hogares urbanos por nivel socioeconómico. Se pensó a esta variable como latente y dado que las coordenadas estándares del primer eje principal obtenidas a partir del análisis de correspondencia múltiple (ACM) coinciden con los pesos óptimos obtenidos del escalado óptimo, se aplicó el ACM.

Una vez obtenidos y analizados los resultados del ACM, en base a los ponderadores en la primera dimensión, se procedió a calcular el puntaje total para cada unos de los hogares encuestados de la ENGHO y se construyeron los quintiles. Se observó que a medida que aumenta el puntaje del índice, más bajo es el estrato socioeconómico del hogar.

Entre las limitaciones del índice, cabe señalar que el indicador construido es de carácter estático atento a que se utilizó únicamente la ENGHO 2012/2013. Se podría haber utilizado la Encuesta Permanente de Hogares (EPH) que se publica trimestralmente y luego efectuar un seguimiento de los pesos óptimos a lo largo de determinado período de tiempo. Sin embargo, se optó por utilizar la ENGHO 2012/2013 debido a que abarca mayor cantidad de hogares urbanos y cubre más dimensiones que la EPH.

Por otro lado, el indicador fue construido únicamente a partir de los pesos óptimos de la primera componente, aspecto que debería sería ser considerado para mejorar la precisión del mismo utilizando algún método que permita incorporar más dimensiones obtenidas a partir del análisis de correspondencia múltiple.

Analizando la literatura, las variables educación del cónyuge, sexo del jefe del hogar y presencia de niños menores a 14 años en hogares nucleares no son comunes al construir índices socioeconómicos o de pobreza. Sin embargo, fueron incluidas debido a que los registros de nacimientos y mortalidad infantil se cruzan generalmente con el nivel de educación de las madres de los niños. Estas variables no contribuyen de manera significativa a la inercia de la primera dimensión, sin embargo, la inclusión de las mismas se justifica con los objetivos del trabajo de gastroenteritis que da marco al estudio.

Por último, cabe destacar que a pesar de las limitaciones mencionadas, la utilidad de este método al diseñar indicadores alternativos multidimensionales de nivel socioeconómico, pudiendo ser considerada para estudios de desarrollo y pobreza. La flexibilidad propia de la técnica utilizada permite explorar variantes en la construcción de los índices y considerar la inclusión de distintas variables, pudiendo considerar a la ENGHO 2012/2013 para tal fin así como también otras encuestas.

Bibliografía

Arakaki, Agustín (2011). La pobreza en Argentina 1974-2006. Construcción y Análisis de la información. Documento de Trabajo N° 15. Centro de Estudios sobre Población, Empleo y Desarrollo. Argentina.
Benzécri JP (1973). L’analyse des donn´ees. Tome 1: La taxinomie. Tome 2: L’analyse des correspondances. Dunod, Paris.
Ezzrari, Abdeljaouad y Verme,Paolo. June, 2012. A multiple correspondence analysis approach to the measurement of multidimensional poverty in Morocco 2001 – 2007. Policy Research Working Paper 6087. The World Bank. Middle East and North Africa Region Economic Policy, Poverty and Gender.
Frikkie Booysen; Servaas van der Berg, Ronelle Burger, Michael von Maltitz, Gideon du Rand. Abril 2008. Using an asset index to asses trends in poverty in seven Sub-Saharan African countries. Using an Asset Index to Assess Trends in Poverty in Seven Sub-Saharan African Countries. Elsevier.
Greenacre, Michael. 2008. La práctica del análisis de correspondencias. Julio 2008. Fundación BBVA.
Greenacre, Michael. 2002. The use of correspondence analysis in the exploration of health survey data. Documentos de trabajo 5. Fundación BBVA.
Hoffman Donna, De Leeuw, Jan. 1992. Interpreting Multiple Correspondence Analyses as a Multidimensional Scaling Method. Marketing Letter 3:3. Kluver Academic Publishers.
Howe, Laura; Hargreaves, James and Huttly, Sharon. January, 2008. Issues in the construction of wealth indices for the measurement of socio-economic position in low income countries. Emerging themes in epidemiology. Bio Med Central.
Instituto Nacional de Estadística y Censos (2003-Mayo). Incidencia de la pobreza y de la indigencia en los Aglomerados Urbanos. ISSN 0327– 7968. Argentina.
Le, Sébastian, Josse, Julie, Husson, Francois. FactoMineR: March 2008. An R Package for Multivariate Analysis. Journal of Statistical Software. Volume 25, Issue 1.
Nenadic, Oleg and Greenacre, Michael. May 2007. Correspondence Analysis in R, with two and three dimensional Graphics: The ca Package. Journal of Statistical Software. Volume 20, Issue 3.
Njong, Aloysius Mom and Ningaye, Paul. August 2008. Characterizing weights in the measurement of multidimensional poverty: An application of data driven approaches to Cameroon. OPHI Working Paper.
Tenenhaus, Michael and Young, Forrest. March 1985. An analysis and synthesis of multiple correspondence analyses, optimal scaling, dual scaling, homogeneity analysis and other methods for quantifying categorical multivariate data. Psychometrika. Volume 50, N° 1

Anexo

Tabla NºI: Inercias principales

Fuente: elaboración propia en base a FactoMineR de R Project.

Tabla NºII: Correlación al cuadrado de cada variable con cada dimensión

Fuente: elaboración propia en base a FactoMineR de R Project.

Tabla NºIII: Contribuciones y correlaciones de las modalidades de las variables – Tres primeras componentes –

Gráfico I: Coordenadas principales e inercias de los primeros 2 ejes

Fuente: elaboración propia en base a R Project.

Cuadro N° I: Representación algebraica del índice: el valor del índice socioeconómico de cada hogar surge del puntaje que adquiere la modalidad seleccionada por los encuestados pertenecientes a determinado hogar. Cada modalidad es excluyente de la otra, por ej. en el caso de pavimento en al cuadra, hay o no hay. Por lo tanto, cada variable suma un puntaje de una sola modalidad.

Tabla NºIV: Cantidad de hogares por modalidad y por quintil socioeconómico

Fuente: elaboración propia.