Sistema de ecuaciones estructurales: una herramienta de investigación

Tamaño: px
Comenzar la demostración a partir de la página:

Download "Sistema de ecuaciones estructurales: una herramienta de investigación"

Transcripción

1 Sistema de ecuaciones estructurales: una herramienta de investigación 4

2

3 Sistema de ecuaciones estructurales: una herramienta de investigación Cuaderno técnico 4

4 Sistema de ecuaciones estructurales: una herramienta de investigación Cuaderno técnico 4 Abigaíl Manzano Patiño Salvador Zamora Muñoz Revisión técnica: Lucía Monroy Cazorla Mauricio Arce Orozco Sistema de ecuaciones estructurales: una herramienta de investigación Cuaderno técnico 4 D.R. 2009, Centro Nacional de Evaluación para la Educación Superior, A.C. (Ceneval) Av. Camino al Desierto de los Leones 19, Col. San Ángel, Deleg. Álvaro Obregón, C.P , México, D.F. Diseño: Mónica Cortés Genis Formación: Alvaro Edel Reynoso Castañeda Primera edición, septiembre de 2010 Impreso en México Printed in México

5 Directorio Dirección General Rafael Vidal Uribe Dirección General Adjunta de los EGEL Jorge Hernández Uralde Dirección General Adjunta de los EXANI José O. Medel Bello Dirección General Adjunta de Programas Especiales Rocío Llarena de Thierry Dirección General Adjunta Técnica y de Investigación Lucía Monroy Cazorla Dirección General Adjunta de Operación Francisco Javier Apreza García Méndez Dirección General Adjunta de Difusión Javier Díaz de la Serna Braojos Dirección General Adjunta de Administración Francisco Javier Anaya Torres Dirección de Procesos Ópticos y Calificación María del Socorro Martínez de Luna Dirección de Tecnologías de la Información y las Comunicaciones Francisco Manuel Otero Flores

6

7 Índice Prefacio Antecedentes históricos Áreas de aplicación Relaciones causales entre variables Variables latentes y variables manifiestas Elementos de los modelos de ecuaciones estructurales Tipos de parámetros Tipos de modelos de ecuaciones estructurales Identificabilidad del modelo Métodos de estimación Modelos con variables discretas Bondad de ajuste del modelo Efecto total, directo e indirecto entre variables Lisrel (LInear Structural relations) Introducción a Lisrel La pantalla principal de Lisrel Prelis Crear la base desde Prelis Data Importar la base desde un archivo externo Datos faltantes Obtención de la matriz de correlaciones Pearson, policóricas y asintótica Dibujando el diagrama que describe al modelo Bibliografía

8 Índice de tablas Tabla 1. Notación básica en los modelos de EE Tabla 2. Funciones de ajuste Tabla 3. Medidas de correlación entre variables con distintas escalas Índice de figuras Figura 1. Modelo recursivo Figura 2. Modelo no recursivo Figura 3. Modelo factorial confirmatorio Figura 4. Modelo de regresión estructural Figura 5. Modelo mimic Figura 6. Modelo de crecimiento Figura 7. Correlaciones Figura 8. One way path Figura 9. Multi-segment path

9 Figura 10. Correlación entre calesc y capitec Figura 11. Habilidad del sustentante Figura 12. Ajuste del modelo Figura 13. Residuos estandarizados Figura 14. Índices modificados Figura 15. Valores estandarizados Figura 16. Efectos indirectos y totales Figura 17. Modelo con tres factores en población femenina

10

11 Prefacio E l Centro Nacional de Evaluación para la Educación Superior (Ceneval) es una institución de carácter eminentemente técnico. A lo largo de tres lustros su actividad esencial ha sido promover la calidad de la educación mediante evaluaciones válidas, confiables y pertinentes de los aprendizajes. Primordialmente, evalúa los conocimientos y habilidades adquiridos por los individuos en los procesos de enseñanza-aprendizaje, formales o no formales, de los sistemas educativos. Así contribuye a la toma de decisiones fundamentadas. De hecho, con sus servicios de evaluación atiende instituciones de educación media superior y superior, autoridades educativas, organizaciones profesionales y otras instancias públicas y privadas y, desde luego, al destinatario final y el más importante de sus pruebas: el propio sustentante. Con la serie Cuadernos técnicos el Centro promueve también el uso de herramientas de análisis en círculos cada vez más amplios. El propósito de estos títulos es contribuir a elevar la calidad de la educación mexicana y fomentar una auténtica cultura de la evaluación. El desarrollo de modelos que incorporan variables latentes y variables medidas objeto de estudio del presente texto se ha incrementado de forma espectacular. Este tipo de modelos tienen aplicación en diversas disciplinas, como la psicología (depresión en adolescentes, adicciones y problemas del comportamiento), la sociología (estudios acerca de la salud ocupacional, redes sociales, ambientes laborales), la mercadotecnia (análisis de satisfacción del consumidor, diseño y desarrollo de nuevos productos), entre otras. En lo concerniente a la investigación educativa, los modelos de ecuaciones estructurales se aplican en estudios de motivación para lectura y aprendizaje, usos de las nuevas tecnologías para la enseñanza, etcétera. Sistema de ecuaciones estructurales tiene el propósito de promover una reflexión más profunda sobre estas valiosas herramientas de investigación. Sistema de ecuaciones estructurales: una herramienta de investigación 9

12 Antecedentes históricos E l primer antecedente de un modelo de ecuaciones estructurales se remonta a 1934, año en el que el biómetra Sewall Wright da a conocer el modelo de trayectoria (path analysis) sobre las relaciones de tamaño en mediciones óseas. Para Wright éste no era un método para descubrir causas, sino más bien era un método aplicado a modelos causales ya formulados con base en un conocimiento y consideración teórica. Esta técnica permitía descomponer la varianza y covarianza de las variables involucradas, en función de los parámetros de un sistema de ecuaciones simultáneas y tenía como fin estudiar el efecto directo e indirecto entre estas variables. A diferencia de los métodos matriciales empleados en la actualidad, él utilizaba diagramas de trayectoria en lugar. No obstante su importancia, este modelo fue ignorado en biología, sociología y psicología. No es sino hasta los años sesenta y principios de los setenta que Blalock, Boundon, Duncan y otros sociólogos reconocen el potencial del análisis de trayectoria y las técnicas relacionadas de correlación parcial, como herramientas para analizar datos no experimentales. Este redescubrimiento del análisis de trayectoria en la sociología se propagó a la ciencia política y a otras ramas de las ciencias sociales. En la segunda mitad del siglo xx varios estadísticos se vieron interesados en los retos que presentaba la estimación de estos modelos. D.N. Lawley, T.W. Anderson, K.G. Jöreskog, M.W. Browne, A. Satorra, D. Sörbom y B. Muthén, entre otros, dan respuesta a la gran cantidad de desafíos que se derivan de los procesos para estimar estos modelos de ecuaciones estructurales. Un paso decisivo ocurre cuando Jöreskog (1973), Keesling (1972) y Wiley (1973) desarrollan un modelo general de ecuaciones estructurales e incorporan diagramas de trayectoria y otras características del análisis de trayectoria, conocido como modelo Lisrel (linear structural relations) o modelo jkw. Además de facilitar la difusión del análisis de trayectoria, presenta las ecuaciones que se derivan de las covarianzas entre las variables, a través de operaciones matriciales en lugar de que se lean del diagrama de trayectoria, y proporciona una 10 Cuaderno técnico 4

13 descomposición más clara de los efectos directos, indirectos y totales. Lisrel incorpora modelos con variables latentes y variables medidas, fundamentales en las técnicas contemporáneas de ecuaciones estructurales. El desarrollo de modelos con esta combinación de variables latentes y medidas se ha incrementado de forma espectacular. Jöreskog extendió el análisis factorial exploratorio al factorial confirmatorio, desarrolló el modelo factorial de segundo orden, el análisis factorial multi-grupo y el ya citado modelo general de ecuación estructural Lisrel. Además, desarrolló métodos para la estimación y prueba de dichos modelos para datos transversales, longitudinales, multi-grupo y multinivel. La influencia de Jöreskog no sólo se limita a los desarrollos propios. Varios de sus estudiantes de doctorado han realizado importantes contribuciones. Por ejemplo, Sörbom (1974) extiende el modelo multi-grupo para incluir medias en las variables latentes; Muthén (1977) introduce métodos para incluir variables observadas categóricas; Hägglund (1985) contribuye con el método de mínimos cuadrados por medio de estimación de dos estados (two-state last-square methods); Quiroga (1992), por su parte, realiza estudios de robustez con correlaciones policóricas para desviaciones del supuesto de normalidad, mientras que Yang- Wallentin (1997) desarrolla métodos para estimar relaciones no lineales. Los avances recientes en modelos de ecuaciones estructurales comprenden extensiones para estimaciones en datos que provienen de muestras complejas, modelos lineales generalizados y series de tiempo. Sistema de ecuaciones estructurales: una herramienta de investigación 11

14 Áreas de aplicación En el ámbito de la psicología, este tipo de modelos se aplica principalmente en estudios sobre depresión en adolescentes, adicciones y problemas del comportamiento. En sociología, sus aplicaciones comprenden estudios acerca de la salud ocupacional, redes sociales, ambientes laborales y otros. En mercadotecnia abarca, sólo por citar algunos, los análisis de satisfacción del consumidor, beneficios de los medios de comunicación en los negocios, así como diseño y desarrollo de nuevos productos. En lo concerniente a la investigación educativa, los modelos de ecuaciones estructurales se aplican en estudios de motivación para lectura y aprendizaje, usos de las nuevas tecnologías para la enseñanza, etcétera. En medicina se usan en estudios de trastornos del sueño, servicios de salud en la población, epidemiología ambiental, entre otros. Aquí damos cuenta de las principales áreas de aplicación, pero existen muchas más en las que el uso de este tipo de modelos empieza a ser una práctica común. 12 Cuaderno técnico 4

15 Relaciones causales entre variables N o se pretende aquí fomentar una discusión exhaustiva sobre causalidad. El propósito es modesto: promover una reflexión más profunda sobre este importantísimo elemento, presente en los modelos que se describen. Un elemento fundamental en los modelos de ecuaciones estructurales es la presencia de relaciones causales entre las variables que los componen. Las relaciones de causalidad se establecen en diversas áreas del conocimiento, en ciencias, en humanidades y muchos otros campos. Sin embargo, existen varias connotaciones del término causalidad. De acuerdo con la definición general de Bollen (1989), consideremos una variable y1, que está aislada de toda influencia excepto de la de una segunda variable x1. Si un cambio en y1 proviene de un cambio en x1, entonces x1 es causa de y1. La definición de causa tiene tres componentes: aislamiento, asociación y dirección de la influencia. Al observar los elementos en las relaciones causales, se aprecia que lo que hace casi imposible tener absoluta certeza de que una variable es causa de otra es la posibilidad de afirmar que y1 está aislada de cualquiera otra causa, excepto de x1. Aislamiento es un ideal no asequible. Podemos decir que existe un aislamiento cuando x1 y y1 están en un vacío que excluye cualquier otra influencia. Mucho del debate sobre el estatus causal de una relación inicia con la interrogante sobre si la asociación entre y1 y x1 no se debe a estos otros factores. Sin la condición de aislamiento de y1, nunca tendremos la certeza de que x1 causa a y1. Varios estudios experimentales, cuasi experimentales y observacionales, intentan aproximarse a estas condiciones de aislamiento, por medio de alguna forma de procesos de control o de aleatorización. La asociación es la segunda condición para establecer la causalidad. Cuando una supuesta causa y su efecto están aislados de otras influencias, podrían estar asociados. Una asociación bivariada no es condición necesaria ni suficiente para una relación causal. La asociación, junto con otros factores, sí. Sistema de ecuaciones estructurales: una herramienta de investigación 13

16 Bollen (1989) presenta varios escenarios relacionados con modelos de ecuaciones estructurales, en los que resulta difícil determinar la asociación entre las variables que componen un modelo. Los problemas van desde la propia determinación de la existencia de la asociación entre las variables, los casos en los que las técnicas estadísticas para evaluarla son inadecuadas y los problemas que provoca la multicolinealidad en la estimación de estas asociaciones. El componente final de una relación causal es la dirección causal. La plausibilidad de una asociación causal inicia con la determinación de la dirección correcta. La variable que produce la causa requiere una prioridad temporal como una condición de causalidad. La supuesta causa debe preceder al efecto, es decir que la variable explicativa tiene primicia causal. Si debe existir un intervalo entre la causa y el efecto que ésta produce, qué tan largo debe ser este intervalo? En estudios epidemiológicos, por ejemplo, es importante determinar cuánto tiempo se debe estar expuesto a un riesgo para desarrollar una enfermedad. Nuevamente referimos al lector a Bollen (1989) para intentar esclarecer la dirección causal. En síntesis, hemos tomado una definición de causalidad orientada a los modelos de ecuaciones estructurales, pues se asume necesario contar con tres condiciones: aislamiento, asociación y dirección de la causalidad para establecer una relación causal. Cada una de estas condiciones es difícil de obtener; sobre todo la certeza de que una causa y su efecto estén aislados de cualquier otra influencia. Por ello debemos ver a los modelos únicamente como una aproximación a la realidad. Las pruebas estadísticas sólo podrán descartar modelos, jamás probarán modelos o relaciones causales dentro de ellos. Los problemas para demostrar el aislamiento, la asociación y la dirección causal son muy añejos en el entorno de las distintas áreas de la ciencia. 14 Cuaderno técnico 4

17 Variables latentes y variables manifiestas E n muchas disciplinas relacionadas con las ciencias sociales es usual intentar medir la inteligencia, motivación, eficiencia, percepción, habilidad verbal, etcétera fenómenos de una gran complejidad, a partir de percepciones, opiniones, indicadores y variables relativas o aproximadas. Este tipo de variables recibe un nombre genérico: variables latentes. La naturaleza de estas variables cuestiona la posibilidad de medirlas pues, a diferencia de muchos fenómenos donde es posible crear condiciones de laboratorio para reproducirlos, los fenómenos asociados a variables latentes carecen no sólo de la posibilidad de medirlos sino, en múltiples ocasiones, de una definición precisa. Cualquier entidad hipotética de difícil definición dentro de una teoría científica puede representarse a través de una variable latente en muchas áreas denominada constructo, la cual no se puede observar o manipular de forma directa. Las variables manifiestas se pueden medir de manera directa y representan características observables de algún fenómeno subyacente, al contrario de las latentes. Una característica importante de estas variables es que sirven para evidenciar o definir a las variables no observadas o latentes. La forma de modelar un fenómeno que requiere representar relaciones entre variables latentes y variables medidas o manifiestas es a través de los modelos de ecuaciones estructurales. Sistema de ecuaciones estructurales: una herramienta de investigación 15

18 Elementos de los modelos de ecuaciones estructurales Un modelo de ecuaciones estructurales puede representarse por medio de un diagrama de trayectorias y un sistema de ecuaciones. En general, es recomendable comenzar por representarlo gráficamente, lo cual facilita la escritura de las ecuaciones que describen a dicho modelo. Existe un consenso para la representación de estos modelos. Así, una variable observada se expresa por medio de un cuadrado o rectángulo, una variable latente con un círculo o elipse, y la asociación y la correlación entre dos variables se manifiestan por medio de una flecha unidireccional ( ) y bidireccional ( ), respectivamente. Las variables dependientes son fácilmente identificables: reciben al menos una flecha. De las independientes sólo salen flechas, pero no entran. La tabla 1 muestra la notación básica para representar los modelos en términos de ecuaciones. Tabla 1. Notación básica en los modelos de EE Variable Símbolo expresado en forma matricial Descripción Variable observada dependiente Variable observada independiente Coeficiente entre una variable observada o entre una variable latente y una observada Error asociado a Y Error asociado a X Variable latente independiente Variable latente dependiente Error asociado a η Coeficiente entre variables latentes dependientes Coeficiente entre una variable latente independiente y una dependiente Matriz de covarianza asociada a ξ 16 Cuaderno técnico 4

19 En modelos en donde sólo se incluyen variables observadas (modelo de trayectorias) algunas veces se usan las matrices B y Γ en lugar de Λ. En el caso de los errores, se utiliza ζ en lugar de ε para simplificar la notación. Lo anterior es conveniente si dichos modelos ajustan con Lisrel. Sistema de ecuaciones estructurales: una herramienta de investigación 17

20 Tipos de parámetros E n los modelos de ecuaciones estructurales hay tres tipos de parámetros: libres, fijos y de restricción. Los libres, que deberán estimarse en el proceso, son los siguientes: las varianzas que corresponden a las variables independientes, las covarianzas entre variables independientes, todos los coeficientes que conectan a las variables latentes con sus respectivas variables observadas, los que conectan a latentes con latentes y los que conectan a observadas con observadas. A los fijos se les asigna de inicio un valor constante sin ser parámetros por estimar en el modelo. Los de restricción son aquellos sobre los que se expresa una conjetura acerca de sus valores. Esencialmente, esta presunción se establece en términos de una hipótesis, por lo que se igualan a un valor particular (cero, por ejemplo), o se asume que son iguales a otro u otros parámetros del modelo. 18 Cuaderno técnico 4

21 Tipos de modelos de ecuaciones estructurales De acuerdo con su estructura y con la naturaleza de las variables que contienen, hay varios tipos de modelos de ecuaciones estructurales: de trayectoria, factorial confirmatoria, factorial de segundo orden, de regresión estructural, mimic, de crecimiento, entre otros. El análisis de trayectoria, el modelo más simple, sólo involucra variables observadas. Es similar a un modelo de regresión lineal, aunque la diferencia radica en que en éstos se puede estimar el efecto indirecto que tiene una variable sobre otra, lo que no puede hacerse con el de regresión lineal. Hay dos tipos de modelos de trayectoria: recursivos y no recursivos. En los modelos recursivos (figura 1) no es posible que haya causalidad recíproca (si hay una trayectoria de Y1 a Y2 no puede haber una de Y2 a Y1) ni ciclos ni correlación entre los errores; en un modelo no recursivo (figura 2), sí. Figura 1. Modelo recursivo Figura 2. Modelo no recursivo X 1 γ11 γ 21 γ 11 X 1 Y 1 ζ 1 γ 21 ζ 1 β Y 21 1 Y 2 ζ 2 β 21 β 12 γ 12 γ 12 γ 22 X 2 γ 22 X 2 Y 2 ζ 2 Sistema de ecuaciones estructurales: una herramienta de investigación 19

22 La ecuación que describe el modelo recursivo es de la siguiente forma Y = BY + ΓX+ ζ Esto es: Y 1 = γ 11 X 1 + γ 12 X 2 + ζ 1 De forma matricial se escribe como: Y 2 = β 21 Y 1 + γ 21 X 1 + γ 22 X 2 + ζ 2 ( Y ) ( )( ) ( )( ) ( ) = Y γ 1 11 γ 12 X + 1 ζ + 1 Y 2 β 0 Y γ X 2 ζ 2 El modelo factorial confirmatorio permite explicar la correlación entre variables latentes y la asociación entre cada latente y sus correspondientes variables observadas. Como su nombre lo indica, está orientado a confirmar la estructura sugerida por medio del modelo. γ 21 Figura 3. Modelo factorial confirmatorio 31 ξ ξ 3 ξ 2 λ 11 λ 21 λ 31 λ 42 λ 52 λ 62 λ 73 λ 83 X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 δ 1 δ 2 δ 3 δ 4 δ 5 δ 6 δ 7 δ 8 20 Cuaderno técnico 4

23 La ecuación asociada a este modelo es: X = Λ x ξ+δ X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 λ λ λ = 0 λ λ 52 λ λ 73 λ 83 ξ 1 ξ 2 ξ 3 δ 1 δ 2 δ 3 δ 4 δ 5 δ 6 δ 7 δ 8 El modelo de regresión estructural difiere del factorial confirmatorio en que entre las variables latentes existe asociación y no sólo correlación, lo que permite identificar dos submodelos de manera natural. Uno de ellos, que suele denominarse modelo estructural, establece la asociación entre variables latentes, mientras que el otro está formado por la asociación entre variables latentes y observadas. Sistema de ecuaciones estructurales: una herramienta de investigación 21

24 Figura 4. Modelo de regresión estructural δ 1 X 1 λ x 11 ζ 1 λ y 11 Y 1 ε 1 δ 2 X 2 λ x 21 ξ 1 γ 11 η 1 λ y 21 Y 2 ε 2 λ x 31 β 21 γ 21 λ y 31 δ 3 X 3 ζ 2 η 2 Y 3 ε 3 λ y 42 λ y 52 λ y 62 Y 4 Y 5 Y 6 ε 4 ε 5 ε 6 Modelo estructural: η= Bη + ΓX + ζ Modelo de medición: Y = Λ X η + ε X = Λ Y ξ + δ El modelo mimic (multiple indicators and multiple causes of a single latent variable) es un caso especial del modelo de regresión estructural. 22 Cuaderno técnico 4

25 Figura 5. Modelo mimic X 1 X 2 ζ 1 Y 1 ε 1 X 3 η 1 Y 2 ε 2 X 4 Y 3 ε 3 X 5 Las ecuaciones que lo describen son: η = ΓX+ζ Y=Λ y η+ε El modelo de crecimiento (Latent Growth Curve Model) se utiliza con datos de tipo longitudinal. Para que este tipo de modelo funcione adecuadamente se deberá garantizar que se cumplan los siguientes requerimientos: todos los individuos deberán contar con información en cada uno de los tiempos o etapas involucrados en el modelo, el espaciamiento entre un tiempo (o etapa) y otro debe ser similar en todos los individuos, la variable de respuesta debe ser continua, el número de periodos debe ser mayor a dos y el tamaño de muestra debe ser al menos de 200 en cada uno de los tiempos (Boomsma, 1985; Boomsma y Hoogland, 2001). Sistema de ecuaciones estructurales: una herramienta de investigación 23

26 Figura 6. Modelo de crecimiento Intercepto Pendiente Xt 1 Xt 2 Xt 3 Xt 4 24 Cuaderno técnico 4

27 Identificabilidad del modelo D esde que en el aula cursamos álgebra elemental enfrentamos problemas de identificabilidad de un modelo, concretamente cuando trabajamos con ecuaciones simultáneas. Una ecuación de la forma 2x - 3y = 4 no tenía solución única y su solución dependía de asignar un valor particular a alguna de las incógnitas (x o y) y encontrar el valor correspondiente de la otra. Dicho en los términos, x y y son nuestros parámetros, y fijamos uno de ellos, para encontrar solución de la ecuación o del sistema. También recordamos que si teníamos otra ecuación que no fuera linealmente dependiente de la primera, podríamos encontrar la solución sin necesidad de asignar ningún valor a nuestras incógnitas. Retomaremos más adelante, algunas de estas condiciones para garantizar identificabilidad en los modelos de ecuaciones estructurales. En un modelo no identificable es imposible obtener de manera única el valor de cada uno de los parámetros libres. Las principales razones por las que se da este problema se deben a que se estipulan dentro del modelo parámetros que por regla general no son estimables. Un ejemplo es cuando en un modelo de regresión estructural se incluye una correlación entre dos variables dependientes. En el caso de modelos que contienen variables latentes es importante no olvidar fijar la escala de cada uno de ellos para evitar este problema. Otra característica que puede generar conflictos es cuando hay más parámetros libres que ecuaciones y por lo tanto uno o varios parámetros quedan expresados en términos de otros, o bien cuando se obtienen valores de parámetros que son inadmisibles como varianzas negativas. Para determinar si un modelo es identificable bastará con verificar ciertas reglas. Una de ellas es aplicable a todos los tipos de modelos, mientras que el resto varían dependiendo el tipo. La regla más sencilla y general es la regla t. Para utilizarla sólo se necesita conocer el número de parámetros libres y de variables observadas, y bastará con que se satisfaga la siguiente desigualdad: Sistema de ecuaciones estructurales: una herramienta de investigación 25

28 t ( p + q ) ( p + q + 1 ) 2 donde t es el número de parámetros libres y p + q es el número de variables observadas. Esta regla es necesaria mas no suficiente para garantizar la identificabilidad del modelo. Algunas reglas pueden ser aplicables a un modelo de trayectorias: regla de la B nula, regla recursiva, regla de condición de orden y regla de condición de rango; a modelos de análisis confirmatorio o derivados de éste: regla de tres variables observadas y regla de dos variables observadas; o bien, a modelos de regresión estructural: regla de los dos pasos y regla mimic. Regla de la B nula. Aunque no se establezcan asociaciones entre variables dependientes en modelos de trayectorias, y por lo tanto la matriz B sea cero, el modelo es identificable. Regla recursiva. Se aplica a los modelos recursivos y sólo verifica que no haya correlación entre los errores asociados a las variables dependientes. Regla de condición de orden. Su propósito es revisar la identificabilidad en cada una de las ecuaciones asociadas al modelo. Una condición necesaria para la identificabilidad de una ecuación es que el número de variables excluidas sea al menos p-1, donde p representa el número de variables dependientes. Regla de condición de rango. Al igual que la regla de orden, se aplica a cada una de las ecuaciones. Para poder aplicar esta regla es necesario formar una nueva matriz C de la forma [(I-B) -Γ ], donde I es la matriz identidad (con valores de uno en la diagonal y lo demás cero). Para verificar la identificabilidad de la i-ésima ecuación, se borran todas las columnas en C en las que no hay un cero en el i-ésimo renglón. Las columnas no borradas formarán una nueva matriz C i. Una condición suficiente y necesaria para que la i-ésima ecuación sea identificable es que el rango 1 de C i sea igual a p Cuaderno técnico 4

29 Para ilustrar la regla de condición de orden, considérese el modelo expresado por medio de las siguientes ecuaciones. Y 1 =β 12 Y 2 + γ 11 X 1 + ζ 1...(1) Y 2 =β 21 Y 1 + γ 22 X 2 + ζ 2...(2) Hay dos variables dependientes (Y1 y Y2) y dos independientes (X1 y X2). Si se aplica la regla de condición de orden para la ecuación uno, se cumple que por lo menos exista una variable excluida de la ecuación (esto es, Y1 y X2) y lo mismo sucede con la ecuación dos. Para aplicar la regla de condición de rango usando este ejemplo, primero se obtendrá la matriz C. Si se junta a (I-B) con -Γ se obtiene: 1 0 ( ) - 0 β 1 ( 12 -β ) ( ) ( I - B ) = = β 21 -β 21 C =( ) 1 -β 12 -γ β γ 22 1 El rango de una matriz es el número de filas o columnas linealmente independientes. Una fila o columna es linealmente dependiente de otra cuando es posible establecer una combinación lineal entre ellas. Por ejemplo, si f 1 = 2f 2 + 3f 3 entonces se dice que la fila uno es linealmente dependiente de la fila 2 y la fila 3. Por el contrario, una fila o columna es linealmente independiente de otra u otras cuando no se puede establecer una combinación lineal entre ellas. Sistema de ecuaciones estructurales: una herramienta de investigación 27

30 Para verificar a la ecuación uno, se deberán borrar las columnas uno, dos y tres (ya que no contienen al cero en el primer renglón) de esta forma: =( ) C 1 0 -γ 22 Como p- 1 = 1 y el rango de C 1 es uno, entonces se cumple la identificabilidad para la ecuación uno. El procedimiento para la ecuación dos es análogo. Regla de tres variables observadas. Para un modelo con un sólo factor, una condición suficiente para su identificabilidad es que tenga asociadas al menos tres variables observadas, con cargas factoriales diferentes de cero y que la matriz de varianzas y covarianzas asociada a los errores δ( Θ δ ) sea diagonal. Para modelos con más de un factor se deben de considerar tres especificaciones: que cada factor tenga asociadas por lo menos tres variables observadas, que cada renglón de Λ X posea un sólo elemento diferente de cero y que Θ δ sea diagonal. La condición dos se puede traducir al hecho de que si un factor tiene asociadas tres variables, éstas no están asociadas a otro factor, mientras que la tres indica que no hay correlación entre los errores asociados a las variables observadas. Regla de dos variables observadas. Esta regla aplica en dos casos. El primero de ellos requiere que se satisfagan la segunda y tercera condiciones de la regla de tres variables observadas y que la matriz Φ sea diferente de cero. El segundo caso difiere del primero con respecto a Φ ya que puede suceder que algunos valores de está matriz sean cero. En ambos casos, con tener dos variables observadas por cada variable latente es suficiente para que el modelo sea identificable. Regla de los dos pasos. Esta regla consta de dos pasos: el primero requiere ver al modelo como un factorial confirmatorio: X y Y se expresan sólo como X; η y ξ como ξ. La manera de identificar este nuevo modelo es por medio de las reglas aplicables a un confirmatorio. Una vez que se ha determinado que es identificable se procede al segundo paso. Éste involucra únicamente a la parte del modelo en 28 Cuaderno técnico 4

31 donde se observan las asociaciones entre latentes (lo que se denominó como modelo estructural). De esta forma se reescribe al modelo como uno de variables observadas en donde η es ahora Y y ξ es X y se procede a utilizar una de las reglas de identificabilidad para modelos de trayectoria. Si la identificabilidad se cumple en ambos pasos, es suficiente para considerar al modelo en su totalidad como identificable. Regla mimic. Sólo es aplicable en los modelos mimic. Establece que si el número de variables observadas Y es mayor o igual que dos y el de observadas X es mayor o igual que uno, y se fija uno de los coeficientes que van de η a Y, es suficiente para que el modelo sea identificable. Sistema de ecuaciones estructurales: una herramienta de investigación 29

32 Métodos de estimación El proceso de estimación de un modelo de ecuaciones estructurales es crucial debido a que permite obtener de manera única el valor estimado que tendrá cada parámetro libre. La hipótesis básica en un modelo de ecuaciones estructurales se reduce a probar que la matriz de varianzas y covarianzas poblacional es igual a la matriz de varianzas y covarianzas asociada al modelo teórico, esto es: Σ = Σ ( θ ) donde Σ es la matriz poblacional y Σ(θ) es la matriz asociada al modelo propuesto. Aunque en la práctica es improbable que se dé la igualdad como tal, el objetivo será encontrar θˆ, de tal forma que Σ sea lo más parecido a Σ( θˆ ). Partiendo del hecho de que no es posible conocer explícitamente los valores de la matriz de varianzas y covarianzas poblacional (si se conociera no tendría sentido plantearse siquiera un modelo), se utiliza a la matriz de varianzas-covarianzas muestral (S) como estimador de Σ. La diferencia entre estas dos matrices (S-Σ( θˆ )) se denomina residuo e indica la discrepancia entre lo observado por medio de los datos y las estimaciones arrojadas por el modelo. La estimación se lleva a cabo por medio de un proceso iterativo cuyo objetivo es minimizar el valor de una función. Esta función, denominada de ajuste (F), se escribe en términos de las matrices S y Σ( θˆ ). La manera de expresar a F varía según el método de estimación que se utilice. F siempre es mayor o igual a cero y sólo es cero si se cumple que S=Σ( θˆ ), es decir que el modelo propuesto ajusta perfectamente a los datos. Los métodos de estimación más empleados son máxima verosimilitud (ml), mínimos cuadrados no ponderados (uls), mínimos cuadrados ponderados (wls) y mínimos cuadrados generalizados (gls). 30 Cuaderno técnico 4

33 El método de máxima verosimilitud es quizá el más empleado y trabaja bajo el supuesto de normalidad de los datos. Recientemente se ha comprobado (Bollen, 1989) que bajo pequeñas desviaciones de normalidad este método puede ser adecuado. Otro método que también opera bajo el supuesto de normalidad es el de mínimos cuadrados generalizados. Este método y el de mínimos cuadrados no ponderados son análogos al método de ols (ordinary least square) empleado en regresión lineal, aunque el gls se pondera por una matriz de pesos. El método de mínimos cuadrados ponderados, también conocido como método de distribución asintóticamente libre, se puede utilizar cuando se viole el supuesto de normalidad de los datos. De hecho, es imprescindible si el modelo contiene una o más variables categóricas y por lo tanto se trabaja con matrices policóricas, poliseriales y tetracóricas. Este método requiere particularmente que la muestra sea considerablemente grande (n > 250, Willet y Sayer, 1994). En la tabla 2 se presentan las funciones de ajuste para estos cuatro métodos. Tabla 2. Funciones de ajuste Método de estimación Máxima verosimilitud Mínimos cuadrados no ponderados Mínimos cuadrados generalizados Mínimos cuadrados ponderados o de distribución asintóticamente libre Función de ajuste F ML = log Σ (θ ) + tr (SΣ -1 ( θ )) log S (p + q) F ULS = (½ ) tr [(S Σ ( θ )) 2 ] F GLS = (½ ) tr ({[S Σ ( θ )] W -1 } 2 ) F WLS = (½ ) tr {[S Σ ( θ )] V -1 } 2 Sistema de ecuaciones estructurales: una herramienta de investigación 31

34 donde tr representa la traza, la cual se define como la suma de los elementos de la diagonal principal de una matriz. Por ejemplo, sea A una matriz de 2x2 de la forma: A =( ) a 11 a 12 a 21 a 22 la traza de A, esto es, tr(a) = a 11 + a Cuaderno técnico 4

35 Modelos con variables discretas En las aplicaciones comunes de los modelos de ecuaciones estructurales se asume que las variables medidas tienen una escala continua, lo que justifica, al menos en principio, los supuestos de distribución normal de los datos, así como el uso de la matriz de correlaciones de Pearson. Sin embargo, en muchas áreas relacionadas con las ciencias sociales, las variables de interés generalmente presentan escalas discretas, ya sean de conteo, nominales u ordinales (principalmente estas dos últimas). En esta situación, como comentamos en el párrafo anterior, es necesario construir esta matriz de correlaciones considerando la escala de medición de las variables involucradas en el cálculo de cada entrada de esta matriz. La tabla 3 presenta el tipo de correlación que es conveniente calcular de acuerdo con el orden de medición de las dos variables involucradas. Tabla 3. Medidas de correlación entre variables con distintas escalas Escala de medición Continua Ordinal Dicotómica Continua Pearson Ordinal Poliserial Policórica Dicotómica Punto biserial Policórica Tetracórica Cada una de estas variables discretas provienen de un proceso de discretización de una variable continua. Es decir, se asume que subyace una variable latente continua, con distribución normal. Recordemos que la mayoría de las variables ordinales de uso común (nivel socioeconómico, nivel de satisfacción de un servicio, evaluación de la calidad de un producto, etcétera) provienen de discretizar variables continuas. Entonces, cuando se desee construir un modelo de ecuaciones estructurales con este tipo de variables, tendremos que trabajar con matrices policóricas, poliseriales, tetracóricas o, lo más común, con una matriz de correlaciones mixta, que contenga varias de las correlaciones anteriores. Sistema de ecuaciones estructurales: una herramienta de investigación 33

36 Un aspecto importante: cuando se utiliza el tipo de correlación respetando la escala de las variables involucradas, generalmente se obtienen correlaciones más grandes que si se utilizan las correlaciones de Pearson, y debemos recordar que un buen principio es tener una estructura de correlación fuerte entre las variables que componen nuestro modelo. 34 Cuaderno técnico 4

37 Bondad de ajuste del modelo La etapa en la que se lleva a cabo la evaluación del modelo propuesto es fundamental para determinar si dicho modelo describe de manera apropiada al fenómeno objeto de estudio. Como ya se mencionó, la hipótesis básica que se contrasta es que la matriz de varianzas y covarianzas muestral es igual a la matriz de varianzas y covarianzas conformada con los parámetros del modelo (S=Σ( θ )). A diferencia de la metodología clásica de regresión, en la cual el principal interés se enfoca en rechazar la hipótesis nula (Ho: β=0) en ecuaciones estructurales el interés radica en no rechazarla para garantizar que el modelo propuesto ajusta adecuadamente a los datos. Las diferentes formas de evaluar el modelo deben ser valoradas de manera global; todas serán indicadores del grado de ajuste del modelo. Basar nuestro juicio sobre lo adecuado del modelo en una sola prueba, puede generar conclusiones erróneas. Prueba ji-cuadrada (χ 2 ). Esta prueba se usa para contrastar la hipótesis básica. Se le conoce con este nombre, ya que si el modelo es correcto y ajusta adecuadamente a los datos, entonces T, el estadístico de prueba, se distribuye como una ji-cuadrada con (t (t+1) / 2) - p grados de libertad (donde t = número de parámetros y p = número de variables observadas). Este estadístico se escribe así: T = (N-1) F min donde N es el tamaño de muestra y F min es el valor mínimo que toma la función de ajuste una vez que se estimaron los parámetros. El criterio para aceptar la hipótesis nula es que el valor de T sea menor al valor en tablas de una ji-cuadrada con los grados de libertad mencionados y a un nivel de significancia α. Otra forma es observando que el p-value es mayor que el α. Una limitación de esta prueba es que es susceptible ante cambios en el tamaño de muestra, por lo que para muestras Sistema de ecuaciones estructurales: una herramienta de investigación 35

38 grandes T tiende a incrementarse, lo que aumenta la frecuencia con que se rechaza Ho, a pesar de que esto no refleje la realidad. Esta es una razón por la cual no se recomienda usar como único criterio de bondad de ajuste a esta prueba, sino más bien como complemento de otros índices de ajuste. Índices de ajuste. Hay dos tipos de índices: los de ajuste absoluto y los de incremento. Los primeros evalúan directamente el ajuste del modelo, mientras que los de incremento comparan al modelo propuesto con el modelo de independencia, en el cual se asume que no hay asociaciones entre las variables. Los índices de ajuste absoluto son: el índice de bondad de ajuste (gfi = Goodness of Fit Index), el índice ajustado de bondad de ajuste (agfi = Adjusted Goodness of Fit Index), el índice de aproximación de la raíz de cuadrados medios del error (rmsea = Root Mean Square Error of Aproximation) y el índice de la raíz del cuadrado medio del residuo (rmr). El índice gfi puede interpretarse como una medida que determina la proporción de varianza explicada por el modelo (como la R 2 en regresión lineal). Si además se consideran los grados de libertad y el número de variables observadas del modelo, se obtiene el índice agfi. El valor que toman estos dos índices se encuentra entre cero y uno (aunque en casos aislados puede tomar valores negativos). En ambos casos, valores cercanos a uno determinan que el modelo tiene muy buen ajuste. Uno de los índices más populares es el rmsea, que sólo puede tomar valores positivos. Un valor menor a 0.05 indica que el ajuste del modelo es bueno aunque es más deseable uno cercano a cero. El rmsea tiene asociada la prueba de hipótesis: Ho: RMSEA 0.05 vs Ha: RMSEA > 0.05 Si el pclose (así se le denomina dentro de la paquetería estadística) es mayor al nivel de significancia α entonces hay evidencia para rechazar a Ho. Una limitación de este índice es que, como su expresión involucra al tamaño de muestra, para muestras pequeñas tiende a sobreestimar el ajuste del modelo. El índice rmr es 36 Cuaderno técnico 4

39 similar en corte al rmsea: los valores más deseables se encuentran por debajo de 0.05 y entre más cercano a cero es mayor la evidencia de buen ajuste. Los índices de ajuste de incremento son: índice de ajuste normado (nfi = Normed Fit Index), índice de ajuste no normado (nnfi o tli = Non Normed Fit Index), índice de ajuste comparativo (cfi = Comparative Fit Index), índice incremental de ajuste (ifi o bl89 = Incremental Fit Index), índice relativo de ajuste (rfi = Relative Fit Index), índice esperado de validación cruzada (ecvi = Expected Cross Validation Index) y criterio de información de Akaike (aic = Akaike Information Criterion). El nfi se calcula por medio de la diferencia del valor de la ji-cuadrada asociada al modelo de independencia con respecto a la del modelo propuesto. Una limitación de este índice es que no toma en cuenta los grados de libertad, de manera que no es posible valorar la complejidad del modelo ni tampoco el tamaño de muestra. El nnfi es una variante del nfi aunque aquel sí considera los grados de libertad y el tamaño de muestra. Los índices cfi, ifi y rfi tienen variaciones con respecto al nfi pero siempre bajo la misma idea de incluir en la expresión al modelo de independencia versus el modelo propuesto. En general, todos estos índices toman valores entre cero y uno, y valores cercanos a uno indicarán que el modelo tiene muy buen ajuste. El ecvi permite cuantificar el cambio que se produce al comparar al modelo propuesto con el modelo de independencia y saturado. Lo deseable es que el ecvi asociado al modelo propuesto sea el más pequeño con respecto a los otros dos. El aic es un índice que toma en cuenta la complejidad del modelo y el grado de ajuste; al igual que el ecvi compara al modelo con los otros dos ya mencionados. Lo atractivo de estos dos índices es que, cuando se cuenta con varias versiones del modelo original, se pueden comparar entre sí por medio de los valores obtenidos del ecvi y aic y utilizarlos para elegir al que tenga el mejor ajuste, prefiriendo a aquel cuyos índices en conjunto sean los de menor valor. Un punto de corte aceptable para los índices gfi, agfi, nfi, nnfi, cfi, ifi y rfi es de 0.9. Sistema de ecuaciones estructurales: una herramienta de investigación 37

40 El test de los multiplicadores de Lagrange conocido en Lisrel como índices modificados, así como el test de Wald, se usan para cuantificar la contribución que tiene un parámetro en el modelo propuesto. El test de los multiplicadores de Lagrange muestra el decremento provocado en la ji-cuadrada al considerar un nuevo parámetro libre (por ejemplo, una nueva trayectoria antes no impuesta). Por el contrario, el test de Wald muestra el incremento en la ji-cuadrada al fijar en cero un parámetro (semejante a eliminar el parámetro del modelo). A diferencia de los índices de ajuste, en los cuales existe un punto de corte sugerido para determinar que el modelo es bueno, en estas dos pruebas no los hay, por lo que el criterio del investigador juega un papel importante en la toma de decisiones para considerar nuevos parámetros sugeridos por medio de las dos pruebas a favor del modelo y tomando siempre en cuenta, que al modificar un parámetro puede afectar otras partes del modelo ya sea en sentido positivo o negativo, esto es, puede hacer que el ajuste del modelo mejore o empeore con respecto al modelo originalmente propuesto. Cuando se desea evaluar el ajuste de un segmento particular del modelo, los índices de ajuste no nos aportan información al respecto, para lo cual podemos utilizar la matriz de residuos estandarizados. Cada una de las entradas de esta matriz cuantifica la discrepancia que hay entre lo observado por medio de los datos y las estimaciones que el modelo produce. Lo deseable es obtener residuos estandarizados cercanos a cero; sin embargo, un rango aceptable es entre -2 y 2. En ecuaciones estructurales no es posible realizar análisis de residuos análogos a los que se hacen con la metodología clásica de regresión lineal. Finalmente, otra forma de evaluar si un parámetro libre es estadísticamente significativo es por medio de su valor t. Para obtener a t se divide el valor estimado del parámetro entre su error estándar. Si t se encuentra por fuera de -2 y 2, entonces el parámetro es significativo al 5%, y puede considerarse diferente de cero a ese nivel de significancia. 38 Cuaderno técnico 4

41 Efecto total, directo e indirecto entre variables U no de los atractivos de sem es que permite estimar el efecto indirecto y total que puede tener una variable sobre otra y no sólo el directo como en regresión lineal. Hay tres tipos de efecto: a) el directo es la influencia que tienen una variable sobre otra, que se da de manera directa dentro del diagrama de trayectorias (por medio de la flecha que une a dos variables); b) el indirecto es la influencia que tiene una variable sobre otra, pero en cuya trayectoria hay al menos otra variable intermedia que las une, y c) el total, que es la suma del efecto directo y el indirecto, permite cuantificar el cambio que se observa en la variable en que se produjo el efecto (la que recibe la flecha), inducido por un cambio en la variable que lo causó (variable de la que sale la flecha), independientemente de los mecanismos por los cuales se haya producido dicho cambio. Sistema de ecuaciones estructurales: una herramienta de investigación 39

42 Lisrel (LInear Structural relations) Diversos paquetes estadísticos sirven para ajustar este tipo de modelos. Algunos fueron desarrollados específicamente para este fin, como AMOS, EQS, Lisrel y M-PLUS; otros incluyen únicamente un módulo particular para realizar esta tarea. Dentro de estos últimos destacan r, s-plus, sas, spss, Stata, Systat, entre otros. Lisrel se mantiene a la vanguardia en el desarrollo de las rutinas computacionales para introducir los desarrollos recientes en estos modelos. Para ilustrar el ajuste de algunos modelos de ecuaciones estructurales, en el ámbito de la evaluación educativa, haremos uso de este paquete. 40 Cuaderno técnico 4

43 Introducción a Lisrel L a primera versión de Lisrel (versión 3) apareció en 1975 y es atribuido a Karl Jöreskog. Lisrel es el acrónimo de LInear Structural RELations, aunque en la actualidad hablar de Lisrel es sinónimo de sem (Structural Equation Modeling). Sin embargo, no fue hasta 1998 cuando apareció la primera versión interactiva de Lisrel (versión 8.2 para Windows). La primera versión del módulo Prelis (PREprocessor for Lisrel) se lanzó en Este módulo ha ido evolucionando hasta convertirse en una herramienta exploratoria de los datos que serán usados posteriormente en Lisrel, como el cálculo de la matriz de correlaciones policóricas cuando los datos son categóricos, el cálculo de la matriz de varianzas-covarianzas asintótica, análisis descriptivo de los datos, etcétera. Sistema de ecuaciones estructurales: una herramienta de investigación 41

44 La pantalla principal de Lisrel La pantalla inicial de Lisrel permite acceder a la barra de menú de opciones por medio del cual se podrá ingresar a la ayuda, abrir archivos, importarlos... Como se observa en la pantalla siguiente, hay iconos que no están habilitados; esto cambia una vez especificado el tipo de proyecto que se va a usar. Un proyecto es el tipo de archivo de trabajo. La opción File permite abrir documentos o comenzar un nuevo proyecto, importar datos en otros formatos (por ejemplo spss) e imprimir. Cuando se elige esta opción aparecen otras. La opción New contiene cinco tipos de archivo (o proyectos), de los cuales se debe elegir uno. Son: 42 Cuaderno técnico 4

45 Syntax Only (.pr2,.ls8,.spl) prelis Data (.pr2) simplis Project (.spj) lisrel Project (.lpj) Path diagram (.pth) Cuando se está familiarizado con la notación de las variables y las matrices y se es capaz de escribir las ecuaciones e instrucciones tal como el paquete lo requiere, se recomienda usar el proyecto de sintaxis (Syntax Only). Por medio de éste, se pueden escribir programas para Prelis o para Lisrel, ya sea para calcular una matriz de correlaciones, o bien para obtener las ecuaciones del modelo y estimarlo. Si no se está familiarizado con Lisrel existen, por fortuna, otras opciones que permiten, de manera más sencilla, realizar análisis descriptivo de los datos, calcular matrices, etcétera. La opción de Prelis Data despliega una hoja en la que se podrá capturar la base con la que se trabajará. Los archivos de Prelis siempre se guardan con la extensión.psf. Lisrel Project y Simplis Project sirven para escribir las ecuaciones subyacentes al modelo de ecuaciones y los archivos con los que trabajan, tienen extensión.lpj y.spj, respectivamente. Path diagram permite dibujar el modelo de ecuaciones y guarda los archivos con extensión.pth Sistema de ecuaciones estructurales: una herramienta de investigación 43

46 Prelis P relis es un módulo incluido en Lisrel que sirve para preparar los datos que serán usados cuando se lleve a cabo la construcción del modelo de ecuaciones estructurales, o bien para hacer otro tipo de análisis estadístico diferente a sem. Para poder trabajar los datos en Prelis es necesario disponer de una base con extensión.pr2. Hay dos formas de obtenerla: a) capturando directamente los datos por medio de la opción Prelis Data, y b) importando una base que se encuentre en otro tipo de formato. 44 Cuaderno técnico 4

47 Crear la base desde Prelis DATA En la pantalla principal de Lisrel elija File New Prelis Data. Inmediatamente aparecerá la siguiente pantalla La opción Data, en la parte izquierda superior de la pantalla, permitirá insertar los nombres de las variables. Data Define Variable nos despliega una nueva pantalla; para poder insertar el nombre de la variable se elegirá la opción Insert. En una nueva ventana (Add Variables) se escribirá el nombre de la variable y se oprimirá Ok. Este procedimiento se hará según el número de variables que se desee insertar. Una vez que se han terminado de definir todas las variables se oprimirá Ok en la pantalla Define variables. Sistema de ecuaciones estructurales: una herramienta de investigación 45

48 Para insertar el número de casos se elegirá nuevamente Data Insert case. Una vez elegido el número de casos, en una ventana parecida a Excel se podrán ir capturando los datos. En principio, siempre aparece en ceros. Una vez capturada la información se debe guardar la base por medio de File Save o con el icono que muestra un diskete (la extensión debe ser.psf). 46 Cuaderno técnico 4

49 Importar la base desde un archivo externo T ambién es posible capturar el archivo como spss, texto, ascii, Excel, sas. Para importar la base se deberá elegir de la pantalla principal las siguientes opciones File Import Data in Free Format o File Import External Data in Other Format, lo que depende del tipo de archivo. Como se despliega una nueva ventana se deberá buscar la ubicación de la base que se desea importar y elegir abrir. Aparecerá una pantalla con la base importada, la cual ha sido guardada automáticamente con el mismo nombre pero con extensión.psf. Sistema de ecuaciones estructurales: una herramienta de investigación 47

50 Datos faltantes A veces, cuando se importa una base o se captura directamente algunos sujetos o casos no cuentan con información en alguna de las variables. Es posible declarar estos valores como datos faltantes. Esta opción de Missing values se ubica en la misma ventana en donde se insertan las variables y se puede declarar un valor diferente de dato faltante para cada variable. Por ejemplo, si la variable sexo tuviera valores de 1 y 2, un dato faltante podría ser declarado con un 9, pero si por ejemplo otra variable con más dígitos digamos edad tuviera un rango entre 0 y 100, entonces el dato faltante podría ser 999, por conveniencia. 48 Cuaderno técnico 4

51 Obtención de la matriz de correlaciones Pearson, policóricas y asintótica Cuando la base de datos es grande, conviene emplear la matriz de correlaciones en lugar de trabajar con la base original. Para poder obtener esta matriz se deberá utilizar Prelis. Será necesario entonces abrir una base de datos con extensión.psf, para que de esta forma se activen nuevos iconos y opciones en la parte superior de la pantalla principal, tal como se muestra enseguida: Estas nuevas opciones permitirán realizar diferentes tipos de análisis estadísticos, como regresiones múltiples, análisis de factores, análisis multinivel, imputación de datos, gráficas, calcular variables a partir de otras, realizar transformaciones u obtener correlaciones, entre otras cosas. Cuando algunas de las variables de un modelo de ecuaciones estructurales son categóricas no es posible trabajar con correlaciones de Pearson, por lo que se tiene que calcular la matriz de correlaciones policóricas. Una vez abierta la base de Sistema de ecuaciones estructurales: una herramienta de investigación 49

52 la que se leerán los datos (con extensión.psf), seleccione Statistics Output options. Automáticamente aparecerá una ventana Output. En la parte superior izquierda se encuentra el recuadro Moment matrix en el cual se tendrá que elegir la opción Correlations. En caso de que se desee guardar la matriz en un archivo, se deberá elegir la opción Save to file y debajo de esta opción escribir el nombre del archivo que deberá guardarse con extensión.cor. También por medio de esta ventana se puede calcular la matriz de varianzas-covarianzas asintótica (Asymptotic Covariance Matrix), indispensable si se utiliza el método de estimación de mínimos cuadrados ponderados (wls) o el de máxima verosimilitud robusto. Al igual que la matriz de correlaciones, ésta se puede guardar con extensión.acm. Para cerrar la ventana se elegirá Ok. Cabe mencionar que cuando se calcula la matriz de correlaciones, Prelis es capaz de determinar si todas las variables son continuas o solo algunas, por lo que en caso de que todas sean continuas, las correlaciones que calculará serán de Pearson y en caso contrario la correspondiente (policórica, poliserial o tetracórica), además de que en el archivo de salida especificará qué tipo de correlación obtuvo. 50 Cuaderno técnico 4

53 Automáticamente aparecerá un nuevo archivo que contiene la salida completa: código de instrucciones para obtener la matriz, ubicación de la base de datos que utilizó Prelis para leer la información, así como estadísticas descriptivas de las variables (frecuencias en caso de variables no continuas), la matriz de correlaciones policóricas, entre otras cosas. Este archivo generalmente es guardado con el mismo nombre de la base de datos que utilizó pero con extensión.out. También, por default, Prelis creará un archivo con extensión.dsf que deberá ser usado cuando se construya el modelo, ya que contiene la información del nombre de las variables, así como la ubicación de los archivos que contienen a las matrices que se calcularon. El siguiente cuadro muestra una porción de la salida para el ejemplo que se estará utilizando a lo largo de la construcción del modelo. La base que se utilizó (modcua2h2.psf) contiene 24 variables y sólo una de ellas (theta) es continua. Como no se declara explícitamente cuál variable es categórica y cuál continua, el programa impone un límite máximo de categorías; si se rebasa el número, el paquete declarará a esa variable como continua y desplegará en la salida un Warning en el que informa que la variable será tratada como continua, tal como se muestra en el ejemplo. Esta salida despliega, entre otras cosas, el número de casos faltantes por variable, gráfica de frecuencias y medidas de tendencia central (en caso de que la variable sea continua), tipo de correlación que se calculó según el par de variables y, por último, la matriz de correlaciones. Sistema de ecuaciones estructurales: una herramienta de investigación 51

54 Figura 7. Correlaciones 52 Cuaderno técnico 4

55 Figura 7. Sistema de ecuaciones estructurales: una herramienta de investigación 53

56 Dibujando el diagrama que describe al modelo Antes de explicar la forma en la que se debe dibujar el modelo, se dará una breve explicación sobre el ejemplo que se presentará y analizará. Las hipótesis que sustenta este modelo son tres: a) la calidad de la escuela y el capital económico familiar tienen una asociación con el compromiso académico que adquiere un estudiante; b) la calidad de la escuela y el capital económico tienen un efecto indirecto, mediado por el compromiso académico, sobre la habilidad del sustentante evaluada mediante un examen, y c) la calidad de la escuela y el capital económico están correlacionadas entre sí. De esta forma, el modelo es de tipo regresión estructural y está conformado por tres variables latentes y 24 variables observadas. Variables latentes: η= compromiso académico (compac) ξ 1 = calidad de la escuela (calesc) ξ 2 = capital económico (capitec) Variables observadas que miden al compromiso académico: Y 1 = habilidad del sustentante (theta) Y 2 = faltar a la escuela (con_fal) Y 3 = llegar tarde a las clases (con_tar) Y 4 = no entrar a las clases estando en la escuela (con_ent) Y 5 = días a la semana que hacia tareas o estudiaba (dia_est) Y 6 = promedio de horas al día dedicadas a estudiar o hacer tareas fuera del horario escolar (hor_tar) Y 7 = calidad de las tareas entregadas (cal_tar) Variables observadas que miden a la calidad de la escuela: X 1 = nivel de exigencia de la escuela secundaria (exi_esc) 54 Cuaderno técnico 4

57 X 2 = porcentaje de compañeros que logró una excelente preparación en la secundaria (pre_com) X 3 = preparación de los maestros que impartían clases en la secundaria (pre_ma) X 4 = maestros que llegaban tarde a clase en el último año de secundaria (ma_tar) X 5 = faltas frecuentes de maestros en el último año de la secundaria (ma_falt) Por último, variables que miden al capital económico: X 6 = horno de microondas en casa (ser_mic) X 7 = lavadora en casa (ser_lav) X 8 = suscripción a periódicos o revistas en casa (ser_sus) X 9 = dvd en casa (ser_dvd) X 10 = computadora en casa (ser_pc) X 11 = televisor en casa (ser_tv) X1 2 = automóvil en casa (ser_auto) X 13 = reproductor de mp3 para uso personal (ser_mp3) X 14 = teléfono celular para uso personal (ser_tec) X 15 = vacaciones dentro de la República Mexicana en los últimos dos años (vva_rp) X 16 = vacaciones fuera del país en los últimos dos años (vva_fp) X 17 = número de estados de la República que ha visitado en los últimos dos años (edo_rep) De esta forma, X 1 a X 5 estarán asociadas con la primera variable latente independiente (ξ 1 ) y X 6 a X 17 con la segunda latente independiente (ξ 2 ); Y 1 a Y 7 estarán asociadas con la única variable latente dependiente η. Ambas (calesc y capitec) están correlacionadas entre sí y tienen asociación con compac. Este modelo se aplicó individualmente para hombres y mujeres, por lo que las bases estuvieron conformadas por un tamaño de muestra de 1075 y 1144, respectivamente. Sistema de ecuaciones estructurales: una herramienta de investigación 55

58 El método de estimación fue mínimos cuadrados ponderados (wls), ya que todas las variables observadas, con excepción de Y 1, son categóricas. Existen varios caminos para especificar y estimar el modelo de ecuaciones estructurales. El más sencillo es dibujar el modelo y permitir que Lisrel escriba de forma autónoma el código del programa que detalla las asociaciones, correlaciones y parámetros que conformarán el modelo teórico. Para dibujar el diagrama es necesario especificar a Lisrel que queremos trabajar con un proyecto Path diagram. En la ventana principal, abrir File New Path diagram. Aparecerá una ventana que pedirá el nombre con el cual se guardará el diagrama con extensión.pth (por ejemplo, modelo2hom2.pth). Al activar la opción de Path diagram o abrir un archivo.pth se muestra la siguiente pantalla: 56 Cuaderno técnico 4

59 La parte superior es muy parecida, pero no igual, a la pantalla principal de Lisrel. La barra de menú contiene las opciones File, Edit, Setup, Draw, View, Image, Output, Window y Help. File cuenta con las mismas características del File de la pantalla principal, aunque aquí es posible exportar un diagrama a otros tipos de formato como.gif y.wmf. Edit permite hacer modificaciones al modelo. Setup introduce la información con respecto a los datos como ubicación de la base, número de casos, tipo de matriz con la que se va a trabajar, etc. En Draw se dibujan las variables, las trayectorias, correlaciones y se pueden escribir notas dentro del diagrama. View permite modificar el aspecto de la pantalla cuadriculada (área en donde se dibujará el modelo) y los iconos que aparecen en la parte superior, elegir qué resultados se mostrarán en el diagrama (parámetros estimados, solución estandarizada, valores t, entre otros) y especificar (opcional) el tipo de modelo que se va a dibujar. Image ayuda a cambiar el aspecto del diagrama. Con Output es posible escoger el tipo de método de estimación, el contenido de la corrida y las matrices que se quieran guardar en un archivo independiente. Para comenzar a construir el modelo, utilizaremos principalmente Setup, Draw y Output. Al elegir Setup Title and Comments aparece la siguiente ventana: Sistema de ecuaciones estructurales: una herramienta de investigación 57

60 En ella se escriben el título y los comentarios del modelo; aunque es opcional, es recomendable hacerlo para que en el caso de correr varias versiones del mismo modelo sea más fácil identificar con cuál se está trabajando. El botón Next es de mucha utilidad, ya que permite acceder a las otras ventanas que se activan dentro de la misma opción (este botón también tiene la misma utilidad en Output), pero sin tener que estar eligiendo una por una. Como en nuestro ejemplo hay tres variables latentes o factores, se especificará el título según lo muestra la ventana anterior. Group names es una ventana opcional. Se utiliza cuando hay varias submuestras para las cuales se quiere correr el mismo modelo. 58 Cuaderno técnico 4

61 La tercera ventana, Labels, sirve para especificar cuáles serán las variables observadas y latentes que describirán al modelo. Para incluir las variables observadas se elige la opción Add/read variables del cuadro izquierdo (Observed variables) y las latentes por medio del cuadro derecho (Latent variables). Sin embargo, la diferencia entre estos dos radica en que por medio del primero se deberán leer las variables observadas de una base en particular, mientras que en el otro únicamente se puede escribir el nombre con el cual se identificará una variable latente. Al elegir la opción izquierda aparece una nueva ventana Add/read variables. Con el botón Browse se busca el archivo que contiene la información de las variables que intervendrán en el modelo. Se puede elegir un archivo creado en Prelis o en Lisrel. En general, el más usado es el del segundo. Este archivo tiene extensión.dsf y, como se mencionó, contiene la información del nombre de las variables y la ubicación de las matrices que se obtuvieron por medio de Prelis. Sistema de ecuaciones estructurales: una herramienta de investigación 59

62 Una vez que aparece en el recuadro en blanco del File name la ubicación y nombre del archivo del cual se leerán las variables observadas, se sabrá que efectivamente se leyó la información, pues aparecerán los nombres de las variables de la base solicitada dentro del cuadro derecho en la ventana Labels. El nombre de las variables latentes se introduce manualmente: 60 Cuaderno técnico 4

63 En el cuadro de la izquierda se despliegan los nombres de las variables observadas que conformarán al modelo y en el de la derecha, los nombres de las latentes: compac, calesc y capitec (siguiendo ese orden). Finalmente, si se desea borrar una variable latente se hace clic en el número del costado izquierdo de la variable seguido de la tecla supr del teclado. La siguiente ventana es Data. En ella se debe especificar el tamaño de la muestra (Number of observation) y la matriz que se va a analizar, recordando que cuando se calcule la matriz policórica o asintótica, la matriz que se va a analizar será de correlaciones. Esta ventana es la última opción del Setup, por lo que ahora se deberá oprimir Ok. Sistema de ecuaciones estructurales: una herramienta de investigación 61

64 Para verificar que se han incluido, los nombres de las variables se aprecian en la parte izquierda de la pantalla cuadriculada. Para que una variable aparezca dentro de la cuadrícula en forma de figura, se debe arrastrar con ayuda del mouse. Cuando el modelo contiene variables observadas X y Y, así como latentes dependientes e independientes, se deberá especificar en dónde aparecen los nombres de las variables, cuáles de ellas son Y (variables observadas asociadas a latentes dependientes) y eta (así se les denomina en Lisrel a las latentes dependientes). Las que no se especifiquen se tomarán como X (observadas) y como latentes independientes (no observadas). Para este ejemplo, únicamente las variables theta, con_fal, con_tar, con_ent, dia_est, hor_tar y cal_tar son Y s, y por lo tanto aparece un tache enseguida de los nombres y compac es la única eta (variable latente dependiente). 62 Cuaderno técnico 4

65 Por medio de la opción Draw o de la paleta de dibujo (en general se activa automáticamente), que tienen las mismas seis opciones, se podrán trazar las trayectorias (flechas unidireccionales ) y correlaciones (flechas bidireccionales ) entre variables, además de escribir texto y fijar parámetros. Select (primer icono en la paleta) permite seleccionar uno o más objetos del diagrama para moverlos, alinearlos, cambiarles el color, el tipo de fuente, etcétera. One-way path (segundo icono) sirve para dibujar la trayectoria (asociaciones) entre las variables. Para dibujar una trayectoria, se debe seleccionar esta opción y colocar el mouse en la variable de la cual saldrá la flecha, arrastrarlo con el botón izquierdo apretado hasta llegar a la variable que recibirá la trayectoria. Esto se hace para cada una de las trayectorias del modelo. Si se quiere desactivar ese icono, se deberá seleccionar Select y dar clic con el botón izquierdo del mouse dentro de la cuadrícula. Esto aplica para cualquier opción de la paleta. Sistema de ecuaciones estructurales: una herramienta de investigación 63

66 Figura 8. One way path Multi-segment path (tercer icono) tiene la misma finalidad del segundo icono, pero permite dibujar la flecha en segmentos. Figura 9. Multi-segment path Error covariance or factor correlation (cuarto icono) sirve para dibujar las correlaciones entre variables o errores. Para ello se procede igual que con las trayectorias. Plain text (quinto icono) sirve para insertar texto al diagrama. Una vez activado este icono se deberá dibujar un rectángulo arrastrando el botón izquierdo del mouse y escribiendo el texto dentro de la figura trazada. Para cambiar la fuente o el color del texto se utiliza el botón derecho del mouse y se selecciona Options. 64 Cuaderno técnico 4

67 Por último, Zoom (sexto icono) permite reducir o incrementar el tamaño del diagrama. Cuando el modelo incluye variables latentes, es necesario fijar la escala de cada una de ellas (para que el modelo no tenga problemas de identificabilidad). Esto se logra fijando en un valor específico (Lisrel los fija en 1) a alguna de las trayectorias que van de la variable latente a una de las observadas. Así, por ejemplo, si el modelo contiene tres variables latentes se deberán fijar tres trayectorias, una por cada una de ellas. Para realizar esto, se selecciona con el botón izquierdo del mouse la trayectoria deseada y se utiliza el botón derecho para seleccionar la opción Fix. Deberá cambiar de color la flecha dentro del diagrama, lo que permite verificar que efectivamente se fijó ese parámetro. En el ejemplo se decidió fijar en uno las trayectorias que van de compac a con_ent, de calesc a pre_com y de capitec a ser_lav. En los dos primeros casos fue arbitraria la decisión, en la tercera trayectoria se fijó debido a que contar con lavadora presentó la menor variabilidad en la respuesta. Sistema de ecuaciones estructurales: una herramienta de investigación 65

68 Una vez dibujado el modelo se debe especificar el método de estimación y lo que queremos que despliegue el archivo de salida. Para ello se elige Output Lisrel Outputs. Esta selección despliega tres opciones Estimations, Selections y Save. Al elegir Estimations aparece la siguiente ventana: 66 Cuaderno técnico 4

69 La ventana despliega todos los métodos disponibles para estimar los parámetros, así como otras opciones relacionadas con el número de iteraciones permitidas para llegar a la solución final, etcétera. En general estas opciones no se modifican a menos que exista un problema de convergencia, por lo que no es necesario hacer cambios en esta sección. La siguiente ventana, Selections, muestra las opciones que queremos que despliegue en el archivo de salida. Se pueden elegir algunas o todas por medio de Print all. La parte inferior de esta ventana permite invocar al modelo, si así se desea. Sistema de ecuaciones estructurales: una herramienta de investigación 67

70 La tercera ventana, Save, permite salvar en archivos separados matrices, índices de bondad de ajuste, valores t, entre otras cosas. Cuando se termina de dibujar el modelo y de especificar el método de estimación y opciones de salida, se debe pedir que se muestre la sintaxis que subyace al modelo. Esto se hace por medio de Setup en la barra de menú, seleccionando Build Lisrel Syntax o Build simplis Syntax. La diferencia entre estas dos opciones radica en la forma en la que despliega la sintaxis. La primera opción es un poco más complicada, ya que no muestra directamente las ecuaciones que subyacen al modelo sino únicamente los parámetros que se van a estimar; esto se hace en forma matricial, por lo que si no se está familiarizado con el lenguaje de Lisrel resultará más difícil de leer. Simplis, por el contrario, sí despliega las ecuaciones por medio de los nombres de las variables. A continuación se muestra el modelo que se va a estimar y la sintaxis subyacente utilizando ambas notaciones. 68 Cuaderno técnico 4

71 La siguiente secuencia de instrucciones se obtiene con Simplis. Como muestra el código, los dos primeros renglones hacen referencia al título y a los comentarios. La tercera línea indica la ubicación del archivo modcua2h2.dsf que contiene la información de la ubicación de las matrices policórica y asintótica. La cuarta línea indica el tamaño de muestra. La quinta corresponde al nombre de las variables latentes. A partir de la séptima línea y hasta la décimo segunda se indican las trayectorias que van de las latentes a las observadas. Véase que no aparece la trayectoria que va de compac a con_ent, de calesc a pre_com y de capitec a ser_lav, ya que se fijaron los parámetros, lo que se puede corroborar en el diagrama (las trayectorias aparecen de color gris claro y no en azul como las otras). La línea 29 indica que se está pidiendo que, una vez estimado el Sistema de ecuaciones estructurales: una herramienta de investigación 69

72 modelo, se despliegue nuevamente el diagrama. Las últimas dos líneas indican el método de estimación, los resultados que deseamos imprimir, como residuos, índices modificados y efectos directos, indirectos y totales. También se puede pedir que despliegue todo por medio de All. 70 Cuaderno técnico 4

73 Con la sintaxis de Lisrel se obtiene la siguiente secuencia de instrucciones. Al igual que en Simplis, la primera línea hace referencia al título. La segunda contiene la especificación con respecto al número de variables observadas, tamaño de muestra, número de grupos (poblaciones a las que se aplicará el mismo modelo) y el tipo de matriz que se usará (MA = matriz y KM = correlación). La tercera línea es similar a la segunda de Simplis. La cuarta la ubicación de la matriz de varianzas-covarianzas asintótica (en este caso la matriz se guardó en el archivo asin2h2.acm). A partir de la siguiente línea y hasta la 15, se especifica la forma de las matrices que contienen los parámetros libres, parámetros fijos y nombre de las variables. En particular, a partir de la 12 se indica cuáles son las trayectorias que se van a estimar. Para poder especificar que son parámetros libres, la línea debe comenzar con la instrucción FR (free) seguido de la lista de parámetros. Como ya se mencionó, en este ejemplo se tienen 24 variables observadas. Las siete primeras se asociaron con la única variable latente dependiente (compac) y las restantes 17 con alguna de las dos latentes independientes (calesc y capitec); en particular, las cinco primeras se asociarán con calesc y las siguientes 12 con capitec, Véase que en el código se hace referencia a LY, LX y ga. LY se refiere a la matriz que contiene las asociaciones entre variables latentes dependientes y sus correspondientes observadas Y. LX es la matriz de coeficientes entre latentes independientes y observadas X y ga entre latentes independientes y latentes dependientes. En este ejemplo, tenemos una única variable latente dependiente (compac) asociada a siete variables, por lo que LY(1,1) a LY(7,1) siempre muestra un uno en la segunda entrada y lo que varía es la primera, que va de uno a siete. Por otro lado, como las X s están asociadas con latentes independientes, la numeración tiene que volver a comenzar desde uno. De esta forma LX(1,1) a LX(5,1) son las trayectorias que van de calesc a X 1 y hasta X 5 y LX(6,2) a LX(17,2) las que van de capitec (segunda latente independiente) a X 6 y hasta X 17. La instrucción va indica qué parámetros se fijaron. En este caso, LY(4,1), LX(2,1) y LX(7,2) tomarán el valor de uno, y se puede corroborar en Sistema de ecuaciones estructurales: una herramienta de investigación 71

74 el diagrama, ya que las flechas aparecen en gris y no en azul. Las últimas dos líneas solicitan el diagrama asociado (PD=Path Diagram) y en la salida referida como ou (output) que se muestren los residuos (RS), los efectos indirectos y totales (EF), la solución estandarizada (SS) y los índices modificados (MI), además de indicar el tipo de método de estimación (ME) que en este caso fue el de mínimos cuadrados ponderados (WLS). Aunque parece complicada la notación, dibujar correctamente el modelo evita estar revisando cada una de las líneas que se despliegan. Una vez que se verificó la sintaxis, se elige el botón Run Lisrel ubicado en la parte superior de la pantalla. Automáticamente se despliega el modelo estimado y por medio de la opción Window (de la barra de menú) nos podemos mover al archivo de sintaxis y al de salida. El diagrama que Lisrel o Simplis despliegan después de estimar el modelo muestra por default los valores de las estimaciones 72 Cuaderno técnico 4

75 de los parámetros; sin embargo, también es posible desplegar otros valores como la solución estandarizada, los valores t, etcétera. Para hacer este cambio se debe utilizar la opción de Estimates que se encuentra arriba de la cuadrícula, tal como se muestra a continuación: Como el documento que contiene la salida con los resultados es extenso, se irán explicando los fragmentos más importantes y la forma más adecuada de interpretarlos. Las siguientes líneas permiten verificar que se han leído correctamente el número de variables X, Y, η, ξ y el número de observaciones. Como se había comentado, el modelo consta de 24 variables observadas, de las cuales siete son Y, 17 son X, una es latente dependiente (eta) y dos son latentes independientes (ksi). El número que finalmente conformó la muestra fue de 908 hombres que tenían información en las 24 variables observadas (y no de 1075 como se declaró originalmente). Sistema de ecuaciones estructurales: una herramienta de investigación 73

Modelos de ecuaciones estructurales (SEM) para la investigación en Contabilidad y Auditoría

Modelos de ecuaciones estructurales (SEM) para la investigación en Contabilidad y Auditoría Iª REUNIÓN INTERNACIONAL DE INVESTIGACIÓN EN CONTABILIDAD Y AUDITORÍA (RIICA) Modelos de ecuaciones estructurales (SEM) para la investigación en Contabilidad y Auditoría Dr. D. Jesús Collado Agudo Departamento

Más detalles

Introducción al uso. de AMOS de SPSS

Introducción al uso. de AMOS de SPSS Introducción al uso de AMOS de SPSS MODELAMIENTO ESTRUCTURAL Nazira Calleja ABRIR AMOS ABRIR UN ARCHIVO NUEVO File New ACOMODAR LA HOJA EN FORMATO HORIZONTAL View Interface properties ACOMODAR LA HOJA

Más detalles

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r)

Correlación. El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) Correlación El coeficiente de correlación mide la fuerza o el grado de asociación entre dos variables (r) El coeficiente de correlación lineal de Pearson (r) permite medir el grado de asociación entre

Más detalles

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI

PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI PRUEBA DE HIPÓTESIS BENJAMIN MAMANI CONDORI 2014 Para qué es útil la estadística inferencial? Se utiliza para probar hipótesis y generalizar los resultados obtenidos en la muestra a la población o universo.

Más detalles

JORNADAS DE INVESTIGACIÓN 2011

JORNADAS DE INVESTIGACIÓN 2011 IX JORNADAS DE INVESTIGACIÓN 2011 Mirza Cequea: MSc. en Gerencia. Ing. Eléctricista. Doctorando de la UPM. Miguel Núñez Bottini: Doctor en Doctor en Ciencias Técnicas. Profesor jubilado UNEXPO Carlos Rodríguez

Más detalles

Modelación estadística: La regresión lineal simple

Modelación estadística: La regresión lineal simple Modelación estadística: La regresión lineal simple Gabriel Cavada Ch. 1 1 División de Bioestadística, Escuela de Salud Pública, Universidad de Chile. Statistical modeling: Simple linear regression Cuando

Más detalles

Tema 5. Introducción a los modelos de ecuaciones estructurales o modelos causales

Tema 5. Introducción a los modelos de ecuaciones estructurales o modelos causales Tema 5. Introducción a los modelos de ecuaciones estructurales o modelos causales 5.1 Introducción a los modelos de ecuaciones el planteamiento LISREL. 5.2. Fases en la elaboración de un modelo. 5.2.1.

Más detalles

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos

Agro 6998 Conferencia 2. Introducción a los modelos estadísticos mixtos Agro 6998 Conferencia Introducción a los modelos estadísticos mixtos Los modelos estadísticos permiten modelar la respuesta de un estudio experimental u observacional en función de factores (tratamientos,

Más detalles

Estadística para la Economía y la Gestión IN 3401 Clase 5

Estadística para la Economía y la Gestión IN 3401 Clase 5 Estadística para la Economía y la Gestión IN 3401 Clase 5 Problemas con los Datos 9 de junio de 2010 1 Multicolinealidad Multicolinealidad Exacta y Multicolinealidad Aproximada Detección de Multicolinealidad

Más detalles

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS

DESCRIPCIÓN DE DATOS POR MEDIO DE GRÁFICAS ÍNDICE Introducción: Entrene su cerebro para la estadística... 1 La población y la muestra... 3 Estadísticas descriptivas e inferenciales... 4 Alcanzar el objetivo de estadísticas inferenciales: los pasos

Más detalles

Pruebas de hipótesis estadísticas acerca de los cambios en la incidencia de la pobreza aplicando la metodología preliminar del CTMP

Pruebas de hipótesis estadísticas acerca de los cambios en la incidencia de la pobreza aplicando la metodología preliminar del CTMP Nota Técnica 0/006 Pruebas de hipótesis estadísticas acerca de los cambios en la incidencia de la pobreza aplicando la metodología preliminar del CTMP 000 005 Octubre de 006 Av. Paseo de la Reforma #51,

Más detalles

Nota de los autores... vi

Nota de los autores... vi ÍNDICE Nota de los autores... vi 1 Qué es la estadística?... 1 1.1 Introducción... 2 1.2 Por qué se debe estudiar estadística?... 2 1.3 Qué se entiende por estadística?... 4 1.4 Tipos de estadística...

Más detalles

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple

Pronósticos, Series de Tiempo y Regresión. Capítulo 4: Regresión Lineal Múltiple Pronósticos, Series de Tiempo y Regresión Capítulo 4: Regresión Lineal Múltiple Temas Modelo de regresión lineal múltiple Estimaciones de Mínimos Cuadrados Ordinarios (MCO); estimación puntual y predicción

Más detalles

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE

ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE ANÁLISIS ESTADÍSTICO REGRESIÓN LINEAL SIMPLE Jorge Fallas jfallas56@gmail.com 2010 1 Temario Introducción: correlación y regresión Supuestos del análisis Variación total de Y y variación explicada por

Más detalles

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez.

Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez. Escuela de Economía Universidad de Carabobo Profesor: Exaú Navarro Pérez. Econometría Regresión Múltiple: Municipio Ocupados Población Analfabeta Mayor de 10 años Total de Viviendas Bejuma 18.874 1.835

Más detalles

Lucila Finkel Temario

Lucila Finkel Temario Lucila Finkel Temario 1. Introducción: el análisis exploratorio de los datos. 2. Tablas de contingencia y asociación entre variables. 3. Correlación bivariada. 4. Contrastes sobre medias. 5. Regresión

Más detalles

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos

viii CAPÍTULO 2 Métodos de muestreo CAPÍTULO 3 Análisis exploratorio de datos Contenido Acerca de los autores.............................. Prefacio.... xvii CAPÍTULO 1 Introducción... 1 Introducción.............................................. 1 1.1 Ideas de la estadística.........................................

Más detalles

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO. Especificación de los modelos VAR

CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO. Especificación de los modelos VAR CURSO: ECONOMETRÍA Y ANÁLISIS DE POLÍTICAS FISCALES INSTRUCTOR: HORACIO CATALÁN ALONSO Especificación de los modelos VAR Modelos VAR es una extensión de un AR(p) Permiten un mejor entendimiento de la

Más detalles

INDICE. Prólogo a la Segunda Edición

INDICE. Prólogo a la Segunda Edición INDICE Prólogo a la Segunda Edición XV Prefacio XVI Capitulo 1. Análisis de datos de Negocios 1 1.1. Definición de estadística de negocios 1 1.2. Estadística descriptiva r inferencia estadística 1 1.3.

Más detalles

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE)

El análisis de correspondencias. Ana María López Jiménez Dept. Psicología Experimental (USE) El análisis de correspondencias Ana María López Jiménez Dept. Psicología Experimental (USE) 4. El análisis de correspondencias 4.. Introducción 4.2. Tabla de correspondencias 4.3. Dependencia e independencia

Más detalles

ANÁLISIS DE COMPONENTES PRINCIPALES

ANÁLISIS DE COMPONENTES PRINCIPALES ANÁLISIS DE COMPONENTES PRINCIPALES INTRODUCCIÓN El objetivo principal de la mayoría de las técnicas numéricas de análisis multivariado, es reducir la dimensión de nuestros datos. Por supuesto, si esta

Más detalles

Estimación PLS de modelos SEM, UMA. Modelos de Ecuaciones Estructurales con PLS (Partial Least Squares)

Estimación PLS de modelos SEM, UMA. Modelos de Ecuaciones Estructurales con PLS (Partial Least Squares) Estimación PLS de modelos SEM, 2015. UMA. Modelos de Ecuaciones Estructurales con PLS (Partial Least Squares) 5 de febrero de 2015 José Mondéjar Jiménez Área de Estadística Económica y Empresarial Universidad

Más detalles

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López Brindar al alumno los conocimientos de los métodos econométricos fundamentales y de los conceptos estadísticos que éstos requieren,

Más detalles

Universidad Nacional Autónoma de México Facultad de Psicología

Universidad Nacional Autónoma de México Facultad de Psicología Universidad Nacional Autónoma de México Facultad de Psicología PROGRAMA DE ASIGNATURA Nombre Método I Análisis de las ecuaciones estructurales I Clave 517 Semestre 8 Créditos 8 Horas teoría 3 Horas práctica

Más detalles

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras.

Regresión Lineal. El modelo de regresión caracteriza la relación entre una variable respuesta que depende de k variables independientes o regresoras. Regresión Lineal Los factores envueltos en la experimentación pueden ser de tipo cuantitativos o cualitativos Un factor cuantitativo es aquel que sus niveles pueden ser asociados con puntos dentro de una

Más detalles

Regresión múltiple. Demostraciones. Elisa Mª Molanes López

Regresión múltiple. Demostraciones. Elisa Mª Molanes López Regresión múltiple Demostraciones Elisa Mª Molanes López El modelo de regresión múltiple El modelo que se plantea en regresión múltiple es el siguiente: y i = β 0 + β 1 x 1i + β 2 x 2i +...+ β k x ki +

Más detalles

Regresión polinomial y factores

Regresión polinomial y factores Capítulo Regresión polinomial y factores.. Regresión polinomial Si una función media tiene un predictor X pueden usarse sus potencias enteras para aproximar E (Y X). El caso más simple es la regresión

Más detalles

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE

REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE UNIDAD 3 REGRESIÓN Y ESTIMACIÓN TEMA 1: REGRESIÓN LINEAL SIMPLE Relación entre variables de interés 1 Relación entre variables de interés Muchas decisiones gerenciales se basan en la relación entre 2 o

Más detalles

INTRODUCCIÓN AL PROGRAMA AMOS 5.0.

INTRODUCCIÓN AL PROGRAMA AMOS 5.0. INTRODUCCIÓN AL PROGRAMA AMOS 5.0. 1. Entrar al programa 2.) También podemos tener una matriz de datos típica con los datos directos de los sujetos (en filas) a las variables (en columnas): El programa

Más detalles

7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño

7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL. Jorge Eduardo Ortiz Triviño 7. REGRESIÓN POR MÍNIMOS CUADRADOS: REGRESIÓN POLINOMIAL Jorge Eduardo Ortiz Triviño jeortizt@unal.edu.co http:/www.docentes.unal.edu.co/jeortizt/ Introducción Los datos frecuentemente son dados para valores

Más detalles

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema:

UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL. Tema: UNIVERSIDAD NACIONAL DE LA PLATA FACULTAD DE CIENCIAS NATURALES Y MUSEO CÁTEDRA DE ESTADÍSTICA CLASE ESPECIAL Tema: Correlación múltiple y parcial. Ecuaciones y planos de regresión La Plata, septiembre

Más detalles

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA

N T E N.. IDO. CAPíTULO 3 TABLAS Y GRÁFICAS: UNA IMAGEN DICE MÁS QUE MIL PALABRAS 78. CAPíTULO I LA IMAGINACiÓN ESTADíSTICA N T E N.. IDO PREFACIO xiv CAPíTULO I LA IMAGINACiÓN ESTADíSTICA Introducción La imaginación estadística 3 Enlace de la imaginación estadística con la imaginación sociológica 4 Normas estadísticas y normas

Más detalles

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA

ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA www.jmontenegro.wordpress.com UNI ESTIMACIÓN Y PRUEBA DE HIPÓTESIS INTERVALOS DE CONFIANZA PROF. JOHNNY MONTENEGRO MOLINA Objetivos Desarrollar el concepto de estimación de parámetros Explicar qué es una

Más detalles

Regresión ponderada y falta de ajuste

Regresión ponderada y falta de ajuste Capítulo 4 Regresión ponderada y falta de ajuste 4.1. Introducción En este capítulo se presentan la regresión ponderada y la prueba de falta de ajuste como un conjunto adicional de herramientas usadas

Más detalles

Modelos de Estructura de Covarianza

Modelos de Estructura de Covarianza Modelos de Estructura de Covarianza Contenidos Introducción histórica Teorías y modelos. Los modelos como aproximaciones Clasificación de las variables 1. En función de los procedimientos por los que se

Más detalles

Modelos de regresión multinivel

Modelos de regresión multinivel Luis Guillermo Díaz Leonardo Trujillo Julio 2011 Estructura de datos multinivel Los investigadores de las ciencias sociales y naturales, se enfrentan al problema de modelar estructuras de datos complejas,

Más detalles

ANALISIS FACTORIAL. Jorge Galbiati R.

ANALISIS FACTORIAL. Jorge Galbiati R. ANALISIS FACTORIAL Jorge Galbiati R El análisis factorial es un modelo matamático que pretende explicar la correlación entre un conjunto grande de variables observadas y un pequeño conjunto de factores

Más detalles

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com

ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez https://torrezcesar.wordpress.com ASIGNATURA: ESTADISTICA II (II-055) Ing. César Torrez torrezcat@gmail.com https://torrezcesar.wordpress.com 0416-2299743 Programa de Estadística II UNIDAD IV: REGRESIÓN Y CORRELACIÓN MÚLTIPLE LINEAL TANTO

Más detalles

Econometría Universidad Carlos III de Madrid Examen Extraordinario 25 de Junio de Pr (N (0, 1) > 1, 282) = 0, 10

Econometría Universidad Carlos III de Madrid Examen Extraordinario 25 de Junio de Pr (N (0, 1) > 1, 282) = 0, 10 Econometría Universidad Carlos III de Madrid Examen Extraordinario 25 de Junio de 2014 Instrucciones para la realización del examen: Dispone de 2 horas y media para responder al examen La evaluación consta

Más detalles

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y)

Qué es? Primer paso Representación en un sistema de coordenadas. numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión Qué es? Primer paso Representación en un sistema de coordenadas cartesianas de los datos numéricos Cada punto muestra el valor de cada pareja de datos (X e Y) Gráfico de dispersión

Más detalles

Lectura No. 8. Contextualización. Nombre: Métodos de Análisis ANÁLISIS FINANCIERO 1

Lectura No. 8. Contextualización. Nombre: Métodos de Análisis ANÁLISIS FINANCIERO 1 Análisis financiero ANÁLISIS FINANCIERO 1 Lectura No. 8 Nombre: Métodos de Análisis Contextualización Uno de los mayores obstáculos que se presentan en el momento de desarrollar un modelo econométrico

Más detalles

Tema 3: Análisis de datos bivariantes

Tema 3: Análisis de datos bivariantes Tema 3: Análisis de datos bivariantes 1 Contenidos 3.1 Tablas de doble entrada. Datos bivariantes. Estructura de la tabla de doble entrada. Distribuciones de frecuencias marginales. Distribución conjunta

Más detalles

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López

Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López Diplomado en Econometría Coordinadora académica: M.F. Esperanza Sainz López Brindar al alumno los conocimientos de los métodos econométricos fundamentales y de los conceptos estadísticos que éstos requieren,

Más detalles

UNIDAD 4. INFERENCIA ESTADÍSTICA. Prof. Eliana Guzmán U. Semestre A-2015

UNIDAD 4. INFERENCIA ESTADÍSTICA. Prof. Eliana Guzmán U. Semestre A-2015 UNIDAD 4. INFERENCIA ESTADÍSTICA Prof. Eliana Guzmán U. Semestre A-05 INFERENCIA ESTADÍSTICA La teoría de la Inferencia Estadística está conformada por aquellos métodos que permiten hacer generalizaciones,

Más detalles

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis

TODO ECONOMETRIA. Bondad del ajuste Contraste de hipótesis TODO ECONOMETRIA Bondad del ajuste Contraste de hipótesis Índice Bondad del ajuste: Coeficiente de determinación, R R ajustado Contraste de hipótesis Contrastes de hipótesis de significación individual:

Más detalles

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE

7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE ESCUELA UNIVERSITARIA DE ENFERMERIA DE TERUEL 1 er CURSO DE GRADO DE ENFERMERIA Estadística en Ciencias de la Salud 7. ANÁLISIS DE VARIABLES CUANTITATIVAS: REGRESIÓN LINEAL SIMPLE PROFESOR Dr. Santiago

Más detalles

Folleto de Estadísticas. Teoría del 2do Parcial

Folleto de Estadísticas. Teoría del 2do Parcial Folleto de Estadísticas Teoría del 2do Parcial 2012 Variables aleatorias conjuntas continuas: Sean X y Y dos variables aleatorias continuas con ellas se asocia una función denominada función de densidad

Más detalles

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL)

TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL) TODO ECONOMETRIA TEMA 1: MODELO BASICO DE REGRESIÓN LINEAL MULTIPLE (MBRL) NOTA IMPORTANTE - Estas notas son complementarias a las notas de clase del primer semestre correspondientes a los temas de Regresión

Más detalles

Relación 3 de problemas

Relación 3 de problemas ESTADÍSTICA II Curso 2016/2017 Grado en Matemáticas Relación 3 de problemas 1. La Comunidad de Madrid evalúa anualmente a los alumnos de sexto de primaria de todos los colegios sobre varias materias. Con

Más detalles

Definición Una hipótesis es una afirmación acerca de un parámetro.

Definición Una hipótesis es una afirmación acerca de un parámetro. Capítulo 8 Prueba de hipótesis Existen dos áreas de interés en el proceso de inferencia estadística: la estimación puntual y las pruebas de hipótesis. En este capítulo se presentan algunos métodos para

Más detalles

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u

Multicolinealidad Introducción. Uno de los supuestos básicos del modelo lineal general. y = Xβ + u CAPíTULO 6 Multicolinealidad 6.1. Introducción Uno de los supuestos básicos del modelo lineal general y = Xβ + u establece que las variables explicativas son linealmente independientes, es decir, la igualdad

Más detalles

Evidencias de constructo de la Prueba de Ap4tud Académica del Ins4tuto Tecnológico de Costa Rica. Dra. Tania Elena Moreira Mora

Evidencias de constructo de la Prueba de Ap4tud Académica del Ins4tuto Tecnológico de Costa Rica. Dra. Tania Elena Moreira Mora Evidencias de constructo de la Prueba de Ap4tud Académica del Ins4tuto Tecnológico de Costa Rica Dra. Tania Elena Moreira Mora Antecedentes Los estudios de las pruebas de aptitud académica (PAA) se han

Más detalles

Estadísticas Pueden ser

Estadísticas Pueden ser Principios Básicos Para iniciar en el curso de Diseño de experimentos, es necesario tener algunos conceptos claros en la parte de probabilidad y estadística. A continuación se presentan los conceptos más

Más detalles

Diseño de experimentos - prueba de hipótesis.

Diseño de experimentos - prueba de hipótesis. Diseño de experimentos - prueba de hipótesis http://www.academia.utp.ac.pa/humberto-alvarez/diseno-deexperimentos-y-regresion Inferencia estadística Conjunto de métodos y técnicas que permiten inducir,

Más detalles

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica

INDICE 1. Qué es la Estadística? 2.Descripción de Datos: Distribuciones de Frecuencia y Presentación Gráfica INDICE 1. Qué es la Estadística? 1 Introducción 2 Qué significa estadística? 2 Por qué se estudia la estadística? 4 Tipos de estadística 5 Estadística descriptiva 5 Estadística inferencial 6 Tipos de variables

Más detalles

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia

UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO. Facultad de Medicina Veterinaria y Zootecnia. Licenciatura en Medicina Veterinaria y Zootecnia UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO Facultad de Medicina Veterinaria y Zootecnia Licenciatura en Medicina Veterinaria y Zootecnia Clave 1212 Modalidad del curso: Carácter Métodos estadísticos en medicina

Más detalles

ANÁLISIS DE REGRESIÓN

ANÁLISIS DE REGRESIÓN ANÁLISIS DE REGRESIÓN INTRODUCCIÓN Francis Galtón DEFINICIÓN Análisis de Regresión Es una técnica estadística que se usa para investigar y modelar la relación entre variables. Respuesta Independiente Y

Más detalles

PATH ANALYSIS. Luis M. Carrascal Depto. Biodiversidad y Biología Evolutiva MUSEO NACIONAL DE CIENCIAS NATURALES

PATH ANALYSIS. Luis M. Carrascal Depto. Biodiversidad y Biología Evolutiva MUSEO NACIONAL DE CIENCIAS NATURALES Luis M. Carrascal Depto. Biodiversidad y Biología Evolutiva MUSEO NACIONAL DE CIENCIAS NATURALES Estructura de relaciones entre variables Matrices de correlaciones frente a modelos a priori de asociaciones

Más detalles

Regresión Lineal Múltiple

Regresión Lineal Múltiple Unidad 4 Regresión Lineal Múltiple Javier Santibáñez (IIMAS, UNAM) Regresión Semestre 2017-2 1 / 35 Introducción La idea de la regresión lineal múltiple es modelar el valor esperado de la variable respuesta

Más detalles

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10

Estadística II Tema 4. Regresión lineal simple. Curso 2009/10 Estadística II Tema 4. Regresión lineal simple Curso 009/10 Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores

Más detalles

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández

Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández Métodos de Investigación en Psicología (11) Dra. Lucy Reidl Martínez Dra. Corina Cuevas Reynaud Dra. Renata López Hernández El método incluye diferentes elementos Justificación Planteamiento del problema

Más detalles

Tema 10: Introducción a los problemas de Asociación y Correlación

Tema 10: Introducción a los problemas de Asociación y Correlación Tema 10: Introducción a los problemas de Asociación y Correlación Estadística 4 o Curso Licenciatura en Ciencias Ambientales Licenciatura en Ciencias Ambientales (4 o Curso) Tema 10: Asociación y Correlación

Más detalles

5.5 Modelo de regresión. se especificó en los términos siguientes: (6.3.1) 1,2,3,..N. Donde:

5.5 Modelo de regresión. se especificó en los términos siguientes: (6.3.1) 1,2,3,..N. Donde: 5.5 Modelo de regresión El modelo de regresión lineal que se aplicó para explicar la relación entre producción antigüedad, edad, capital humano, apiarios y camioneta de los apicultores nayaritas se especificó

Más detalles

Análisis de datos Categóricos

Análisis de datos Categóricos Introducción Universidad Nacional Agraria La Molina 2017-1 Variable cualitativa Variable respuesta cualitativa Variable respuesta y explicativa Variable de conteo y proporción Escalas de medición Una variable

Más detalles

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74

Representaciones gráficas de las distribuciones bidimensionales de frecuencias... 74 Índice 1. Introducción al R 15 1.1. Introducción............................. 15 1.2. El editor de objetos R....................... 18 1.3. Datos en R............................. 19 1.3.1. Vectores...........................

Más detalles

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas

INDICE Prefacio 1. Introducción 2. Distribuciones de frecuencia: tablas estadísticas y graficas INDICE Prefacio XIII 1. Introducción 1.1. la imagen de la estadística 1 1.2. dos tipos de estadísticas 1.3. estadística descriptiva 2 1.4. estadística inferencial 1.5. naturaleza interdisciplinaria de

Más detalles

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos

1. Conceptos de Regresión y Correlación. 2. Variables aleatorias bidimensionales. 3. Ajuste de una recta a una nube de puntos TEMA 10 (curso anterior): REGRESIÓN Y CORRELACIÓN 1 Conceptos de Regresión y Correlación 2 Variables aleatorias bidimensionales 3 Ajuste de una recta a una nube de puntos 4 El modelo de la correlación

Más detalles

Teorema Central del Límite (1)

Teorema Central del Límite (1) Teorema Central del Límite (1) Definición. Cualquier cantidad calculada a partir de las observaciones de una muestra se llama estadístico. La distribución de los valores que puede tomar un estadístico

Más detalles

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos

INDICE 1. Introducción 2. Recopilación de Datos Caso de estudia A 3. Descripción y Resumen de Datos 4. Presentación de Datos INDICE Prefacio VII 1. Introducción 1 1.1. Qué es la estadística moderna? 1 1.2. El crecimiento y desarrollo de la estadística moderna 1 1.3. Estudios enumerativos en comparación con estudios analíticos

Más detalles

peso edad grasas Regresión lineal simple Los datos

peso edad grasas Regresión lineal simple Los datos Regresión lineal simple Los datos Los datos del fichero EdadPesoGrasas.txt corresponden a tres variables medidas en 25 individuos: edad, peso y cantidad de grasas en sangre. Para leer el fichero de datos

Más detalles

Pruebas estadís,cas para evaluar relaciones

Pruebas estadís,cas para evaluar relaciones Pruebas estadís,cas para evaluar relaciones Asociación entre dos variables categóricas Hipótesis: frecuencias de ocurrencias en las categorías de una variable son independientes de los frecuencias en la

Más detalles

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos

Tema 7. Introducción Metodología del contraste de hipótesis Métodos no paramétricos 7-1 Tema 7 Contrastes de Hipótesis para una Muestra Introducción Metodología del contraste de hipótesis Métodos no paramétricos Test binomial Test de los signos Test de rango con signos de Wilcoxon Test

Más detalles

Prueba de Hipótesis. Para dos muestras

Prueba de Hipótesis. Para dos muestras Prueba de Hipótesis Para dos muestras Muestras grandes (n mayor a 30) Utilizar tabla Z Ho: μ1 = μ2 H1: μ1 μ2 Localizar en valor de Zt en la tabla Z Error estándar de la diferencia de medias Prueba de

Más detalles

Universidad Autónoma de Sinaloa

Universidad Autónoma de Sinaloa Séptima Edición del Diplomado en Estadística Mc. José V. Jiménez Ramírez Director de la Escuela de Ciencias Fisico-Matemáticas Tel. : 7 16 11 54 vidaljr@uas.uasnet.mx Dr. René Castro Montoya Coordinador

Más detalles

3 CAPÍTULO III TRABAJO EMPÍRICO. Para toda evaluación cuantitativa generalmente se tiene uno que basar en

3 CAPÍTULO III TRABAJO EMPÍRICO. Para toda evaluación cuantitativa generalmente se tiene uno que basar en 3 CAPÍTULO III TRABAJO EMPÍRICO. 3.1 Modelo Econométrico Para toda evaluación cuantitativa generalmente se tiene uno que basar en experiencias anteriores (Allard, 1980, p. 1). Las experiencias anteriores

Más detalles

Análisis descriptivo con SPSS. Favio Murillo García

Análisis descriptivo con SPSS. Favio Murillo García Análisis descriptivo con SPSS Favio Murillo García Tablas de contingencia Cuando se trabaja con variables categóricas, los datos suelen organizarse en tablas de doble entrada en las que cada entrada representa

Más detalles

TEMA 2 Diseño de experimentos: modelos con varios factores

TEMA 2 Diseño de experimentos: modelos con varios factores TEMA 2 Diseño de experimentos: modelos con varios factores José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Esquema del tema Modelo bifactorial

Más detalles

Taller: Aplicación e importancia del software SPSS en la investigación. Instructor: Mtro. Roberto Leonardo Sánchez Medina

Taller: Aplicación e importancia del software SPSS en la investigación. Instructor: Mtro. Roberto Leonardo Sánchez Medina Taller: Aplicación e importancia del software SPSS en la investigación Instructor: Mtro. Roberto Leonardo Sánchez Medina Contenido UNIDAD 1: Estadística descriptiva 1.1. Datos y variables 1.2. Escalas

Más detalles

ANEXO VI. DETALLE ESTADÍSTICO

ANEXO VI. DETALLE ESTADÍSTICO ANEXO VI. DETALLE ESTADÍSTICO El análisis de variables categóricas 8 mediante tablas cruzadas o de contingencia, es uno de los más empleados en ciencias sociales para estudiar la existencia de relación

Más detalles

Introducción al programa AMOS

Introducción al programa AMOS 6 Introducción al programa AMOS Entrar al programa El programa AMOS 18.0 permite la estimación y contraste de modelos estructurales mediante un sencillo y cómodo interface gráfico. Para entrar en AMOS

Más detalles

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN

ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN CURSO DE BIOESTADÍSTICA BÁSICA Y SPSS ASOCIACIÓN ENTRE DOS VARIABLES CONTINUAS: REGRESIÓN Y CORRELACIÓN Amaia Bilbao González Unidad de Investigación Hospital Universitario Basurto (OSI Bilbao-Basurto)

Más detalles

Se trata de: Explicar el comportamiento de una variable dependiente ( Y ) en función de otras variables ( i ) 2 Investigar si las variables están asoc

Se trata de: Explicar el comportamiento de una variable dependiente ( Y ) en función de otras variables ( i ) 2 Investigar si las variables están asoc 4 ASOCIACION ENTRE VARIABLES En la investigación estadística- y en lo fundamental aquella relacionada a variables socioeconómicas-, es común encontrar variables relacionadas o asociadas Estadísticamente

Más detalles

Tema 4. Regresión lineal simple

Tema 4. Regresión lineal simple Tema 4. Regresión lineal simple Contenidos El objeto del análisis de regresión La especificación de un modelo de regresión lineal simple Estimadores de mínimos cuadrados: construcción y propiedades Inferencias

Más detalles

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media:

Modelo Lineal Generalizado GAMMA. Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: Modelo Lineal Generalizado GAMMA Distribución gamma: Otra parametrización mediante el parámetro de forma y la media: La distribución gamma es de tipo exponencial: 1 Supongamos que se dispone de r subpoblaciones

Más detalles

Análisis de regresión y correlación lineal

Análisis de regresión y correlación lineal Análisis de regresión y correlación lineal En las unidades anteriores hemos aplicado metodologías estadísticas para analizar la información de una variable desde una o más muestras utilizando las herramientas

Más detalles

TALLER DE INTRODUCCIÓN A LOS NEGOCIOS

TALLER DE INTRODUCCIÓN A LOS NEGOCIOS REGRESIÓN LINEAL SIMPLE INTRODUCCIÓN Si sabemos que existe una relación entre una variable denominada dependiente y otras denominadas independientes (como por ejemplo las existentes entre: la experiencia

Más detalles

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO

ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO ESTIMACIONES INTERVALOS DE CONFIANZA CON VARIANZA DIFERENTE LI. MIGUEL CANO Varianzas poblacionales desconocidas y distintas Muestras grandes (n 30) Muestras pequeñas (n

Más detalles

Estimación de Parámetros.

Estimación de Parámetros. Estimación de Parámetros. Un estimador es un valor que puede calcularse a partir de los datos muestrales y que proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un

Más detalles

Regresión Lineal Simple y Múltiple Regresión Logística

Regresión Lineal Simple y Múltiple Regresión Logística Regresión Lineal Simple y Múltiple Regresión Logística Miguel González Velasco Departamento de Matemáticas. Universidad de Extremadura MUI en Ciencias de la Salud MUI en Ciencias de la Salud (UEx) Regresión

Más detalles

Dr. Abner A. Fonseca Livias

Dr. Abner A. Fonseca Livias UNIVERSIDAD NACIONAL HERMILIO VALDIZAN FACULTAD DE ENFERMERÍA Dr. Abner A. Fonseca Livias 3/21/2015 6:17 AM Dr. Abner Fonseca Livias 1 UNIVERSIDAD NACIONAL HERMILIO VALDIZAN ESCUELA DE POST GRADO Dr. Abner

Más detalles

TEMA 4 Modelo de regresión múltiple

TEMA 4 Modelo de regresión múltiple TEMA 4 Modelo de regresión múltiple José R. Berrendero Departamento de Matemáticas Universidad Autónoma de Madrid Análisis de Datos - Grado en Biología Estructura de este tema Modelo de regresión múltiple.

Más detalles

Método Simplex. Ing. Ricardo Fernando Otero, MSc

Método Simplex. Ing. Ricardo Fernando Otero, MSc Método Simplex Ing. Ricardo Fernando Otero, MSc Forma estándar de un modelo de programación lineal Dirección de mejora: Maximizar Todas las restricciones deben ser El lado izquierdo debe contener solo

Más detalles

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4)

INTRODUCCIÓN AL ANÁLISIS DE DATOS ORIENTACIONES (TEMA Nº 4) OBJETIVOS DE APRENDIZAJE: TEMA Nº ANÁLISIS CONJUNTO DE DOS VARIABLES Distinguir entre variables cualitativas y cuantitativas, y saber elegir los métodos en cada caso. Conocer métodos gráficos y cuantitativos

Más detalles

Contrastes basados en el estadístico Ji Cuadrado

Contrastes basados en el estadístico Ji Cuadrado Capítulo 10 Contrastes basados en el estadístico Ji Cuadrado 10.1. Introducción Existen multitud de situaciones en el ámbito de la salud en el que las variables de interés, las cuales no pueden cuantificarse

Más detalles

Métodos de Diseño y Análisis de Experimentos

Métodos de Diseño y Análisis de Experimentos 1 / 28 Métodos de Diseño y Análisis de Experimentos Patricia Isabel Romero Mares Departamento de Probabilidad y Estadística IIMAS UNAM marzo 2018 Ideas básicas del diseño experimental Capítulo 4 de Analysis

Más detalles

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS

TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS TEMA 9 EL ANÁLISIS BÁSICO DE LA INFORMACIÓN EN LA INVESTIGACION DE MERCADOS 9.1. Análisis Descriptivo de la Información 9.2. La Tabulación Cruzada 9.3. Contraste de Hipótesis 9.1. Análisis Descriptivo

Más detalles

Generalmente, el objetivo de cualquier estudio de econometría es la. búsqueda de relaciones matemáticas que permitan explicar el comportamiento

Generalmente, el objetivo de cualquier estudio de econometría es la. búsqueda de relaciones matemáticas que permitan explicar el comportamiento 5. METODOLOGÍA ECONOMÉTRICA. Generalmente, el objetivo de cualquier estudio de econometría es la búsqueda de relaciones matemáticas que permitan explicar el comportamiento de una variable económica a partir

Más detalles

Bioestadística. Curso Práctica: La recta de regresión

Bioestadística. Curso Práctica: La recta de regresión Bioestadística. Curso 2012-2013 Carmen M a Cadarso, M a del Carmen Carollo, Xosé Luis Otero, Beatriz Pateiro Índice 1. Introducción 2 2. El diagrama de dispersión 2 3. Covarianza 4 4. Coeciente de correlación

Más detalles