- Introducción
- Justificación
- Descripción de la empresa: ESSALUD
- Antecedentes
- Marco teórico
- Tamaño de muestra para estimar proporciones con M.S.A.
- Tamaño de muestra para estimar la media con M.A.E.
- Problema
- Variables de estudio
- Análisis y discusión de resultados
- Bibliografía
Introducción
El presente trabajo, como parte del desarrollo del curso del primer ciclo de la Maestría Administración y Dirección de Empresas de la Universidad Privada Alas Peruanas, contiene un programa de curso donde se plantean dos temáticas importantes a desarrollar, la estadística desde su enfoque descriptivo y el inferencial, y el uso de modelos cuantitativos en la resolución de problemas de gestión y administración de sistemas complejos, con especial énfasis en la toma de decisiones, puesto que la Estadística es una disciplina que apoya el proceso de toma de decisiones en diversas áreas del conocimiento, además, de entregar pautas para la presentación adecuada de información.
La temática del curso, y que se ha intentado desarrollar a cabalidad en este trabajo de fin de curso, se orienta a fortalecer la adquisición de competencias en la formación del nivel de postgrado, primero para un tipo de usuario: administrador general o potencial, que puede sacar provecho de su uso en la comprensión y aplicación de los modelos cuantitativos para la toma de decisiones; o en segundo lugar, para estudiantes de postgrado, con necesidades de aprender herramientas gerenciales, en donde la toma de decisiones juegue un papel fundamental, como son las herramientas de gestión, administración y economía, entre otros, y se emplea de tres maneras: como guía en la toma de decisiones; como ayuda en la toma de decisiones (pronósticos), y para automatizar la toma de decisiones (modelar y desarrollar una fórmula matemática).
En el presente trabajo se exponen aplicaciones, ejemplos y/o casos de estadística descriptiva e inferencia y de investigación operativa, con la característica que el nivel de complejidad matemática se mantiene al mínimo nivel posible, y se hace especial énfasis en el planteamiento de modelos y en explicar cómo algunas de las técnicas existentes pueden ayudar a solucionar problemas que aparecen en cualquier organización. Por ello, para su comprensión no se necesita una formación matemática previa; porque muchos de los cálculos se realizan mediantes software de aplicación como el SPSS, la hoja de cálculo MS Excel y otros programas aplicativos estadísticos.
El trabajo está organizado por: introducción, justificación, descripción de la empresa, antecedentes. Luego, el Marco Teórico de la Estadística Descriptiva y Aplicada, y de los Métodos Cuantitativos. Seguidamente, se formulan el problema y las variables de estudio para las aplicaciones de la estadística, así como la función objetivo y el planteamiento del modelo, para el desarrollo del caso de investigación operativa. Posteriormente se hace el análisis y discusión de resultados, y finalmente las conclusiones y recomendaciones, así como los anexos y la bibliografía consultada.
Justificación
En la Región Tumbes existen instituciones universitarias como la Universidad Nacional de Tumbes y la filial de la Universidad Privada Alas Peruanas. Ambas ofrecen una serie de servicios educativos en el nivel de pregrado y postgrado, entre los que se encuentra la Maestría en Administración y Dirección de Empresas, y en ambos niveles la asignatura de estadística es fundamental en la formación de competencias profesional, siendo en muchos casos requisito de las asignaturas del área de investigación, en tal sentido es importante en el nivel de postgrado la comprensión de la estadística aplicada, que en este curso se circunscribe a la estadística inferencia y a los métodos cuantitativos.
El desarrollo de este trabajo de fin de curso, es una estrategia didáctica que permite al estudiante de postgrado dedicar tiempo al estudio de manera que adapte su disponibilidad de tiempo con el manejo de información relaciona con el quehacer profesional, que siendo en nuestro caso ESSALUD, nos permite no solo comprender y aplicar los conceptos teóricos, sino generalizar y fijar como aprendizaje significativo, durante el proceso colaborativo de la elaboración del trabajo, con el planteamiento de problemas con información real y al alcance de los estudiantes, utilizando las herramientas de la investigación operativa y de la estadística aplicada, que nos ha permitido enfrentar problemas estadísticos desde un nivel básico a otro intermedia y avanzado, con lo cual podemos afirmar que estamos en condiciones de explicar con conocimiento lo aprendido, desarrollar habilidades y demostrar una valoración y comprensión de la ciencia estadística.
Esta materia es importante y cobra relevancia, puesto que al ser la estadística base para las materias de investigación, puesto que siendo la finalidad de la investigación el análisis o experimentación de situaciones para el descubrimiento de nuevos hechos, la revisión o establecimiento de teorías y las aplicaciones prácticas de las mismas, se basa en los principios de observación y razonamiento y necesita en su carácter científico del análisis técnico de datos para obtener de ellos información confiable y oportuna. En ese sentido éste análisis de datos requiere de la Estadística como una de sus principales herramientas, y nuestra formación postgradual requieren de conocimientos especializados en su quehacer o campo de actividades, para el manejo eficiente de conceptos, técnicas y procedimientos estadísticos. Es así que hemos, alcanzado aprendizajes significativos en cada uno de los temas abordados con el auxilio de herramientas de software, logrando alcanzar los propósitos del curso en forma gradual, adquiriendo destrezas para aplicar correctamente las herramientas estadísticas aplicadas usando información disponible en ESSALUD.
Descripción de la empresa: ESSALUD
ESSALUD
ESSALUD es un organismo público descentralizado, con personería jurídica de derecho público interno, cuya finalidad es dar cobertura a los asegurados y a sus derechohabientes a través del otorgamiento de prestaciones de prevención, promoción, recuperación, rehabilitación, prestaciones económicas y prestaciones sociales que corresponden al régimen contributivo de la Seguridad Social en Salud, en un marco de equidad, solidaridad, eficiencia y facilidad de acceso a los servicios de salud.
Por Ley N° 27056 se creó el Seguro Social de Salud – ESSALUD, como organismo público descentralizado, con personería jurídica de derecho público interno, con la finalidad de dar cobertura a nuestros asegurados y derecho habientes a través de diversas prestaciones que corresponden al régimen contributivo de la seguridad social en salud así como otros seguros de riesgos humanos.
Son asegurados del seguro regular:
Los trabajadores activos que laboran bajo una relación de dependencia o en calidad de socios de cooperativas de trabajadores, los trabajadores del hogar así como los pensionistas que perciben pensión de jubilación, incapacidad o sobrevivencia.
También son asegurados regulares los trabajadores pescadores, procesadores pesqueros artesanales y trabajadores agrarios dependientes e independientes, existiendo una normatividad especial por cada sector.
En el caso de las microempresas, los trabajadores y conductores (persona natural propietaria de la unidad económica) están comprendidos como asegurados regulares.
Los familiares de los trabajadores llamados derechohabientes comprenden al cónyuge (esposo, esposa) o concubino(a). (Artículo 326 del Código Civil), los hijos menores de edad o mayores de edad incapacitados en forma total y permanente para el trabajo, siempre que no sean afiliados obligatorios.
VISIÓN
Hacia un Servicio centrado en el asegurado que supere sus expectativas y mejore su bienestar.
MISIÓN
Somos un Seguro Social de Salud que brinda una atención Integral con calidad, calidez y eficiencia para mantener saludables a nuestros asegurados.
SERVICIOS
Los Servicios del asegurado comprende:
a) Servicios de Salud
Atención Primaria
Instituto de Medicina Tradicional
Servicio de Salud Mental
Programa Nacional de Transplante.
Proyectos Especiales
Atención Domiciliaria (PADOMI)
Sistema de Transporte Asistido de Emergencia (STAE)
Hospitales móviles (Hospital Perú)
b) Centro de Seguridad Ocupacional
Centro de Prevención de Riesgos del Trabajo (CEPRIT)
RED ASISTENCIAL DE ESSALUD – TUMBES
La Red Asistencial de Essalud de Tumbes forma parte del sistema de Essalud a nivel nacional y esta conformada por los servicios que presta el Hospital "Carlos Alberto Cortez" y centros de salud localizados en las provincias de Zarumilla y de Contralmirante Villar. Hasta antes de la remodelación del Hospital "Carlos Alberto Cortez" de la Red Asistencial de EsSalud en Tumbes, sólo brindaba atenciones de baja complejidad, por lo que los pacientes con enfermedades más complejas eran enviados a Piura y Chiclayo.
EsSalud de Tumbes cuenta con un hospital remodelado, que se estima beneficia a más de 50 mil asegurados de esta zona del país. Esta ubicado en Prolongación Tumbes 1625, Carretera Panamericana. Su inversión asciende a 18 millones de nuevos soles, de los cuales 11 millones 724 mil 817 nuevos soles, corresponden a infraestructura y para equipamiento se invirtieron seis millones 629 mil soles. Asimismo, cuenta con cuatro nuevas ambulancias.
El hospital remodelado cuenta con 25 camas en el área de hospitalización, 14 consultorios físicos, 28 funcionales, un moderno centro quirúrgico, un centro obstétrico y neonatológico, servicio de emergencia, unidad de cuidados intermedios, unidad de cuidados intensivos neonatales y un área de aislados. Además, con un laboratorio de última tecnología, un banco de sangre, área de imagenología, de medicina física, rehabilitación y un auditorio. Todos los servicios están computarizados e interconectados con el sistema de gestión hospitalaria, lo que permite que historias clínicas, recetas, resultados de laboratorio, informes de rayos X y ecografías puedan ser visualizados desde cualquier computadora de consulta externa, con lo cual se agiliza la atención, ahorrando tiempo al paciente y facilitando el trabajo de los profesionales de la salud.
Antecedentes
Como dijera Huntsberger: "La palabra estadística a menudo nos trae a la mente imágenes de números apilados en grandes arreglos y tablas, de volúmenes de cifras relativas a nacimientos, muertes, impuestos, poblaciones, ingresos, deudas, créditos y así sucesivamente. Huntsberger tiene razón pues al instante de escuchar esta palabra estas son las imágenes que llegan a nuestra cabeza. La Estadística es mucho más que sólo números apilados y gráficas bonitas. Es una ciencia con tanta antigüedad como la escritura, y es por sí misma auxiliar de todas las demás ciencias. Los mercados, la medicina, la ingeniería, los gobiernos, etc. Se nombran entre los más destacados clientes de ésta. La ausencia de ésta conllevaría a un caos generalizado, dejando a los administradores y ejecutivos sin información vital a la hora de tomar decisiones en tiempos de incertidumbre. La Estadística que conocemos hoy en día debe gran parte de su realización a los trabajos matemáticos de aquellos hombres que desarrollaron la teoría de las probabilidades, con la cual se adhirió a la Estadística a las ciencias formales.
La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro. La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con e fin de realizar una toma de decisión más efectiva. Otros autores tienen otras definiciones de la Estadística semejantes a las anteriores, y algunos otros no tan semejantes. La más aceptada, sin embargo, es la de Minguez, que define la Estadística como "La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima".
Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística, en primer término se usa para referirse a la información estadística; también se utiliza para referirse al conjunto de técnicas y métodos que se utilizan para analizar la información estadística; y el término estadístico, en singular y en masculino, se refiere a una medida derivada de una muestra.
Respecto a la utilidad e Importancia de la estadística es preciso indicar que, los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones.
La historia de la estadística está resumida en tres grandes etapas o fases.
1.- Primera Fase: Los Censos:
Desde el momento en que se constituye una autoridad política, la idea de inventariar de una forma más o menos regular la población y las riquezas existentes en el territorio está ligada a la conciencia de soberanía y a los primeros esfuerzos administrativos.
2.- Segunda Fase: De la Descripción de los Conjuntos a la Aritmética Política:
Las ideas mercantilistas extrañan una intensificación de este tipo de investigación.
Colbert multiplica las encuestas sobre artículos manufacturados, el comercio y la población: los intendentes del Reino envían a París sus memorias. Vauban, más conocido por sus fortificaciones o su Dime Royale, que es la primera propuesta de un impuesto sobre los ingresos, se señala como el verdadero precursor de los sondeos. Más tarde, Bufón se preocupa de esos problemas antes de dedicarse a la historia natural.
La escuela inglesa proporciona un nuevo progreso al superar la fase puramente
descriptiva. Sus tres principales representantes son Graunt, Petty y Halley. El penúltimo es autor de la famosa Aritmética Política.
Chaptal, ministro del interior francés, publica en 1801 el primer censo general de población, desarrolla los estudios industriales, de las producciones y los cambios, haciéndose sistemáticos durantes las dos terceras partes del siglo XIX.
3.- Tercera Fase: Estadística y Cálculo de Probabilidades:
El cálculo de probabilidades se incorpora rápidamente como un instrumento de análisis extremadamente poderoso para el estudio de los fenómenos económicos y sociales y en general para el estudio de fenómenos "cuyas causas son demasiados complejas para conocerlos totalmente y hacer posible su análisis".
Marco teórico
5.1. LA ESTADISTICA
5.1.1. Conceptos básicos
Definición de Estadística
Es el conjunto de procedimientos y técnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales. También se puede definir la Estadística como la Ciencia de la sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones.
Análisis estadístico
El análisis estadístico es todo el proceso de organización, procesamiento, reducción e interpretación de datos para realizar inferencias. En este sentido, uno de los problemas fundamentales de la Estadística es el estudio de la relación existente entre una población y sus muestras. Según la dirección de tal relación la Estadística puede ser:
Deductiva, cuando a partir del conocimiento de la población se trata de caracterizar cada muestra posible.
Inductiva, cuando a partir del conocimiento derivado de una muestra se pretende caracterizar la población.
Asimismo, por el nivel, comprende dos partes:
Estadística Descriptiva o General. Se refiere a la recolección, presentación, descripción, análisis e interpretación de una colección de datos, esencialmente consiste en resumir éstos con uno o dos elementos de información (medidas descriptivas) que caracterizan la totalidad de los mismos.
Estadística inferencial o Aplicada. Comprende aquellas técnicas por medio de las cuales se toman dediciones sobre un universo basado en una muestra. Debido a que esas dediciones se toman en condiciones de incertidumbre, se requiere el uso de conceptos de probabilidad.
5.1.2. ESTADISTICA DESCRIPTIVA
La estadística Descriptiva es el método de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por éstos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una población o de una muestra, cuando en la etapa preliminar de la Inferencia Estadística se conocen los elementos de una muestra. Incluye la técnica que se relaciona con el resumen y la descripción de datos numéricos. Estos métodos pueden ser tablas o gráficos o pueden incluir análisis mediante cálculos de determinadas medidas estadísticas: Medidas de posición y medidas de variabilidad e índices.
A. POBLACIONES Y MUESTRAS
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una muestra a una población. Se estudia en particular a un reducido número de individuos a los que tenemos acceso con la idea de poder generalizar los hallazgos a la población de la cual esa muestra procede. Este proceso de inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población). El individuo es cada uno de los componentes de la población y la muestra. La muestra debe ser representativa de la población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar:
Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
Como consecuencia del punto anterior ahorraremos costes.
Estudiar la totalidad de los pacientes o personas con una característica determinada en muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.
Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos que realizar a una población.
La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar los criterios de inclusión y/o exclusión.
B. DATOS Y VARIABLES
Cuando se consideran los métodos de organización, reducción y análisis de datos estadísticos, se hace necesario aclarar los siguientes conceptos.
Datos: son medidas o valores de las características susceptibles de observar y contar, se originan por la observación de una o más variables de un grupo de elementos o unidades
Variables: es toda característica que varía de un elemento a otro de la población.
Clasificación de variables
Las variables pueden clasificarse en: categóricas o cualitativas (atributos), no tienen ningún grado de comparación numérica, ejemplo: sexo, estado civil; y numéricas o cuantitativas, son características factibles de expresar por medio de números, estas pueden ser Discretas, que solo pueden tomar ciertos valores aislados en un intervalo, y Continuas, que pueden tomar cualquier valor en un intervalo.
Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión arterial sistólica, etcétera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida que aplicaremos a cada variable.
La naturaleza de las observaciones será de gran importancia a la hora de elegir el método estadístico más apropiado para abordar su análisis. Con este fin, clasificaremos las variables, a grandes rasgos, en dos tipos 3-5: variables cuantitativas o variables cualitativas.
Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse numéricamente. Las variables cuantitativas pueden ser de dos tipos:
Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico determinado (edad, peso, talla).
Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango. Suelen tomar solamente valores enteros (número de hijos, número de partos, número de hermanos, etc).
Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a cada caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se requiere de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etcétera).
En el proceso de medición de estas variables, se pueden utilizar dos escalas:
Escalas nominales: ésta es una forma de observar o medir en la que los datos se ajustan por categorías que no mantienen una relación de orden entre sí (color de los ojos, sexo, profesión, presencia o ausencia de un factor de riesgo o enfermedad, etcétera).
Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las categorías (grados de disnea, estadiaje de un tumor, etcétera).
C. REPRESENTACIÓN DE DATOS
Los datos son colecciones de un número cualquiera de observaciones relacionadas entre si, para que sean útiles se deben organizar de manera que faciliten su análisis, se puedan seleccionar tendencias, describir relaciones, determinar causas y efectos y permitan llegar a conclusiones lógicas y tomar decisiones bien fundamentadas; por esa razón es necesario conocer lo métodos de Organización y Representación, la finalidad de éstos métodos es permitir ver rápidamente todas las características posibles de los datos que se han recolectado.
Representación Tabular:
Presenta las variables y las frecuencias con que los valores de éstas se encuentran presentes en el estudio.
Representación Gráfica:
Se llaman gráficas a las diferentes formas de expresar los datos utilizando los medios de representación que proporciona la geometría.
D. METODOS DE REPRESENTACIÓN DE DATOS CUANTITATIVOS
Arreglo de Datos. Es una forma de presentar los datos en un arreglo ascendente o descendente. Ofrece las ventajas siguientes: describe los valores mínimos y máximos, en él se pueden dividir los datos fácilmente en secciones, permite darse cuenta de los valores que aparecen más de una vez, se puede observar la distancia entre valores consecutivos.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los valores.
Diagrama de Tallo y Hoja. Es útil para realizar una exploración preliminar del conjunto, genera una imagen adecuada de ellos sin perder información.
Distribución de Frecuencias. Es una forma de sintetizar los datos y consiste en valerse de una tabla para clasificar los datos según su magnitud, en ella se señala el número de veces que aparece cada uno de los valores. Cuando se dispone de un gran número de valores discretos o cuando las variables son continuas, tiene sentido formar una tabla que presente la distribución de frecuencias de los datos agrupados en intervalos o clases, de igual tamaño si es posible, sin embargo una tabla de este tipo supone una concentración de datos que produce pérdida de información.
E. DISTRIBUCIÓN DE FRECUENCIAS
Organización de datos agrupados
Definiciones
Clases o intervalos de clase: Grupo de valores que describen una característica. Deben incluir todas las observaciones y ser excluyentes. Los intervalos contienen los límites de clase que son los puntos extremos del intervalo. Se denominan intervalos cerrados, cuando contienen ambos límites e intervalos abiertos si incluyen solo un límite.
Limites Reales: Sirven para mantener la continuidad de las clases
Anchura o tamaño del intervalo: es la diferencia entre los límites reales de una clase.
Número de clases: es el número total de grupos en que se clasifica la información, se recomienda que no sea menor que 5 ni mayor que 15
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los puntos medios coincidan con los datos observados para minimizar el error.
Frecuencia: es el número de veces que aparece un valor
Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un determinado valor o límite de clase.
Frecuencia Relativa: Indica la proporción que representa la frecuencia de cada intervalo de clase en relación al total, es útil para comparar varias distribuciones con parámetros de referencia uniformes.
Frecuencia Acumulada Relativa: Indica la proporción de datos que se encuentra por arriba o debajo de cierto valor o límite de clase.
Gráficos de una Distribución de Frecuencias
Los gráficos son útiles porque ponen en relieve y aclaran las tendencias que no se captan fácilmente en la tabla, ayudan a estimar valores con una simple ojeada y brinda una verificación gráfica de la veracidad de las soluciones.
Histograma:
Está formado por rectángulos cuya base es la amplitud del intervalo y tiene la característica que la superficie que corresponde a las barras es representativa de la cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases que tienen el mismo tamaño o diferente ( intervalo variable). La utilización de los intervalos de amplitud variable se recomienda cuando en alguno de los intervalos , de amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos de los intervalos sea mucho mayor que la de los demás, logrando así que las observaciones se hallen mejor repartidas dentro del intervalo.
Polígono de Frecuencias
Se puede obtener uniendo cada punto medio (marca de clase) de los rectángulos del histograma con líneas rectas, teniendo cuidado de agregar al inicio y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del áreas.
Curvas de frecuencia
No es más que la curva suavizada que se traza sobre el polígono y representa la asimetría y la curtosis que tiene la distribución, permite visualizar un esquema más claro del patrón de datos. Existen varios tipos de curva de frecuencia: Curvas J, Simétricas o Asimétricas (sesgada a la derecha o a la izquierda), Unimodales, Bimodales y Multimodales.
Ojivas: Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es necesario tener una base estándar, la frecuencia relativa. La ojiva representa gráficamente la forma en que se acumulan los datos y permiten ver cuantas observaciones se hallan por arriba o debajo de ciertos valores. Es útil para obtener una medida de los cuartiles, deciles , percentiles.
F. MEDIDAS DESCRIPTIVAS
Con estas medidas se persigue reducir en pocas cifras significativas el conjunto de observaciones de una variable y describir con ellas ciertas características de los conjuntos, logrando una comparación más precisa de los datos que la que se puede conseguir con tablas y gráficas. Estas usualmente se denominan: Parámetros Estadísticos, Estadísticos o Estadígrafos.
Así para variables categóricas, como el sexo, se quiere conocer el número de casos en cada una de las categorías, reflejando habitualmente el porcentaje que representan del total, y expresándolo en una tabla de frecuencias.
Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar por un método de análisis distinto, respondiendo a las siguientes preguntas:
¿Alrededor de qué valor se agrupan los datos?
Supuesto que se agrupan alrededor de un número, ¿cómo lo hacen? ¿muy concentrados? ¿muy dispersos?
a) Medidas de tendencia central
Los promedios son una medida de posición que dan una descripción compacta de cómo están centrados los datos y una visualización más clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar valores extremos o raros y brinda mayor facilidad para efectuar comparaciones.
Es importante poner en relieve que la notación de promedio lleva implícita la idea de variación y que este número promedio debe cumplir con la condición de ser representativo de conjunto de datos.
Medidas de tendencia central: Media o Promedio
Es una medida matemática, un número individual que representa razonablemente el comportamiento de todos los datos.
La media no es más que la suma de todos los valores de una variable dividida entre el número total de datos de los que se dispone.
Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de edad de estos sujetos será de:
El promedio como punto típico de los datos es el valor al rededor del cual se agrupan los demás valores de la variable.
Para datos no agrupados X = S xi / n
Para datos agrupados X = S fi Xi / S fi
donde Xi es la marca de clase para cada intervalo y fi es la frecuencia de clase
Características de la Media:
1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno afecta la media.
2. La suma algebraica de las desviaciones de los valores individuales respecto a la media es cero.
3. La suma del cuadrado de las desviaciones de una serie de datos a cualquier número A es mínimo si A = X
4. Aunque es confiable porque refleja todos los valores del conjunto de datos puede ser afectada por los valores extremos, y de esa forma llegar a ser una medida menos representativa, por lo que si la distribución es asimétrica, la media aritmética no constituye un valor típico.
LA MEDIANA
La mediana, es el valor de la observación que ocupa la posición central de un conjunto de datos ordenados según su magnitud. Es el valor medio o la media aritmética de los valores medios. La mediana es un valor de la variable que deja por debajo de él un número de casos igual al que deja por arriba.
La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
15, 21, 32, 59, 60, 60,61, 64, 71, 80.
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se encuentran en el medio son 60 y 60. Si realizamos el cálculo de la media de estos dos valores nos dará a su vez 60, que es el valor de la mediana.
Si la media y la mediana son iguales, la distribución de la variable es simétrica. La media es muy sensible a la variación de las puntuaciones. Sin embargo, la mediana es menos sensible a dichos cambios.
Geométricamente la mediana es el valor de la variable que corresponde a la vertical que divide al histograma en dos áreas iguales. Cuando determinados valores de un conjunto de observaciones son muy grandes o pequeños con respecto a los demás, entonces la media aritmética se puede distorsionar y perder su carácter representativo, en esos casos es conveniente utilizar la mediana como medida de tendencia central.
Características de la mediana
1. Es un promedio de posición no afectado por los valores extremos.
2. No está definida algebraicamente
3. Cuando la localización del elemento central puede ser determinada y los límites de clase mediana son conocidos, la mediana para la distribución de frecuencias puede ser calculada por interpolación, no importando que ésta contenga intervalos abiertos, cerrados, iguales o diferentes.
4. La suma de los valores absolutos, sin considerar el signo, de las desviaciones individuales respecto a la mediana es mínimo.
5 La mediana en caso de una distribución asimétrica, no resulta desplazado del punto de tendencia central.
6. Si el universo tiene curtosis excesiva la mediana como estadístico, varía menos que cualquier otra medida.
7. Si la mediana se calcula por interpolación y hay lagunas en los valores de la clase mediana o los datos son irregulares, esta medida no es buena ya que su ubicación puede resultar falsa.
8. Si se desea ubicar las condiciones de un elemento en una clase, la mediana resulta ser la indicada, ya que por comparación pone en evidencia si un elemento está en la mitad superior a ella o en la inferior.
LA MODA
Es otra medida de tendencia central, no tan usual como las anteriores, es la moda, siendo éste el valor de la variable que presenta una mayor frecuencia. Es el valor de un conjunto de datos que ocurre más frecuentemente, se considera como el valor más típico de una serie de datos.
En el ejemplo anterior el valor que más se repite es 60, que es la moda
Para datos agrupados se define como Clase Modal el intervalo que tiene más frecuencia.
La moda puede no existir o no ser única, las distribuciones que presentan dos o más máximos relativos se designan de modo general como bimodales o multimodales.
Características de la Moda.
1. Representa más elementos que cualquier otro valor
2. No está afectada por los valores extremos pero para datos continuos es dudoso su cálculo.
3. La moda para una distribución de frecuencias de datos agrupados no puede ser calculada exactamente, el valor de la moda puede ser afectado por el método de agrupación de los intervalos de clase.
4. La moda no permite conocer la mayor parte de los datos
5. Algunas veces el azar interviene de manera importante y hace que un valor no representativo se repita frecuentemente.
6. Puede usarse para datos cuantitativos como cualitativos
7. La moda como estadístico, varía mucho de una muestra a otra
8. Cuando se tienen dos o más modas es difícil su interpretación
9. Tiene la ventaja de que los datos desproporcionados con respecto al resto no la distorsionan, pero no se presta para un tratamiento matemático.
RELACIÓN ENTRE MEDIA, MEDIANA, MODA
Distribución Simétrica: Cuando ( Media = Mediana = Moda
Distribución Sesgada hacia la derecha: Cuando ( Moda < Mediana < Media
Distribución Sesgada hacia la Izquierda: Cuando ( Media < Mediana < Moda.
OTRAS MEDIDAS:
MEDIA ARITMETICA PONDERADA
En ésta, para cada uno de los valores de xi se asigna un factor wi de peso, que depende de la importancia que el investigador desee darle.
Xp = S ( xi wi) / S wi
MEDIA GEOMÉTRICA
Útil cuando la variable cambia a lo largo del tiempo, esto es, en el calculo del promedio de tasas, razones, proporciones geométricas y relaciones de variables. Se utiliza en Matemáticas Financieras y Finanzas para promediar números índices, tasas de cambio, etc.
La media Geométrica de una serie de números es la raíz n-ésima del producto de esos números
M = n e (x 1 * x 2 * x 3 *…..*x n )
Se ve afectada por todos los números y valores extremos pero en menor grado que la Media Aritmética, su valor siempre es menor que el de ésta.
MEDIA ARMÓNICA
Se utiliza para el promedio de rendimientos y velocidades. La Media Armónica de una serie de números es el reciproco de la media aritmética del recíproco de esos números.
1 / MH = [ S 1 / xi ] / n
MEDIA CUADRÁTICA
Es la raíz cuadrada de la media aritmética de los cuadrados de los números, se usa eficientemente para promediar los errores o desviaciones porque es más susceptible a los mismos.
MC = 2 e S [ xi 2 ] / n
b) Medidas de dispersión
Un rasgo principal de los datos es su dispersión o amplitud, que se refiere a su variabilidad, a la evaluación de cuán separados o extendidos están estos datos o bien cuanto difieren unos de otros.
Variación: es el grado en que los datos numéricos tienden a extenderse alrededor de un valor, generalmente el valor medio
¿Por qué es importante la variación?
1. Al menudo una medida de posición de un conjunto de datos se vincula con la indicación de cuán típico o representativo es para la población y para ello es necesario contar con la información que proporcionan las mediadas de variación. Solo el conocimiento de un estadístico de tendencia central no aclara o define toda la distribución, además que no existe un valor de tendencia central ideal, por lo que es significativo tener una idea de la dispersión de los valores y determinar si es mucha o poca alrededor de la media, pues si la variación es muy grande entonces esta medida de tendencia central no es buena selección como valor típico.
2. La medida de tendencia central no indica la relación de un dato con los otros, es necesario para ello las medidas de variabilidad o dispersión.
3. Al tratar problemas con datos dispersos se requiere conocer que problemas puede esto traer, hasta que punto la dispersión tiene un riesgo aceptable o inaceptable en la toma de decisiones.
4. Al comparar dos distribuciones por lo general centramos la atención en la posición y en la dispersión.
RANGO
Mide la dispersión de la totalidad de los datos. Es la más obvia de las mediadas ya que es la distancia entre los valores máximo y mínimo.
Página siguiente |