lunes, 16 de enero de 2017

miércoles, 9 de noviembre de 2016

Actividades

Actividades del Primer corte.

Luego de haber leído y comprendido la información correspondiente a los conceptos básicos de estadística y a la organización de datos, va a desarrollar las siguientes actividades para cumplir con la evaluación de estos contenidos.

1.- Suponga que el gerente de la División de servicios al cliente de Zenith, está interesado en determinar si los clientes que compraron un televisor en los últimos 12 meses están satisfechos con sus productos. Utilizando las tarjetas de garantía que envían los clientes después de la compra, el gerente está planeando encuestar a 1425 de esos clientes.
a) Describa tanto la población como la muestra de interés para el gerente.
b) Describa el tipo de datos que el gerente desea recolectar
c) Elabore un primer borrador de cuestionario describiendo una serie de tres preguntas cualitativas y tres cuantitativas que considere apropiadas para esta encuesta.


2. - En un hospital de la localidad, se llevó un registro diario del número de veces que hubo fallas en el sistema eléctrico, durante un período de 33 días. La información obtenida es la siguiente:

1            0        4          1          2          0          0          6          4          5          2
3            1        6          5          4          4          5          1          5          1          0
0            3        0          3          2          1          2          6          0          4          3


  • Resuma los datos en una distribución de frecuencias.
  • Represente los datos mediante un gráfico de barras verticales
  • Seleccione una frecuencia relativa cualquiera y una frecuencia acumulada cualquiera e interprétela en términos del problema.
  • Determine el porcentaje de días en que ocurrieron menos de tres fallas diarias.
3.- Para tener un mejor conocimiento de la altura de los estudiantes de un instituto de 800 alumnos, se ha medido a cuarenta de ellos elegidos al azar, obteniéndose los siguientes resultados:

                        1,52     1,85     1,70     1,68     1,65     1,80     1,72     1,71     1,60     1,68
                        1,69     1,59     1,70     1,79     1,76     1,35     1,60     1,62     1,61     1,66
                        1,67     1,66     1,68     1,73     1,74     1,81     1,85     1,72     1,53     1,50
                        1,62     1,72     1,68     1,70     1,65     1,70      1,75     1,77     1,76     1,71

a)    Se pide:  Construir una distribución de frecuencias agrupadas, comenzando desde el gráfico de tallo y hoja, hasta llegar a formar la tabla de frecuencia completa 
b)   Realice el gráfico del histograma
c) Seleccione una frecuencia relativa cualquiera y una frecuencia acumulada cualquiera e interprétela en términos del problema.

Una vez que ya realizó los ejercicios, los va a escanear, copia y pega en un archivo word y los envia al correo institucional de la profesora de la materia, ese archivo debe tener su nombre, por ejemplo sofiaizq-tarea1.doc

sofia.izquierdo@psmmerida.edu.ve

La ponderación de la evaluación es de 20%




Organización de datos


Organización de Datos  (Hacer click para ir al documento)


La información estadística puede comunicarse más fácilmente si se organiza en tablas y se muestra en gráficas. A menos que un conjunto de datos esté sistemáticamente organizado, será difícil de asimilar e interpretar. Los procedimientos para organizar, resumir y simplificar datos son fundamentales para los métodos estadísticos. Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto grande de datos, la manera más simple es la serie ordenada, en forma ascendente o descendente.
Entre las herramientas estadísticas que resultan de particular utilidad para organizar los datos se incluyen:
- Tablas de contingencia - Doble entrada
- Tablas de frecuencia que colocan todos los datos en clases específicas
- Diversos gráficos que pueden proporcionar una representación visual de los datos
Tablas estadísticas
Las tablas estadísticas son recopilaciones numéricas bien estructuradas y fáciles de interpretar de las que se vale el estadístico para sintetizar los datos obtenidos con el fin de hacer un uso sencillo de ellos o bien para darlos a conocer de forma comprensible.
Existen infinidad de tablas estadísticas, pero las más básicas son las tablas de frecuencias, las de frecuencias relativas y frecuencias acumuladas, las de frecuencias con datos agrupados en intervalos y las de doble entrada.

TABLAS DE DOBLE ENTRADA
En las distribuciones bidimensionales, en las que a cada individuo le corresponden dos valores, xi, yi, puede suceder que cada par de valores (xm, yn) ocurra varias veces, es decir, lleve apareada una frecuencia. En tal caso conviene disponer los resultados mediante una tabla de doble entrada como la que se muestra a continuación, correspondiente a los resultados de un colectivo de 125 personas puntuadas por su sensibilidad ecológica, xi, y por sus conocimientos de biología, yi:

TABLAS DE FRECUENCIAS
Estas tablas constan de dos columnas. En la primera se escriben los valores de la variable, xi. En la segunda las correspondientes frecuencias, fi. Estas sencillas tablas se utilizan, únicamente, cuando la variable es discreta y admite pocos valores (a lo sumo, de 12 a 16).La tabla siguiente da la distribución de la variable “número de hijos” correspondiente a un conjunto de 43 familias:
TABLAS DE FRECUENCIAS RELATIVAS Y FRECUENCIAS ACUMULADAS
Una tabla de frecuencias se puede ampliar con nuevas columnas con las frecuencias relativas y las frecuencias acumuladas. La tabla anterior con estos nuevos datos sería


TABLAS DE FRECUENCIAS AGRUPADAS EN INTERVALOS
Cuando la variable es continua, o es discreta pero toma una gran cantidad de valores, conviene dividir el rango de la variable en unos pocos intervalos (entre 6 y 12) y repartir los valores en ellos. El resultado será una tabla de frecuencias en la cual la variable, en lugar de tomar valores numéricos concretos, varía dentro de intervalos.
Para construir una Tabla de frecuencias en intervalos de clase se siguen algunos pasos:
1.- Ordenar los datos en un gráfico de tallo y hoja.
2.- Calcular el Rango del conjunto de datos    R= Valor mayor – Valor menor
3.- Determinar el número de intervalos de clases.
Para determinar el número aproximado de clases se puede usar la regla de Sturges como guía:
K = 1 + 3,3 x log n
donde:
K = nº aproximado de clases
n = nº total de observaciones de la muestra
log = logaritmo ordinario en base 10
4.- Calcular la amplitud de los intervalos
a = R/K
5.- Construir los intervalos. Se recomienda comenzar por el valor menor de los datos como el límite inferior de la primera clase, a ese valor se le suma la amplitud y se encuentra el límite superior de la primera clase.
6.- Se calcula el punto medio o marca de clase
mi = Li + Ls / 2
Cuando se necesita (por ejemplo para el cálculo de parámetros) que cada intervalo quede representado por un único número, se toma su punto medio, al que se llama marca de clase.
7.- Se continúa con las frecuencias (Acumuladas y relativas)

Gráficas estadísticas
Las gráficas estadísticas son representaciones gráficas de los resultados que se muestran en una tabla estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se cumple un propósito. Por ejemplo, en los medios de comunicación, libros de divulgación y revistas especializadas se encuentran multitud de gráficas estadísticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribución que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polígonos de frecuencias son algunas de ellas.

Conceptos Básicos



En la última década han tenido lugar cambios revolucionarios en la sociedad debido a la rápida difusión de la tecnología de las computadoras. En particular, la creciente disponibilidad de microcomputadoras ha introducido cambios en nuestros negocios, nuestros hogares y nuestros salones de clase. La disponibilidad de computadoras poderosas ha incrementado en gran medida nuestra capacidad de manejar información numérica. Existen varias razones por las que el alcance de la estadística y la necesidad de estudiarla han crecido de manera considerable en los últimos años, una razón es el planteamiento cuantitativo que se usa en forma creciente en todas las ciencias, así como en los negocios y muchas actividades que afectan nuestras vidas de modo directo. La otra razón es que la cantidad de datos que se recopila, procesa y difunde al público por algún motivo se ha incrementado casi más allá de la compresión y se requiere cada vez más personas con cierto conocimiento estadístico para que participen en forma activa en la recopilación y análisis de datos, y de lo que es de igual importancia, en toda la planificación preliminar. Por otro lado, en cualquier investigación o estudio que se lleve a cabo, siempre se le presentará al investigador la tarea de recabar información sobre el problema planteado, de ordenar y procesar esa información y finalmente analizar la misma y obtener conclusiones.
La materia estadística puede presentarse en diferentes niveles de dificultad matemática y puede estar dirigida hacia aplicaciones en distintos campos de la investigación; se han escrito libros de texto sobre estadística empresarial, estadística educativa, estadística médica, e incluso sobre estadística para los historiadores. En los campos de la ingeniería y de las ciencias experimentales, el empleo de valores estadísticos casi siempre es necesario cuando se efectúan pruebas rutinarias de laboratorio, al igual que en los trabajos de investigación y de producción y construcción. En una investigación experimental, quizás se quiera saber si las pruebas son “precisas”, o si la variabilidad de los resultados es mayor que lo esperado, o mayor que en cualquier otra prueba. En la investigación de productos, tal vez se desearía conocer si un cambio en los ingredientes afecta las propiedades del material resultante; comparar la eficacia de los procesos o la eficiencia de las máquinas de ensayo; determinar si los resultados se adaptan a una forma supuesta o postulada; o bien, idear un experimento que permita considerar la variación debida a diversas causas.

El concepto de la estadística aparece usualmente asociado para denotar una colección de datos numéricos y los métodos estadísticos son los métodos utilizados en la recolección, organización e interpretación de dichos datos; sin embargo, es necesario aclarar que la estadística se interesa solamente en fenómenos o situaciones donde está presente la incertidumbre en cuánto a lo que va a suceder. Es decir, que no puede predecirse con seguridad total lo que va a ocurrir bajo ciertas condiciones, aunque existan experiencias anteriores al respecto y aunque se controlen al máximo y traten de reproducirse exactamente las mismas condiciones. Lo importante en todas las afirmaciones que se hagan en las cuales está presente la incertidumbre, es que se puedan cuantificar o tener una idea de la magnitud del riesgo que se corre o del error que se comete al hacerlas. Aquí es donde la estadística es importante ya que realizando la planificación adecuada, recolectando la información pertinente y haciendo el tratamiento debido, es posible medir el margen de error al cual estamos expuestos al tomar decisiones, en condiciones de incertidumbre. Tomando en cuenta lo anterior se puede tomar la definición de estadística según Ya-Lun Chou (1972); La estadística es un método empleado en la toma de decisiones frente a la incertidumbre, partiendo de datos “numéricos” y calculando los riesgos.
Mediante la estadística se intenta definir y controlar el grado de incertidumbre que surge de la inevitable variabilidad de los datos; en la estadística se presentan dos tipos básicos de problemas: Descriptivos e Inferenciales, por lo que se divide la estadística en:

 Estadística Descriptiva; que se define como los métodos que implican recopilación, presentación y caracterización de un conjunto de datos, con el objeto de describir en forma apropiada las diversas características de dicho conjunto.
 Estadística Inferencial; en donde se toman los métodos que hacen posible la estimación de una característica de una población, o la toma de decisión con respecto a una población, con base únicamente en resultados obtenidos en una muestra.

De los conceptos anteriores se desprenden otras definiciones importantes en el campo de la estadística, como son:
 Población estadística: Se denota con N, y se dice que una población estadística es el conjunto de todas las mediciones que pueden hacerse de una característica en estudio; o que es la totalidad de elementos o cosas que se estudian; ella va a estar constituida por datos o valores. Una población puede ser finita o infinita; por ejemplo, la población consistente de todas las tuercas producidas por una fábrica un cierto día, es finita mientras que, la determinada por todos los posibles resultados (caras o sellos) de sucesivos lanzamientos de una moneda, es infinita.
 Muestra: Se denota con n. Es la porción o subconjunto de la población que se selecciona para el análisis, de una misma población pueden seleccionarse diferentes muestras; es en la muestra que se van a aplicar los métodos estadísticos que se requieran.
Cuando una investigación es exhaustiva en el sentido de analizar toda la población, se dice que se ha realizado un censo y se habla de enumeración completa. Cuando el estudio se hace en base a una muestra de una población, se habla de investigación por muestreo o enumeración parcial.
 Parámetro: Se denota como θ (tita)
Es una medida que se calcula para describir una característica de la población completa. 
Son parámetros poblacionales: la media poblacional ( μ), la Varianza poblacional ( σ2 ), la desviación estándar poblacional (σ ) y la proporción poblacional ( Ρ o π).
 Estadístico o Estimador: Se denota por θ (tita con gorro)
Es una medida que se calcula para describir una característica a partir de solo una muestra. 
Son estimadores muestrales: la media muestral (X), la varianza muestral ( S2 ), la desviación estándar muestral (S) y la proporción muestral (p).

Objetivo de la Estadística:
Uno de los principales aspectos de la inferencia estadística es el proceso que consiste en utilizar estadísticos muestrales para obtener conclusiones sobre los verdaderos parámetros de la población. La necesidad de los métodos de la inferencia estadística proviene de la necesidad del muestreo; entre las razones que conducen a la utilización del muestreo están:
i) Menor costo que un censo.
ii) Mayor control en la recolección de la información y en consecuencia mejor calidad de la misma.
iii) Mayor rapidez en los resultados.
iv) Imposibilidad de cubrir una población muy grande.
v) Población suficientemente homogénea.
vi) El proceso de medición de la característica es destructivo en el sentido de ocasionar daño o pérdida de la unidad sobre la cual se mide.
Sin embargo, el interés del investigador está en toda la población y no en la pequeña parte que se selecciona. El objetivo fundamental de la Estadística es generalizar o inferir a una población los resultados provenientes de una muestra. Estas inferencias van acompañadas de una cuantificación del error o incertidumbre bajo la cual se realizan, por lo que se hace necesario un adecuado diseño de muestreo para que el proceso sea eficiente y confiable.
 Datos Estadísticos: Los datos estadísticos son la materia prima de las investigaciones estadísticas, surgen siempre que se toman medidas o se registran observaciones; entonces, son los resultados de las observaciones de la variable o característica en estudio, existen básicamente dos tipos de variables aleatorias que producen dos clases de datos: Cualitativos y Cuantitativos. Las variables aleatorias cualitativas arrojan respuestas categóricas, en tanto que las variables cuantitativas producen respuestas numéricas; estos datos cuantitativos pueden ser discretos o continuos. Los datos cuantitativos continuos son respuestas numéricas que surgen de un proceso de medición (son valores continuos), mientras que los datos cuantitativos discretos son respuestas numéricas que surgen de un proceso de conteo (los valores son enteros o absolutos).
Ejemplo:
Tipo de datos                                            Tipo de pregunta                                         Respuestas
Cualitativos                                            Posee teléfono celular                                   SI    NO
Cuantitativos Discretos                       A cuántas revistas está                                ______Número
                                                               suscrito actualmente
Cuantitativos Continuos                      Cuál es su estatura                                     _______metros

 Unidad Estadística: es el elemento aislado de la población que posee la característica en estudio, también se le llama unidad elemental; por ejemplo, se quiere determinar el ingreso familiar en un estado determinado. Aquí la población incluye todas las familias de ese estado, y la característica a ser observada es la cantidad del ingreso familiar de las unidades elementales: las familias.

Niveles de medición y Escalas de medida.
Los resultados de medir las cantidades de las unidades elementales forman la totalidad de las observaciones, que se expresan numéricamente en términos de las unidades de medida usadas. Los valores que las observaciones cuantitativas pueden asumir se llaman valores de la variable. 
Todos ellos juntos constituyen una variable. Cuando las características son cualitativas no son directamente medibles, sin embargo esos atributos pueden ser expresados numéricamente. 
El determinar si una unidad elemental posee o no cierta característica, se define como un proceso de medición, este puede realizarse bien sea con instrumentos especiales, mediante la observación o utilizando la deducción; se define la escala de medida al conjunto de valores que puede tomar una variable o el conjunto de modalidades que puede presentar una característica. 
Existen cinco niveles de medición ampliamente reconocidos (del más débil al más fuerte): escala nominal, ordinal, de intervalo, proporcional o de razón y la escala absoluta.
 Escala Nominal: Los valores que toma la variable se designan por letras, palabras, números o símbolos; los cuales constituyen simplemente un indicador de distinción cualitativa y en ningún caso el orden y la distancia entre ellos tiene otra interpretación; se caracteriza porque la única relación que está definida entre los valores que puede tomar la variable es la igualdad o diferencia. Las operaciones aritméticas entre los valores no están definidas. Ejemplo: Variable SEXO, toma solamente dos valores, Masculino y Femenino, se pueden denotar por M (Masculino) y F(Femenino).
 Escala Ordinal: Si los datos observados se clasifican en categorías distintas en la que existe un orden, se obtiene un nivel de medición ordinal; se caracteriza porque entre dos valores de la variable, además de la relación de igualdad y diferencia se pueden dar las relaciones “mayor que”, “menor que” ( =, ≠, <, >). Dados dos valores se puede decir si son iguales o diferentes y además saber si uno es mayor o menor que otro, los valores de la variable también se pueden denotar con letras, números o palabras pero existiendo un orden entre ellos.
Las operaciones aritméticas no tienen sentido. Ejemplo: Rango docente: Profesor titular, Asociado, Agregado, Asistente, Instructor. ; Evaluación de restaurantes: ٭٭٭٭٭, ٭٭٭٭, ٭٭٭, ٭٭,٭.
 Escala de intervalo: En esta escala los valores de la variable son números y entre ellos tienen sentido las relaciones de igualdad, orden y las distancias, la única operación aritmética que tiene sentido es la resta o diferencia. Las escalas de intervalo tienen dos propiedades muy importantes: a) Existe una unidad de medida cuyo significado se mantiene constante para todos los valores que pueda tomar la variable b) Posee un cero relativo o punto de origen relativo; es decir que se escoge en forma arbitraria, el cero en la escala no significa ausencia de la característica. El ejemplo clásico de este tipo de escala es la correspondiente a la temperatura   ( en ºC o ºF).
                                             º Centígrados         º Fahrenheit
            A                                      0                          32
            B                                      4                          39.9
            C                                    12                          53.6
            D                                    28                          82.4
 Escala proporcional o de razón: Los valores de la variable son números entre los cuales tienen sentido las relaciones de igualdad, orden, las diferencias, las sumas y las proporciones o múltiplos. Entre dos valores de la variable se puede decir si son o no iguales, cual es mayor que otro y en cuánto; y además la suma de los dos valores es igual a otro valor de la variable. Tienen un cero absoluto, no arbitrario, el cual representa la ausencia de la propiedad. Son ejemplos de escalas proporcionales las correspondientes al peso, la estatura, el ingreso, el precio, la longitud, el volumen de un líquido, etc.
 Escala Absoluta: es una escala adicional a las otras escalas ya que se caracteriza porque los valores de la variable son el resultado de un conteo, en consecuencia está constituida por todos los enteros positivos y el cero ( Z+, 0). Las escalas absolutas tienen todas las propiedades de las escalas de razón, Son ejemplos de este tipo de escala: Nº de hoteles en una región, Nº de habitantes en un país, Nº de hijos en una familia, etc.