miércoles, 9 de noviembre de 2016

Organización de datos


Organización de Datos  (Hacer click para ir al documento)


La información estadística puede comunicarse más fácilmente si se organiza en tablas y se muestra en gráficas. A menos que un conjunto de datos esté sistemáticamente organizado, será difícil de asimilar e interpretar. Los procedimientos para organizar, resumir y simplificar datos son fundamentales para los métodos estadísticos. Pueden utilizarse varias herramientas básicas para describir y resumir un conjunto grande de datos, la manera más simple es la serie ordenada, en forma ascendente o descendente.
Entre las herramientas estadísticas que resultan de particular utilidad para organizar los datos se incluyen:
- Tablas de contingencia - Doble entrada
- Tablas de frecuencia que colocan todos los datos en clases específicas
- Diversos gráficos que pueden proporcionar una representación visual de los datos
Tablas estadísticas
Las tablas estadísticas son recopilaciones numéricas bien estructuradas y fáciles de interpretar de las que se vale el estadístico para sintetizar los datos obtenidos con el fin de hacer un uso sencillo de ellos o bien para darlos a conocer de forma comprensible.
Existen infinidad de tablas estadísticas, pero las más básicas son las tablas de frecuencias, las de frecuencias relativas y frecuencias acumuladas, las de frecuencias con datos agrupados en intervalos y las de doble entrada.

TABLAS DE DOBLE ENTRADA
En las distribuciones bidimensionales, en las que a cada individuo le corresponden dos valores, xi, yi, puede suceder que cada par de valores (xm, yn) ocurra varias veces, es decir, lleve apareada una frecuencia. En tal caso conviene disponer los resultados mediante una tabla de doble entrada como la que se muestra a continuación, correspondiente a los resultados de un colectivo de 125 personas puntuadas por su sensibilidad ecológica, xi, y por sus conocimientos de biología, yi:

TABLAS DE FRECUENCIAS
Estas tablas constan de dos columnas. En la primera se escriben los valores de la variable, xi. En la segunda las correspondientes frecuencias, fi. Estas sencillas tablas se utilizan, únicamente, cuando la variable es discreta y admite pocos valores (a lo sumo, de 12 a 16).La tabla siguiente da la distribución de la variable “número de hijos” correspondiente a un conjunto de 43 familias:
TABLAS DE FRECUENCIAS RELATIVAS Y FRECUENCIAS ACUMULADAS
Una tabla de frecuencias se puede ampliar con nuevas columnas con las frecuencias relativas y las frecuencias acumuladas. La tabla anterior con estos nuevos datos sería


TABLAS DE FRECUENCIAS AGRUPADAS EN INTERVALOS
Cuando la variable es continua, o es discreta pero toma una gran cantidad de valores, conviene dividir el rango de la variable en unos pocos intervalos (entre 6 y 12) y repartir los valores en ellos. El resultado será una tabla de frecuencias en la cual la variable, en lugar de tomar valores numéricos concretos, varía dentro de intervalos.
Para construir una Tabla de frecuencias en intervalos de clase se siguen algunos pasos:
1.- Ordenar los datos en un gráfico de tallo y hoja.
2.- Calcular el Rango del conjunto de datos    R= Valor mayor – Valor menor
3.- Determinar el número de intervalos de clases.
Para determinar el número aproximado de clases se puede usar la regla de Sturges como guía:
K = 1 + 3,3 x log n
donde:
K = nº aproximado de clases
n = nº total de observaciones de la muestra
log = logaritmo ordinario en base 10
4.- Calcular la amplitud de los intervalos
a = R/K
5.- Construir los intervalos. Se recomienda comenzar por el valor menor de los datos como el límite inferior de la primera clase, a ese valor se le suma la amplitud y se encuentra el límite superior de la primera clase.
6.- Se calcula el punto medio o marca de clase
mi = Li + Ls / 2
Cuando se necesita (por ejemplo para el cálculo de parámetros) que cada intervalo quede representado por un único número, se toma su punto medio, al que se llama marca de clase.
7.- Se continúa con las frecuencias (Acumuladas y relativas)

Gráficas estadísticas
Las gráficas estadísticas son representaciones gráficas de los resultados que se muestran en una tabla estadística. Pueden ser de formas muy diversas, pero con cada tipo de gráfica se cumple un propósito. Por ejemplo, en los medios de comunicación, libros de divulgación y revistas especializadas se encuentran multitud de gráficas estadísticas en las que, con notable expresividad, se ponen de manifiesto los rasgos de la distribución que se pretende destacar. Los diagramas de barras, los diagramas de sectores, los histogramas y los polígonos de frecuencias son algunas de ellas.

No hay comentarios:

Publicar un comentario