domingo, 16 de marzo de 2008

CONCEPTOS DE ESTADISTICA Y LO VISTO EN CLASE





ESTADISTICA


Estadística, rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.

Comentario sobre estadística
La estadística tiene como función principal reunir y analizar datos numéricos sobre algún fenómeno que se desea realizar. La estadística interviene cuando se quiere conocer un fenómeno como la tasa de mortalidad de X pais.



VARIABLE


Se llaman variables a las letras (x, y…) que se relacionan mediante las funciones.


Comentario sobre variable
La variable es algo que va a variar o cambiar como su mismo nombre lo indica.



VARIABLES





VARIABLE CUANTITATIVA
Es la variable que representa a una característica o propiedad del objeto de estudio que se refiere a cantidades, por lo que puede ser medida directamente en la práctica.

Comentario sobre variable cuantitativa
Las variables cuantitativas son aquellas que se pueden contar.

VARIABLE CUANTITATIVA CONTINUA
Al tomar valores, estos pueden ser representados con números enteros o fraccionarios, ya que entre dos valores cualesquiera pueden existir un número infinitos de valores intermedios.


Comentario sobre la variable cuantitativa continúa
En la variable continua puede tomar cualquier valor en una escala de números, como expresar una altura podría ser 1.6502 m.

VARIABLE CUANTITATIVA DISCRETA
Son las que al tomar valores, estos solamente pueden ser representados con números enteros ya que los datos se generan al efectuar operaciones de conteo.

Comentario sobre la variable cuantitativa discreta
En la variable discreta los valores se pueden contar como el número de hijos.


VARIABLE CUALITATIVA
Son aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos).

Comentario sobre la variable cualitativa
Esta variable expresa cualidades de un fenómeno que se desea estudiar, como por ejemplo la honestidad.

VARIABLE CUALITATIVA ORDINAL
Recogen la idea de orden pero no tiene sentido realizar operaciones aritméticas, no puede medirse la distancia entre una categoría y otra. Ejemplo, grados de desnutrición.

Comentario sobre la variable cualitativa ordinal
La variable ordinal no tiene jerarquía porque no se puede medir una distancia entre un objeto y otro.

VARIABLE CUALITATIVA ORDINAL POLITOMICA
Puede tomar tres o mas valores posibles, los cuales pueden ser ordenados siguiendo un criterio establecido por una Escala Ordinal, la cual se caracteriza porque no es preciso que el intervalo entre mediciones consecutivas sea uniforme.

Ejemplo característico de este tipo de variable es el Estadio de la Enfermedad, en el cual se clasifica a una entidad nosológica determinada en estadios que generalmente van del I al IV, donde cada uno representa un grado mas avanzado de la enfermedad que el estadio precedente, pero no podemos afirmar que, digamos, la diferencia entre el Estadio II y el III sea igual que la que existe entre el III y el IV.

Comentario sobre la variable cualitativa ordinal polítomica
En la variable cualitativa ordinal polítomica no se pude afirmar datos exactos.

VARIABLE CUALITATIVA ORDINAL DICOTOMICAS
Solo puede tomar dos valores posibles, pero entre estos se puede establecer un criterio de orden porque uno representa ventaja o superioridad sobre el otro. Ejemplo: Vivo-Fallecido, Pobres – Ricos, etc.

Comentario sobre la variable cualitativa ordinal Dicotomica
La variable cualitativa ordinal Dicotomica se caracteriza de las demás ya que siempre va a tener una ventaja de una cualidad a otra, como por ejemplo sanos y enfermos los sanos tienen una ventaja sobre las personas que se encuentran enfermos (as).

VARIABLE CUALITATIVA NOMINAL
Este tipo de variable se caracteriza porque los valores que toma no pueden ser sometidos a un criterio de orden. Ejemplos la raza y el sexo.

Comentario sobre la variable cualitativa nominal
La variable cualitativa nominal no puede ser sometida a un orden ya que en esta escala solo se puede ordenar los datos con su debida frecuencia de cada cualidad.
Como por ejemplo tenemos una variable de religión y se lo realizamos a 6 personas y obtenemos que 2 son católicos, 3 protestantes y 1 judío, solo de esta manera se pueden clasificar las variables nominales.





DECODIFICAR


Aplicar inversamente las reglas de su código a un mensaje codificado para obtener la forma primitiva de este.

CODIFICADO




Comentario sobre decodificar
La decodificación nos sirve para facilitarnos trabajar con datos que contengan decimales, esto nos permite tener una facilidad para poder procesar datos.




DIAGRAMA DE TALLOS Y HOJAS



Un diagrama de tallo y hojas es una modalidad relativamente simple de organización y presentación de medidas en un formato de gráfica de barras jerárquicamente ordenado. Se trata de una técnica común en el análisis exploratorio de datos.

Ejemplo: DIADRAMA DE TALLOS Y HOJAS

24 17 10 14 19 21 25 41 12 24 10 34
34 45 59 51 78




Comentario de Diagrama de Tallos y Hojas
El diagrama de tallos y hojas va representado jerárquicamente ordenado, es fácil para poder organizar los datos de esta forma ya que se puede obtener el puntaje individual de cada uno de los datos.





NOTACION SUMATORIA


En estadística se requiere la suma de grandes masas de datos y es pertinente tener una notación simplificada para indicar la suma de estos datos. Así, si una variable se puede denotar por X, entonces las observaciones sucesivas de esta variable se escriben.



Comentario sobre notacion sumatoria
De la sumatoria podemos extraer grandes cantidades.





PROPIEDADES DE LA SUMATORIA













































Comentario sobre propiedades de la sumatoria.

Esta propiedades de la sumatoria nos sirven para poder simplificar sumatorias



MEDIDAS DE TENDENCIA CENTRAL

Al analizar la información estadistica, observamos un significativo comporta miento de los datos en cuanto a la frecuencia en que se presentan los valores y que la mayor densidad de las frecuencias esta en la parte central de las graficas y ahí se deriva el nombre de medidas de tendencia central o promedios centrales.

Comentario medidas de tendencia central
Las medidas de tendencia central estan compuestas por media, moda y mediana. Se le llama medidas de tendencia central porque se encuentran casi en el centro de la distribución.

MEDIA
Es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos.

Comentario sobre la media
La media es en promedio de la distribución, ósea la sumatoria de todos los datos dividido entre el número de todos los datos.




MODA
Es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.


Comentario sobre la moda
La moda es el valor que más veces se repite dentro de la distribución. Pueden existir uno, dos o tres o mas modas en una distribución.



MEDIANA
Es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores.



Comentario sobre la mediana
La Mediana es el valor que se encuentra en medio de la distribución, tambien se dice que es el punto de equilibrio de la distribución, en la mediana el 50% son menores y el otro restante son mayores por eso se dice que es el punto de equilibrio de tal manera que queda en el centro



MEDIA ARMONICA

La media armónica , representada por H, de una cantidad finita de números es igual al recíproco, o inverso, de la media aritmética de los recíprocos de dichos números




Comentario sobre media armonica

La media armonica es sencible a los valores pequeños.

MEDIA CUADRATICA (Mc)

La media cuadrática es igual a la raíz cuadrada de la suma de los cuadrados de los valores dividida entre el número de datos






Comentario sobre la media cuadratica
Consiste en elevar al cuadrado todas las observaciones (así los signos negativos desaparecen), en obtener después su media aritmética y en extraer, finalmente, la raíz cuadrada de dicha media para volver a la unidad de medida original.



MEDIA GEOMETRICA


Media geométrica de una cantidad finita de números (digamos n números) es la raíz n-ésima del producto de todos los números




Concepto sobre la media geometrica

La media geométrica es relevante cuando varias cantidades son sumadas para producir un total




MEDIDAS DE ASIMETRIA

SESGO
Es el grado de asimetría o falta de simetría de una distribución.

Comentario sobre sesgo
El sesgo nos muestra para donde va la curva si a la derecha o izquierda, si es positiva o negativa.

CURTOSIS
Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis: leptocúrtica, mesocúrtica y platicúrtica.

Comentario sobre curtosis
Nos muestra la altura de los datos para ello se aplica la formula de 0.5(Q3 – Q1)/ P90 –P10. Con el resultado de la formula podemos determinar si es leptocúrtica, mesocúrtica o platicúrtica. Si nos sale :

> que 0.263 leptocúrtica
= que 0.263 mesocúrtica
> que 0.263 platicurtica.



MEDIDAS DE DISPERCION

DESVIACION TIPICA O ESTANDAR

Es la medida cuadrática de las desviaciones con respecto al promedio aritmético, es la raíz cuadrada de la varianza, la raíz cuadrada de la media aritmética de los cuadrados de las desviaciones de los datos de la serie respecto a su media aritmética.

Comentario de la desviación estándar
La desviación estándar es el promedio de las desviaciones, es el promedio de las distancias.

DESVIACION MEDIA


Es la media aritmética de las desviaciones, respecto a las medias tomadas en calor absoluto de todas las observaciones desde su media aritmética, la cual es dividida entre el número de observaciones.

Concepto de la desviación media
La mide cuanto hay de espacio entre un dato y la media.



MEDIDAS DE POSICION


CUARTILES: son los tres valores que dividen al conjunto de datos ordenados en cuatro partes iguales.



DECILES: son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales.

PERCENTILES: son 99 valores que dividen en cien partes iguales el conjunto de datos ordenados.


Comentario sobre las medidas de posicion


Las mediadas de posicion nos sirven para encontrar datos en porcentajes. Para eso nos siven los cuartiles, deciles y percentiles.




CONCEPTO DE TERMINOS ESTADISTICOS


ESTADISTICA
Es una ciencia que estudia los métodos para recoger, organizar, resumir y analizar datos y así poder sacar conclusiones.

INDIVIDUO O UNIDAD ESTADISTICA
Son los elementos que componen la población, no necesariamente tiene que ser una persona, puede ser un objeto o algo abstracto.

POBLACION
Lo compone todo lo que deseamos estudiar sobre algún fenómeno.

MUESTRA
Es un grupo que se saca de del total de la población.

PARAMETRO
Característica de la población.

ESTIMADOR O ESTADISTICO
Unidad de medida que se extrae de la muestra.

VARIABLES Y SU CLASIFICACION
Las variables son características que se van a variar (magnitud o peso).

VARIABLE CUNATITATIVA
Son las variables que se expresan en números.

VARIABLE CUALITATIVA
Variable que se representa en cualidades o características.

VARIABLE DISCRETA
Esta variable se caracteriza por sus separaciones, es decir valores exactos.

VARIABLE CONTINUA
Esta puede adquirir cualquier valor dentro de un intervalo.

ESCALAS DE MEDICION
ESCALA NOMINAL
Sirven como indicativos.

ESCALA ORDINAL
Refleja una jerarquía de <> y de > a <.

NFORMACION CUANTITATIVA
Información en formato numérico.

ESCALA DE INTERVALO
Tienen un mismo orden natural se puede medir la diferencia entre una medida y otra.

ESCALAS DE RAZON
Sirve para medir valores y magnitudes y tiene un cero absoluto.

ESTADIGRAFO
Persona que se dedica a la estadística.




ESCALA DE LIKERT

Para medir un objeto se requiere una escala de medida. Definimos una escala como una serie de ítems o frases que han sido cuidadosamente seleccionados, de forma que constituyan un criterio válido, fiable y preciso para medir de alguna forma los fenómenos sociales. Un ítem es una frase o proposición que expresa una idea positiva o negativa respecto a un fenómeno que nos interesa conocer.

Comentario sobre la escala de likert
La escala de likert nos sirve para medir datos cualitativos, se elabora con una serie de ítems o preguntas que deben de ir bien estructuradas de manera que al encuestar se nos sea de una manera más fácil.



DIAGRAMA DE CAJAS

Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.

Rango intercuartílico = RIC = 92.2-88.25 = 3.95 Þ Paso = 5.925Cercas interna inferior = 88.25 - 5.925 = 82.325Cerca interna superior = 92.20 + 5.925 = 98.125Cerca externa inferior = 82.325 - 5.925 = 76.40Cerca externa superior = 98.125 + 5.925 = 104.0




Comentario sobre el diagrama de cajas
El diagrama de cajas describe tres características especiales entre las que se encuentran el Q1, Q2 y Q3 estas medidas son primordiales para poder elaborar el diagrama de cajas o bigotes, el cuartil 1 es el 25%, el cuartil 2 es el 50% y tambien es la media, el cuartil 3 es el 75% de la distribución, En base a estas medidas de posición se puede realizar el diagrama de cajas.




DIAGRAMAS DE PUNTOS

Un diagrama de puntos se asemeja a un histograma en el sentido de que consiste en una representación gráfica de una distribución de los valores de los datos. Sin embargo, se diferencia de éste en que los valores se representan individualmente, en lugar de agruparse en clases. Los diagramas de puntos se aplican preferentemente a pequeños conjuntos de datos, en cuyo caso no se garantiza el agrupamiento de valores en clases de una distribución de frecuencias. Son particularmente útiles en la comparación de dos conjuntos de datos diferentes, o de dos subgrupos de un conjunto de datos.

Comentario sobre el diagrama de puntos
El diagrama de puntos se parece a un histograma con el diagrama de puntos podemos observar que datos son mas fiables unos de otros.

No hay comentarios: