lunes, 7 de enero de 2008

INTRODUCCION A LA ESTADISTICA














Modulo de Estadística

Definiciones








  • Conjunto de métodos científicos ligados a la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.





  • Arte de la decisión en presencia de incertidumbre.





  • Ciencia que sirve para demostrar que dos personas han leído 2 libros cada uno, cuando en realidad una ha leído cuatro uno y el otro ninguno.
    ¿Por qué la estadística?
    ¿Usaron la estadística Galileo, Newton y Einstein?
    En ciertas ciencias (Biología, Ciencias Humanas, algunos campos de la Física,...) aparece el concepto de experimento aleatorio (experimento que repetido en las "mismas condiciones" no produce el mismo resultado) y asociado al mismo el de variable aleatoria.
    Una variable no aleatoria (asociada al resultado de una experiencia que sí produce el mismo resultado) está caracterizada por un valor para cada condición.
    Una variable aleatoria está caracterizada por la llamada función densidad de probabilidad, a partir de la cual se obtienen las probabilidades para sus posibles valores para cada condición.
    Los objetivos de la investigación científica se pueden entender, de un modo muy general, en términos de encontrar y describir las variables de interés y las relaciones entre ellas, para el problema en estudio.
    La estadística es la ciencia que estudia los métodos que permiten realizar este proceso para variables aleatorias. Estos métodos permiten resumir datos y acotar el papel de la casualidad (azar).

    Población, elementos y caracteres.
    Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población.
    Las personas o cosas que forman parte de la población se denominan elementos. En sentido estadístico un elemento puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura, un voto, o un intervalo de tiempo.
    A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres:
    Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color de pelo, Etc.
    Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres.
    La población puede ser según su tamaño de dos tipos:
    Población finita: cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos de un centro de enseñanza, o grupo clase.
    Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.
    Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los elementos de la población sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toman un determinado número de elementos de la población, sin que en principio tengan nada en común; o una subpoblación, que es el subconjunto de la población formado por los elementos de la población que comparten una determinada característica, por ejemplo de los alumnos del centro la subpoblación formada por los alumnos de 3º grado, o la subpoblación de los varones.

    Tipos de Estadística
    La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) y trata de extraer conclusiones sobre el comportamiento de estas variables.
    La inferencia estadística es una parte de la Estadística que comprende los métodos y procedimientos para deducir propiedades (hacer inferencias) de una población, a partir de una pequeña parte de la misma (muestra).
    La bondad de estas deducciones se mide en términos probabilísticas, es decir, toda inferencia se acompaña de su probabilidad de acierto.
    La estadística inferencial comprende:
    La Teoría de muestras.
    La estimación de parámetros.
    El Contraste de hipótesis.
    El Diseño experimental.
    La Inferencia bayesiana.
    Tipos de Variables:









Las variables pueden ser de dos tipos:

















  • Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo, nivel de instrucción, distrito de procedencia, tipo de institución educativa).







  • Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales, alumnos matriculados, alumnos repitentes, alumnos desertores).










Las variables también se pueden clasificar en:

















  • Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).







  • Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).







  • Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).










Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

















  • Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3,45 hermanos).







  • Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 Km./h, 94,57 Km./h...etc.










Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

















  • Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si estudiamos el precio de la vivienda, cada vivienda es un individuo.







  • Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.







  • Muestra: subconjunto que seleccionamos de la población. Así, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.










EL MÉTODO DE INVESTIGACIÓN ESTADÍSTICA:

















  • El método de investigación estadística comprende las cinco fases siguientes:
     Preparación del trabajo.
     Recopilación de los datos.
     Evaluación y depuración de los datos.
     Presentación de los datos.
     Análisis e interpretación.
    PRIMERA FASE O PREPARACION DEL TRABAJO
    Se limita a la redacción de las instrucciones para recabar los datos, definición precisa de los datos que se necesitan; diseño de formularios y planillas, planificación y organización del trabajo en el espacio y en el tiempo.
    En esta fase deben quedar perfectamente claros los conceptos y cada participante debe conocer a cabalidad sus atribuciones y responsabilidades; ya que las dudas o malas interpretaciones echarán a perder el resto de la investigación.
    SEGUNDA FASE O RECOPILACION DE LOS DATOS
    En ella se recaban los datos necesarios para la investigación, mediante encuestas, muestreos, censos, o se toman de fuentes secundarias o registros y publicaciones.
    La eficiencia con que se realice esta etapa generará la calidad de todo el trabajo de investigación estadística.
    TERCERA FASE O EVALUACIÓN DE LOS DATOS
    Los datos recopilados, en la vida real, suelen adolecer de imperfecciones y errores varios; debidos a la ignorancia, a malos entendidos, a intereses creados o a prejuicios sociales, de parte de quien aporta los datos o de quien los recaba. De allí que el paso inmediato sería una depuración y evaluación de tales datos, a fin de subsanar o mitigar las influencias y efectos de tales errores e imperfecciones. Para lograrlo se recomiendan los siguientes procedimientos:
     Revisión total de los cálculos, de las tabulaciones y del procedimiento utilizado.
     Confrontar los datos recopilados, con los obtenidos al cálculo, con los de otras regiones o países, tomados en otras ocasiones o con otra finalidad.
     Repetir al muestreo, el mismo trabajo, en zonas estratégicamente escogidas; cuando en las verificaciones anteriores se hubieran obtenido notorias discrepancias.

    CUARTA FASE O PRESENTACIÓN DE LOS DATOS
    Los datos suelen estar presentados en forma tabular, en cuadros de doble entrada, proporcionales, porcentuales, o en valores promedios. También suelen representarse gráficamente, mediante: Histogramas, polígonos, diagramas figurados, prismogramas, pictogramas, dibujos acotados, entre otros.
    QUINTA FASE O ANALISIS E INTERPRETACIÓN DE LOS DATOS
    Podría decirse que es ésta la fase más amplia de todas y en la cual la investigación rinde sus mejores frutos. Desde la más remota antigüedad se ha venido aplicando el análisis estadístico a las investigaciones demográficas, socioeconómicas, fiscales, entre otros. Obteniéndose así índices y tendencias de natalidad, mortalidad, mortinalidad (nacidos muertos), nupcialidad, inmigración, emigración, etc. De generalización más reciente tenemos los índices y tendencias del costo de la vida, de tan rotunda actualidad; los cuales se obtienen sumando los costos promedios de alimentos, vivienda, medicinas, ropas y servicios consumidos por una persona, familia, estándar, en el período que se estudia. Igualmente, los índices de productividad o relación entre la producción y las horas - hombre de trabajo en ella utilizadas.




ELABORACIÓN DE TABLA DE FRECUENCIAS PARA DATOS NO AGRUPADOS (variables cualitativas):





Seleccionamos al azar alumnos matriculados en el primer año de secundaria en la Institución Educativa “Tupac Amaru” de Villa Maria del Triunfo durante el año 2007 y registramos la zona de residencia.
Cercado de Villa Maria: 1
José Carlos Mariategui: 2
Nueva Esperanza: 3
Tablada de Lurin: 4
José Gálvez: 5
Mariano Melgar: 6
San Gabriel: 7






















ELABORACIÓN DE TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS (variables cuantitativas)
Seleccionamos al azar alumnos matriculados en secundaria en la Institución Educativa “Tupac Amaru” de Villa Maria del Triunfo durante el año 2007 y registramos sus edades tal como se muestra en la siguiente tabla.








ELABORACIÓN DE TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS (variables cuantitativas):
Seleccionamos al azar alumnos matriculados en secundaria en la Institución Educativa “Tupac Amaru” de Villa Maria del Triunfo durante el año 2007 y registramos sus edades.






















estadistica.pps