SlideShare a Scribd company logo
1 of 141
Download to read offline
MODULO EDUCATIVO DEL CURSO
DE MÉTODOS ESTADÍSTICOS

Autor: Msc. César A. Zatta Silva
Universidad Señor de Sipan
2011-I
INTRODUCCIÓN


                                                Las acciones que acometemos hoy
                                                    se basan en un plan de ayer y
                                                     las expectativas del mañana.


Para satisfacer las necesidades de conocimiento sobre los Métodos Estadísticos, se
ha diseñado este módulo teniendo en consideración los objetivos señalados en las
competencias, capacidades y actitudes que el alumno debe alcanzar en este curso.

Se contempla en este curso que los estudiantes conozcan el origen de la palabra
estadística, las técnicas de recolección, organización, conservación, y tratamiento
de los datos para su análisis y posterior interpretación de la información.

En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que
partiendo de observaciones muestrales o históricas, crean modelos lógico-
matemáticos que se "aventuran" describir o pronosticar un determinado fenómeno
con cierto grado de certidumbre medible.

El avance tecnológico en la informática ha contribuido enormemente al desarrollo
de la estadística, sobre todo en la manipulación de la información, pues en el
mercado existen paquetes estadísticos de excelente calidad como el SPSS y MS
Excel que ya existe en el computador sin mayores exigencias técnicas,
Contenido

Semana 1    Introducción, reseña histórica, contenidos. Objetivos. Definición de Estadística.
            Conceptos básicos importantes. Importancia y objeto de la estadística. Elementos
            básicos: Población, muestra, variable, unidad de estudio, parámetro. Clasificación de las
            variables.
Semana 2    Organización y presentación de los datos. Tablas de distribución de frecuencias.
            Tipos de tablas estadísticas. Procesamiento de datos en cuadros y gráficos estadísticos.
Semana 3    Métodos Estadísticos en la investigación, etapas de la investigación estadística:
            Planeamiento, organización, análisis e interpretación de datos, formulación de
            conclusiones. Técnicas de recolección de datos, observación, entrevista, cuestionario,
            encuestas por muestreo, sistemas de recolección.
Semana 4    Medidas de Tendencia Central: Media Aritmética. Media Ponderada. Mediana.
            Moda. Medidas de Posición: Cuartiles. Deciles y Percentiles.
Semana 5    Medidas de Dispersión. Descripción de las medidas de dispersión: Rango,
            Desviación y Varianza para datos simples y agrupados, Coeficiente de Variación
Semana 6    Introducción al Cálculo de Probabilidades. Experimento aleatorio, espacio
            muestral, suceso o evento. Definición de Probabilidad Clásica, Probabilidad de
            Frecuencia Relativa, Probabilidad Subjetiva. Combinación, Variación, Permutación.
Semana 7    Probabilidad de un evento. Teorema de la adición y de la complementación. Reglas
            de multiplicación y de probabilidad total. Probabilidad Condicional. Teorema de Bayes.
Semana 8    Variables aleatorias. Función de probabilidad. Variables aleatorias discretas y
            continuas.
            Distribuciones discretas de probabilidad. Distribución Binomial y de Poisson.
            Distribuciones continuas de probabilidad. Distribución Normal. Uso de Tablas
Semana 9    Primer Examen Parcial
Semana 10   Introducción a la Inferencia Estadística. Métodos y distribuciones de muestreo.
            Muestreo de la población. Métodos de muestreo probabilístico. Error de muestreo.
            Distribución de muestreo de medias muestrales. Tamaño de muestra.
Semana 11   Introducción a la Teoría de la estimación Estadística.Estimaciones puntuales e
            Intervalos de Confianza sobre parámetros.
Semana 12   Prueba de Hipótesis, introducción, hipótesis estadísticas, pasos para una verificación de
            hipótesis. Hipótesis para la media poblacional. Prueba de Hipótesis para una varianza
            poblacional y una proporción poblacional.
Semana 13   Análisis de tendencia o series de tiempo. Análisis de regresión, formas de encontrar la
            regresión simple. Método de los mínimos cuadrados. La tendencia lineal.
Semana 14   Correlación y desviación estándar. Tasas y Números Índices, aplicación de los números
            índices.
Semana 15   Control de Calidad y Procesos Estadísticos. Aplicación de la estadística en trabajo de
            Investigación. Presentación de Diagnóstico en Proyecto Integrador.
Semana 16   Segundo Examen Parcial
Semana 1
                                     ESTADÍSTICA
La Estadística es la ciencia que nos ofrece un conjunto de métodos y técnicas para: Recolectar,
Resumir, Procesar, Presentar , Analizar e Interpretar un conjunto de datos, con la finalidad de
conocer el problema, proyectar su comportamiento y colaborar en la toma de decisiones sobre
dicho problema.

Otra definición: La estadística es una rama de las matemáticas, constituye uno de los idiomas
esenciales para comunicarse en el mundo universal de la ciencia y la tecnología. Aquellos
profesionales que no conozcan Estadística tendrán serias dificultades para ser expertos en su
respectivo campo científico.

Importancia
Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para
organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la
tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas
descriptivas.

Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad,
control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en
deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por
otras personas que intervienen en la toma de decisiones

Método que sigue la Estadística



              Recolectar                    Resumir y Ordenar                    Procesar


                                            ESTADISTICA


              Tomar decisiones              Analizar e Interpretar               Presentar




Clasificación: La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la
Estadística Descriptiva y la Inferencial.

Estadística Descriptiva: Comprende a los procesos de consolidación, resumen y descripción de
los datos recopilados. Consiste sobre todo en la presentación de datos en forma de tablas y
gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para
resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir
nada que vaya más allá de los datos, como tales.

Estadística Inferencial: Incluye procedimientos que permiten la extrapolación y generalización
sobre características que tipifican a todos los elementos de la población. Es decir, la inferencia
estadística es el proceso de hacer afirmaciones o predicciones sobre toda la población tomando
como base sólo a la información recabada a través de una muestra representativa.

CONCEPTOS FUNDAMENTALES

   1. POBLACIÓN: Es el conjunto de todos los datos que intervienen en una investigación.
      Al número de elementos de una población se denota por “N.”

       Población finita: Es el conjunto finito de unidades de análisis donde se puede identificar a
       un elemento inicial y/o a un elemento final.
       Ejemplo: Población de hoteles de Lima, población de agencias de viaje existentes en la
       ciudad de Cajamarca, turistas de nacionalidad alemana que ingresaron al Perú en el año
       2000.

       Población Infinita: Conjunto infinito de elementos donde no se podría identificar a una
       unidad inicial ni a la unidad final.
       Ejemplo: la población de los peces del mar, los árboles de la selva peruana

   2. MUESTRA: Es una parte de la población y como tal es también un conjunto de datos.
      Al número de elementos de una muestra se denota por “n”.
      Una muestra tiene 2 características principales: Es representativa y es adecuada.

       Muestra No Probabilística: Corresponde al subconjunto de observaciones elegidas
       siguiendo un criterio de representatividad establecida arbitrariamente por el investigador.
       Ejm. Analizo todos los ratones que son de color blanco del total de ratones

       Muestra Probabilística: Comprende a las observaciones realizadas en unidades que han
       sido elegidas siguiendo un criterio probabilístico, esto es a cada unidad de la población se
       asigna probabilidad conocida para estar incluida como parte de la muestra. Ejm. Sacar 2
       pelotas blancas de una canasta de 8 pelotas entre blancas y negras.

   3. UNIDAD DE ESTUDIO: Es el objeto o elemento indivisible que será estudiado. Es
      quien nos va a dar la información.
      Ejemplo: Se va a estudiar la capacidad hotelera de la ciudad de Lima, se define la unidad
      de análisis “hotel”

   4. VARIABLE: Es una característica de estudio de una población, que toma diferentes
      valores
      Las variables son características observables referidas a la unidad de estudio. Se denota
      por las letras X, Y, Z, etc. Se clasifican en:

       4.1 Variable cualitativa : Son aquellas variables que expresan cualidades o atributos, y
       que por tanto su medida no tiene un carácter numérico, esta variables pueden ser:
       Nominales Sus valores representan un atributo a manera de etiqueta y no contiene
       información sobre ordenamiento. Ejm. Sexo del cliente, nacionalidad del entrevistado,
       etc.
       Ordinales Sus valores sí representan un ordenamiento del atributo. Ejm. Grado de
       educación del entrevistado, grado de satisfacción sobre la atención recibida por el cliente,
       etc.
4.2 Variable Cuantitativa: Comprende aquellos conceptos que sí pueden ser expresados
       en forma numérica porque corresponde a criterios de cantidad. Pueden ser:
       v. c. Discretas Son variables que toman valores que se expresan en números enteros. Es
       el resultado del proceso de conteo. Ejm. Número de empleados, Número de habitaciones,
       Total de alumnos, etc.
       v.c. Continuas Son aquellas variables que sus cantidades se expresan con números
       reales, es decir, tienen parte fraccionaria. Son el resultado del proceso de medición. Ejm.
       Ingresos totales mes de julio, costo de servicio diario del hotel, toneladas embarcadas,
       etc.

Ejemplos:
El alumno deberá identificar las variables para las unidades de estudio siguiente
*UNIDAD DE ESTUDIO: Estudiante
Variables: Peso, edad, talla, tipo de sangre, color de ojos, ingreso familiar, número de hermanos,
etc.
*UNIDAD DE ESTUDIO: Empresa
Variables: Ventas, ganancias, número de trabajadores, número de computadoras, gastos en
publicidad, etc.



                                   Práctica Calificada Nº 01

   A. Determina la población y la muestra, y la variable de los siguientes ejemplos:
   1. Tiempo dedicado a las tareas domésticas por los hombres y las mujeres que trabajan fuera
      del hogar en Lambayeque
   2. Estudios que quieren hacer las alumnas y los alumnos del Colegio Manuel Pardo al
      terminar la Educación Secundaria
   3. Intención de voto en unas elecciones municipales
   4. Horas que dedican a ver televisión los estudiantes de educación primaria del colegio San
      José
   5. Número de aparatos de radio que hay en los hogares chiclayanos
   6. Se quiere realizar un estudio para determinar la cantidad promedio de huevos que ponen
      los pingüinos hembras en el período reproductivo en Puerto Maldonado.
   7. Se quiere determinar la audiencia de cierto programa televisivo de televisión de aire.
   8. Se requiere determinar el grado de afectación que tuvo la salmonella en las gallinas
      provenientes de las granjas del empresario Gonzales
   9. Se quiere estimar el grado de aceptación que tiene la mermelada de carambola en la zona
      oeste de Chiclayo

   B. De las siguientes variables, determinar cuáles son cualitativas y cuales son cuantitativas
      discretas o cuantitativas continuas
      1. Precio del pollo
      2. Angulo de inclinación de los puentes
      3. Grado de instrucción de los postulantes
      4. Color de ojos de las finalistas
      5. Peso promedio de las bolsas
      6. Número de taxis que ingresan por hora a Chiclayo
      7. Comida favorita
      8. Número de goles marcados por la selección
      9. Profesión que te gusta
10. Coeficiente intelectual de tus compañeros de clase
       11. El color de los ojos de tus compañeros de clase
       12. Temperaturas registradas en verano
       13. Número de acciones vendidas en la Bolsa de valores
       14. Diámetro de las ruedas de varios coches
       15. Censo anual de los españoles
       16. Número de libro en un estante
       17. Litros de agua contenidos en un depósito
       18. La profesión de una persona
       19. Suma de puntos obtenidos en un lanzamiento de dados

   C. Determina lo siguiente:

CASO Nº 01:
Dentro de los estudios sociales que realiza el Dr. Pauling sobre rendimiento y características
cognoscitivas de los alumnos pertenecientes al Colegio Público San Carlos, ha llegado a
resultados inesperados.
 Unidad de estudio
 Variable de estudio
 Población
 Muestra

CASO Nº 02
Un proveedor de servicios de línea blanca desea saber cuál es la marca preferida de cocinas de
las amas de casa pertenecientes a la ciudad de Chiclayo. Para llevar a cabo esta investigación,
selecciona a 120 amas de casa que fueron escogidas según la zona de la ciudad de Chiclayo.
 Unidad de estudio
 Variable de estudio
 Población
 Muestra

CASO Nº 03
Un investigador de mercado quiere saber cuál es la marca de detergente que más se utiliza o más
prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo esta investigación
selecciona una muestra de 504 amas de casa que fueron escogidas según zona o urbanización de
la ciudad de Chiclayo.
 Unidad de estudio            Amas de casa
 Variable de estudio          Marca de detergente (tipo cualitativa nominal)
 Población                    Amas de casa de la ciudad de Chiclayo
 Muestra                      504 amas de casa

CASO Nº 04:
El Ingeniero de Producción de Cerveza Cristal en Motupe, dentro de su evaluación diaria, desea
saber si el brix (grado de azúcar), porcentaje de alcohol, tiempo de maduración, etc, han
cumplido con las parámetros de calidad en la producción del fin de semana.
 Unidad de estudio            Cerveza
 Variable de estudio          Brix, porcentaje de alcohol, tiempo maduración
                              (cuantitativa)
 Población                    Producción de cerveza del fin de semana
 Muestra                      Producción de cerveza de un día
CASO Nº 05:
Un investigador social desea saber cuáles son las características socio demográficas que influyen
en el rendimiento académico de los Estudiantes de la Universidad Señor de Sipan, de la
especialidad de Ingeniería Agroindustrial matriculados en el 2º Semestre-Año 2006.
 Unidad de estudio             Estudiante
 Variable de estudio           Características socio demográficas
 Población                     Estudiantes matriculados de Ing. Agroindustrial de la USS
                               (cualitativa)
 Muestra                       Alumnos matriculados del 2º semestre

CASO Nº 06:
El gerente del Grifo “San Luis” ubicado en el ovalo está haciendo un estudio de factibilidad para
determinar si es conveniente la instalación de un nuevo servidor de gasolina en dicho
establecimiento. Para realizar este estudio toma información sobre el tiempo que se demora en
dar el servicio y el tiempo que demora en llegar el usuario (automóvil).
 Unidad de estudio              Usuario de automóvil
 Variable de estudio            Tiempo en dar el servicio y tiempo llegar usuario
                                (cuantitativa)
 Población                      Todos los clientes del grifo
 Muestra                        Algunos clientes del grifo

CASO Nº 07
Un investigador de mercado quiere saber cuál es la marca de jabones que más se utiliza o más
prefieren las empleadas de casa de la ciudad de Tarapoto. Para llevar a cabo esta investigación
selecciona una muestra de 610 empleadas que fueron escogidas según zona o urbanización de la
ciudad de Tarapoto.
 Unidad de estudio
 Variable de estudio
 Población
 Muestra
Semana 2

      ORGANIZACIÓN DE DATOS Y DISTRIBUCIONES DE
                    FRECUENCIA
Frecuencia: (fi) Número de individuos o elementos que pertenecen o aparecen en cada
categoría.

1. ORGANIZACIÓN DE VARIABLES CUALITATIVAS: Comprende la representación
gráfica de conceptos cualitativos y/o atributos que se registran para las unidades de análisis.
Ejemplo:
El número de turistas que registraron su ingreso por el aeropuerto de Chiclayo el mes de
Febrero, se registra según su nacionalidad

      NACIONALIDAD                              Número de Turistas (fi)
      Argentina                                      20
      Boliviana                                      10
      Brasileña                                      5
      Venezolana                                     15
      TOTAL                                     50

2. ORGANIZACIÓN DE VARIABLES CUANTITATIVAS DISCRETAS: Comprende
clasificaciones de variables que sólo toman valores enteros, por tanto las unidades de análisis se
ordenan de acuerdo con sus propios valores. Ejm:
Las puntuaciones obtenidas por los 30 alumnos del curso de Física I, fueron:
[12,11,13,13,10,10,12,12,09,09,08,14,12,11,14,14,14,10,10,14,13,13,11,11,14,13,14,13,14,12]

Se consolida la información en una Tabla de Frecuencia:
                                                              Frecuencia Acumulada
            Notas        Frecuencia        Frecuencia
                                                              Absoluta      Relativa
             Xi         Absoluta ( fi )   Relativa ( hi)
                                                                (Fi)         (Hi)
             08                1              0.03               1           0.03
             09                2              0.07               3           0.10
             10                4              0.13               7           0.23
             11                4              0.13               11          0.36
             12                5              0.17               16          0.53
             13                6              0.20               22          0.73
             14                8              0.27               30          1.00
           TOTAL              30              1.00

El gráfico que corresponde a esta tabla de frecuencia se denomina: Histograma
      Histograma de frecuencias absolutas                  Histograma de frecuencias absolutas acumuladas
3. ORGANIZACIÓN DE VARIABLES CUANTITATIVAS CONTINUAS: Comprende
clasificaciones de unidades de análisis resultantes de una medición, que en ocasiones toman
valores decimales. Ejemplo:
El Gran Hotel Chiclayo, durante los últimos 32 días, el valor de las compras en revistas y
periódicos para la sala de recepción fueron:




Esta información diaria y dispersa no permitirá analizar su comportamiento, es necesario
resumirla en una tabla de frecuencia. Para organizar una tabla de frecuencia se deberá seguir el
procedimiento siguiente:

* Elegir el número de intervalos de clase ( k )
      Se puede utilizar la regla se Sturges:                     k =    1 + 3.322 log n
      Donde:k = número de intervalos
              n = número de datos

        En el ejemplo: k = 1 + 3.322 Log(32) = 5.967 = Aprox. 6 intervalos

* Determinar el Tamaño del Intervalo de Clase ( c )
      c = A/k
      A= Amplitud de los datos = (Observación máxima – Observación Mínima) = 10.2 – 5.2 =
5.0
      k=6
      Por tanto: c = 5.0 / 6 = 0.8333 = Aproximadamente = 0.9

* Realizar la clasificación y el conteo de datos en cada clase construida




* Construir la Tabla de Frecuencia
                                       Frecuencia   Frecuencia    Frec. Acumul.   Frec. Acumul.
 Intervalo de clase   Marca de Clase
                                        Absoluta     Relativa       Absoluta         Relativa
  (escala de gasto)        Xi
                                           fi           hi              Fi              Hi
 [ 5.2 – 6.1 )            5.65             3         0.094              3            0.094
 [ 6.1 – 7.0 )            6.55             5         0.156              8            0.250
 [ 7.0 – 7.9 )            7.45             9         0.281             17            0.531
 [ 7.9 – 8.8 )            8.35             7         0.219             24            0.750
  [ 8.8 – 9.7 )           9.25             5         0.156             29            0.906
 [ 9.7 – 10.6 )          10.15             3         0.094             32            1.000
    TOTAL                                 32         1.000
Análisis de la distribución de frecuencias:
      * ¿Cuántos días el hotel gastó “de 7.0 a menos de 7.9 soles”?             : 9 días
      * ¿Cuántos días el hotel gastó “menos de 7.9 soles”?                      : 17 días
      * ¿Cuántos días el hotel gastó “menos de 9.7 soles”?                      : 29 días
      * ¿Qué porcentaje de días el hotel gastó “menos de 7.9 soles”?            : 53.1%
      * ¿Qué porcentaje de días el hotel gastó “más de 7.9 soles”?              : 46.9 %

Polígono de Frecuencias: Es la línea que une los puntos medios de los lados superiores (marcas
de clase) de un histograma. Los puntos o vértices del polígono de frecuencias están situados, por
tanto, en las marcas de clase, ya que estos corresponden a los puntos medios de los intervalos.



Histograma y Polígono de Frecuencias
USO DE MS EXCEL
Construcción tablas tipo A en EXCEL: Para variables cualitativas y cuantitativas discretas




Color           f                            F               h              H
Azul           =contar.si($B$2:$H$11;B14) 21
Rojo                                     16
Verde                                    13
Negro                                     8
Blanco                                   12

Construcción tablas tipo B en EXCEL: Para variables cuantitativas continuas
Las densidades de los materiales en estudio fueron:




n = contar (celda inicio: celda final)
K = numero de intervalos, con fórmula
Xmin= Valor Mínimo = MIN (celda)
Xmax= Valor Máximo = MAX( celda)
Rango = Max – Min
C = R/K
  Intervalos    f
                = Frecuencia (datos; grupos)          B2:H8   Todos los datos
                = Frecuencia (B2:H8; D22:D28)         D22:D28 La columna de datos del límite superior
PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS ESTADÍSTICOS




Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se
emplean para tener una representación visual de la totalidad de la información. Los gráficos
estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente
los hechos esenciales y compararlos con otros.

TIPOS DE GRÁFICOS

Gráficos de barras verticales
Representan valores usando trazos verticales, aislados o separados unos de otros, según la
variable a graficar sea discreta o continua. Pueden usarse para comparar y representar: una serie;
dos o mas series




Gráficos de barras horizontales
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan
cuando los textos correspondientes a cada categoría son muy extensos. Pueden usarse para una
serie, dos o más series.
Gráficos de barras proporcionales
   Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que
   componen un total. Las barras pueden ser: Verticales u Horizontales




Gráficos de líneas
En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales
entre sí. Estos gráficos se utilizan para representar valores con grandes incrementos entre sí. Se
pueden usar para representar una serie, dos o más series.




Gráficos circulares
Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en
forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor
valor, según lo que se desee destacar. Pueden ser: En dos dimensiones o tres dimensiones




Gráficos de Áreas
En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un
período de tiempo. Pueden ser para representar una, dos o más series; en dos dimensiones o en tres
dimensiones.
PRACTICA CALIFICADA Nº 02

USANDO EL PAQUETE O SOFTWARE RESPECTIVO, RESOLVER LOS SIGUIENTES EJERCICIOS

1. ¿Qué es frecuencia absoluta?
2. Cómo se obtiene:
       2.1 ¿La frecuencia acumulada?
       2.2 ¿La frecuencia relativa?
       2.3 ¿La frecuencia relativa acumulada
3. En una distribución de frecuencias ¿se pueden establecer conclusiones porcentuales,
utilizando solamente la frecuencia relativa? ¿Por qué?
4. ¿Por qué se recurre al agrupamiento en distribuciones de frecuencias por intervalos?
5. ¿Cómo se determina el número de intervalos y la amplitud de ellos?
6. ¿Qué es una marca de clase?
7. La siguiente tabla relaciona las ausencias al trabajo de 50 obreros, durante el mes de
octubre, en la fábrica de confecciones "La Unión".

1       0        2        1        3        1        4        3        2        5
3       2        4        2        0        3        1        2        0        2
1       1        0        1        0        0        1        2        1        3
4       0        2        3        2        0        0        2        5        2
2       4        2        1        3        1        2        1        0        2
      7.1 Construir una distribución de frecuencias simple.
      7.2 Sacar 3 conclusiones.

8. Años de experiencia de las 50 operarias de agro exportadora “La Calidad”




Ordenar la Información y responder:
8.1 ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6
      años?
8.2 ¿Qué porcentaje tiene experiencia entre 5 y 7 años (incluyendo los       extremos)?
9. Peso de los sacos de ají páprika que fueron cosechados en los primeros 50 días de
producción de la empresa Exporta SAC




Construir una distribución de frecuencias y resaltar 3 conclusiones

10. Consumo de agua, en m3de 184 familias n un barrio residencial de una ciudad
durante el mes de octubre:




Construir una distribución de frecuencias por intervalos.
Comparar las distribuciones con intervalos y sin intervalos; y las conclusiones que de
ellas se deriven.
Semana 3

         MÉTODOS ESTADÍSTICOS EN LA INVESTIGACION Y
              RECOLECCIÓN DE LA INFORMACIÓN

El método estadístico, parte de la observación de un fenómeno, y como
no puede siempre mantener las mismas condiciones predeterminadas o a
voluntad del investigador, deja que actúen libremente, pero se registran
las diferentes observaciones y se analizan sus variaciones.
Para el planeamiento de una investigación, por norma general, se siguen
las siguientes etapas:

1. PLANTEAMIENTO DEL PROBLEMA
Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretende
estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o los
fenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la
revisión bibliográfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por
investigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es decir, se
debe hacer una ubicación histórica y teórica del problema.

2. FIJACIÓN DE LOS OBJETIVOS
Luego de tener claro lo que se pretende investigar, debemos presupuestar hasta dónde queremos
llegar; en otras palabras, debemos fijar cuáles son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y debe,
además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre los
objetivos generales y los específicos.

3. FORMULACIÓN DE LAS HIPÓTESIS
Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y su
formulación depende del conocimiento que el investigador posea sobre la población investigada. Una
hipótesis estadística debe ser susceptible de demostrar, esto es, debe poderse probar para su
aceptación o rechazo.

Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.), con el
propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su hipótesis
contraria se le llama Hipótesis Alternativa (H1).

4. DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE
MEDIDA
La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la
población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin de
cuentas, es a ellas a las que se les hará la medición. La unidad de observación puede estar constituida
por uno o varios individuos u objetos y denominarse respectivamente simple o compleja.

El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el equipo
de investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qué
unidad se tomarán las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales
se ha de efectuar la toma de la información.

5. DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA
Estadísticamente, la población se define como un conjunto de individuos o de objetos que poseen
una o varias características comunes. No se refiere esta definición únicamente a los seres vivientes;
una población puede estar constituida por los habitantes de un país o por los peces de un estanque,
así como por los establecimientos comerciales de un barrio o las unidades de vivienda de una
ciudad.

Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el término
infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro de
un estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser considerado
como infinito.

Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar
las propiedades del conjunto del cual es obtenida.

En la práctica, estudiar todos y cada uno de los elementos que conforman la población no es
aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos,
porque a veces es necesario destruir lo que se está midiendo, por ser demasiado grande el número de
sus componentes o no se pueden controlar; por eso se recurre al análisis de los elementos de una
muestra con el fin de hacer inferencias respecto al total de la población.

Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos
que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra
debe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividad
de la investigación.

6. LA RECOLECCIÓN
Una de las etapas más importantes de la investigación es la recolección de la información, la cual ha
de partir, a menos que se tenga experiencia con muestras análogas, de una o varias muestras piloto en
las cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación de la variabilidad de
la población, con el fin de calcular el tamaño exacto de la muestra que conduzca a una estimación de
los parámetros con la precisión establecida.

El establecimiento de las fuentes y cauces de información, así como la cantidad y complejidad de las
preguntas, de acuerdo con los objetivos de la investigación son decisiones que se han de tomar
teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geográfica, el grado de desarrollo, la ausencia de técnica, etc.

Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede conseguir; es
determinar si la encuesta se debe aplicar por teléfono, por correo, o si se necesitan agentes directos
que recojan la información; establecer su número óptimo y preparar su entrenamiento adecuado.

7. CRITICA, CLASIFICACIÓN Y ORDENACIÓN
Después de haber reunido toda la información pertinente, se necesita la depuración de los datos
recogidos. Para hacer la crítica de una información, es fundamental el conocimiento de la población
por parte de quien depura para poder detectar falsedades en las respuestas, incomprensión a las
preguntas, respuestas al margen, amén de todas las posibles causas de nulidad de una pregunta o
nulidad de todo un cuestionario.

Separado el material de "desecho" con la información depurada se procede a establecer las
clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces
necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulación de
las diferentes variables que intervienen en la investigación.

El avance tecnológico y la popularización de los computadores hacen que estas tareas, manualmente
dispendiosas, puedan ser realizadas en corto tiempo.

8. LA TABULACIÓN
Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad al lector
sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener por lo menos: Un
titulo adecuado el cual debe ser claro y conciso.
La Tabla propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los
diferentes ítems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones
especiales de la tabla, u otorguen los créditos a la fuente de la información.

9. LA PRESENTACIÓN
Una información estadística adquiere más claridad cuando se presenta en la forma adecuada. Los
cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con las variables que se van
a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficos
redundantes que, antes que claridad, crean confusión.

Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse no sólo
en función de las variables que relaciona, sino del lector a quien va dirigido el informe.

10. EL ANÁLISIS
La técnica estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones
de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa
medible en la toma de una decisión.

Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los
parámetros y estadísticos muestrales para las estimaciones e inferencias respecto a la población, el
ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de establecer y redactar las
conclusiones definitivas.

11. PUBLICACIÓN
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del mismo
problema a quienes se les puede aportar información, conocimientos y otros puntos de vista acerca
de él.
MÉTODOS DE RECOLECCIÓN DE DATOS PARA UNA
                 INVESTIGACIÓN



                    En una investigación científica se procede básicamente por observación, por
                    encuestas o entrevistas a los sujetos de estudio y por experimentación.



FUENTES DE INFORMACIÓN
Unidades Estadísticas: Elementos componentes de la población estudiada.
Ejemplo: personal de una empresa, habitantes del distrito de Oyotún, etc.
La población en una investigación debe ser definida con precisión.
FUENTES DE INFORMACIÓN



          PRIMARIAS                                                       SECUNDARIAS




      Los datos provienen                                     Los datos parten de datos pre-
  directamente de la población                                elaborados, ejemplo: anuarios
   o muestra de la población                                  estadísticos, de Internet, de medios
                                                              de comunicación.
Se subdividen
                        Observación Directa:              Deben ser analizadas bajo 4 preguntas básicas que son:
en:                  Cuando el investigador toma          • ¿Es pertinente? cuando la información se adapta a los
                directamente los datos de la población.   objetivos
                       Ejm: un científico realiza
                           un experimento.                • ¿Es obsoleta? cuando ha perdido actualidad
                                                          • ¿Es Fidedigna cuando la veracidad de la fuente de
                        Observación Indirecta:            origen no es cuestionada
                  Cuando los datos no son obtenidos       • y ¿Es digna de Confianza? si la información ha sido
                   directamente por el investigador.      obtenida con la metodología adecuada y honestidad
                   Usa un cuestionario u otro medio       necesaria, con objetividad, naturaleza continuada y
                        para obtener los datos.           exactitud
                      Debe realizar una encuesta
Encuesta: Constituye el término medio entre la observación y la experimentación. En
ella se pueden registrar situaciones que pueden ser observadas y en ausencia de
poder recrear un experimento se cuestiona a la persona participante sobre ello.

La encuesta es un método descriptivo con el que se pueden detectar ideas,
necesidades, preferencias, hábitos de uso, etc.
Codificación. Una vez cumplimentados los cuestionarios, viene la fase de
recuento de las respuestas. Cuando estas son numéricas no hay ninguna
dificultad, pero cuando las preguntas han tenido una contestación no numérica, es
preciso traducir estas respuestas a números.
Esto se conoce con el nombre de codificación.
Por ejemplo:
¿Como ves el estado actual del Instituto?
Muy Bien            …………….. 5
Bien                …………….. 4
Regular             …………….. 3
Mal                 …………….. 2
Muy Mal             …………….. 1
No sabe/No contesta …………….. 0
EJEMPLO
     DE
CUESTIONARIO
REPASO:   En el siguiente blog www.ingenieriainvestigacazasi.blogspot.com
          encontrará información adicional sobre los temas descritos, tales como:

                Ficha Técnica-Encuesta INEI 2007
                Modelo de Encuesta – INEI
                Caso – Preferencia por Leche Envasada
                Encuesta Servicio PLAZA VEA
                Estadística en la Investigación Científica
                Resultado Encuesta (Modelo Computacional)



             Se solicita organizarse en grupos y
             presentar el resultado de un
             cuestionario aplicado a determinada
             población sobre un tema libre.
Semana 4


                       MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central,
llamadas así porque tienden a
localizarse en el centro de la
información, son de gran importancia
en el manejo de las técnicas estadísticas,
sin embargo, su interpretación no debe
hacerse aisladamente de las medidas de
dispersión, ya que la representatividad
de ellas está asociada con el grado de
concentración de la información.


Las principales medidas de tendencia central son:

1. MEDIA ARITMETICA:

        Se conoce comúnmente como promedio. La media aritmética se calcula como la suma de todos los
        valores que toma la característica en estudio dividida por el número total de unidades experimentales
        observadas. En símbolos:




Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80.
                      _
                      x = 21+32+15+59+60+61+64+60+71+80 = 52.3 años
                                             10

Interpretación: La edad media de estos pacientes es de: 52.3 años

       Si se trata de datos agrupados se utiliza para variables discretas:




Donde: Xi = valores que toma la variable, fi = Frecuencia absoluta, n = total de datos

Ejemplo:
Un investigador social está interesado en conocer el número promedio de hijos en una muestra de 10 familias
entrevistadas para una encuesta en particular. Luego de efectuar el trabajo de recolección de datos, el listado
de las familias con su correspondiente número de hijos se formó la siguiente tabla:
                                 Familia No             Número de Hijos
                                 1                             2
                                 2                             4
                                 3                             4
                                 4                             3
                                 5                             4
                                 6                             3
                                 7                             3
                                 8                             3
                                 9                             6
                                 10                            3

Con esta información se construye la tabla de frecuencias de la siguiente manera:
               Número de Hijos (Xj)             Frecuencia (fj)                 Xjfj
                     2                                 1                        2
                     3                                 5                        15
                     4                                 3                        12
                     6                                 1                          6

                        Total                           10                      35
       _
Luego: x = 35 = 3.5
           10

Interpretación:
La familia promedio proporcionada por la encuesta es aquella que presenta entre 3 y 4 hijos; el valor 3,5 es el
resultado matemático del cálculo de la media aritmética pero no es un valor posible de la variable por su
propia definición.



       En el caso de datos numéricos continuos agrupados en intervalos de clase, el cálculo de la media
        aritmética es similar al caso anterior, es decir :
                                  _
                                  Y = ∑Yi fi
                                         n

Cuando se agrupan datos continuos en intervalos de clase, se pierde la información original. Luego, para
solucionar este problema, Yi se calcula como el promedio entre los extremos de cada intervalo, es decir Yi
representa el punto medio del intervalo de clase.


Ejemplo:
Calcular la media aritmética de la longitud de 100 tornillos fabricados por una máquina.(Tabla 1)
Luego:           _
                 Y = ∑Yi fi = 1014,0 = 10,14 mm
                       N        100

Interpretación : En promedio el proceso productivo fabrica tornillos de 10,14 mm de longitud


    2. MEDIANA: (Md o Me)

         Es el valor que ocupa la posición central de un conjunto de observaciones ordenadas. El 50% de las
         observaciones son mayores que este valor y el otro 50% son menores.

A continuación se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios:
• Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos
criterios conduce al mismo resultado.
• Si n (tamaño de la muestra) es impar, entonces, la mediana coincide con el valor medio, el cual corresponde
al dato Xn/2.
• Si n (tamaño de la muestra) es par, no existe un solo valor medio, si no que existen dos valores medios, en
tal caso, la mediana es el promedio de esos valores, es decir, los sumamos y luego los dividimos por dos.




La Mediana para datos no agrupados

Ejemplo 1:
Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 correspondientes al número de hijos de 15
empleados de una empresa. Para la obtención de la mediana se deberán de ordenar.
Tomemos el criterio de orden ascendente con lo que, tendremos:
                        0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4
Por otro lado el número de datos n = 15, siendo el número de datos impar se elige el dato que se encuentra a
la mitad, una vez ordenados los datos, en este caso es 1.
                        0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4
                                         Mediana

Interpretación: El número mediano de hijos para estos empleados es 1.
Ejemplo 2:
Las calderas de una planta de energía de vapor a alta presión tuvieron las siguientes eficiencias en porcentajes:
90,3 - 91,6 - 90,9 - 90,4 - 90,3 - 91,0 - 87,9 - 89,4
El tamaño de la muestra, n=8, número par. Luego los ordenamos y la mediana es la semisuma de los valores
centrales o sea el promedio de esos valores.
87,9 - 89,4 - 90,3 - 90,3 - 90,4 - 90,9 - 91,0 - 91,6

Mediana = 90,3 + 90,4 = 90,35
              2

Interpretación: El número mediano de eficiencia en porcentaje de las calderas de una planta de energía es de
90,35 % aunque el mismo no sea un valor posible de la variable.

       Hallar la mediana de los siguientes datos: 7,10,15,13,10,12

La Mediana para datos agrupados

Si tenemos datos agrupados en tablas simples de frecuencia, procedemos de la siguiente manera:

• Calculamos el orden que ocupa la Mediana, lo llamaremos orden de la mediana, cuya fórmula es:
                Orden = n        (este valor lo observamos en la frecuencia acumulada)
                          2
Ejemplo 1:
Supongamos que el gerente de personal de una empresa obtuvo los siguientes datos, correspondientes al
número de días que 19 de sus empleados faltan por enfermedad en un año.
Luego:
                Orden = 19 = 9.5                         (está contenido en Fj = 10)
                          2
Los datos se presentan en la siguiente tabla:
La mediana es 8
Interpretación: El 50 % de los 19 empleados faltan menos de 8 días y el 50% restante más de 8 días.


Ejemplo 2: Supongamos que la siguiente tabla corresponde a la vida útil en horas de 100 válvulas




Orden = 100 + 1 = 101 = 50,5
          2        2


Esto nos indica que la mediana se encuentra entre el lugar 50 y el lugar 51. Pero, qué valores ocupan esos
lugares?
Por lo explicado anteriormente, desde el lugar 38 y hasta el lugar 57, hay valores 39. Luego el valor número
50 y el valor número 51 son 39. Entonces:
                Mediana = 39 + 39 = 39
                              2

 Si los datos están agrupados en intervalo de clase, veamos cómo se calcula la mediana
Ejemplo: Tenemos los siguientes datos agrupados en una Tabla de Frecuencia que representan los montos de
40 préstamos personales, en dólares, en una compañía financiera de consumidores. (Tabla Nº 4)
En este caso se emplea la siguiente fórmula:
Dónde:
Li = Límite Inferior del intervalo que contiene a la Mediana
Fi-1 = Frecuencia Acumulada en la clase anterior i-ésima
fi = Frecuencia en la clase que contiene a la mediana
Hi-1 = Frecuencia Relativa Acumulada en la clase anterior i-ésima
hi = Frecuencia Relativa en la clase que contiene a la mediana
c =Tamaño del intervalo de clase.

Mediana = 930.64



    3. MODA: (Mo)

        La moda es el valor que aparece con mayor frecuencia, es decir, el que ocurre más frecuentemente.

Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene más de un dato repetido se dice que es multimodal y un último caso es
cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal.

Moda para datos no agrupados
Si tenemos datos sin agrupar, la encontramos fácilmente observando cuál es el valor que más se repite.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3
Respuesta: La moda de este conjunto de datos es igual a 3 y si considera unimodal.

b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Respuesta: Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por lo
que la muestra es bimodal

c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
Respuesta: La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.
Moda para datos agrupados

   En datos agrupados en tablas simples de frecuencias, nos fijamos que valor corresponde a la
    mayor frecuencia absoluta. En la siguiente tabla




En este ejemplo, la mayor frecuencia absoluta es 4, que corresponde al valor 10. Luego la Moda es
10.
Interpretación: La cantidad de días más frecuente que los empleados faltan por enfermedad es 10.

   En datos agrupados en intervalos de clases, existen varios métodos para calcular la Moda. Cada
    método puede darnos un valor diferente, pero aproximado, para un mismo conjunto de datos.
    Se puede hallar de la siguiente manera:


Donde: Li= extremo inferior de la clase modal
d1= (fi – fi-1), d2 = ( fi – fi+1)

Ejemplo: Hallar la moda de la tabla Nº 4

Solución: Mo = 685

Interpretación: El monto de préstamos personales en dólares más frecuente otorgados por una compañía
financiera de consumidores es de 685 dólares.
MEDIDAS DE POSICIÓN NO CENTRALES.

   CUARTILES
Los cuarteles de una distribución, como si nombre lo indica, son valores de la variable que dividen al
conjunto de datos (ordenados de menor a mayor) en cuatro subconjuntos que contienen la misma
cantidad de datos.
Para calcular los cuartiles de una distribución de frecuencias se procede del mismo modo que en el
caso de la mediana, salvo que ahora dividiremos a la distribución de la variable en cuatro partes
iguales en lugar de dos.

A partir de esta definición es evidente que la mediana coincide con el segundo cuartil. Los cuarteles
se simbolizan con la letra Q.

Ejemplo:
Supongamos que un veterinario ha registrado los pesos de 8 pollos de seis semanas de vida y ordenó
de menor a mayor, obteniendo:
150 - 151 - 152 - 154 - 155 - 156 - 157 - 159 gramos.

La mediana de este conjunto de datos estará posicionada entre el 4º y 5º valor de la serie, siendo:
Mediana = Q2 = 154,5 gramos

El primer cuartel Q1, debe dividir a la primera mitad de la serie en dos partes iguales, por lo cual Q1
se ubicará entre el 2º y el 3º valor de la serie.

Luego:
Q1 = 151,5 gramos
Del mismo modo Q3, el tercer cuartel, divide a la segunda mitad de la serie en dos partes iguales.
Es decir:
Q3 = 156,5 gramos

Interpretación:
Si Q1 = 151,5 gramos significa que el 25 % de los pollos tendrán un peso inferior a 151,5 gramos y
el 75 % un peso superior a ese valor.
Si Q2 = 154,5 gramos significa que el 50 % de los pollos tendrán un peso inferior a 154,5 gramos y
el 50% restante superior a ese peso.
Si Q3 = 156,5 gramos significa que el 75 % de los pollos tendrán un peso inferior a 156,5 y un 25%
será superior a ese peso.
* Cuando se trata de cuartiles para datos agrupados continuos, se aplica la fórmula de interpolación:




Dónde: n/4: es el número total de observaciones dividido por 4
Fj-1 : es el mayor de las frecuencias acumuladas que no supera a n/4
Fj    : es la frecuencia acumulada que le sigue a Fj-1
Xj-1 : es el extremo inferior del intervalo que tiene como frecuencia acumulada F.
c ó h : amplitud de dicho intervalo

Para la tabla No 1 (longitud de los tornillos), calcular Q1 y Q3.
Respuestas: Q1= 8,36 mm
             Q3= 11,57mm

Interpretación: Q1= Este valor indica que el 25% de los tornillos miden menos de 8,36 mm mientras
que el 75% restante mide más de 8,36mm
Q3 = Este valor indica que el 75% de los tornillos miden menos de 11,57 mm mientras que el 25%
restante mide más de 11,57mm.


     PERCENTILES:
Los percentiles de una distribución, como su nombre lo indica, son valores de la variable, que
dividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales.
Los percentiles tienen el mismo significado y la misma forma de cálculo que los cuartiles. Así,
cuando se habla del percentil 15 se quiere expresar que es el valor de la variable que deja el 15% de
los datos a su izquierda y el 85 % de los mismos a su derecha o lo que es lo mismo decir que es el
valor de la variable que deja al 15 % de los datos por debajo de él y el 85% por encima.

Se puede emplear la siguiente fórmula:




Li = Límite Inferior del intervalo que contiene al Percentil
Fi-1 = Frecuencia Acumulada en la clase anterior k-ésima
fi = Frecuencia en la clase que contiene al Percentil
c =Tamaño del intervalo de clase.
k = 1%, 2%, 3%, ... , 97%, 98%, 99% Percentiles
Práctica Calificada Nº 04
1. ¿Qué es una medida de tendencia central?
2. ¿Cuáles son las principales medidas de tendencia central?
3. Defina: media aritmética mediana y moda.
4. ¿Cuándo se utiliza la media aritmética ponderada?
5. Enuncie las propiedades de la media aritmética
6. Para cada información de los ejercicios del capítulo 3, calcular e interpretar la media aritmética, la
mediana y la moda.
        7.




Elaborar la tabla de frecuencia y determinar las medidas de tendencia central

8. Los siguientes datos representan las temperaturas observadas al proceso de fermentación en un día
   cualquiera de producción de cerveza “ALE”. Determine utilizando intervalos: la media, mediana y
   moda a la siguiente tabla de frecuencia:

                                        25 33 27 20 14 21 33 29 25 17
                                        31 18 16 29 33 22 23 17 21 26
                                        13 20 27 37 26 19 25 24 25 20
                                        25 29 33 17 22 25 31 27 21 14
                                        24 7 23 15 21 24 18 25 23 24

9. Los estadísticos del programa de “Comida Sobre Ruedas”, el cual lleva comidas calientes a
   enfermos confinados en casa, desean evaluar sus servicios. El número de comidas diarias que
   suministran aparece en la siguiente tabla de frecuencia. Calcular la media, mediana y la moda.
                                          Número de       Número de
                                        comidas por día     días
                                             0-5             3
                                            5 - 10           6
                                            10 - 15          5
                                            15 - 20          8
                                            20 - 25          2
                                            25 - 30          3
10. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadas
    aparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la mediana y la moda.
    Además, calcule e interprete: Q1 y P15.

                                              Edades      Frecuencias
                                         50 y menos de 55      8
                                         55 y menos de 60     13
                                         60 y menos de 65     15
                                         65 y menos de 70      10
                                         70 y menos de 75      3
                                         75 y menos de 80      1


11. Una granja ganadera registró durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer
    (en kilogramos) fue el siguiente:
   22,31,33,34,35,36,37,38,38,39,40,40,40,41,41,42,42,42,42,42,43,43,44,45,46,46,46,46,50


12. Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvieron en
    la siguiente tabla resultante.


                                 Calcular la el promedio y la mediana para datos agrupados y no agrupados; y
                                 comparar resultados




13. Ingresando a la biblioteca Digital E-libro , de la USS, busquen en el libro:

               Título         Estadística
               Autor:         Colegio24hs
               Editorial:     Colegio24hs
               Publicado:     2004

Y desarrollen los ejercicios 1 al 5, de la página 47 a la 49 según corresponda a encontrar la media
aritmética, la mediana, y la moda.
Semana 5


                                 MEDIDAS DE DISPERSIÓN

Las medidas de dispersión muestran la variabilidad de una
distribución, indicando por medio de un número la tendencia de
los datos a dispersarse respecto al valor central o media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son
parecidos o varían mucho entre ellos.


Las medidas de dispersión más usuales son:

1.       RANGO ESTADÍSTICO, AMPLITUD Ó RECORRIDO.
Es la medida de variabilidad más fácil de calcular. Es la diferencia entre el valor mínimo y el valor
máximo en un grupo de números. Para averiguar el rango de un grupo de números:

        Ordenamos los números según su tamaño
        Restamos el valor mínimo del valor máximo

                                 R= Xmáx.    -    Xmín.

Ejemplo:

a. Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se
encuentran en un rango de:

                                      Rango = 100 – 1 = 99

b. Hallar el rango de los conjuntos: x= 12, 6, 7, 3, 15, 10, 18, 5
                                     y= 9, 3, 8, 8, 9, 8, 9, 18

 En ambos casos, rango: 18 – 3 = 15; sin embargo si ordenamos se ven como sigue:

x = 3, 5, 6, 7, 10, 12, 15, 18        y = 3, 8, 8, 8, 9, 9, 9, 18

hay mucha más dispersión en “x” que en “y”, por lo que “y” consiste esencialmente en ochos y
nueves, pero en este caso el rango no indica diferencia entre ambos conjuntos, no es una buena
medida de la dispersión. Cuando hay valores muy extremos, el rango es una pobre medida de la
dispersión.
2.       LA VARIANZA. (S2 ó δ2)
Es una variable estadística que mide la dispersión de los valores respecto a un valor central (media).
Específicamente, la varianza es una medida de que tan cerca o que tan lejos están los diferentes
valores de su propia media aritmética.

Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando
más cerca estén las Xi a su media menos es la varianza. La Varianza es el cuadrado de la
desviación estándar

        Para datos no agrupados




        Para datos agrupados

La variancia de los valores: (x1 x2 … xk) que ocurren con las frecuencias (f1 f2 … fk) es:
3.     DESVIACION ESTANDAR (S ó δ) . (ó DESVIACIÓN TIPICA)
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar
ese problema se define otra medida de dispersión, la desviación estándar, que se halla como la raíz
cuadrada de la varianza. La desviación estándar o desviación típica nos informa sobre la dispersión
de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos.
Desviación Estándar: S = √S2 ó δ = √ δ2             (Es la raíz cuadrada de la varianza)




Propiedades de la Desviación Estándar
A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de
las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):
1. La desviación estándar es siempre un valor no negativo S
2. Es la medida de dispersión óptima por ser la más pequeña.
3. La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable
4. Si a todos los valores de la variable se le suma una misma constante la desviación estándar no
varía.
5. Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar
queda multiplicada por el valor absoluto de dicha constante.

Para el ejemplo anterior, la desviación estándar es 1.293 soles.
4. COEFICIENTE DE VARIABILIDAD
 Es una medida de variabilidad de los datos que se expresa en porcentaje, en la cual se compara la desviación
 estándar con el respectivo valor del promedio de los datos, se expresa en porcentaje:
Practica Calificada Nº 05
1. ¿Cuál es la utilidad de las medidas de dispersión?
2. ¿Cuáles son las principales medidas de dispersión?
3. ¿Cuál es la medida adecuada para comparar la dispersión entre varias variables que posean
diferente magnitud o diferente unidad de medida?
4. Para cada una de las informaciones de las unidades 2 y 4 de las sesiones anteriores, calcular e
interpretar:
4.1 Rango
4.2 Desviación media
4.3 Desviación Estandar
4.4 Coeficiente de variabilidad
5. La tabla de frecuencias exhibe las edades de una muestra de 36 personas que asistieron a una película:
                                    Años                    f
                                    8-13                    2
                                    14-19                   7
                                    20-25                   13
                                    26-31                   5
                                    32-37                   9
Hallar:
a. La media
b. La varianza
c. La desviación

6. La siguiente tabla muestra los coeficientes de inteligencia de 480 niños de una escuela elemental
   C.I.        70        74    78     82     86        90        94   98   102   106   110   114   118   122   126
   fi          4         9     16     28     45        66        85   72   54    38    27    18    11    5     2

Calcula:
           a) El C.I. promedio de los niños estudiados
           b) Su desviación.



7. El entrenador de un equipo de baloncesto duda entre seleccionar a Elena o María. Los puntos
   conseguidos por cada una, en una semana de entrenamiento fueron:
Elena     18        23    22   24    19     25    16
María     18        26    18   28    22     17    18


    a. ¿Cuál de las dos tiene mejor media?
    b. Calcula la desviación típica. ¿Cuál de las dos es más regular?
    c. Si tú fueras el entrenador, a quién seleccionarías?
Semana 6


           INTRODUCCIÓN A LAS PROBABILIDADES


                                                    “Los planes corresponden al hombre,
                                                             las probabilidades a Dios.”

                                                                            Proverbio chino




  1. EXPERIMENTO ALEATORIO:
    Es cualquier hecho o fenómeno cuyo resultado no puede predecirse antes de que suceda.
    Ejemplo:
    - Rendir un examen y observar su resultado
    - Tirar una moneda y observar cual de las caras queda hacia arriba
    - El lanzamiento de 2 dados paralelamente y observar el puntaje obtenido
    - Elegir un cliente del restaurante y preguntar su opinión sobre el servicio recibido.

  2. ESPACIO MUESTRAL:
    Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa
    comúnmente con la letra S.

    Ejemplos:

    * En el experimento aleatorio de lanzar una moneda 3 veces




    El espacio muestral es un conjunto formado por 8 elementos:
* En el experimento aleatorio de lanzar un par de dados, el espacio muestral es:




3. EVENTO O SUCESO:
       Es un subconjunto de elementos que pertenecen al espacio muestral y que cumple una
       característica determinada. Ejemplos:

* Del espacio muestral, lanzamiento de un dado; el evento
  A= puntaje obtenido es mayor de 3
  A= [4,5,6]

* Al lanzar una moneda 3 veces, el evento de obtener por lo menos dos caras es:
  E = [(C,C,C), (C,C,S), (C,S,C), (S,C,C)] ; tiene 4 elementos

* Al lanzar un par de dados, el evento “la suma es igual a 7” será:


4. PROBABILIDAD
Es una medida que expresa la “tasa de ocurrencia de un evento a largo plazo”. El valor de esta
medida está comprendido entre [0 y 1].
La probabilidad de que ocurra un evento A se define como el valor que corresponde al número de
casos “favorables” entre el número de casos “posibles”:




Ejemplos:
 Si se lanza un dado, cual es la probabilidad de obtener un puntaje impar. Rpta. 0.5
 De un juego de 52 naipes se extrae una carta al azar (aleatoria), cuál es la probabilidad de obtener
   un puntaje mayor de 9. Rpta. 0.3077
 Si se lanza un dado 2 veces cuál es la probabilidad de que:
   - Se obtenga un puntaje igual a 8        - Se obtenga un puntaje <= a 4
   - Se obtenga un puntaje < a 5 pero >= a 2
OPERACIONES CON PROBABILIDADES

1. Eventos Mutuamente Excluyentes
Dos eventos son mutuamente excluyentes cuando “no pueden ocurrir los dos al mismo tiempo”, es
decir la ocurrencia de uno de ellos impide automáticamente la ocurrencia del otro. Por tanto, si 2
eventos son mutuamente excluyentes no habrá intersección entre ellos.

Si el evento A y el evento B son excluyentes:
                                            A∩B = 0, Luego P(A∩) = 0

Ejemplo: Los clientes de una agencia de turismo se clasifican según nacionalidad y edad:




¿Cuál es la probabilidad de elegir un cliente joven o adulto?

       P(J U A) = P(J) + P(A) = 130 + 40 = 170 = 0.85
                                200  200 200

2. Intersección de Eventos: En el ejemplo anterior, calcular la probabilidad de que un cliente
elegido sea Joven o Extranjero:

P(J U E) = P(J) + P(E) – P(J∩E) = 130 + 80 - 30 = 180 = 0.9
                                  200 200 200 200


Si A y B son no excluyentes: P(A U B) = P(A) + P(B) – P(A∩B)

               “o” = unión           “y” = intersección



Ejemplos:

1. De la urna que tienes a la derecha, sacamos una bola a azar y anotamos su número
   a) Describe el espacio muestral. ¿Cuántos casos tiene?
   b) Describe los siguientes sucesos:
       Bola Roja = A; Bola Verde = B; Bola Azul = C; Bola Roja con número
       impar = D; Bola con número par = F
   c) Calcula la probabilidad de cada uno de los sucesos anteriores
2. ¿Cuál es el espacio muestral correspondiente al lanzamiento de una moneda? ¿Cuál es la
   probabilidad de cada una de las dos caras?
3. Si se lanza un dado, cuál es la probabilidad de obtener un puntaje impar
4. Al extraerse una carta de un juego de 52 naipes, cual es la probabilidad de que ésta sea de
    color rojo o tenga un puntaje menor de 5.
5. En una encuesta aplicada a 50 estudiantes secundarios, 22 alumnos manifestaron inclinación por la
Química, 28 por Estadística y 10 alumnos por ambos cursos. Si se selecciona al azar a uno de estos
alumnos:
a) ¿Cuál es la probabilidad de que les guste Química o Estadística?
b) ¿De qué se incline por Química y Estadística?
c) ¿Qué no le guste ninguno de los 2 cursos?
6. En un salón de clase hay 15 alumnos y 24 alumnas, la tercera parte de los hombres y la mitad de
mujeres son de Chiclayo. Hallar la P[ ] de que sea alumno ó sea de Chiclayo; y de que sea alumna y
que haya nacido fuera de Trujillo.



                                  TÉCNICAS DE CONTEO

Repaso de Factoriales
n! = 1x2x3x4x……xn
0! = 1
1! = 1

PERMUTACIÓN “Pn”
Una permutación es un conjunto de arreglos diferentes de n en n elementos de un total de n
Se lee: Pn = permutación de n elementos.

Fórmula:      Pn = n!

Ejemplo:
1. De cuántas formas diferentes se pueden sentar 3 personas ABC en 3 asientos consecutivos:
[ ABC, ACB, BAC, BCA, CAB, CBA ] P3 = 3! = 6

2. Cuántas juntas directivas diferentes se podrían formar con las personas ABC y D, si dicha junta
tiene los cargos de Presidente, Vicepresidente, Secretario y Tesorero.
P4 = 4! = 24 juntas

                              m
COMBINACIÓN                   C =   m!
                              n   (m-n)! n!

Se lee: “combinación de n en n elementos de un total de m”

Son arreglos diferentes de n en n elementos de un total de m, en los cuales no interesa el orden en
que se presentan.

Ejm. Se desea elegir un comité de 3 personas entre 8 candidatos, cuantos comités diferentes pueden
formarse:
8
C3=      8! =      8!     56 formas diferentes
      (8-3)! 3! 5! 3!


                                      m
VARIACIÓN                            V =  m!__
                                      n  (m-n)!
Se lee: “Variación de n en n elementos de un total de m”. Sí interesa el orden de los elementos.

Ejm. Se desea formar una junta directiva con los cargos de presidente, secretario y tesorero. Si hay 8
candidatos, cuantas juntas directivas diferentes se podría formar:
     8! = 8! = 8x7x6x5! = 336 formas diferentes
   (8-3)! 5!         5!


Ejemplos para el Aula:
   1. Si un conjunto A tiene 5 elementos. ¿Cuántas duplas se pueden formar con los elementos de
      A?.
   2. En el concurso de belleza de Miss Universo, se suelen elegir primero 15 semifinalistas, luego
      se eligen 5 finalistas. ¿De cuántas formas diferentes se pueden ocupar las 5 primeras
      posiciones entre las 15 semifinalistas?
   3. La junta directiva de la compañía ABC consta de 15 miembros. ¿De cuántas formas se puede
      elegir presidente, vicepresidente y secretario?
   4. ¿Cuántos equipos de basquet de cinco hombres se pueden formar de una escuadra de 12
      hombres si no tienen en cuenta las posiciones de juego?
   5. En una clase de estadística hay 30 estudiantes 24 hombres y 6 mujeres. ¿De cuántas formas
      distintas se puede construir un comité de cuatro estudiantes?
      ¿De cuántas formas distintas se puede construir un comité de cuatro estudiantes si dos deben
      ser mujeres?
Practica Calificada N° 06
ACTIVIDAD Nº 1
A continuación se describen varias situaciones. Contesta la pregunta, en cada caso, razonando las respuestas:
a) En una clase de 30 alumnos, 12 chicos y 18 chicas, cada uno escribe su nombre en una papeleta y la
introduce en una caja. ¿Qué es más probable que aparezca el nombre de una chica o de un chico?
b) Se lanza un dado cúbico con las caras numeradas del 1 al 6. ¿Qué es más probable que salga el 5 o el 1?
c) Si lanzas una ficha cuyas caras son verde y rojo ¿qué color esperas que salga?

ACTIVIDAD Nº 2
Indica el espacio muestral de los siguientes sucesos:
a) Obtener par, al lanzar un dado cúbico con las caras numeradas del 1 al 6.
b) Lanzamos dos monedas al aire.
c) Obtener impar al lanzar un dado cúbico.

ACTIVIDAD Nº 3
En cada uno de los siguientes experimentos aleatorios, diga cuál es la probabilidad de que ocurra el suceso
que se indica:
a)   CESTA I                         CESTA II                 b) BOLSA I                    BOLSA II




Se extrae una pieza de fruta                                      Se extrae una bola
Suceso: OBTENER UNA PERA                                          Suceso: OBTENER UNA BOLA VERDE

ACTIVIDAD Nº 4
Resolver:
1. Hallar la probabilidad de sacar por suma 4 o 11 al lanzar dos dados.
2. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Se extrae una al azar, calcular la probabilidad de que:
        Sea roja.
        Sea verde.
        Sea amarilla.
3. Se extrae aleatoriamente una baraja de un juego de 52 cartas. ¿Cuál es la probabilidad de que la carta
seleccionada?
        a) Sea un “as”
        b) Sea una carta negra ó un número menor de 5
        c) Sea número 8 y de color rojo
4. De 100 personas que fueron consultadas sobre sus preferencias a la hora de realizar un deporte, 50
practicaban fútbol, 40 practicaban baloncesto y 30 practicaban ciclismo. Además, 25 personas practicaban
futbol y baloncesto, 15 practicaban fútbol y ciclismo, y 12 practicaban baloncesto y ciclismo. Por último, tan
sólo 5 personas practicaban los tres deportes. El resto no sabe o no contesta.
a) Representa el diagrama de Venn correspondiente.
b) Calcula las siguientes probabilidades: P(practicar fútbol), P(practicar fútbol y baloncesto), P(practicar sólo
ciclismo), P(practicar los tres deportes), P(practicar alguno de los tres deportes), P(no practicar ninguno de los
tres deportes.
Permutaciones, Combinaciones, Variaciones

1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano, de
modo que no estén en el mismo dedo?
2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos obtener?
3. Con los números 1,2,3,4,5 y 6:
3.1 ¿Cuántos números distintos de siete cifras podríamos formar?
3.2 ¿Podremos numerar a los 3224564 habitantes de una ciudad con esos
números?
4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es el
número de casos posibles?
5. ¿Cuántos números de seis cifras existen que estén formados por cuatro números dos
y por dos números tres?
6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar.
Engarzando las 25 bolitas en un hilo, ¿cuántos collares distintos podrá realizar?
7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras de la
palabra educación? ¿y con la palabra vacaciones?
8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan una
fiesta, acuerdan que dos de ellos se encargarán de comprar la comida y las bebidas
¿De cuántas formas posibles puede estar compuesta la pareja encargada de dicha
misión?
9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata,
fresa y cola) y quiere hacer helados de dos sabores ¿Cuántos tipos de helado podrán
fabricar?
10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si se
han dado en total 21 besos, ¿cuántas personas había?
11. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras
pueden adjudicarse las medallas de oro, plata, bronce?
12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente,
secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos?
Semana 7


                    PROBABILIDADES CONDICIONALES




Hasta ahora se ha estudiado la probabilidad absoluta de un evento, es decir sin relacionarlo uno con
otro. Sin embargo pudiera ser de interés calcular la probabilidad de que ocurra un evento de cierto
espacio muestral “S” a la luz de que otro evento de ese mismo espacio “S” ocurra.

Sean A y B dos eventos de un mismo espacio muestral S. La probabilidad condicional de A, dado
que ha ocurrido B (o viceversa), está dado por:

                       P[ A/B ] = “ probabilidad de que ocurra A habiendo sucedido B”


                       P[ A/B ] = P[A∩B]      = n (A∩B)
                                  P[B]           n(B)

                       P[B/A] = “probabilidad de que ocurra B habiendo sucedido A”

                       P[ B/A ] = P[B∩A] = n (B∩A)
                                     P[A]   n(A)


Ejemplos:
1. En una empresa el 50% de trabajadores trabaja por la mañana, el 30% lo hace por las tardes y el 20% tanto
en la mañana como por la tarde; si se escoge aleatoriamente a un trabajador cualquiera:
a) Cual es la probabilidad de que trabaje en la mañana si se conoce que labora en la tarde
b) Cual es la probabilidad de que trabaje por las tardes si se conoce que labora por la mañana
SOLUCIÓN
A= labora en la mañana …………. 50%
B= labora en la tarde …………….. 30%
A Π B = labora en los dos turnos … 20%

   a)      P[A/B] = P[A ∩ B] = 20/30 = 2/3 ó 66.67%
                      P[B]
b)     P[B/A] = P[B ∩ = 20/50 = 2/5 ó 40%
                         A]
                     P[A]

2. De todos los alumnos que el ciclo pasado llevaron los cursos de Estadística Aplicada y Matemática I, se
tienen los siguientes datos:
        El 20% desaprobaron Matemática I
        El 35% desaprobaron Estadística Aplicada
        El 10% desaprobaron ambos cursos

Si se escoge aleatoriamente a un alumno que lleva estos cursos, cual es la probabilidad de que este:
    a) Haya sido desaprobado en Matemática I conociéndose que fue desaprobado en Estadística Aplicada
    b) Haya sido desaprobado en Estadística Aplicada conociéndose que fue desaprobado en Matemática I
    c) De que haya sido desaprobado en Matemática I ó Estadística Aplicada

SOLUCIÓN:
M = desaprobó Matemática I =20%
E = desaprobó Estad. Aplicada =35%
M ∩ E = desaprobaron ambos cursos = 10

    a)     P[M/E] = 10/35 = 2/7 = 28,57%

    b)     P[E/M] = 10/20 = ½ = 50%

    c) P[E UM] = P[E] + P[M] – P[E ∩ = 35/100 + 20/100 – 10/100 = 9/20 = 45%
                                    M]

3. En la parte preferencial de un teatro solamente hay 120 asientos, los cuales son de 2 colores, azules o
negros; algunos son de madera y otros son metálicos. El resumen se presenta en el recuadro siguiente:

                Asientos        Metálicos        Madera          Total
                Azul            35               45              80
                Negro           18               22              40
                Total           53               67              120

Si se selecciona aleatoriamente uno de estos asientos, calcule la probabilidad de que este sea:
    a) De color azul
    b) De color negro metálico
    c) El asiento elegido sea de madera
    d) Sea de color azul si se sabe que es de metal
    e) El asiento sea de madera si se sabe que es de color negro
    f) El asiento no sea de color azul

SOLUCIÓN
A= Azul,        N=Negro,        M=Metálico,      Ma=Madera

    a) P[A] = n(A)/n(S) = 80/120 = 2/3 = 66.47%
    b) P[N ∩ M] = n(M ∩ N)/n(S) = 18/120 = 9/60 = 3/20 = 15%
    c) P[Ma] = 67/120 = 55.83 %
    d) P[A/M] = P[A ∩ M] / P[M] = n(A ∩ M) / n(M) = 35/53 = 66.04%
    e) P[M/N] = P[Ma ∩ N]/ P[N] = n(Ma ∩ N)/n(N) = 22/40 = 11/20 = 55%
Complemento de un suceso=> P[M’]= 1 – P[M]

       Sea de color azul: P[A], complemento = 1 – P[A]

   f) P[A]’ = 1 – P[A] = 1 - 80/120 = 40/120 = 4/12 = 1/3 = 33.33%




TEOREMA DE BAYES
Es un caso particular de la probabilidad condicional.
Si A1, A2, A3, …, An, son sucesos mutuamente excluyentes de los cuales al menos uno de los
sucesos Ai (i=1,2,3,…,n) debe ocurrir y siendo B un suceso cualquiera del espacio muestral, la
probabilidad de que ocurra el suceso “Ak” habiendo ocurrido B se puede definir como:

       P[Ak / B] = P[Ak] . P[B/Ak]
                   ∑ P[Ai] . P[B/Ai]

Ejemplo 1
1. En una empresa el 50% de trabajadores pertenecen al área técnica profesional, el 30% son
oficinistas y el 20% pertenecen al área de personal de servicio; se sabe además que el 8, 9 y 10% de
los técnicos profesionales, oficinistas y personal de servicio respectivamente son provincianos.
        a) Represente las condiciones enunciadas en un árbol de probabilidades
        b) Si se selecciona al azar un trabajador, cual es la probabilidad de que este sea técnico
        profesional o personal de servicio.
        c) Sea técnico profesional si se conoce que es provinciano
        d) Sea de personal de servicio si se sabe que es de la capital

SOLUCIÓN
T= técnico profesional                       P=provinciano
O=oficinistas                                C=capital
S=personal servicio

       a) Árbol de probabilidades

       b) P[T U S] = P[T] + P[S] – P[T ∩ S] = 50/100 + 20/100 – 0 = 70/100 = 70%

       c) P[T/P] = _________50/100 x 8/100_______________________
                 50/100x8/100 + 30/100x9/100 + 20/100x10/100
                   = 50 x 8_____________ = ___400                = 400/870 = 40/87 ó 45.98%
                      50x8 + 30x9 + 20x10 400+270+200

       d) P[S/C] = P[S].P[C/S]
                   P[T].P[C/T] + P[O].P[C/O] + P[S].P[C/S]
= 20/100 . 90/100
                   50/100x92/100 + 30/100x91/100 + 20/100x90/100

                  = 1800                = 1800 / 9130 = 180/913 ó 19.72 %
                     4600 + 2730 + 1800

Ejemplo 2
El 70% de los pacientes de un hospital son mujeres y el 20% de ellas son fumadoras. Por otro lado el
40% de los pacientes hombres son fumadores. Se elige al azar un paciente del hospital. ¿Cuál es la
probabilidad de que sea fumador?

Solución                     Diagrama de Árbol para el ejemplo:




Ejemplo 3
Consideremos un control de calidad de una empresa en el cual se desea saber la probabilidad de que
un determinado artefacto tenga una vida útil superior a las 1200hs. Para ello el dpto. de Control de
Calidad separa 500 unidades de la producción y mide la vida útil de cada unidad. Los resultados de
observan en la siguiente tabla:

                             Duración(en hs)              Frec. Abs.(fi)       Frec. Relat.
                      Menos de 800                        10                   2%
                      800 a 899                           40                   8%
                      900 a 999                           55                   11%
                      1000 a 1099                         70                   14%
                      1100 a 1199                         85                   17%
                      1200 a 1299                         115                  23%
                      1300 a 1399                         84                   17%
                      1400 a más                          41                   8%

                                           Total          500                  100%

P(A) = 115 + 84 +41                        ó       = 23% + 17% + 8%
           500                                     = 48%
Práctica Calificada N° 07


Ejercicio 1:

Tres máquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas
producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3%,
4% y 5%.

   a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.
   b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido
      producida por la máquina B.
   c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza

Ejercicio 2:

Tras un estudio estadístico en una ciudad se observa que el 70% de los motoristas son varones y, de
estos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con
casco es del 40%. Se pide:

   a. Calcular la probabilidad de que un motorista elegido al azar lleve casco.
   b. Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de que sea
      varón?

Ejercicio 3:

En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene. Se sabe
además que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se abstienen, son
mayores de 60 años. Se pide:

   a. Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 años.
   b. Hallar la probabilidad de que un ciudadano mayor de 60 años se haya abstenido.

Ejercicio 4:

Los alumnos de Primero de Biología tienen que realizar dos pruebas, una teórica y otra práctica. La
probabilidad de que un estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebe
la parte práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5.

   a.   ¿Son independientes los sucesos aprobar la parte teórica y la parte práctica?
   b.   ¿Cuál es la probabilidad de que un alumno no apruebe ninguno de los dos exámenes?
   c.   ¿Cuál es la probabilidad de que un alumno apruebe solamente uno de los dos exámenes?
   d.   Se sabe que un alumno aprobó la teoría. ¿Cuál es la probabilidad de que apruebe también la
        práctica?

Ejercicio 5:

El 35% de los créditos de un banco es para vivienda, el 50% para industrias y el 15% para consumo
diverso. Resultan fallidos el 20% de los créditos para vivienda, el 15% de los créditos para industrias
y el 70% de los créditos para consumo. Calcula la probabilidad de que se pague un crédito elegido al
azar.

Ejercicio 6:

El volumen de producción en tres plantas diferentes de una fábrica es de 500 unidades en la primera,
1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades
defectuosas producidas en cada planta es del 1%, 0.8% y 2%, respectivamente, calcula la
probabilidad de que al seleccionar una unidad al azar sea defectuosa.

Ejercicio 7:

El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los
ingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras que de los no
ingenieros y no economistas solamente el 20% ocupan un puesto directivo. ¿Cuál es la probabilidad
de que un empleado directivo elegido al azar sea ingeniero?
Semana 8


      VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS
           DISTRIBUCIONES DE PROBABILIDADES

                                           En el cálculo de probabilidades, generalmente, es más
                                           sencillo identificar los eventos numéricamente, y no con
                                           la simple descripción del suceso que pueda ocurrir, es
                                           más, en muchas ocasiones no podemos registrar todos los
                                           sucesos inmersos en el espacio muestral del experimento.

                                           Debemos recurrir a cuantificar esos símbolos iniciales en
                                           números reales que se puedan operar matemáticamente.




Variable Aleatoria

Definición: Una variable aleatoria es una función definida sobre un espacio muestral a los
números reales. Si ese espacio muestral especificado como dominio es numerable, decimos
que la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo.

En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: el
número de sellos obtenido.




En la tirada de dos dados si X es la suma obtenida:
FUNCIÓN DE PROBABILIDAD
Las variables aleatorias, transforman eventos del espacio muestral en eventos numéricos, los
cuales desde luego, tienen asociada una probabilidad de ocurrencia.

1. Función de Probabilidad f(x)=p(X=x): Es una función definida sobre una variable aleatoria a los
reales en el intervalo [0,1] que cumple con los axiomas de la teoría de la probabilidad.




2. Función de Distribución F(x)=p(X=x)
Es la acumulada de una función de probabilidad.




-: Limite inferior de la variable X
Ejemplo:
En el Lanzamiento de una Moneda,
X: Número de Sellos




Ejemplo:
X es la Suma Obtenida en el Lanzamiento de dos Dados:




Ejemplo: ¿ Cuál es la probabilidad que un disparo impacte a menos de 15 cm del centro? ¿ a más de
9 centímetros? ¿Entre 7 y 14 centímetros?
CUESTIONARIO Y EJERCICIOS PROPUESTOS

1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria continua, función
de probabilidad y función de distribución.
2. En el ejercicio de la ficha de dominó, si X representa la diferencia absoluta entre los dos
números, representar y calcular la probabilidad de ocurrencia de los siguientes eventos:
2.1 La diferencia sea menor o igual a 5
2.2 La diferencia sea mayor que 2
2.3 La diferencia sea mayor que 2 pero menor o igual 5
2.4 La diferencia sea mayor que 5 ó menor que 3
DISTRIBUCIÓN BINOMIAL
DISTRIBUCIÓN DE POISSON

La distribución de Poisson es de gran utilidad cuando tenemos variables distribuidas a través del
tiempo ó del espacio. Es el caso del número de llamadas que entran a una central telefónica en una
unidad de tiempo, la cantidad de personas que atiende un cajero en una hora, los baches por
kilómetro en una autopista, los artículos defectuosos que hay en un lote de producción; amén de su
utilización como aproximación binomial cuando p es muy cercano a cero, o n superior a 30. (p<0.1 ,
n>30).

La función de probabilidad de Poisson es:
Ejemplo:
Un cajero de un banco atiende en promedio 7 personas por hora, cual es la probabilidad de que un
una hora determinada:
1. Atienda menos de 5 personas
2. Atienda más de 8 personas
3. Atienda más de 5 pero menos de 8 personas
4. Atienda exactamente 7 personas

Consultando la tabla para la distribución de Poisson:




Ejemplo:
En cierto núcleo poblacional, el 0.5% es portador del V.I.H. En una muestra de 80 personas, cual es
la probabilidad:
1. De que haya alguna persona portadora.
2. No haya personas portadoras.

Solución:
DISTRIBUCIÓN NORMAL
Dada la caracterización propia de este modelo continuo, donde coinciden las medidas de tendencia
central, media, moda y mediana; la simetría respecto a estos parámetros y la facilidad de su
aplicación hacen de la distribución normal, una herramienta de uso común, máxime que la mayoría
de las variables económicas y sociales se ajustan a una función normal.

La distribución normal, también es útil como aproximación de los modelos binomial y poisson
expuestos anteriormente, y yendo un poco más adelante, sustentados en el teorema del “límite
central” podemos afirmar que, cuando el tamaño de la muestra es lo suficientemente grande,
podemos asumir el supuesto de normalidad para una suma de variables.

La forma acampanada de la variable normal, resalta la perfección de esta curva definida por los

parámetros




Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmética ó
varianza diferente se describe una función también diferente:
Normal Diferente Media Igual Varianza




Normal Diferente Varianza Igual Media
Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los
extremos y un aumento paulatino hasta llegar a la parte central del
recorrido, donde está la mayoría de ellos.
DEFINICIÓN :
Es la distribución más importante en la estadística.
Es una distribución simétrica con respecto a su promedio, teniendo la media,
mediana y moda el mismo valor. El valor máximo ocurre cuando
                                               U = Me = Mo




En el caso de la
Distribución normal de
parámetros x y σ,
 dicha función viene dada
 por:




         <=                                                                    >=
Z=x–u
             δ
 Casos:
 I.   P [x≤x] = P [ Z ≤ x – u ]
                                δ


 II. P [x≥x] = 1 – P[x ≤ x] = 1 – P[ Z ≤ x – u ]
                                                   δ


 III. P[a ≤ x ≤ b] = P[x ≤ b] – P[x ≤ a]
                      = P[Z ≤ b – u ] – P[Z ≤ a – u ]
                                      δ                δ




a)     Tenga un contenido mayor a 1020 cm3
       u = promedio = 1000 cm3
       σ = 30 cm3

       P [x > 1020]
              = 1 – P[ x ≤ 1020]
              = 1 – P[ z ≤ 1020 – 1000 ]
                                 30
              = 1 – P [ z≤ 0,67]                   Buscar en tablas 0,67

              = 1 – 0,74857 = 025143 ó 25.14%

b)     Tenga un contenido menor a 975 cm3
       P[ x < 975 ]
       P [ z ≤ 975 – 1000 ]
                  30

       P [ z ≤ -0.833] = 0,20327 ó 20.33%

c)     Contenga entre 980 y 1030 cm3

       P [980 ≤ x ≤ 1030]
       P [ z≤ 1030 – 1000 ] – P[z ≤ 980 – 1000 ]
                  30                    30

       P [ z≤ 1 ] – P [z ≤ -0.666 ]   ………………………..                Ver en tablas

       0.84134 - 0.25143

       0.58991 ó 58.99%
2. Una prueba acelerada de duración en un gran número
   de pilas alcalinas tipo D, reveló que la duración media
  para un caso específico antes que falle es 19 h. La
  distribución de las duraciones se aproxima a una
  distribución normal. La desviación estándar de la
  distribución fue de 1.2 h.
Calcular:
a) Probabilidad que dure más de 21 horas
b) Probabilidad que dure como máximo 17.8 horas
c) Probabilidad de que su duración esté comprendida
   entre 18.7 y 19.3 h
Nota: Las tablas utilizadas en esta sesión, se encuentran
colgadas en el Aula Virtual de la USS y en el blog:
www.ingenieriainvestigacazasi.blogspot.com
Practica Calificada N° 08

1. La probabilidad de que un visitante efectúe una compra en un almacén, durante un
día dado es 0.8. Si al negocio entran 20 clientes, ¿cuál es la probabilidad de que el
almacén realice:
       1.1 Exactamente 16 ventas?
       1.2 Menos de 17 ventas?
       1.3 Más de 14 ventas?
       1.4 Exactamente 5 ventas?
       1.5 ¿Cuál es el número esperado de ventas?
2. Si un almacén tiene en promedio 5 ventas por hora. ¿Cuál es la probabilidad de que
en una hora determinada:
       2.1 Haya exactamente 4 ventas?
       2.2 Haya más de 3 ventas?
       2.3 No se efectúen ventas?
3. Una de cada 10 personas mayores de 40 años de una comunidad, sufren de
hipertensión. Se toma una muestra de 50 personas mayores de 40 años.
Utilizando primero la distribución binomial y luego la aproximación a la distribución
de Poisson, responder y comparar los resultados:
       3.1 ¿Cuál es la probabilidad que haya más de 4 hipertensos?
       3.2 ¿Cuál es la probabilidad que haya exactamente 5hipertensos?
4. Un lote de arandelas tiene un diámetro normal con media 10 milímetros y
desviación típica 0.5 milímetros. Se toma una arandela al azar. ¿Cuál es la
probabilidad de que tenga un diámetro:
       4.1 Superior a 10.5 milímetros?
       4.2 Entre 9 y 11 milímetros?
       4.3 Menos de 9 milímetros?
Semana 10

           INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA


       La preparación de un proyecto de investigación es una
tarea compleja, ya que se han de tener en cuenta multitud de
aspectos para que el documento final contemple todos los
apartados que cualquier estructura estándar considera y para
que todos los investigadores sepan con qué y cómo deben
proceder en todas las etapas de ejecución del estudio planteado.

       Uno de los dilemas que se presenta cuando se inicia la
elaboración del proyecto es decidir sobre los individuos o
elementos que se incluirán en el estudio: qué características
tendrán «criterios de inclusión y exclusión», a cuántos pacientes
se estudiará «tamaño de la muestra» y cómo se elegirán para
que entren a formar parte del estudio «técnica de muestreo».

        Estudiar a toda la población, que sería la manera más exacta de conocer lo que se pretende
estudiar, es casi imposible en la práctica. Entre los motivos que lo impiden se encuentran la falta de
tiempo, la escasez de recursos humanos y económicos, la dificultad para acceder a todos los sujetos,
etc., por lo que se estudia sólo a una parte de ellos, para, posteriormente, generalizar o inferir los
resultados obtenidos a toda la población.

       Por tanto, cuando se habla de sujetos de estudio, se ha de diferenciar claramente entre
población, muestra e individuo.
TEOREMA DEL MUESTREO
DISEÑO DE MUESTRA

  1. Definir la Población Meta: Conjunto de Elementos que poseen la información
     que se busca




  2. Determinar el Marco de la Muestra: Lista o grupo de indicaciones para
     identificar a la población meta

    Listas:
     Directorio Telefónico de Organizaciones
     Lista de correo
3. Seleccionar las Técnicas de Muestreo



                                                                           T E C N IC A S D E

                                                                            MUESTREO




                        N o P r o b a b ilís t ic o                                                      P ro b a b ilís tic o




                                                                                                                                     Estratificado
                                                           Bola de Nieve
         Conveniencia




                                                                                                         Sistemático
                                                                                                Simple




                                                                                                                             Grupo




                                                                                                                                                     Áreas
                              Juicio



                                             Cuota




                                                                                                                       Por
   Por



                        Por



                                       Por



                                                     Por




  TÉCNICAS NO PROBABILÍSTICAS:
  Es aquella en la cual los elementos del conjunto población no tienen la misma probabilidad
  de ser seleccionado.

  1. Por Conveniencia: Su principal debilidad es el nombre, ya que, para muchas personas el
  nombre da a entender que se está haciendo la selección de las unidades de análisis amañando
  las respuestas, situación que no es cierta, toma su nombre, debido a que se busca obtener una
  representatividad de la población consultando o midiendo unidades de análisis que pueden ser
  accesadas con relativa facilidad. Es uno de los muestreos con mayor uso, dado esa
  particularidad.

  2. Por Juicio: Se busca seleccionar a individuos que se juzga de antemano tienen un
  conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información
  aportada por esas personas es vital para la toma de decisiones. En el área de vacunas
  sintéticas, el Dr. Patarroyo, es considerado una eminencia, luego sería un personaje ideal para
  hablar sobre esa temática. Si se utilizará un método aleatorio, probablemente quedarían en la
  muestra algunas personas con poco dominio sobre el tema en estudio.
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos
Módulo de Estadística para el Análisis de Datos

More Related Content

What's hot

7 permutaciones combinaciones
7 permutaciones combinaciones7 permutaciones combinaciones
7 permutaciones combinacionesArbey Gutierrez
 
4. estadistica inferencial
4.  estadistica inferencial4.  estadistica inferencial
4. estadistica inferencialrbarriosm
 
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasEjercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasJaviera Huera (Temuco)
 
Intervalos de confianza 2
Intervalos de confianza 2Intervalos de confianza 2
Intervalos de confianza 2Hector Funes
 
Curvas y superficies de nivel, trazado de funciones de 2 variables
Curvas y superficies de nivel, trazado de funciones de 2 variablesCurvas y superficies de nivel, trazado de funciones de 2 variables
Curvas y superficies de nivel, trazado de funciones de 2 variablesDaniel Orozco
 
Distribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosDistribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosamy Lopez
 
VECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMALVECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMALMario Muruato
 
Uso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandarUso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandarAraceli Gomez
 

What's hot (20)

7 permutaciones combinaciones
7 permutaciones combinaciones7 permutaciones combinaciones
7 permutaciones combinaciones
 
4. estadistica inferencial
4.  estadistica inferencial4.  estadistica inferencial
4. estadistica inferencial
 
Distribucion Normal
Distribucion NormalDistribucion Normal
Distribucion Normal
 
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables AleatoriasEjercicios Resueltos: Probabilidades y Variables Aleatorias
Ejercicios Resueltos: Probabilidades y Variables Aleatorias
 
Distribucion normal completo
Distribucion normal completoDistribucion normal completo
Distribucion normal completo
 
CENTRO DE MASA O GRAVEDAD
CENTRO DE MASA O GRAVEDADCENTRO DE MASA O GRAVEDAD
CENTRO DE MASA O GRAVEDAD
 
Distribución multinomial
Distribución multinomialDistribución multinomial
Distribución multinomial
 
Intervalos de confianza 2
Intervalos de confianza 2Intervalos de confianza 2
Intervalos de confianza 2
 
Distribucion binomial
Distribucion binomialDistribucion binomial
Distribucion binomial
 
Distribucion Geometrica
Distribucion GeometricaDistribucion Geometrica
Distribucion Geometrica
 
2.ejeercicios
2.ejeercicios2.ejeercicios
2.ejeercicios
 
Curvas y superficies de nivel, trazado de funciones de 2 variables
Curvas y superficies de nivel, trazado de funciones de 2 variablesCurvas y superficies de nivel, trazado de funciones de 2 variables
Curvas y superficies de nivel, trazado de funciones de 2 variables
 
Estadistica y probabilidad
Estadistica y probabilidadEstadistica y probabilidad
Estadistica y probabilidad
 
Distribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplosDistribuciones de probabilidad con ejemplos
Distribuciones de probabilidad con ejemplos
 
Fundamentos de probabilidad
Fundamentos de probabilidadFundamentos de probabilidad
Fundamentos de probabilidad
 
VECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMALVECTOR TANGENTE NORMAL Y BINORMAL
VECTOR TANGENTE NORMAL Y BINORMAL
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
Uso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandarUso de la tabla de distribucion de probabilidad normal estandar
Uso de la tabla de distribucion de probabilidad normal estandar
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Desviación estándar (ds)
Desviación estándar (ds)Desviación estándar (ds)
Desviación estándar (ds)
 

Viewers also liked

Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Juan Carlos GB
 
Ejercicios de estadística
Ejercicios de estadísticaEjercicios de estadística
Ejercicios de estadísticaLoreSR
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadisticaDaday Rivas
 
Prueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianzaPrueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianzaIselitaa Hernadez
 
Capitulo 2. descripción de datos
Capitulo 2.  descripción de datosCapitulo 2.  descripción de datos
Capitulo 2. descripción de datosalbanoaga
 
Lenguaje estadístico
Lenguaje estadísticoLenguaje estadístico
Lenguaje estadísticolauraperez175
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersioneraperez
 
Estadística (tema 2, power point)
Estadística (tema 2, power point)Estadística (tema 2, power point)
Estadística (tema 2, power point)lauraperez175
 
Taller estadistica tercer_corte[1]
Taller estadistica tercer_corte[1]Taller estadistica tercer_corte[1]
Taller estadistica tercer_corte[1]luisapatriciaviviana
 
Pediculosis
PediculosisPediculosis
PediculosisSuperPT
 
Circular Princ Curso 09 10
Circular Princ Curso 09 10Circular Princ Curso 09 10
Circular Princ Curso 09 10fercanarias
 
Taller estadistica (2)
Taller estadistica (2)Taller estadistica (2)
Taller estadistica (2)Jorge Florez
 
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...Alejandro Ruiz
 

Viewers also liked (20)

Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:Ejercicios Resueltos de Estadística:
Ejercicios Resueltos de Estadística:
 
Ejercicios de estadística
Ejercicios de estadísticaEjercicios de estadística
Ejercicios de estadística
 
Que es la estadistica
Que es la estadisticaQue es la estadistica
Que es la estadistica
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Ejercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadisticaEjercicios resueltos-de-estadistica
Ejercicios resueltos-de-estadistica
 
PISA matemáticas: Puerta giratoria
 PISA matemáticas: Puerta giratoria PISA matemáticas: Puerta giratoria
PISA matemáticas: Puerta giratoria
 
Prueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianzaPrueba de hipotesis y intervalos de confianza
Prueba de hipotesis y intervalos de confianza
 
Capitulo 2. descripción de datos
Capitulo 2.  descripción de datosCapitulo 2.  descripción de datos
Capitulo 2. descripción de datos
 
PISA-FICHA DE MATEMÁTICA 6
PISA-FICHA DE MATEMÁTICA 6PISA-FICHA DE MATEMÁTICA 6
PISA-FICHA DE MATEMÁTICA 6
 
Regla de tres
Regla de tresRegla de tres
Regla de tres
 
Lenguaje estadístico
Lenguaje estadísticoLenguaje estadístico
Lenguaje estadístico
 
Medidas de dispersion
Medidas de dispersionMedidas de dispersion
Medidas de dispersion
 
Estadística (tema 2, power point)
Estadística (tema 2, power point)Estadística (tema 2, power point)
Estadística (tema 2, power point)
 
Taller estadistica tercer_corte[1]
Taller estadistica tercer_corte[1]Taller estadistica tercer_corte[1]
Taller estadistica tercer_corte[1]
 
Pediculosis
PediculosisPediculosis
Pediculosis
 
Calendario Enero
Calendario EneroCalendario Enero
Calendario Enero
 
Circular Princ Curso 09 10
Circular Princ Curso 09 10Circular Princ Curso 09 10
Circular Princ Curso 09 10
 
Taller estadistica (2)
Taller estadistica (2)Taller estadistica (2)
Taller estadistica (2)
 
Circular informativa 11 12
Circular informativa 11 12Circular informativa 11 12
Circular informativa 11 12
 
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
Capítulo 02, Descripción de los datos, distribuciones de frecuencias y repres...
 

Similar to Módulo de Estadística para el Análisis de Datos

BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxJuancamiloZuiga4
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxhellendiaz12
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxhellendiaz12
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfIsabellaLugo3
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfElizabethPereaCastil
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxhellendiaz12
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfXcpBoy
 
Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4HannaGravenhorst2
 
Tecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadooooooooooooooooooooooooTecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadoooooooooooooooooooooooogeladinemeneses
 
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrTECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrLaura225304
 
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdfACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdfnathalietruque
 
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...Eduardorojas972246
 
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...JeanCarloMontoya
 
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...JeanCarloMontoya
 
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...Elpalmar756Eventos
 
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...JeanCarloMontoya
 
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...Eduardorojas972246
 
Estad Gener I
Estad Gener IEstad Gener I
Estad Gener Imarix
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata hamlet mata mata
 

Similar to Módulo de Estadística para el Análisis de Datos (20)

Modulometodosestadisticos2011 110329231153-phpapp01
Modulometodosestadisticos2011 110329231153-phpapp01Modulometodosestadisticos2011 110329231153-phpapp01
Modulometodosestadisticos2011 110329231153-phpapp01
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docxBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..docx
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS..pdf
 
Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4Conceptos basicos de programacion y metodos estadisticos 11-4
Conceptos basicos de programacion y metodos estadisticos 11-4
 
Tecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadooooooooooooooooooooooooTecnología - Excel avanzadoooooooooooooooooooooooo
Tecnología - Excel avanzadoooooooooooooooooooooooo
 
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrTECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
TECNOLOGIA 2024 (2).pdfcfrrrrrrrrrrrrrrrrrrrrrrrrrrrrrrr
 
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdfACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
ACTIVIDAD: BLOG. EXCEL AVANZADO. METODOS ESTADISTICOS.(2).pdf
 
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
 
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
 
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
 
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas 11-...
 
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
Conceptos_basicos_de_programacion_y_metodos_estadisticos_Montoya_y_Rojas_11-4...
 
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
Conceptos básicos de programación y métodos estadísticos, Montoya y Rojas...
 
Estad Gener I
Estad Gener IEstad Gener I
Estad Gener I
 
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
Ebook de Estadistica con el SPSS Presentado por Hamlet Mata Mata
 

More from cesarzatta

Estadística en la investigación
Estadística en la investigaciónEstadística en la investigación
Estadística en la investigacióncesarzatta
 
Encuesta servicio plaza vea
Encuesta servicio plaza veaEncuesta servicio plaza vea
Encuesta servicio plaza veacesarzatta
 
Caso preferencias por leche envasada
Caso preferencias por leche envasadaCaso preferencias por leche envasada
Caso preferencias por leche envasadacesarzatta
 
Modelo de encuesta inei
Modelo de encuesta ineiModelo de encuesta inei
Modelo de encuesta ineicesarzatta
 
Ficha tecnica encuesta inei 2007
Ficha tecnica   encuesta inei 2007Ficha tecnica   encuesta inei 2007
Ficha tecnica encuesta inei 2007cesarzatta
 
Historia de la Estadistica
Historia de la EstadisticaHistoria de la Estadistica
Historia de la Estadisticacesarzatta
 

More from cesarzatta (6)

Estadística en la investigación
Estadística en la investigaciónEstadística en la investigación
Estadística en la investigación
 
Encuesta servicio plaza vea
Encuesta servicio plaza veaEncuesta servicio plaza vea
Encuesta servicio plaza vea
 
Caso preferencias por leche envasada
Caso preferencias por leche envasadaCaso preferencias por leche envasada
Caso preferencias por leche envasada
 
Modelo de encuesta inei
Modelo de encuesta ineiModelo de encuesta inei
Modelo de encuesta inei
 
Ficha tecnica encuesta inei 2007
Ficha tecnica   encuesta inei 2007Ficha tecnica   encuesta inei 2007
Ficha tecnica encuesta inei 2007
 
Historia de la Estadistica
Historia de la EstadisticaHistoria de la Estadistica
Historia de la Estadistica
 

Recently uploaded

libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicialLorenaSanchez350426
 
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfNataliaMalky1
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxMartín Ramírez
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas123yudy
 
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)veganet
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfEDILIAGAMBOA
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfromanmillans
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfDaniel Ángel Corral de la Mata, Ph.D.
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORGonella
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docxAgustinaNuez21
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxMartín Ramírez
 
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).pptPINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).pptAlberto Rubio
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxJUANCARLOSAPARCANARE
 

Recently uploaded (20)

TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicial
 
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
 
periodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicasperiodico mural y sus partes y caracteristicas
periodico mural y sus partes y caracteristicas
 
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
Instrucciones para la aplicacion de la PAA-2024b - (Mayo 2024)
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdf
 
Estrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdfEstrategia de Enseñanza y Aprendizaje.pdf
Estrategia de Enseñanza y Aprendizaje.pdf
 
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdfTema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
Tema 8.- Gestion de la imagen a traves de la comunicacion de crisis.pdf
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIOR
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
CIENCIAS NATURALES 4 TO ambientes .docx
CIENCIAS NATURALES 4 TO  ambientes .docxCIENCIAS NATURALES 4 TO  ambientes .docx
CIENCIAS NATURALES 4 TO ambientes .docx
 
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptxc3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
c3.hu3.p1.p2.El ser humano y el sentido de su existencia.pptx
 
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).pptPINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
 

Módulo de Estadística para el Análisis de Datos

  • 1. MODULO EDUCATIVO DEL CURSO DE MÉTODOS ESTADÍSTICOS Autor: Msc. César A. Zatta Silva Universidad Señor de Sipan 2011-I
  • 2. INTRODUCCIÓN Las acciones que acometemos hoy se basan en un plan de ayer y las expectativas del mañana. Para satisfacer las necesidades de conocimiento sobre los Métodos Estadísticos, se ha diseñado este módulo teniendo en consideración los objetivos señalados en las competencias, capacidades y actitudes que el alumno debe alcanzar en este curso. Se contempla en este curso que los estudiantes conozcan el origen de la palabra estadística, las técnicas de recolección, organización, conservación, y tratamiento de los datos para su análisis y posterior interpretación de la información. En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de observaciones muestrales o históricas, crean modelos lógico- matemáticos que se "aventuran" describir o pronosticar un determinado fenómeno con cierto grado de certidumbre medible. El avance tecnológico en la informática ha contribuido enormemente al desarrollo de la estadística, sobre todo en la manipulación de la información, pues en el mercado existen paquetes estadísticos de excelente calidad como el SPSS y MS Excel que ya existe en el computador sin mayores exigencias técnicas,
  • 3. Contenido Semana 1 Introducción, reseña histórica, contenidos. Objetivos. Definición de Estadística. Conceptos básicos importantes. Importancia y objeto de la estadística. Elementos básicos: Población, muestra, variable, unidad de estudio, parámetro. Clasificación de las variables. Semana 2 Organización y presentación de los datos. Tablas de distribución de frecuencias. Tipos de tablas estadísticas. Procesamiento de datos en cuadros y gráficos estadísticos. Semana 3 Métodos Estadísticos en la investigación, etapas de la investigación estadística: Planeamiento, organización, análisis e interpretación de datos, formulación de conclusiones. Técnicas de recolección de datos, observación, entrevista, cuestionario, encuestas por muestreo, sistemas de recolección. Semana 4 Medidas de Tendencia Central: Media Aritmética. Media Ponderada. Mediana. Moda. Medidas de Posición: Cuartiles. Deciles y Percentiles. Semana 5 Medidas de Dispersión. Descripción de las medidas de dispersión: Rango, Desviación y Varianza para datos simples y agrupados, Coeficiente de Variación Semana 6 Introducción al Cálculo de Probabilidades. Experimento aleatorio, espacio muestral, suceso o evento. Definición de Probabilidad Clásica, Probabilidad de Frecuencia Relativa, Probabilidad Subjetiva. Combinación, Variación, Permutación. Semana 7 Probabilidad de un evento. Teorema de la adición y de la complementación. Reglas de multiplicación y de probabilidad total. Probabilidad Condicional. Teorema de Bayes. Semana 8 Variables aleatorias. Función de probabilidad. Variables aleatorias discretas y continuas. Distribuciones discretas de probabilidad. Distribución Binomial y de Poisson. Distribuciones continuas de probabilidad. Distribución Normal. Uso de Tablas Semana 9 Primer Examen Parcial Semana 10 Introducción a la Inferencia Estadística. Métodos y distribuciones de muestreo. Muestreo de la población. Métodos de muestreo probabilístico. Error de muestreo. Distribución de muestreo de medias muestrales. Tamaño de muestra. Semana 11 Introducción a la Teoría de la estimación Estadística.Estimaciones puntuales e Intervalos de Confianza sobre parámetros. Semana 12 Prueba de Hipótesis, introducción, hipótesis estadísticas, pasos para una verificación de hipótesis. Hipótesis para la media poblacional. Prueba de Hipótesis para una varianza poblacional y una proporción poblacional. Semana 13 Análisis de tendencia o series de tiempo. Análisis de regresión, formas de encontrar la regresión simple. Método de los mínimos cuadrados. La tendencia lineal. Semana 14 Correlación y desviación estándar. Tasas y Números Índices, aplicación de los números índices. Semana 15 Control de Calidad y Procesos Estadísticos. Aplicación de la estadística en trabajo de Investigación. Presentación de Diagnóstico en Proyecto Integrador. Semana 16 Segundo Examen Parcial
  • 4. Semana 1 ESTADÍSTICA La Estadística es la ciencia que nos ofrece un conjunto de métodos y técnicas para: Recolectar, Resumir, Procesar, Presentar , Analizar e Interpretar un conjunto de datos, con la finalidad de conocer el problema, proyectar su comportamiento y colaborar en la toma de decisiones sobre dicho problema. Otra definición: La estadística es una rama de las matemáticas, constituye uno de los idiomas esenciales para comunicarse en el mundo universal de la ciencia y la tecnología. Aquellos profesionales que no conozcan Estadística tendrán serias dificultades para ser expertos en su respectivo campo científico. Importancia Los métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para organizar y resumir datos numéricos. La estadística descriptiva, por ejemplo trata de la tabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidas descriptivas. Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de consumidores; análisis de resultados en deportes; administradores de instituciones; en la educación; organismos políticos; médicos; y por otras personas que intervienen en la toma de decisiones Método que sigue la Estadística Recolectar Resumir y Ordenar Procesar ESTADISTICA Tomar decisiones Analizar e Interpretar Presentar Clasificación: La Estadística para su mejor estudio se ha dividido en dos grandes ramas: la Estadística Descriptiva y la Inferencial. Estadística Descriptiva: Comprende a los procesos de consolidación, resumen y descripción de los datos recopilados. Consiste sobre todo en la presentación de datos en forma de tablas y gráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada para resumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferir nada que vaya más allá de los datos, como tales. Estadística Inferencial: Incluye procedimientos que permiten la extrapolación y generalización sobre características que tipifican a todos los elementos de la población. Es decir, la inferencia
  • 5. estadística es el proceso de hacer afirmaciones o predicciones sobre toda la población tomando como base sólo a la información recabada a través de una muestra representativa. CONCEPTOS FUNDAMENTALES 1. POBLACIÓN: Es el conjunto de todos los datos que intervienen en una investigación. Al número de elementos de una población se denota por “N.” Población finita: Es el conjunto finito de unidades de análisis donde se puede identificar a un elemento inicial y/o a un elemento final. Ejemplo: Población de hoteles de Lima, población de agencias de viaje existentes en la ciudad de Cajamarca, turistas de nacionalidad alemana que ingresaron al Perú en el año 2000. Población Infinita: Conjunto infinito de elementos donde no se podría identificar a una unidad inicial ni a la unidad final. Ejemplo: la población de los peces del mar, los árboles de la selva peruana 2. MUESTRA: Es una parte de la población y como tal es también un conjunto de datos. Al número de elementos de una muestra se denota por “n”. Una muestra tiene 2 características principales: Es representativa y es adecuada. Muestra No Probabilística: Corresponde al subconjunto de observaciones elegidas siguiendo un criterio de representatividad establecida arbitrariamente por el investigador. Ejm. Analizo todos los ratones que son de color blanco del total de ratones Muestra Probabilística: Comprende a las observaciones realizadas en unidades que han sido elegidas siguiendo un criterio probabilístico, esto es a cada unidad de la población se asigna probabilidad conocida para estar incluida como parte de la muestra. Ejm. Sacar 2 pelotas blancas de una canasta de 8 pelotas entre blancas y negras. 3. UNIDAD DE ESTUDIO: Es el objeto o elemento indivisible que será estudiado. Es quien nos va a dar la información. Ejemplo: Se va a estudiar la capacidad hotelera de la ciudad de Lima, se define la unidad de análisis “hotel” 4. VARIABLE: Es una característica de estudio de una población, que toma diferentes valores Las variables son características observables referidas a la unidad de estudio. Se denota por las letras X, Y, Z, etc. Se clasifican en: 4.1 Variable cualitativa : Son aquellas variables que expresan cualidades o atributos, y que por tanto su medida no tiene un carácter numérico, esta variables pueden ser: Nominales Sus valores representan un atributo a manera de etiqueta y no contiene información sobre ordenamiento. Ejm. Sexo del cliente, nacionalidad del entrevistado, etc. Ordinales Sus valores sí representan un ordenamiento del atributo. Ejm. Grado de educación del entrevistado, grado de satisfacción sobre la atención recibida por el cliente, etc.
  • 6. 4.2 Variable Cuantitativa: Comprende aquellos conceptos que sí pueden ser expresados en forma numérica porque corresponde a criterios de cantidad. Pueden ser: v. c. Discretas Son variables que toman valores que se expresan en números enteros. Es el resultado del proceso de conteo. Ejm. Número de empleados, Número de habitaciones, Total de alumnos, etc. v.c. Continuas Son aquellas variables que sus cantidades se expresan con números reales, es decir, tienen parte fraccionaria. Son el resultado del proceso de medición. Ejm. Ingresos totales mes de julio, costo de servicio diario del hotel, toneladas embarcadas, etc. Ejemplos: El alumno deberá identificar las variables para las unidades de estudio siguiente *UNIDAD DE ESTUDIO: Estudiante Variables: Peso, edad, talla, tipo de sangre, color de ojos, ingreso familiar, número de hermanos, etc. *UNIDAD DE ESTUDIO: Empresa Variables: Ventas, ganancias, número de trabajadores, número de computadoras, gastos en publicidad, etc. Práctica Calificada Nº 01 A. Determina la población y la muestra, y la variable de los siguientes ejemplos: 1. Tiempo dedicado a las tareas domésticas por los hombres y las mujeres que trabajan fuera del hogar en Lambayeque 2. Estudios que quieren hacer las alumnas y los alumnos del Colegio Manuel Pardo al terminar la Educación Secundaria 3. Intención de voto en unas elecciones municipales 4. Horas que dedican a ver televisión los estudiantes de educación primaria del colegio San José 5. Número de aparatos de radio que hay en los hogares chiclayanos 6. Se quiere realizar un estudio para determinar la cantidad promedio de huevos que ponen los pingüinos hembras en el período reproductivo en Puerto Maldonado. 7. Se quiere determinar la audiencia de cierto programa televisivo de televisión de aire. 8. Se requiere determinar el grado de afectación que tuvo la salmonella en las gallinas provenientes de las granjas del empresario Gonzales 9. Se quiere estimar el grado de aceptación que tiene la mermelada de carambola en la zona oeste de Chiclayo B. De las siguientes variables, determinar cuáles son cualitativas y cuales son cuantitativas discretas o cuantitativas continuas 1. Precio del pollo 2. Angulo de inclinación de los puentes 3. Grado de instrucción de los postulantes 4. Color de ojos de las finalistas 5. Peso promedio de las bolsas 6. Número de taxis que ingresan por hora a Chiclayo 7. Comida favorita 8. Número de goles marcados por la selección 9. Profesión que te gusta
  • 7. 10. Coeficiente intelectual de tus compañeros de clase 11. El color de los ojos de tus compañeros de clase 12. Temperaturas registradas en verano 13. Número de acciones vendidas en la Bolsa de valores 14. Diámetro de las ruedas de varios coches 15. Censo anual de los españoles 16. Número de libro en un estante 17. Litros de agua contenidos en un depósito 18. La profesión de una persona 19. Suma de puntos obtenidos en un lanzamiento de dados C. Determina lo siguiente: CASO Nº 01: Dentro de los estudios sociales que realiza el Dr. Pauling sobre rendimiento y características cognoscitivas de los alumnos pertenecientes al Colegio Público San Carlos, ha llegado a resultados inesperados. Unidad de estudio Variable de estudio Población Muestra CASO Nº 02 Un proveedor de servicios de línea blanca desea saber cuál es la marca preferida de cocinas de las amas de casa pertenecientes a la ciudad de Chiclayo. Para llevar a cabo esta investigación, selecciona a 120 amas de casa que fueron escogidas según la zona de la ciudad de Chiclayo. Unidad de estudio Variable de estudio Población Muestra CASO Nº 03 Un investigador de mercado quiere saber cuál es la marca de detergente que más se utiliza o más prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo esta investigación selecciona una muestra de 504 amas de casa que fueron escogidas según zona o urbanización de la ciudad de Chiclayo. Unidad de estudio Amas de casa Variable de estudio Marca de detergente (tipo cualitativa nominal) Población Amas de casa de la ciudad de Chiclayo Muestra 504 amas de casa CASO Nº 04: El Ingeniero de Producción de Cerveza Cristal en Motupe, dentro de su evaluación diaria, desea saber si el brix (grado de azúcar), porcentaje de alcohol, tiempo de maduración, etc, han cumplido con las parámetros de calidad en la producción del fin de semana. Unidad de estudio Cerveza Variable de estudio Brix, porcentaje de alcohol, tiempo maduración (cuantitativa) Población Producción de cerveza del fin de semana Muestra Producción de cerveza de un día
  • 8. CASO Nº 05: Un investigador social desea saber cuáles son las características socio demográficas que influyen en el rendimiento académico de los Estudiantes de la Universidad Señor de Sipan, de la especialidad de Ingeniería Agroindustrial matriculados en el 2º Semestre-Año 2006. Unidad de estudio Estudiante Variable de estudio Características socio demográficas Población Estudiantes matriculados de Ing. Agroindustrial de la USS (cualitativa) Muestra Alumnos matriculados del 2º semestre CASO Nº 06: El gerente del Grifo “San Luis” ubicado en el ovalo está haciendo un estudio de factibilidad para determinar si es conveniente la instalación de un nuevo servidor de gasolina en dicho establecimiento. Para realizar este estudio toma información sobre el tiempo que se demora en dar el servicio y el tiempo que demora en llegar el usuario (automóvil). Unidad de estudio Usuario de automóvil Variable de estudio Tiempo en dar el servicio y tiempo llegar usuario (cuantitativa) Población Todos los clientes del grifo Muestra Algunos clientes del grifo CASO Nº 07 Un investigador de mercado quiere saber cuál es la marca de jabones que más se utiliza o más prefieren las empleadas de casa de la ciudad de Tarapoto. Para llevar a cabo esta investigación selecciona una muestra de 610 empleadas que fueron escogidas según zona o urbanización de la ciudad de Tarapoto. Unidad de estudio Variable de estudio Población Muestra
  • 9. Semana 2 ORGANIZACIÓN DE DATOS Y DISTRIBUCIONES DE FRECUENCIA Frecuencia: (fi) Número de individuos o elementos que pertenecen o aparecen en cada categoría. 1. ORGANIZACIÓN DE VARIABLES CUALITATIVAS: Comprende la representación gráfica de conceptos cualitativos y/o atributos que se registran para las unidades de análisis. Ejemplo: El número de turistas que registraron su ingreso por el aeropuerto de Chiclayo el mes de Febrero, se registra según su nacionalidad NACIONALIDAD Número de Turistas (fi) Argentina 20 Boliviana 10 Brasileña 5 Venezolana 15 TOTAL 50 2. ORGANIZACIÓN DE VARIABLES CUANTITATIVAS DISCRETAS: Comprende clasificaciones de variables que sólo toman valores enteros, por tanto las unidades de análisis se ordenan de acuerdo con sus propios valores. Ejm: Las puntuaciones obtenidas por los 30 alumnos del curso de Física I, fueron: [12,11,13,13,10,10,12,12,09,09,08,14,12,11,14,14,14,10,10,14,13,13,11,11,14,13,14,13,14,12] Se consolida la información en una Tabla de Frecuencia: Frecuencia Acumulada Notas Frecuencia Frecuencia Absoluta Relativa Xi Absoluta ( fi ) Relativa ( hi) (Fi) (Hi) 08 1 0.03 1 0.03 09 2 0.07 3 0.10 10 4 0.13 7 0.23 11 4 0.13 11 0.36 12 5 0.17 16 0.53 13 6 0.20 22 0.73 14 8 0.27 30 1.00 TOTAL 30 1.00 El gráfico que corresponde a esta tabla de frecuencia se denomina: Histograma Histograma de frecuencias absolutas Histograma de frecuencias absolutas acumuladas
  • 10. 3. ORGANIZACIÓN DE VARIABLES CUANTITATIVAS CONTINUAS: Comprende clasificaciones de unidades de análisis resultantes de una medición, que en ocasiones toman valores decimales. Ejemplo: El Gran Hotel Chiclayo, durante los últimos 32 días, el valor de las compras en revistas y periódicos para la sala de recepción fueron: Esta información diaria y dispersa no permitirá analizar su comportamiento, es necesario resumirla en una tabla de frecuencia. Para organizar una tabla de frecuencia se deberá seguir el procedimiento siguiente: * Elegir el número de intervalos de clase ( k ) Se puede utilizar la regla se Sturges: k = 1 + 3.322 log n Donde:k = número de intervalos n = número de datos En el ejemplo: k = 1 + 3.322 Log(32) = 5.967 = Aprox. 6 intervalos * Determinar el Tamaño del Intervalo de Clase ( c ) c = A/k A= Amplitud de los datos = (Observación máxima – Observación Mínima) = 10.2 – 5.2 = 5.0 k=6 Por tanto: c = 5.0 / 6 = 0.8333 = Aproximadamente = 0.9 * Realizar la clasificación y el conteo de datos en cada clase construida * Construir la Tabla de Frecuencia Frecuencia Frecuencia Frec. Acumul. Frec. Acumul. Intervalo de clase Marca de Clase Absoluta Relativa Absoluta Relativa (escala de gasto) Xi fi hi Fi Hi [ 5.2 – 6.1 ) 5.65 3 0.094 3 0.094 [ 6.1 – 7.0 ) 6.55 5 0.156 8 0.250 [ 7.0 – 7.9 ) 7.45 9 0.281 17 0.531 [ 7.9 – 8.8 ) 8.35 7 0.219 24 0.750 [ 8.8 – 9.7 ) 9.25 5 0.156 29 0.906 [ 9.7 – 10.6 ) 10.15 3 0.094 32 1.000 TOTAL 32 1.000
  • 11. Análisis de la distribución de frecuencias: * ¿Cuántos días el hotel gastó “de 7.0 a menos de 7.9 soles”? : 9 días * ¿Cuántos días el hotel gastó “menos de 7.9 soles”? : 17 días * ¿Cuántos días el hotel gastó “menos de 9.7 soles”? : 29 días * ¿Qué porcentaje de días el hotel gastó “menos de 7.9 soles”? : 53.1% * ¿Qué porcentaje de días el hotel gastó “más de 7.9 soles”? : 46.9 % Polígono de Frecuencias: Es la línea que une los puntos medios de los lados superiores (marcas de clase) de un histograma. Los puntos o vértices del polígono de frecuencias están situados, por tanto, en las marcas de clase, ya que estos corresponden a los puntos medios de los intervalos. Histograma y Polígono de Frecuencias
  • 12. USO DE MS EXCEL Construcción tablas tipo A en EXCEL: Para variables cualitativas y cuantitativas discretas Color f F h H Azul =contar.si($B$2:$H$11;B14) 21 Rojo 16 Verde 13 Negro 8 Blanco 12 Construcción tablas tipo B en EXCEL: Para variables cuantitativas continuas Las densidades de los materiales en estudio fueron: n = contar (celda inicio: celda final) K = numero de intervalos, con fórmula Xmin= Valor Mínimo = MIN (celda) Xmax= Valor Máximo = MAX( celda) Rango = Max – Min C = R/K Intervalos f = Frecuencia (datos; grupos) B2:H8 Todos los datos = Frecuencia (B2:H8; D22:D28) D22:D28 La columna de datos del límite superior
  • 13. PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS ESTADÍSTICOS Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, se emplean para tener una representación visual de la totalidad de la información. Los gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmente los hechos esenciales y compararlos con otros. TIPOS DE GRÁFICOS Gráficos de barras verticales Representan valores usando trazos verticales, aislados o separados unos de otros, según la variable a graficar sea discreta o continua. Pueden usarse para comparar y representar: una serie; dos o mas series Gráficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categoría son muy extensos. Pueden usarse para una serie, dos o más series.
  • 14. Gráficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos que componen un total. Las barras pueden ser: Verticales u Horizontales Gráficos de líneas En este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre sí. Estos gráficos se utilizan para representar valores con grandes incrementos entre sí. Se pueden usar para representar una serie, dos o más series. Gráficos circulares Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, según lo que se desee destacar. Pueden ser: En dos dimensiones o tres dimensiones Gráficos de Áreas En estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un período de tiempo. Pueden ser para representar una, dos o más series; en dos dimensiones o en tres dimensiones.
  • 15. PRACTICA CALIFICADA Nº 02 USANDO EL PAQUETE O SOFTWARE RESPECTIVO, RESOLVER LOS SIGUIENTES EJERCICIOS 1. ¿Qué es frecuencia absoluta? 2. Cómo se obtiene: 2.1 ¿La frecuencia acumulada? 2.2 ¿La frecuencia relativa? 2.3 ¿La frecuencia relativa acumulada 3. En una distribución de frecuencias ¿se pueden establecer conclusiones porcentuales, utilizando solamente la frecuencia relativa? ¿Por qué? 4. ¿Por qué se recurre al agrupamiento en distribuciones de frecuencias por intervalos? 5. ¿Cómo se determina el número de intervalos y la amplitud de ellos? 6. ¿Qué es una marca de clase? 7. La siguiente tabla relaciona las ausencias al trabajo de 50 obreros, durante el mes de octubre, en la fábrica de confecciones "La Unión". 1 0 2 1 3 1 4 3 2 5 3 2 4 2 0 3 1 2 0 2 1 1 0 1 0 0 1 2 1 3 4 0 2 3 2 0 0 2 5 2 2 4 2 1 3 1 2 1 0 2 7.1 Construir una distribución de frecuencias simple. 7.2 Sacar 3 conclusiones. 8. Años de experiencia de las 50 operarias de agro exportadora “La Calidad” Ordenar la Información y responder: 8.1 ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6 años? 8.2 ¿Qué porcentaje tiene experiencia entre 5 y 7 años (incluyendo los extremos)?
  • 16. 9. Peso de los sacos de ají páprika que fueron cosechados en los primeros 50 días de producción de la empresa Exporta SAC Construir una distribución de frecuencias y resaltar 3 conclusiones 10. Consumo de agua, en m3de 184 familias n un barrio residencial de una ciudad durante el mes de octubre: Construir una distribución de frecuencias por intervalos. Comparar las distribuciones con intervalos y sin intervalos; y las conclusiones que de ellas se deriven.
  • 17. Semana 3 MÉTODOS ESTADÍSTICOS EN LA INVESTIGACION Y RECOLECCIÓN DE LA INFORMACIÓN El método estadístico, parte de la observación de un fenómeno, y como no puede siempre mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que actúen libremente, pero se registran las diferentes observaciones y se analizan sus variaciones. Para el planeamiento de una investigación, por norma general, se siguen las siguientes etapas: 1. PLANTEAMIENTO DEL PROBLEMA Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y consultar los resultados obtenidos por investigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y teórica del problema. 2. FIJACIÓN DE LOS OBJETIVOS Luego de tener claro lo que se pretende investigar, debemos presupuestar hasta dónde queremos llegar; en otras palabras, debemos fijar cuáles son nuestras metas y objetivos. Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y debe, además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre los objetivos generales y los específicos. 3. FORMULACIÓN DE LAS HIPÓTESIS Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y su formulación depende del conocimiento que el investigador posea sobre la población investigada. Una hipótesis estadística debe ser susceptible de demostrar, esto es, debe poderse probar para su aceptación o rechazo. Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.), con el propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su hipótesis contraria se le llama Hipótesis Alternativa (H1). 4. DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DE MEDIDA La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin de cuentas, es a ellas a las que se les hará la medición. La unidad de observación puede estar constituida por uno o varios individuos u objetos y denominarse respectivamente simple o compleja. El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el equipo de investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qué unidad se tomarán las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.
  • 18. Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales se ha de efectuar la toma de la información. 5. DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRA Estadísticamente, la población se define como un conjunto de individuos o de objetos que poseen una o varias características comunes. No se refiere esta definición únicamente a los seres vivientes; una población puede estar constituida por los habitantes de un país o por los peces de un estanque, así como por los establecimientos comerciales de un barrio o las unidades de vivienda de una ciudad. Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro de un estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser considerado como infinito. Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar las propiedades del conjunto del cual es obtenida. En la práctica, estudiar todos y cada uno de los elementos que conforman la población no es aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos, porque a veces es necesario destruir lo que se está midiendo, por ser demasiado grande el número de sus componentes o no se pueden controlar; por eso se recurre al análisis de los elementos de una muestra con el fin de hacer inferencias respecto al total de la población. Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementos que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra debe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividad de la investigación. 6. LA RECOLECCIÓN Una de las etapas más importantes de la investigación es la recolección de la información, la cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o varias muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de la muestra que conduzca a una estimación de los parámetros con la precisión establecida. El establecimiento de las fuentes y cauces de información, así como la cantidad y complejidad de las preguntas, de acuerdo con los objetivos de la investigación son decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el grado de desarrollo, la ausencia de técnica, etc. Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede conseguir; es determinar si la encuesta se debe aplicar por teléfono, por correo, o si se necesitan agentes directos que recojan la información; establecer su número óptimo y preparar su entrenamiento adecuado. 7. CRITICA, CLASIFICACIÓN Y ORDENACIÓN Después de haber reunido toda la información pertinente, se necesita la depuración de los datos recogidos. Para hacer la crítica de una información, es fundamental el conocimiento de la población por parte de quien depura para poder detectar falsedades en las respuestas, incomprensión a las
  • 19. preguntas, respuestas al margen, amén de todas las posibles causas de nulidad de una pregunta o nulidad de todo un cuestionario. Separado el material de "desecho" con la información depurada se procede a establecer las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulación de las diferentes variables que intervienen en la investigación. El avance tecnológico y la popularización de los computadores hacen que estas tareas, manualmente dispendiosas, puedan ser realizadas en corto tiempo. 8. LA TABULACIÓN Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener por lo menos: Un titulo adecuado el cual debe ser claro y conciso. La Tabla propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes ítems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales de la tabla, u otorguen los créditos a la fuente de la información. 9. LA PRESENTACIÓN Una información estadística adquiere más claridad cuando se presenta en la forma adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficos redundantes que, antes que claridad, crean confusión. Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse no sólo en función de las variables que relaciona, sino del lector a quien va dirigido el informe. 10. EL ANÁLISIS La técnica estadística ofrece métodos y procedimientos objetivos que convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en la toma de una decisión. Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los parámetros y estadísticos muestrales para las estimaciones e inferencias respecto a la población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de establecer y redactar las conclusiones definitivas. 11. PUBLICACIÓN Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del mismo problema a quienes se les puede aportar información, conocimientos y otros puntos de vista acerca de él.
  • 20. MÉTODOS DE RECOLECCIÓN DE DATOS PARA UNA INVESTIGACIÓN En una investigación científica se procede básicamente por observación, por encuestas o entrevistas a los sujetos de estudio y por experimentación. FUENTES DE INFORMACIÓN Unidades Estadísticas: Elementos componentes de la población estudiada. Ejemplo: personal de una empresa, habitantes del distrito de Oyotún, etc. La población en una investigación debe ser definida con precisión.
  • 21. FUENTES DE INFORMACIÓN PRIMARIAS SECUNDARIAS Los datos provienen Los datos parten de datos pre- directamente de la población elaborados, ejemplo: anuarios o muestra de la población estadísticos, de Internet, de medios de comunicación. Se subdividen Observación Directa: Deben ser analizadas bajo 4 preguntas básicas que son: en: Cuando el investigador toma • ¿Es pertinente? cuando la información se adapta a los directamente los datos de la población. objetivos Ejm: un científico realiza un experimento. • ¿Es obsoleta? cuando ha perdido actualidad • ¿Es Fidedigna cuando la veracidad de la fuente de Observación Indirecta: origen no es cuestionada Cuando los datos no son obtenidos • y ¿Es digna de Confianza? si la información ha sido directamente por el investigador. obtenida con la metodología adecuada y honestidad Usa un cuestionario u otro medio necesaria, con objetividad, naturaleza continuada y para obtener los datos. exactitud Debe realizar una encuesta
  • 22. Encuesta: Constituye el término medio entre la observación y la experimentación. En ella se pueden registrar situaciones que pueden ser observadas y en ausencia de poder recrear un experimento se cuestiona a la persona participante sobre ello. La encuesta es un método descriptivo con el que se pueden detectar ideas, necesidades, preferencias, hábitos de uso, etc.
  • 23.
  • 24. Codificación. Una vez cumplimentados los cuestionarios, viene la fase de recuento de las respuestas. Cuando estas son numéricas no hay ninguna dificultad, pero cuando las preguntas han tenido una contestación no numérica, es preciso traducir estas respuestas a números. Esto se conoce con el nombre de codificación.
  • 25. Por ejemplo: ¿Como ves el estado actual del Instituto? Muy Bien …………….. 5 Bien …………….. 4 Regular …………….. 3 Mal …………….. 2 Muy Mal …………….. 1 No sabe/No contesta …………….. 0
  • 26. EJEMPLO DE CUESTIONARIO
  • 27. REPASO: En el siguiente blog www.ingenieriainvestigacazasi.blogspot.com encontrará información adicional sobre los temas descritos, tales como:  Ficha Técnica-Encuesta INEI 2007  Modelo de Encuesta – INEI  Caso – Preferencia por Leche Envasada  Encuesta Servicio PLAZA VEA  Estadística en la Investigación Científica  Resultado Encuesta (Modelo Computacional) Se solicita organizarse en grupos y presentar el resultado de un cuestionario aplicado a determinada población sobre un tema libre.
  • 28. Semana 4 MEDIDAS DE TENDENCIA CENTRAL Las medidas de tendencia central, llamadas así porque tienden a localizarse en el centro de la información, son de gran importancia en el manejo de las técnicas estadísticas, sin embargo, su interpretación no debe hacerse aisladamente de las medidas de dispersión, ya que la representatividad de ellas está asociada con el grado de concentración de la información. Las principales medidas de tendencia central son: 1. MEDIA ARITMETICA: Se conoce comúnmente como promedio. La media aritmética se calcula como la suma de todos los valores que toma la característica en estudio dividida por el número total de unidades experimentales observadas. En símbolos: Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. _ x = 21+32+15+59+60+61+64+60+71+80 = 52.3 años 10 Interpretación: La edad media de estos pacientes es de: 52.3 años  Si se trata de datos agrupados se utiliza para variables discretas: Donde: Xi = valores que toma la variable, fi = Frecuencia absoluta, n = total de datos Ejemplo:
  • 29. Un investigador social está interesado en conocer el número promedio de hijos en una muestra de 10 familias entrevistadas para una encuesta en particular. Luego de efectuar el trabajo de recolección de datos, el listado de las familias con su correspondiente número de hijos se formó la siguiente tabla: Familia No Número de Hijos 1 2 2 4 3 4 4 3 5 4 6 3 7 3 8 3 9 6 10 3 Con esta información se construye la tabla de frecuencias de la siguiente manera: Número de Hijos (Xj) Frecuencia (fj) Xjfj 2 1 2 3 5 15 4 3 12 6 1 6 Total 10 35 _ Luego: x = 35 = 3.5 10 Interpretación: La familia promedio proporcionada por la encuesta es aquella que presenta entre 3 y 4 hijos; el valor 3,5 es el resultado matemático del cálculo de la media aritmética pero no es un valor posible de la variable por su propia definición.  En el caso de datos numéricos continuos agrupados en intervalos de clase, el cálculo de la media aritmética es similar al caso anterior, es decir : _ Y = ∑Yi fi n Cuando se agrupan datos continuos en intervalos de clase, se pierde la información original. Luego, para solucionar este problema, Yi se calcula como el promedio entre los extremos de cada intervalo, es decir Yi representa el punto medio del intervalo de clase. Ejemplo: Calcular la media aritmética de la longitud de 100 tornillos fabricados por una máquina.(Tabla 1)
  • 30. Luego: _ Y = ∑Yi fi = 1014,0 = 10,14 mm N 100 Interpretación : En promedio el proceso productivo fabrica tornillos de 10,14 mm de longitud 2. MEDIANA: (Md o Me) Es el valor que ocupa la posición central de un conjunto de observaciones ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores. A continuación se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios: • Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado. • Si n (tamaño de la muestra) es impar, entonces, la mediana coincide con el valor medio, el cual corresponde al dato Xn/2. • Si n (tamaño de la muestra) es par, no existe un solo valor medio, si no que existen dos valores medios, en tal caso, la mediana es el promedio de esos valores, es decir, los sumamos y luego los dividimos por dos. La Mediana para datos no agrupados Ejemplo 1: Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 correspondientes al número de hijos de 15 empleados de una empresa. Para la obtención de la mediana se deberán de ordenar. Tomemos el criterio de orden ascendente con lo que, tendremos: 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4
  • 31. Por otro lado el número de datos n = 15, siendo el número de datos impar se elige el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1. 0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4 Mediana Interpretación: El número mediano de hijos para estos empleados es 1. Ejemplo 2: Las calderas de una planta de energía de vapor a alta presión tuvieron las siguientes eficiencias en porcentajes: 90,3 - 91,6 - 90,9 - 90,4 - 90,3 - 91,0 - 87,9 - 89,4 El tamaño de la muestra, n=8, número par. Luego los ordenamos y la mediana es la semisuma de los valores centrales o sea el promedio de esos valores. 87,9 - 89,4 - 90,3 - 90,3 - 90,4 - 90,9 - 91,0 - 91,6 Mediana = 90,3 + 90,4 = 90,35 2 Interpretación: El número mediano de eficiencia en porcentaje de las calderas de una planta de energía es de 90,35 % aunque el mismo no sea un valor posible de la variable.  Hallar la mediana de los siguientes datos: 7,10,15,13,10,12 La Mediana para datos agrupados Si tenemos datos agrupados en tablas simples de frecuencia, procedemos de la siguiente manera: • Calculamos el orden que ocupa la Mediana, lo llamaremos orden de la mediana, cuya fórmula es: Orden = n (este valor lo observamos en la frecuencia acumulada) 2 Ejemplo 1: Supongamos que el gerente de personal de una empresa obtuvo los siguientes datos, correspondientes al número de días que 19 de sus empleados faltan por enfermedad en un año. Luego: Orden = 19 = 9.5 (está contenido en Fj = 10) 2 Los datos se presentan en la siguiente tabla:
  • 32. La mediana es 8 Interpretación: El 50 % de los 19 empleados faltan menos de 8 días y el 50% restante más de 8 días. Ejemplo 2: Supongamos que la siguiente tabla corresponde a la vida útil en horas de 100 válvulas Orden = 100 + 1 = 101 = 50,5 2 2 Esto nos indica que la mediana se encuentra entre el lugar 50 y el lugar 51. Pero, qué valores ocupan esos lugares? Por lo explicado anteriormente, desde el lugar 38 y hasta el lugar 57, hay valores 39. Luego el valor número 50 y el valor número 51 son 39. Entonces: Mediana = 39 + 39 = 39 2  Si los datos están agrupados en intervalo de clase, veamos cómo se calcula la mediana Ejemplo: Tenemos los siguientes datos agrupados en una Tabla de Frecuencia que representan los montos de 40 préstamos personales, en dólares, en una compañía financiera de consumidores. (Tabla Nº 4)
  • 33. En este caso se emplea la siguiente fórmula: Dónde: Li = Límite Inferior del intervalo que contiene a la Mediana Fi-1 = Frecuencia Acumulada en la clase anterior i-ésima fi = Frecuencia en la clase que contiene a la mediana Hi-1 = Frecuencia Relativa Acumulada en la clase anterior i-ésima hi = Frecuencia Relativa en la clase que contiene a la mediana c =Tamaño del intervalo de clase. Mediana = 930.64 3. MODA: (Mo) La moda es el valor que aparece con mayor frecuencia, es decir, el que ocurre más frecuentemente. Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene más de un dato repetido se dice que es multimodal y un último caso es cuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal. Moda para datos no agrupados Si tenemos datos sin agrupar, la encontramos fácilmente observando cuál es el valor que más se repite. Ejemplos: 1.- Determinar la moda del siguiente conjunto de datos: a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3 Respuesta: La moda de este conjunto de datos es igual a 3 y si considera unimodal. b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3 Respuesta: Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por lo que la muestra es bimodal c).- 1, 2, 3, 4, 5, 6, 7, 8, 9 Respuesta: La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.
  • 34. Moda para datos agrupados  En datos agrupados en tablas simples de frecuencias, nos fijamos que valor corresponde a la mayor frecuencia absoluta. En la siguiente tabla En este ejemplo, la mayor frecuencia absoluta es 4, que corresponde al valor 10. Luego la Moda es 10. Interpretación: La cantidad de días más frecuente que los empleados faltan por enfermedad es 10.  En datos agrupados en intervalos de clases, existen varios métodos para calcular la Moda. Cada método puede darnos un valor diferente, pero aproximado, para un mismo conjunto de datos. Se puede hallar de la siguiente manera: Donde: Li= extremo inferior de la clase modal d1= (fi – fi-1), d2 = ( fi – fi+1) Ejemplo: Hallar la moda de la tabla Nº 4 Solución: Mo = 685 Interpretación: El monto de préstamos personales en dólares más frecuente otorgados por una compañía financiera de consumidores es de 685 dólares.
  • 35. MEDIDAS DE POSICIÓN NO CENTRALES. CUARTILES Los cuarteles de una distribución, como si nombre lo indica, son valores de la variable que dividen al conjunto de datos (ordenados de menor a mayor) en cuatro subconjuntos que contienen la misma cantidad de datos. Para calcular los cuartiles de una distribución de frecuencias se procede del mismo modo que en el caso de la mediana, salvo que ahora dividiremos a la distribución de la variable en cuatro partes iguales en lugar de dos. A partir de esta definición es evidente que la mediana coincide con el segundo cuartil. Los cuarteles se simbolizan con la letra Q. Ejemplo: Supongamos que un veterinario ha registrado los pesos de 8 pollos de seis semanas de vida y ordenó de menor a mayor, obteniendo: 150 - 151 - 152 - 154 - 155 - 156 - 157 - 159 gramos. La mediana de este conjunto de datos estará posicionada entre el 4º y 5º valor de la serie, siendo: Mediana = Q2 = 154,5 gramos El primer cuartel Q1, debe dividir a la primera mitad de la serie en dos partes iguales, por lo cual Q1 se ubicará entre el 2º y el 3º valor de la serie. Luego: Q1 = 151,5 gramos Del mismo modo Q3, el tercer cuartel, divide a la segunda mitad de la serie en dos partes iguales. Es decir: Q3 = 156,5 gramos Interpretación: Si Q1 = 151,5 gramos significa que el 25 % de los pollos tendrán un peso inferior a 151,5 gramos y el 75 % un peso superior a ese valor. Si Q2 = 154,5 gramos significa que el 50 % de los pollos tendrán un peso inferior a 154,5 gramos y el 50% restante superior a ese peso. Si Q3 = 156,5 gramos significa que el 75 % de los pollos tendrán un peso inferior a 156,5 y un 25% será superior a ese peso.
  • 36. * Cuando se trata de cuartiles para datos agrupados continuos, se aplica la fórmula de interpolación: Dónde: n/4: es el número total de observaciones dividido por 4 Fj-1 : es el mayor de las frecuencias acumuladas que no supera a n/4 Fj : es la frecuencia acumulada que le sigue a Fj-1 Xj-1 : es el extremo inferior del intervalo que tiene como frecuencia acumulada F. c ó h : amplitud de dicho intervalo Para la tabla No 1 (longitud de los tornillos), calcular Q1 y Q3. Respuestas: Q1= 8,36 mm Q3= 11,57mm Interpretación: Q1= Este valor indica que el 25% de los tornillos miden menos de 8,36 mm mientras que el 75% restante mide más de 8,36mm Q3 = Este valor indica que el 75% de los tornillos miden menos de 11,57 mm mientras que el 25% restante mide más de 11,57mm. PERCENTILES: Los percentiles de una distribución, como su nombre lo indica, son valores de la variable, que dividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales. Los percentiles tienen el mismo significado y la misma forma de cálculo que los cuartiles. Así, cuando se habla del percentil 15 se quiere expresar que es el valor de la variable que deja el 15% de los datos a su izquierda y el 85 % de los mismos a su derecha o lo que es lo mismo decir que es el valor de la variable que deja al 15 % de los datos por debajo de él y el 85% por encima. Se puede emplear la siguiente fórmula: Li = Límite Inferior del intervalo que contiene al Percentil Fi-1 = Frecuencia Acumulada en la clase anterior k-ésima fi = Frecuencia en la clase que contiene al Percentil c =Tamaño del intervalo de clase. k = 1%, 2%, 3%, ... , 97%, 98%, 99% Percentiles
  • 37. Práctica Calificada Nº 04 1. ¿Qué es una medida de tendencia central? 2. ¿Cuáles son las principales medidas de tendencia central? 3. Defina: media aritmética mediana y moda. 4. ¿Cuándo se utiliza la media aritmética ponderada? 5. Enuncie las propiedades de la media aritmética 6. Para cada información de los ejercicios del capítulo 3, calcular e interpretar la media aritmética, la mediana y la moda. 7. Elaborar la tabla de frecuencia y determinar las medidas de tendencia central 8. Los siguientes datos representan las temperaturas observadas al proceso de fermentación en un día cualquiera de producción de cerveza “ALE”. Determine utilizando intervalos: la media, mediana y moda a la siguiente tabla de frecuencia: 25 33 27 20 14 21 33 29 25 17 31 18 16 29 33 22 23 17 21 26 13 20 27 37 26 19 25 24 25 20 25 29 33 17 22 25 31 27 21 14 24 7 23 15 21 24 18 25 23 24 9. Los estadísticos del programa de “Comida Sobre Ruedas”, el cual lleva comidas calientes a enfermos confinados en casa, desean evaluar sus servicios. El número de comidas diarias que suministran aparece en la siguiente tabla de frecuencia. Calcular la media, mediana y la moda. Número de Número de comidas por día días 0-5 3 5 - 10 6 10 - 15 5 15 - 20 8 20 - 25 2 25 - 30 3
  • 38. 10. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadas aparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la mediana y la moda. Además, calcule e interprete: Q1 y P15. Edades Frecuencias 50 y menos de 55 8 55 y menos de 60 13 60 y menos de 65 15 65 y menos de 70 10 70 y menos de 75 3 75 y menos de 80 1 11. Una granja ganadera registró durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer (en kilogramos) fue el siguiente: 22,31,33,34,35,36,37,38,38,39,40,40,40,41,41,42,42,42,42,42,43,43,44,45,46,46,46,46,50 12. Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvieron en la siguiente tabla resultante. Calcular la el promedio y la mediana para datos agrupados y no agrupados; y comparar resultados 13. Ingresando a la biblioteca Digital E-libro , de la USS, busquen en el libro: Título Estadística Autor: Colegio24hs Editorial: Colegio24hs Publicado: 2004 Y desarrollen los ejercicios 1 al 5, de la página 47 a la 49 según corresponda a encontrar la media aritmética, la mediana, y la moda.
  • 39. Semana 5 MEDIDAS DE DISPERSIÓN Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de un número la tendencia de los datos a dispersarse respecto al valor central o media. Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Las medidas de dispersión más usuales son: 1. RANGO ESTADÍSTICO, AMPLITUD Ó RECORRIDO. Es la medida de variabilidad más fácil de calcular. Es la diferencia entre el valor mínimo y el valor máximo en un grupo de números. Para averiguar el rango de un grupo de números:  Ordenamos los números según su tamaño  Restamos el valor mínimo del valor máximo R= Xmáx. - Xmín. Ejemplo: a. Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en un rango de: Rango = 100 – 1 = 99 b. Hallar el rango de los conjuntos: x= 12, 6, 7, 3, 15, 10, 18, 5 y= 9, 3, 8, 8, 9, 8, 9, 18 En ambos casos, rango: 18 – 3 = 15; sin embargo si ordenamos se ven como sigue: x = 3, 5, 6, 7, 10, 12, 15, 18 y = 3, 8, 8, 8, 9, 9, 9, 18 hay mucha más dispersión en “x” que en “y”, por lo que “y” consiste esencialmente en ochos y nueves, pero en este caso el rango no indica diferencia entre ambos conjuntos, no es una buena medida de la dispersión. Cuando hay valores muy extremos, el rango es una pobre medida de la dispersión.
  • 40. 2. LA VARIANZA. (S2 ó δ2) Es una variable estadística que mide la dispersión de los valores respecto a un valor central (media). Específicamente, la varianza es una medida de que tan cerca o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su media menos es la varianza. La Varianza es el cuadrado de la desviación estándar  Para datos no agrupados  Para datos agrupados La variancia de los valores: (x1 x2 … xk) que ocurren con las frecuencias (f1 f2 … fk) es:
  • 41. 3. DESVIACION ESTANDAR (S ó δ) . (ó DESVIACIÓN TIPICA) La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, la desviación estándar, que se halla como la raíz cuadrada de la varianza. La desviación estándar o desviación típica nos informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos. Desviación Estándar: S = √S2 ó δ = √ δ2 (Es la raíz cuadrada de la varianza) Propiedades de la Desviación Estándar A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza): 1. La desviación estándar es siempre un valor no negativo S 2. Es la medida de dispersión óptima por ser la más pequeña. 3. La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable 4. Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía. 5. Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar queda multiplicada por el valor absoluto de dicha constante. Para el ejemplo anterior, la desviación estándar es 1.293 soles.
  • 42. 4. COEFICIENTE DE VARIABILIDAD Es una medida de variabilidad de los datos que se expresa en porcentaje, en la cual se compara la desviación estándar con el respectivo valor del promedio de los datos, se expresa en porcentaje:
  • 43. Practica Calificada Nº 05 1. ¿Cuál es la utilidad de las medidas de dispersión? 2. ¿Cuáles son las principales medidas de dispersión? 3. ¿Cuál es la medida adecuada para comparar la dispersión entre varias variables que posean diferente magnitud o diferente unidad de medida? 4. Para cada una de las informaciones de las unidades 2 y 4 de las sesiones anteriores, calcular e interpretar: 4.1 Rango 4.2 Desviación media 4.3 Desviación Estandar 4.4 Coeficiente de variabilidad 5. La tabla de frecuencias exhibe las edades de una muestra de 36 personas que asistieron a una película: Años f 8-13 2 14-19 7 20-25 13 26-31 5 32-37 9 Hallar: a. La media b. La varianza c. La desviación 6. La siguiente tabla muestra los coeficientes de inteligencia de 480 niños de una escuela elemental C.I. 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126 fi 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2 Calcula: a) El C.I. promedio de los niños estudiados b) Su desviación. 7. El entrenador de un equipo de baloncesto duda entre seleccionar a Elena o María. Los puntos conseguidos por cada una, en una semana de entrenamiento fueron: Elena 18 23 22 24 19 25 16 María 18 26 18 28 22 17 18 a. ¿Cuál de las dos tiene mejor media? b. Calcula la desviación típica. ¿Cuál de las dos es más regular? c. Si tú fueras el entrenador, a quién seleccionarías?
  • 44. Semana 6 INTRODUCCIÓN A LAS PROBABILIDADES “Los planes corresponden al hombre, las probabilidades a Dios.” Proverbio chino 1. EXPERIMENTO ALEATORIO: Es cualquier hecho o fenómeno cuyo resultado no puede predecirse antes de que suceda. Ejemplo: - Rendir un examen y observar su resultado - Tirar una moneda y observar cual de las caras queda hacia arriba - El lanzamiento de 2 dados paralelamente y observar el puntaje obtenido - Elegir un cliente del restaurante y preguntar su opinión sobre el servicio recibido. 2. ESPACIO MUESTRAL: Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa comúnmente con la letra S. Ejemplos: * En el experimento aleatorio de lanzar una moneda 3 veces El espacio muestral es un conjunto formado por 8 elementos:
  • 45. * En el experimento aleatorio de lanzar un par de dados, el espacio muestral es: 3. EVENTO O SUCESO: Es un subconjunto de elementos que pertenecen al espacio muestral y que cumple una característica determinada. Ejemplos: * Del espacio muestral, lanzamiento de un dado; el evento A= puntaje obtenido es mayor de 3 A= [4,5,6] * Al lanzar una moneda 3 veces, el evento de obtener por lo menos dos caras es: E = [(C,C,C), (C,C,S), (C,S,C), (S,C,C)] ; tiene 4 elementos * Al lanzar un par de dados, el evento “la suma es igual a 7” será: 4. PROBABILIDAD Es una medida que expresa la “tasa de ocurrencia de un evento a largo plazo”. El valor de esta medida está comprendido entre [0 y 1]. La probabilidad de que ocurra un evento A se define como el valor que corresponde al número de casos “favorables” entre el número de casos “posibles”: Ejemplos:  Si se lanza un dado, cual es la probabilidad de obtener un puntaje impar. Rpta. 0.5  De un juego de 52 naipes se extrae una carta al azar (aleatoria), cuál es la probabilidad de obtener un puntaje mayor de 9. Rpta. 0.3077  Si se lanza un dado 2 veces cuál es la probabilidad de que: - Se obtenga un puntaje igual a 8 - Se obtenga un puntaje <= a 4 - Se obtenga un puntaje < a 5 pero >= a 2
  • 46. OPERACIONES CON PROBABILIDADES 1. Eventos Mutuamente Excluyentes Dos eventos son mutuamente excluyentes cuando “no pueden ocurrir los dos al mismo tiempo”, es decir la ocurrencia de uno de ellos impide automáticamente la ocurrencia del otro. Por tanto, si 2 eventos son mutuamente excluyentes no habrá intersección entre ellos. Si el evento A y el evento B son excluyentes: A∩B = 0, Luego P(A∩) = 0 Ejemplo: Los clientes de una agencia de turismo se clasifican según nacionalidad y edad: ¿Cuál es la probabilidad de elegir un cliente joven o adulto? P(J U A) = P(J) + P(A) = 130 + 40 = 170 = 0.85 200 200 200 2. Intersección de Eventos: En el ejemplo anterior, calcular la probabilidad de que un cliente elegido sea Joven o Extranjero: P(J U E) = P(J) + P(E) – P(J∩E) = 130 + 80 - 30 = 180 = 0.9 200 200 200 200 Si A y B son no excluyentes: P(A U B) = P(A) + P(B) – P(A∩B) “o” = unión “y” = intersección Ejemplos: 1. De la urna que tienes a la derecha, sacamos una bola a azar y anotamos su número a) Describe el espacio muestral. ¿Cuántos casos tiene? b) Describe los siguientes sucesos: Bola Roja = A; Bola Verde = B; Bola Azul = C; Bola Roja con número impar = D; Bola con número par = F c) Calcula la probabilidad de cada uno de los sucesos anteriores 2. ¿Cuál es el espacio muestral correspondiente al lanzamiento de una moneda? ¿Cuál es la probabilidad de cada una de las dos caras? 3. Si se lanza un dado, cuál es la probabilidad de obtener un puntaje impar
  • 47. 4. Al extraerse una carta de un juego de 52 naipes, cual es la probabilidad de que ésta sea de color rojo o tenga un puntaje menor de 5. 5. En una encuesta aplicada a 50 estudiantes secundarios, 22 alumnos manifestaron inclinación por la Química, 28 por Estadística y 10 alumnos por ambos cursos. Si se selecciona al azar a uno de estos alumnos: a) ¿Cuál es la probabilidad de que les guste Química o Estadística? b) ¿De qué se incline por Química y Estadística? c) ¿Qué no le guste ninguno de los 2 cursos? 6. En un salón de clase hay 15 alumnos y 24 alumnas, la tercera parte de los hombres y la mitad de mujeres son de Chiclayo. Hallar la P[ ] de que sea alumno ó sea de Chiclayo; y de que sea alumna y que haya nacido fuera de Trujillo. TÉCNICAS DE CONTEO Repaso de Factoriales n! = 1x2x3x4x……xn 0! = 1 1! = 1 PERMUTACIÓN “Pn” Una permutación es un conjunto de arreglos diferentes de n en n elementos de un total de n Se lee: Pn = permutación de n elementos. Fórmula: Pn = n! Ejemplo: 1. De cuántas formas diferentes se pueden sentar 3 personas ABC en 3 asientos consecutivos: [ ABC, ACB, BAC, BCA, CAB, CBA ] P3 = 3! = 6 2. Cuántas juntas directivas diferentes se podrían formar con las personas ABC y D, si dicha junta tiene los cargos de Presidente, Vicepresidente, Secretario y Tesorero. P4 = 4! = 24 juntas m COMBINACIÓN C = m! n (m-n)! n! Se lee: “combinación de n en n elementos de un total de m” Son arreglos diferentes de n en n elementos de un total de m, en los cuales no interesa el orden en que se presentan. Ejm. Se desea elegir un comité de 3 personas entre 8 candidatos, cuantos comités diferentes pueden formarse:
  • 48. 8 C3= 8! = 8! 56 formas diferentes (8-3)! 3! 5! 3! m VARIACIÓN V = m!__ n (m-n)! Se lee: “Variación de n en n elementos de un total de m”. Sí interesa el orden de los elementos. Ejm. Se desea formar una junta directiva con los cargos de presidente, secretario y tesorero. Si hay 8 candidatos, cuantas juntas directivas diferentes se podría formar: 8! = 8! = 8x7x6x5! = 336 formas diferentes (8-3)! 5! 5! Ejemplos para el Aula: 1. Si un conjunto A tiene 5 elementos. ¿Cuántas duplas se pueden formar con los elementos de A?. 2. En el concurso de belleza de Miss Universo, se suelen elegir primero 15 semifinalistas, luego se eligen 5 finalistas. ¿De cuántas formas diferentes se pueden ocupar las 5 primeras posiciones entre las 15 semifinalistas? 3. La junta directiva de la compañía ABC consta de 15 miembros. ¿De cuántas formas se puede elegir presidente, vicepresidente y secretario? 4. ¿Cuántos equipos de basquet de cinco hombres se pueden formar de una escuadra de 12 hombres si no tienen en cuenta las posiciones de juego? 5. En una clase de estadística hay 30 estudiantes 24 hombres y 6 mujeres. ¿De cuántas formas distintas se puede construir un comité de cuatro estudiantes? ¿De cuántas formas distintas se puede construir un comité de cuatro estudiantes si dos deben ser mujeres?
  • 49. Practica Calificada N° 06 ACTIVIDAD Nº 1 A continuación se describen varias situaciones. Contesta la pregunta, en cada caso, razonando las respuestas: a) En una clase de 30 alumnos, 12 chicos y 18 chicas, cada uno escribe su nombre en una papeleta y la introduce en una caja. ¿Qué es más probable que aparezca el nombre de una chica o de un chico? b) Se lanza un dado cúbico con las caras numeradas del 1 al 6. ¿Qué es más probable que salga el 5 o el 1? c) Si lanzas una ficha cuyas caras son verde y rojo ¿qué color esperas que salga? ACTIVIDAD Nº 2 Indica el espacio muestral de los siguientes sucesos: a) Obtener par, al lanzar un dado cúbico con las caras numeradas del 1 al 6. b) Lanzamos dos monedas al aire. c) Obtener impar al lanzar un dado cúbico. ACTIVIDAD Nº 3 En cada uno de los siguientes experimentos aleatorios, diga cuál es la probabilidad de que ocurra el suceso que se indica: a) CESTA I CESTA II b) BOLSA I BOLSA II Se extrae una pieza de fruta Se extrae una bola Suceso: OBTENER UNA PERA Suceso: OBTENER UNA BOLA VERDE ACTIVIDAD Nº 4 Resolver: 1. Hallar la probabilidad de sacar por suma 4 o 11 al lanzar dos dados. 2. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Se extrae una al azar, calcular la probabilidad de que: Sea roja. Sea verde. Sea amarilla. 3. Se extrae aleatoriamente una baraja de un juego de 52 cartas. ¿Cuál es la probabilidad de que la carta seleccionada? a) Sea un “as” b) Sea una carta negra ó un número menor de 5 c) Sea número 8 y de color rojo 4. De 100 personas que fueron consultadas sobre sus preferencias a la hora de realizar un deporte, 50 practicaban fútbol, 40 practicaban baloncesto y 30 practicaban ciclismo. Además, 25 personas practicaban futbol y baloncesto, 15 practicaban fútbol y ciclismo, y 12 practicaban baloncesto y ciclismo. Por último, tan sólo 5 personas practicaban los tres deportes. El resto no sabe o no contesta. a) Representa el diagrama de Venn correspondiente. b) Calcula las siguientes probabilidades: P(practicar fútbol), P(practicar fútbol y baloncesto), P(practicar sólo ciclismo), P(practicar los tres deportes), P(practicar alguno de los tres deportes), P(no practicar ninguno de los tres deportes.
  • 50. Permutaciones, Combinaciones, Variaciones 1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano, de modo que no estén en el mismo dedo? 2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos obtener? 3. Con los números 1,2,3,4,5 y 6: 3.1 ¿Cuántos números distintos de siete cifras podríamos formar? 3.2 ¿Podremos numerar a los 3224564 habitantes de una ciudad con esos números? 4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es el número de casos posibles? 5. ¿Cuántos números de seis cifras existen que estén formados por cuatro números dos y por dos números tres? 6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar. Engarzando las 25 bolitas en un hilo, ¿cuántos collares distintos podrá realizar? 7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras de la palabra educación? ¿y con la palabra vacaciones? 8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan una fiesta, acuerdan que dos de ellos se encargarán de comprar la comida y las bebidas ¿De cuántas formas posibles puede estar compuesta la pareja encargada de dicha misión? 9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata, fresa y cola) y quiere hacer helados de dos sabores ¿Cuántos tipos de helado podrán fabricar? 10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si se han dado en total 21 besos, ¿cuántas personas había? 11. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras pueden adjudicarse las medallas de oro, plata, bronce? 12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente, secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos?
  • 51. Semana 7 PROBABILIDADES CONDICIONALES Hasta ahora se ha estudiado la probabilidad absoluta de un evento, es decir sin relacionarlo uno con otro. Sin embargo pudiera ser de interés calcular la probabilidad de que ocurra un evento de cierto espacio muestral “S” a la luz de que otro evento de ese mismo espacio “S” ocurra. Sean A y B dos eventos de un mismo espacio muestral S. La probabilidad condicional de A, dado que ha ocurrido B (o viceversa), está dado por: P[ A/B ] = “ probabilidad de que ocurra A habiendo sucedido B” P[ A/B ] = P[A∩B] = n (A∩B) P[B] n(B) P[B/A] = “probabilidad de que ocurra B habiendo sucedido A” P[ B/A ] = P[B∩A] = n (B∩A) P[A] n(A) Ejemplos: 1. En una empresa el 50% de trabajadores trabaja por la mañana, el 30% lo hace por las tardes y el 20% tanto en la mañana como por la tarde; si se escoge aleatoriamente a un trabajador cualquiera: a) Cual es la probabilidad de que trabaje en la mañana si se conoce que labora en la tarde b) Cual es la probabilidad de que trabaje por las tardes si se conoce que labora por la mañana SOLUCIÓN A= labora en la mañana …………. 50% B= labora en la tarde …………….. 30% A Π B = labora en los dos turnos … 20% a) P[A/B] = P[A ∩ B] = 20/30 = 2/3 ó 66.67% P[B]
  • 52. b) P[B/A] = P[B ∩ = 20/50 = 2/5 ó 40% A] P[A] 2. De todos los alumnos que el ciclo pasado llevaron los cursos de Estadística Aplicada y Matemática I, se tienen los siguientes datos: El 20% desaprobaron Matemática I El 35% desaprobaron Estadística Aplicada El 10% desaprobaron ambos cursos Si se escoge aleatoriamente a un alumno que lleva estos cursos, cual es la probabilidad de que este: a) Haya sido desaprobado en Matemática I conociéndose que fue desaprobado en Estadística Aplicada b) Haya sido desaprobado en Estadística Aplicada conociéndose que fue desaprobado en Matemática I c) De que haya sido desaprobado en Matemática I ó Estadística Aplicada SOLUCIÓN: M = desaprobó Matemática I =20% E = desaprobó Estad. Aplicada =35% M ∩ E = desaprobaron ambos cursos = 10 a) P[M/E] = 10/35 = 2/7 = 28,57% b) P[E/M] = 10/20 = ½ = 50% c) P[E UM] = P[E] + P[M] – P[E ∩ = 35/100 + 20/100 – 10/100 = 9/20 = 45% M] 3. En la parte preferencial de un teatro solamente hay 120 asientos, los cuales son de 2 colores, azules o negros; algunos son de madera y otros son metálicos. El resumen se presenta en el recuadro siguiente: Asientos Metálicos Madera Total Azul 35 45 80 Negro 18 22 40 Total 53 67 120 Si se selecciona aleatoriamente uno de estos asientos, calcule la probabilidad de que este sea: a) De color azul b) De color negro metálico c) El asiento elegido sea de madera d) Sea de color azul si se sabe que es de metal e) El asiento sea de madera si se sabe que es de color negro f) El asiento no sea de color azul SOLUCIÓN A= Azul, N=Negro, M=Metálico, Ma=Madera a) P[A] = n(A)/n(S) = 80/120 = 2/3 = 66.47% b) P[N ∩ M] = n(M ∩ N)/n(S) = 18/120 = 9/60 = 3/20 = 15% c) P[Ma] = 67/120 = 55.83 % d) P[A/M] = P[A ∩ M] / P[M] = n(A ∩ M) / n(M) = 35/53 = 66.04% e) P[M/N] = P[Ma ∩ N]/ P[N] = n(Ma ∩ N)/n(N) = 22/40 = 11/20 = 55%
  • 53. Complemento de un suceso=> P[M’]= 1 – P[M] Sea de color azul: P[A], complemento = 1 – P[A] f) P[A]’ = 1 – P[A] = 1 - 80/120 = 40/120 = 4/12 = 1/3 = 33.33% TEOREMA DE BAYES Es un caso particular de la probabilidad condicional. Si A1, A2, A3, …, An, son sucesos mutuamente excluyentes de los cuales al menos uno de los sucesos Ai (i=1,2,3,…,n) debe ocurrir y siendo B un suceso cualquiera del espacio muestral, la probabilidad de que ocurra el suceso “Ak” habiendo ocurrido B se puede definir como: P[Ak / B] = P[Ak] . P[B/Ak] ∑ P[Ai] . P[B/Ai] Ejemplo 1 1. En una empresa el 50% de trabajadores pertenecen al área técnica profesional, el 30% son oficinistas y el 20% pertenecen al área de personal de servicio; se sabe además que el 8, 9 y 10% de los técnicos profesionales, oficinistas y personal de servicio respectivamente son provincianos. a) Represente las condiciones enunciadas en un árbol de probabilidades b) Si se selecciona al azar un trabajador, cual es la probabilidad de que este sea técnico profesional o personal de servicio. c) Sea técnico profesional si se conoce que es provinciano d) Sea de personal de servicio si se sabe que es de la capital SOLUCIÓN T= técnico profesional P=provinciano O=oficinistas C=capital S=personal servicio a) Árbol de probabilidades b) P[T U S] = P[T] + P[S] – P[T ∩ S] = 50/100 + 20/100 – 0 = 70/100 = 70% c) P[T/P] = _________50/100 x 8/100_______________________ 50/100x8/100 + 30/100x9/100 + 20/100x10/100 = 50 x 8_____________ = ___400 = 400/870 = 40/87 ó 45.98% 50x8 + 30x9 + 20x10 400+270+200 d) P[S/C] = P[S].P[C/S] P[T].P[C/T] + P[O].P[C/O] + P[S].P[C/S]
  • 54. = 20/100 . 90/100 50/100x92/100 + 30/100x91/100 + 20/100x90/100 = 1800 = 1800 / 9130 = 180/913 ó 19.72 % 4600 + 2730 + 1800 Ejemplo 2 El 70% de los pacientes de un hospital son mujeres y el 20% de ellas son fumadoras. Por otro lado el 40% de los pacientes hombres son fumadores. Se elige al azar un paciente del hospital. ¿Cuál es la probabilidad de que sea fumador? Solución Diagrama de Árbol para el ejemplo: Ejemplo 3 Consideremos un control de calidad de una empresa en el cual se desea saber la probabilidad de que un determinado artefacto tenga una vida útil superior a las 1200hs. Para ello el dpto. de Control de Calidad separa 500 unidades de la producción y mide la vida útil de cada unidad. Los resultados de observan en la siguiente tabla: Duración(en hs) Frec. Abs.(fi) Frec. Relat. Menos de 800 10 2% 800 a 899 40 8% 900 a 999 55 11% 1000 a 1099 70 14% 1100 a 1199 85 17% 1200 a 1299 115 23% 1300 a 1399 84 17% 1400 a más 41 8% Total 500 100% P(A) = 115 + 84 +41 ó = 23% + 17% + 8% 500 = 48%
  • 55. Práctica Calificada N° 07 Ejercicio 1: Tres máquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3%, 4% y 5%. a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa. b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido producida por la máquina B. c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza Ejercicio 2: Tras un estudio estadístico en una ciudad se observa que el 70% de los motoristas son varones y, de estos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con casco es del 40%. Se pide: a. Calcular la probabilidad de que un motorista elegido al azar lleve casco. b. Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de que sea varón? Ejercicio 3: En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene. Se sabe además que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se abstienen, son mayores de 60 años. Se pide: a. Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 años. b. Hallar la probabilidad de que un ciudadano mayor de 60 años se haya abstenido. Ejercicio 4: Los alumnos de Primero de Biología tienen que realizar dos pruebas, una teórica y otra práctica. La probabilidad de que un estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebe la parte práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. a. ¿Son independientes los sucesos aprobar la parte teórica y la parte práctica? b. ¿Cuál es la probabilidad de que un alumno no apruebe ninguno de los dos exámenes? c. ¿Cuál es la probabilidad de que un alumno apruebe solamente uno de los dos exámenes? d. Se sabe que un alumno aprobó la teoría. ¿Cuál es la probabilidad de que apruebe también la práctica? Ejercicio 5: El 35% de los créditos de un banco es para vivienda, el 50% para industrias y el 15% para consumo diverso. Resultan fallidos el 20% de los créditos para vivienda, el 15% de los créditos para industrias
  • 56. y el 70% de los créditos para consumo. Calcula la probabilidad de que se pague un crédito elegido al azar. Ejercicio 6: El volumen de producción en tres plantas diferentes de una fábrica es de 500 unidades en la primera, 1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades defectuosas producidas en cada planta es del 1%, 0.8% y 2%, respectivamente, calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa. Ejercicio 7: El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras que de los no ingenieros y no economistas solamente el 20% ocupan un puesto directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea ingeniero?
  • 57. Semana 8 VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS DISTRIBUCIONES DE PROBABILIDADES En el cálculo de probabilidades, generalmente, es más sencillo identificar los eventos numéricamente, y no con la simple descripción del suceso que pueda ocurrir, es más, en muchas ocasiones no podemos registrar todos los sucesos inmersos en el espacio muestral del experimento. Debemos recurrir a cuantificar esos símbolos iniciales en números reales que se puedan operar matemáticamente. Variable Aleatoria Definición: Una variable aleatoria es una función definida sobre un espacio muestral a los números reales. Si ese espacio muestral especificado como dominio es numerable, decimos que la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo. En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: el número de sellos obtenido. En la tirada de dos dados si X es la suma obtenida:
  • 58. FUNCIÓN DE PROBABILIDAD Las variables aleatorias, transforman eventos del espacio muestral en eventos numéricos, los cuales desde luego, tienen asociada una probabilidad de ocurrencia. 1. Función de Probabilidad f(x)=p(X=x): Es una función definida sobre una variable aleatoria a los reales en el intervalo [0,1] que cumple con los axiomas de la teoría de la probabilidad. 2. Función de Distribución F(x)=p(X=x) Es la acumulada de una función de probabilidad. -: Limite inferior de la variable X
  • 59. Ejemplo: En el Lanzamiento de una Moneda, X: Número de Sellos Ejemplo: X es la Suma Obtenida en el Lanzamiento de dos Dados: Ejemplo: ¿ Cuál es la probabilidad que un disparo impacte a menos de 15 cm del centro? ¿ a más de 9 centímetros? ¿Entre 7 y 14 centímetros?
  • 60. CUESTIONARIO Y EJERCICIOS PROPUESTOS 1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria continua, función de probabilidad y función de distribución. 2. En el ejercicio de la ficha de dominó, si X representa la diferencia absoluta entre los dos números, representar y calcular la probabilidad de ocurrencia de los siguientes eventos: 2.1 La diferencia sea menor o igual a 5 2.2 La diferencia sea mayor que 2 2.3 La diferencia sea mayor que 2 pero menor o igual 5 2.4 La diferencia sea mayor que 5 ó menor que 3
  • 62.
  • 63.
  • 64. DISTRIBUCIÓN DE POISSON La distribución de Poisson es de gran utilidad cuando tenemos variables distribuidas a través del tiempo ó del espacio. Es el caso del número de llamadas que entran a una central telefónica en una unidad de tiempo, la cantidad de personas que atiende un cajero en una hora, los baches por kilómetro en una autopista, los artículos defectuosos que hay en un lote de producción; amén de su utilización como aproximación binomial cuando p es muy cercano a cero, o n superior a 30. (p<0.1 , n>30). La función de probabilidad de Poisson es:
  • 65. Ejemplo: Un cajero de un banco atiende en promedio 7 personas por hora, cual es la probabilidad de que un una hora determinada: 1. Atienda menos de 5 personas 2. Atienda más de 8 personas 3. Atienda más de 5 pero menos de 8 personas 4. Atienda exactamente 7 personas Consultando la tabla para la distribución de Poisson: Ejemplo: En cierto núcleo poblacional, el 0.5% es portador del V.I.H. En una muestra de 80 personas, cual es la probabilidad: 1. De que haya alguna persona portadora. 2. No haya personas portadoras. Solución:
  • 66. DISTRIBUCIÓN NORMAL Dada la caracterización propia de este modelo continuo, donde coinciden las medidas de tendencia central, media, moda y mediana; la simetría respecto a estos parámetros y la facilidad de su aplicación hacen de la distribución normal, una herramienta de uso común, máxime que la mayoría de las variables económicas y sociales se ajustan a una función normal. La distribución normal, también es útil como aproximación de los modelos binomial y poisson expuestos anteriormente, y yendo un poco más adelante, sustentados en el teorema del “límite central” podemos afirmar que, cuando el tamaño de la muestra es lo suficientemente grande, podemos asumir el supuesto de normalidad para una suma de variables. La forma acampanada de la variable normal, resalta la perfección de esta curva definida por los parámetros Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmética ó varianza diferente se describe una función también diferente:
  • 67. Normal Diferente Media Igual Varianza Normal Diferente Varianza Igual Media
  • 68. Las gráficas de este tipo son muy corrientes: Hay pocos individuos en los extremos y un aumento paulatino hasta llegar a la parte central del recorrido, donde está la mayoría de ellos.
  • 69. DEFINICIÓN : Es la distribución más importante en la estadística. Es una distribución simétrica con respecto a su promedio, teniendo la media, mediana y moda el mismo valor. El valor máximo ocurre cuando U = Me = Mo En el caso de la Distribución normal de parámetros x y σ, dicha función viene dada por: <= >=
  • 70. Z=x–u δ Casos: I. P [x≤x] = P [ Z ≤ x – u ] δ II. P [x≥x] = 1 – P[x ≤ x] = 1 – P[ Z ≤ x – u ] δ III. P[a ≤ x ≤ b] = P[x ≤ b] – P[x ≤ a] = P[Z ≤ b – u ] – P[Z ≤ a – u ] δ δ a) Tenga un contenido mayor a 1020 cm3 u = promedio = 1000 cm3 σ = 30 cm3 P [x > 1020] = 1 – P[ x ≤ 1020] = 1 – P[ z ≤ 1020 – 1000 ] 30 = 1 – P [ z≤ 0,67] Buscar en tablas 0,67 = 1 – 0,74857 = 025143 ó 25.14% b) Tenga un contenido menor a 975 cm3 P[ x < 975 ] P [ z ≤ 975 – 1000 ] 30 P [ z ≤ -0.833] = 0,20327 ó 20.33% c) Contenga entre 980 y 1030 cm3 P [980 ≤ x ≤ 1030] P [ z≤ 1030 – 1000 ] – P[z ≤ 980 – 1000 ] 30 30 P [ z≤ 1 ] – P [z ≤ -0.666 ] ……………………….. Ver en tablas 0.84134 - 0.25143 0.58991 ó 58.99%
  • 71. 2. Una prueba acelerada de duración en un gran número de pilas alcalinas tipo D, reveló que la duración media para un caso específico antes que falle es 19 h. La distribución de las duraciones se aproxima a una distribución normal. La desviación estándar de la distribución fue de 1.2 h. Calcular: a) Probabilidad que dure más de 21 horas b) Probabilidad que dure como máximo 17.8 horas c) Probabilidad de que su duración esté comprendida entre 18.7 y 19.3 h
  • 72. Nota: Las tablas utilizadas en esta sesión, se encuentran colgadas en el Aula Virtual de la USS y en el blog: www.ingenieriainvestigacazasi.blogspot.com
  • 73. Practica Calificada N° 08 1. La probabilidad de que un visitante efectúe una compra en un almacén, durante un día dado es 0.8. Si al negocio entran 20 clientes, ¿cuál es la probabilidad de que el almacén realice: 1.1 Exactamente 16 ventas? 1.2 Menos de 17 ventas? 1.3 Más de 14 ventas? 1.4 Exactamente 5 ventas? 1.5 ¿Cuál es el número esperado de ventas? 2. Si un almacén tiene en promedio 5 ventas por hora. ¿Cuál es la probabilidad de que en una hora determinada: 2.1 Haya exactamente 4 ventas? 2.2 Haya más de 3 ventas? 2.3 No se efectúen ventas? 3. Una de cada 10 personas mayores de 40 años de una comunidad, sufren de hipertensión. Se toma una muestra de 50 personas mayores de 40 años. Utilizando primero la distribución binomial y luego la aproximación a la distribución de Poisson, responder y comparar los resultados: 3.1 ¿Cuál es la probabilidad que haya más de 4 hipertensos? 3.2 ¿Cuál es la probabilidad que haya exactamente 5hipertensos? 4. Un lote de arandelas tiene un diámetro normal con media 10 milímetros y desviación típica 0.5 milímetros. Se toma una arandela al azar. ¿Cuál es la probabilidad de que tenga un diámetro: 4.1 Superior a 10.5 milímetros? 4.2 Entre 9 y 11 milímetros? 4.3 Menos de 9 milímetros?
  • 74. Semana 10 INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA La preparación de un proyecto de investigación es una tarea compleja, ya que se han de tener en cuenta multitud de aspectos para que el documento final contemple todos los apartados que cualquier estructura estándar considera y para que todos los investigadores sepan con qué y cómo deben proceder en todas las etapas de ejecución del estudio planteado. Uno de los dilemas que se presenta cuando se inicia la elaboración del proyecto es decidir sobre los individuos o elementos que se incluirán en el estudio: qué características tendrán «criterios de inclusión y exclusión», a cuántos pacientes se estudiará «tamaño de la muestra» y cómo se elegirán para que entren a formar parte del estudio «técnica de muestreo». Estudiar a toda la población, que sería la manera más exacta de conocer lo que se pretende estudiar, es casi imposible en la práctica. Entre los motivos que lo impiden se encuentran la falta de tiempo, la escasez de recursos humanos y económicos, la dificultad para acceder a todos los sujetos, etc., por lo que se estudia sólo a una parte de ellos, para, posteriormente, generalizar o inferir los resultados obtenidos a toda la población. Por tanto, cuando se habla de sujetos de estudio, se ha de diferenciar claramente entre población, muestra e individuo.
  • 75. TEOREMA DEL MUESTREO DISEÑO DE MUESTRA 1. Definir la Población Meta: Conjunto de Elementos que poseen la información que se busca 2. Determinar el Marco de la Muestra: Lista o grupo de indicaciones para identificar a la población meta Listas:  Directorio Telefónico de Organizaciones  Lista de correo
  • 76. 3. Seleccionar las Técnicas de Muestreo T E C N IC A S D E MUESTREO N o P r o b a b ilís t ic o P ro b a b ilís tic o Estratificado Bola de Nieve Conveniencia Sistemático Simple Grupo Áreas Juicio Cuota Por Por Por Por Por TÉCNICAS NO PROBABILÍSTICAS: Es aquella en la cual los elementos del conjunto población no tienen la misma probabilidad de ser seleccionado. 1. Por Conveniencia: Su principal debilidad es el nombre, ya que, para muchas personas el nombre da a entender que se está haciendo la selección de las unidades de análisis amañando las respuestas, situación que no es cierta, toma su nombre, debido a que se busca obtener una representatividad de la población consultando o midiendo unidades de análisis que pueden ser accesadas con relativa facilidad. Es uno de los muestreos con mayor uso, dado esa particularidad. 2. Por Juicio: Se busca seleccionar a individuos que se juzga de antemano tienen un conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la información aportada por esas personas es vital para la toma de decisiones. En el área de vacunas sintéticas, el Dr. Patarroyo, es considerado una eminencia, luego sería un personaje ideal para hablar sobre esa temática. Si se utilizará un método aleatorio, probablemente quedarían en la muestra algunas personas con poco dominio sobre el tema en estudio.