TEMA 1: ESTADÍSTICA

Capitulo 5: Organización de los Datos.

Elección de intervalos para variables continuas

    A la hora de seleccionar los intervalos para las variables continuas se plantean varios problemas, como son el número de intervalos a elegir y sus tamaños respectivos. La notación más común que usaremos para un intervalo será MATH

    El primer intervalo, $l_{0}-l_{1}$, podemos  cerrarlo en el extremo inferior para no excluir la observación más pequeña,

MATH

    Éste es un convenio que tomaremos en las páginas que siguen. El considerar los intervalos por el lado izquierdo y abrirlos por el derecho no cambia de modo significativo nada de lo que expondremos. El número de intervalos, $k$, a utilizar no está determinado de forma fija y por tanto tomaremos un $k$ que nos permita trabajar cómodamente y ver bien la estructura de los datos. Como referencia nosotros tomaremos una de los siguientes valores aproximados:


MATH


Por ejemplo, si el número de observaciones que tenemos es $n=100$, un buen criterio es agrupar las observaciones en  

$k=\sqrt{100}=10$ intervalos.

 Sin embargo si tenemos n=1.000.000, será más razonable elegir MATH intervalos, que

MATH

    La amplitud de cada intervalo MATH se suele tomar constante, considerando la observación más pequeña y y más grande de la población (respectivamente $l_{0}=x_{\min }$ y $l_{k}=x_{\max }$) para calcular la amplitud total, $A$, de la población $A=l_{k}-l_{0}$ de forma que la amplitud de cada intervalo sea: $a_{i}=a$ MATH donde $a=A/k$. Así la división en intervalos podría hacerse tomando:

$l_{0}=x_{min}$

$l_{1}=l_{0}+a$

..........

MATH

Consultar Observación

Ir al apartado anterior  Ir al indice del capitulo  Ir al apartado siguiente