Domina el universo de los datos.

Una guía interactiva para explorar, visualizar y entender la estadística de una forma nueva y audaz.

Comenzar a explorar

1. Ingresa tus Datos

Pega tus datos aquí, carga un archivo CSV o usa los datos de ejemplo. La magia comenzará al instante.

Cargando resumen de datos...

2. Estadística Descriptiva

Un resumen numérico de tus datos. Elige si tus datos representan una muestra o una población completa para ver los cálculos correctos.

3. Visualización de Datos

Una imagen vale más que mil números. Explora la forma, centro y dispersión de tus datos con estas gráficas interactivas.

Diagrama de Puntos (Dot Plot)

Cada punto representa un dato. Ideal para ver la distribución de conjuntos de datos pequeños.

Histograma

Agrupa los datos en "contenedores" (bins) para mostrar la frecuencia. Ajusta el número de bins para descubrir patrones.

Diagrama de Caja (Box Plot)

El "resumen de cinco números": mínimo, Q1, mediana, Q3 y máximo. Revela la dispersión, simetría y datos atípicos.

Diagrama de Dispersión (Scatter Plot)

Para datos de dos variables (x, y). Muestra la relación entre ellas. La línea representa la regresión lineal.

4. Probabilidad y Simulaciones

Explora el azar y cómo las frecuencias a largo plazo se acercan a la probabilidad teórica.

Lanzar una Moneda

Lanzar un Dado (6 caras)

5. Distribuciones de Probabilidad

Modelos matemáticos que describen la probabilidad de diferentes resultados.

Distribución Normal

La famosa "curva de campana". Modela muchos fenómenos naturales.

Distribución Binomial

Describe el número de éxitos en \(n\) ensayos independientes, cada uno con probabilidad de éxito \(p\).

6. Muestreo y Teorema Central del Límite

El TCL es uno de los resultados más importantes de la estadística. Dice que si tomas muestras suficientemente grandes de una población, las medias de esas muestras estarán distribuidas normalmente, ¡sin importar la forma de la distribución de la población original!

Simulación del Teorema Central del Límite (TCL)

Usa los datos que ingresaste como "población". Tomaremos miles de muestras de un tamaño determinado, calcularemos la media de cada una y dibujaremos un histograma de esas medias.

7. Calculadoras Rápidas

Herramientas para cálculos estadísticos comunes.

Calculadora de Puntuación Z

Calcula cuántas desviaciones estándar un valor \(x\) está de la media \(\mu\).

8. Tabla de Fórmulas Clave

MedidaFórmula
Media Muestral\(\bar{x} = \frac{1}{n} \sum_{i=1}^{n} x_i\)
Varianza Muestral\(s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2\)
Desviación Estándar Muestral\(s = \sqrt{s^2}\)
Varianza Poblacional\(\sigma^2 = \frac{1}{N} \sum_{i=1}^{N} (x_i - \mu)^2\)
Desviación Estándar Poblacional\(\sigma = \sqrt{\sigma^2}\)
Coeficiente de Correlación (r)\(r = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum(x_i - \bar{x})^2 \sum(y_i - \bar{y})^2}}\)
Probabilidad Binomial\(P(X=k) = \binom{n}{k} p^k (1-p)^{n-k}\)
Puntuación Z\(z = \frac{x - \mu}{\sigma}\)

9. Glosario

Correlación
Medida estadística que expresa hasta qué punto dos variables están relacionadas linealmente.
Cuartiles
Valores que dividen un conjunto de datos ordenado en cuatro partes iguales. Q1, Q2 (Mediana), Q3.
Datos Atípicos (Outlier)
Una observación que es numéricamente distante del resto de los datos.
Desviación Estándar
Medida de la cantidad de variación o dispersión de un conjunto de valores.
Estadístico
Un número que resume un aspecto de los datos de una muestra (ej. la media muestral \(\bar{x}\)).
Media
El promedio aritmético de un conjunto de números.
Mediana
El valor medio en un conjunto de datos ordenado.
Moda
El valor que aparece con más frecuencia en un conjunto de datos.
Muestra
Un subconjunto de miembros seleccionados de una población.
Parámetro
Un número que resume un aspecto de la población completa (ej. la media poblacional \(\mu\)).
Población
El conjunto completo de elementos que poseen la característica de interés.
Rango Intercuartílico (IQR)
La diferencia entre el tercer y el primer cuartil (Q3 - Q1). Mide la dispersión del 50% central de los datos.
Teorema Central del Límite (TCL)
Teorema fundamental que establece que la distribución de las medias muestrales se aproxima a una distribución normal a medida que el tamaño de la muestra crece.
Varianza
El promedio de las diferencias al cuadrado con respecto a la media. Mide la dispersión.

10. Preguntas Frecuentes

¿Cuándo debo usar la mediana en lugar de la media?

Usa la mediana cuando tu conjunto de datos tenga valores extremos (outliers) o esté muy sesgado. La media es muy sensible a estos valores extremos y puede dar una idea engañosa del "centro" de los datos. La mediana, al ser el valor del medio, no se ve afectada por ellos. Por ejemplo, al analizar salarios, donde unas pocas personas ganan muchísimo más que el resto, la mediana suele ser un mejor indicador del salario "típico".

¿Qué significa realmente la desviación estándar?

La desviación estándar te dice, en promedio, qué tan lejos está cada punto de dato de la media. Una desviación estándar pequeña significa que los datos están muy agrupados alrededor de la media (son consistentes). Una desviación estándar grande indica que los datos están muy dispersos. Es como medir la "propagación" de tus datos.

¿Por qué la correlación no implica causalidad?

Este es uno de los principios más importantes en estadística. Que dos variables se muevan juntas (correlación) no significa que una cause la otra. Puede haber una tercera variable oculta (variable de confusión) que cause ambas. Ejemplo clásico: las ventas de helados y los ataques de tiburones están correlacionados. ¿Comer helado causa ataques de tiburón? No. La variable oculta es el calor del verano, que hace que más gente compre helados y más gente se bañe en el mar.

¿Para qué sirve una puntuación Z?

Una puntuación Z estandariza un valor, diciéndote exactamente cuántas desviaciones estándar está por encima o por debajo de la media. Esto es increíblemente útil para comparar valores de diferentes distribuciones. Por ejemplo, si sacaste un 80 en un examen de historia (media 70, desv. est. 5) y un 75 en matemáticas (media 60, desv. est. 10), ¿en cuál te fue mejor relativamente? Tu Z en historia es (80-70)/5 = +2. Tu Z en matemáticas es (75-60)/10 = +1.5. ¡Te fue mejor en historia en comparación con tus compañeros!

¿Por qué se divide entre n-1 para la varianza muestral?

Se divide por \(n-1\) (los "grados de libertad") en lugar de \(n\) para obtener una estimación insesgada de la varianza de la población. Cuando usamos la media de una muestra (\(\bar{x}\)) para calcular la varianza, esta media ya está "optimizada" para esa muestra específica, haciendo que las desviaciones al cuadrado sean un poco más pequeñas de lo que serían si usáramos la verdadera media de la población (\(\mu\)). Dividir por \(n-1\) corrige esta subestimación, dándonos una mejor idea de la varianza real de la población de la que proviene la muestra.