DEPARTAMENTO DE MATEMÁTICA
INSTITUTO DE CÁLCULO
  FCEyN  UBA

Análisis Exploratorio de Datos

Segundo Cuatrimestre 2013

Programa y Bibliografía

1.  Introducción al R y R-Commander. Creación de un directorio de trabajo separado. Presentación de distintos tipos de gráficos. Objetos en R. Lenguaje: expresiones y asignaciones.  Lectura y escritura de estructuras sencillas de datos: funciones scan, read.table, read.csv. Lectura y escritura de funciones. 

2.  Histogramas. Reglas para cantidad de intervalos de clase: Dixon&Kronmal, Velleman, Sturges. Reglas para la longitud de intervalos: Scott y Friedman&Diaconis. Comparación. Modificación de la cantidad de clases.

3.  Diagramas Tallo-Hoja. Esquema básico. Profundidades y cantidad de hojas por tallo. Resistencia.

4.  Estadísticos de orden. Cuantiles en distribuciones continuas y discretas. Cuantiles en conjuntos de datos. Funciones sort, sort.list, rank,rev,order,min, max, median, summary, quantile. Diferentes formas de cálculo de los cuantiles.  Gráfico cuantil-cuantil.

5.  Medidas resumen. Media muestral. Varianza muestral. Desvío. Mediana. Cuartiles. Cuartos. Distancia Intercuartos. Identificación de valores atípicos.

6.  Boxplots. Construcción. Resistencia. Interpretación. Puntos de corte para outliers en varias distribuciones, simétricas y asimétricas. Comparación de lotes.

7.  Gráfico de dispersión versus nivel. Construcción. Escalera de potencias de Tukey. Justificación del gráfico.

8.  Transformaciones de potencia. Definición. Ventajas. Propiedades. Transformaciones apareadas: procedimiento, interpretación.

9.  Simetrización de datos. Gráfico de transformación para simetría. Justificación.

10.Regresión lineal simple. Modelo. Interpretación. Estimación. Predicción. Cuadrados mínimos. Supuestos. Residuos. Leverage. Outliers. Puntos influyentes

11.Rectas resistentes. Recta resistente a partir de tres grupos. Mínimos absolutos (L1). Mínima mediana cuadrática (LMS). Otros métodos alternativos.

 

 

 

Básico: UNDERSTANDING ROBUST AND EXPLORATORY DATA ANALYSIS. Hoaglin, Mosteller, Tukey (1983). Wiley. Nuestro libro de cabecera UREDA.

 

Complementario: The Elements of Graphing Data. Cleveland, W. S. (1994) Belmont, CA: Wadsworth.

 

 

 

 

volver