Análisis Exploratorio de Datos
Segundo Cuatrimestre 2013
Programa y Bibliografía
1.
Introducción
al R y R-Commander. Creación de un directorio de trabajo separado. Presentación
de distintos tipos de gráficos. Objetos en R. Lenguaje: expresiones y
asignaciones. Lectura y escritura de
estructuras sencillas de datos: funciones scan, read.table, read.csv. Lectura
y escritura de funciones. 2.
Histogramas.
Reglas para cantidad de intervalos de clase: Dixon&Kronmal, Velleman,
Sturges. Reglas para la longitud de intervalos: Scott y
Friedman&Diaconis. Comparación. Modificación de la cantidad de clases. 3.
Diagramas
Tallo-Hoja. Esquema básico. Profundidades y cantidad de hojas por tallo.
Resistencia. 4.
Estadísticos
de orden. Cuantiles en distribuciones continuas y discretas. Cuantiles en
conjuntos de datos. Funciones sort, sort.list, rank,rev,order,min, max,
median, summary, quantile. Diferentes formas de cálculo de los cuantiles. Gráfico cuantil-cuantil. 5.
Medidas
resumen. Media muestral. Varianza muestral. Desvío. Mediana. Cuartiles.
Cuartos. Distancia Intercuartos. Identificación de valores atípicos. 6.
Boxplots.
Construcción. Resistencia. Interpretación. Puntos de corte para outliers en
varias distribuciones, simétricas y asimétricas. Comparación de lotes. 7.
Gráfico de
dispersión versus nivel. Construcción. Escalera de potencias de Tukey.
Justificación del gráfico. 8.
Transformaciones
de potencia. Definición. Ventajas. Propiedades. Transformaciones apareadas:
procedimiento, interpretación. 9.
Simetrización
de datos. Gráfico de transformación para simetría. Justificación. 10.Regresión lineal simple. Modelo. Interpretación.
Estimación. Predicción. Cuadrados mínimos. Supuestos. Residuos. Leverage. Outliers.
Puntos influyentes 11.Rectas resistentes. Recta resistente a partir de
tres grupos. Mínimos absolutos (L1). Mínima mediana cuadrática (LMS). Otros
métodos alternativos.
|
Básico: UNDERSTANDING ROBUST AND EXPLORATORY DATA ANALYSIS. Hoaglin, Mosteller, Tukey (1983). Wiley.
Nuestro libro de cabecera UREDA. Complementario: The
Elements of Graphing Data. Cleveland, W. S. (1994) Belmont, CA: Wadsworth. |