Análisis Exploratorio de Datos - Segundo Cuatrimestre 2011
Programa
1.
Introducción
al R. Creación de un directorio de trabajo separado. Presentación de
distintos tipos de gráficos. Objetos en R. Lenguaje: expresiones y
asignaciones. Lectura y escritura de
estructuras sencillas de datos: funciones scan, read.table. Lectura y
escritura de funciones. Uso de fix y edit. 2.
Histogramas.
Reglas para cantidad de intervalos de clase: Dixon&Kronmal, Velleman,
Sturges. Reglas para la longitud de intervalos: Scott y
Friedman&Diaconis. Comparación. 3.
Diagramas
Tallo-Hoja. Esquema básico. Profundidades y cantidad de hojas por tallo.
Resistencia. 4.
Estadísticos
de orden. Cuantiles en distribuciones continuas y discretas. Cuantiles en
conjuntos de datos. Funciones sort, sort.list, rank, rev,order, min, max,
median, summary, quantile. Diferentes formas de cálculo de los
cuantiles. Gráfico cuantil-cuantil. 5.
Medidas
resumen. Media muestral. Varianza muestral. Desvío. Mediana. Cuartos.
Distancia Intercuartos. Identificación de valores atípicos. 6.
Boxplots.
Construcción. Resistencia. Interpretación. Puntos de corte para outliers en
varias distribuciones, simétricas y asimétricas. Comparación de lotes. 7.
Gráfico
de dispersión versus nivel. Construcción. Escalera de potencias de Tukey.
Justificación del gráfico. 8.
Transformaciones
de potencia. Definición. Ventajas. Propiedades. Transformaciones apareadas:
procedimiento, interpretación. 9.
Simetrización
de datos. Gráfico de transformación para simetría. Justificación. 10.Regresión lineal simple. Modelo.
Interpretación. Estimación. Predicción. Cuadrados mínimos. Supuestos. Residuos.
Leverage. Outliers. Puntos influyentes 11.Rectas resistentes. Recta resistente
a partir de tres grupos. Mínimos absolutos (L1). Mínima mediana cuadrática
(LMS). Otros métodos alternativos.
|
Bibliografía
UNDERSTANDING ROBUST AND EXPLORATORY DATA ANALYSIS Hoaglin, D,, Mosteller, F., Tukey, .J. Wiley &
Sons -1983 |