Análisis de Datos - Primer Cuatrimestre 2008
Programa
1.
Introducción
al R y S-plus. Creación de un directorio de trabajo separado. Presentación de
distintos tipos de gráficos. Objetos en R. Lenguaje: expresiones y asignaciones. Lectura y escritura de estructuras
sencillas de datos: funciones scan, read.table. Lectura y escritura de funciones. Uso de fix y edit. 2.
Histogramas.
Reglas para cantidad de intervalos de clase: Dixon&Kronmal,
Velleman, Sturges. Reglas
para la longitud de intervalos: Scott y Friedman&Diaconis. Comparación. Modificación de la
cantidad de clases en S-plus. 3.
Diagramas
Tallo-Hoja. Esquema básico. Profundidades y cantidad de hojas por tallo.
Resistencia. 4.
Estadísticos
de orden. Cuantiles en distribuciones continuas y discretas. Cuantiles en
conjuntos de datos. Funciones sort, sort.list, rank,rev,order,min,
max, median, summary, quantile. Diferentes formas de cálculo de los
cuantiles. Gráfico cuantil-cuantil. 5.
Medidas
resumen. Media muestral. Varianza muestral. Desvío. Mediana. Cuartos. Distancia
Intercuartos. Identificación de valores atípicos. 6.
Boxplots.
Construcción. Resistencia. Interpretación. Puntos de corte para outliers en
varias distribuciones, simétricas y asimétricas. Comparación de lotes. 7.
Gráfico
de dispersión versus nivel. Construcción. Escalera de potencias de Tukey. Justificación del gráfico. 8.
Transformaciones
de potencia. Definición. Ventajas. Propiedades. Transformaciones apareadas:
procedimiento, interpretación. 9.
Simetrización de datos. Gráfico de transformación para simetría.
Justificación. 10.Regresión lineal simple. Modelo.
Interpretación. Estimación. Predicción. Cuadrados mínimos. Supuestos.
Residuos. Leverage. Outliers. Puntos influyentes 11.Rectas resistentes. Recta resistente
a partir de tres grupos. Mínimos absolutos (L1). Mínima mediana cuadrática
(LMS). Otros métodos alternativos.
|
Bibliografía
UNDERSTANDING ROBUST AND EXPLORATORY DATA ANALYSIS Hoaglin, D,, Mosteller,
F., Tukey, .J. Wiley & Sons -1983 |