SlideShare a Scribd company logo
1 of 19
Lenguaje R: Sesión 7
ING. LUIS FERNANDO AGUAS B
2Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (1)
Fácilmente se pueden calcular estadísticos sumario tipo media, mediana,
desviación, …
> x<-rnorm(50)
> mean(x)
[1] -0.2552258
> sd(x)
[1] 1.209657
> var(x)
[1] 1.463269
> median(x)
[1] -0.3365646
#cuantiles empíricos
> quantile(x)
0% 25% 50% 75% 100%
-3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436
> pvec<-seq(0,1,0.1)
> pvec
[1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
> quantile(x,pvec)
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
-3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
3Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (2)
#exploramos el dataset juul
> library(ISwR)
> data(juul)
> ?juul
> attach(juul)
> mean(igf1)
[1] NA
Debemos indicarle que no tenga en cuenta los valores missing:
> mean(igf1,na.rm=T)
[1] 340.168
> sd(igf1,na.rm=T)
[1] 171.0356
#una excepción: la función length
> sum(!is.na(igf1))
[1] 1018
#directamente, función summary() sobre cualquier dataset
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000
1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000
Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000
Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896
3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000
Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000
NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
4Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen (3)
#en el data frame tenemos variables categóricas
> detach(juul)
> juul$sex<-factor(juul$sex,labels=c("M","F"))
> juul$menarche<-factor(juul$menarche,labels=c("No","Yes"))
> juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V"))
> attach(juul)
> summary(juul)
age menarche sex igf1 tanner testvol
Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000
1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000
Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000
Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896
3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000
Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000
NA's : 5.000 NA's :321.0 NA's :859.000
#también podríamos haber utilizado la función transform()
> juul<-transform(juul,
+ sex=factor(sex,labels=c("M","F")),
+ menarche=factor(menarche,labels=c("No","Yes")),
+ tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
5Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (1)
#histogramas. Por defecto R, intenta hacer puntos de corte "adecuados"
> hist(x)
6Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (2)
#Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79)
> mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5)
> acc.count<-c(28,46,58,20,31,64,149,316,103)
> age.acc<-rep(mid.age,acc.count)
> brk<-c(0,5,10,16,17,18,20,25,60,80)
> hist(age.acc,breaks=brk)
7Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (3)
#distribución empírica acumulada
> n<-length(x)
> plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
8Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (4)
#qqplot
> qqnorm(x)
9Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para una variable (5)
#Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years)
> data(IgM)
> ?IgM
> par(mfrow=c(1,2))
> boxplot(IgM)
> boxplot(log(IgM))
> par(mfrow=c(1,1))
10Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (1)
#Folate concentration in blood cells according to three types of ventilation during
anesthesia
> data(red.cell.folate)
> attach(red.cell.folate)
> ?red.cell.folate
> summary(red.cell.folate)
folate ventilation
Min. :206.0 N2O+O2,24h:8
1st Qu.:249.5 N2O+O2,op :9
Median :274.0 O2,24h :5
Mean :283.2
3rd Qu.:305.5
Max. :392.0
> tapply(folate,ventilation,mean)
N2O+O2,24h N2O+O2,op O2,24h
316.6250 256.4444 278.0000
> #Para tener más de un estadístico resumen por grupo
> m<-tapply(folate,ventilation,mean)
> s<-tapply(folate,ventilation,sd)
> n<-tapply(folate,ventilation,length)
> cbind(mean=m,std.dev=s,n=n)
mean std.dev n
N2O+O2,24h 316.6250 58.71709 8
N2O+O2,op 256.4444 37.12180 9
O2,24h 278.0000 33.75648 5
11Sesión 7 – Introducción a la estadística básica y gráficos
Estadísticos resumen para grupos (2)
#para el dataset juul
> tapply(igf1,tanner,mean)
I II III IV V
NA NA NA NA NA
> tapply(igf1,tanner,mean,na.rm=T)
I II III IV V
207.4727 352.6714 483.2222 513.0172 465.3344
13Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (2)
#boxplots para cada grupo
> boxplot(expend~stature)
> boxplot(expend.lean,expend.obese)
14Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para datos agrupados (3)
#con muestras tan pequeñas, los boxplots pueden resultar engañosos
#gráficos de los datos originales, punto a punto
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1)
> stripchart(expend~stature)
> stripchart(expend~stature,method="jitter")
> stripchart(expend~stature,method="stack")
> stripchart(expend~stature,method="stack",jitter=0.03)
> par(opar)
15Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (1)
#Una tabla debe estar en un objecto tipo matriz
#Ejemplo mujeres consumo cafeína vs estado civil
> caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T)
> caff.marital
[,1] [,2] [,3] [,4]
[1,] 652 1537 598 242
[2,] 36 46 38 21
[3,] 218 327 106 67
> colnames(caff.marital)<-c("0","1-150","151-300",">300")
> rownames(caff.marital)<-c("Married","Prev.married","Single")
> caff.marital
0 1-150 151-300 >300
Married 652 1537 598 242
Prev.married 36 46 38 21
Single 218 327 106 67
#también podemos crearla a partir de variables categóricas de un dataset
table(sex)
sex
M F
621 713
> table(sex,menarche)
menarche
sex No Yes
M 0 0
F 369 335
> table(menarche,tanner)
tanner
menarche I II III IV V
No 221 43 32 14 2
Yes 1 1 5 26 202
16Sesión 7 – Introducción a la estadística básica y gráficos
Tablas (2)
#podemos transponer las tablas
> t(caff.marital)
Married Prev.married Single
0 652 36 218
1-150 1537 46 327
151-300 598 38 106
>300 242 21 67
#para calcular las frecuencias marginales, perfiles fila, ...
> tanner.sex<-table(tanner,sex)
> tanner.sex
sex
tanner M F
I 291 224
II 55 48
III 34 38
IV 41 40
V 124 204
> margin.table(tanner.sex,1)
tanner
I II III IV V
515 103 72 81 328
> margin.table(tanner.sex,2)
sex
M F
545 554
> prop.table(tanner.sex,1)
sex
tanner M F
I 0.5650485 0.4349515
II 0.5339806 0.4660194
III 0.4722222 0.5277778
IV 0.5061728 0.4938272
V 0.3780488 0.6219512
> prop.table(tanner.sex,1)*100
sex
tanner M F
I 56.50485 43.49515
II 53.39806 46.60194
III 47.22222 52.77778
IV 50.61728 49.38272
V 37.80488 62.19512
> tanner.sex/sum(tanner.sex)
sex
tanner M F
I 0.26478617 0.20382166
II 0.05004550 0.04367607
III 0.03093722 0.03457689
IV 0.03730664 0.03639672
V 0.11282985 0.18562329
17Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (1)
#diagrama de barras
> total.caff<-margin.table(caff.marital,2)
> total.caff
0 1-150 151-300 >300
906 1910 742 330
> barplot(total.caff,col="white")
18Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (2)
#diagramas de barras para una tabla de contingencia
> par(mfrow=c(2,2))
> barplot(caff.marital,col="white")
> barplot(t(caff.marital),col="white")
> barplot(t(caff.marital),col="white",beside=T)
> barplot(prop.table(t(caff.marital),2),col="white",beside=T)
> par(mfrow=c(1,1))
19Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (3)
#otro diagrama de barras para una tabla de contingencia
> barplot(prop.table(t(caff.marital),2),beside=T,
+ legend.text=colnames(caff.marital),
+ col=c("white","grey80","grey50","black"))
20Sesión 7 – Introducción a la estadística básica y gráficos
Gráficos para tablas (4)
#diagrama de sectores para una tabla de contingencia
> opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1))
> slices<-c("white","grey80","grey50","black")
> pie(caff.marital["Married",],main="Married",col=slices)
> pie(caff.marital["Prev.married",],main="Previously married",col=slices)
> pie(caff.marital["Single",],main="Single",col=slices)
> par(opar)

More Related Content

Viewers also liked

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...Martín Cabrera
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Software Guru
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaLuis Fernando Aguas Bucheli
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALGuillermo Herrera
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R CommanderFernando Reche
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDDr. Orville M. Disdier
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industriaJorge Medina
 
Costos industriales
Costos industrialesCostos industriales
Costos industrialesyhameille
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RShirley Armas
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operacionesgueste3129d
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básicaVanessa Ortiz
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval Venkata Reddy Konasani
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL WILSON VELASTEGUI
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrioCARLOS MASSUH
 

Viewers also liked (20)

¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
¿Qué debemos hacer desde Tecnología para estar alineados con la Transformac...
 
Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI Transformación digital y el nuevo paradigma de TI
Transformación digital y el nuevo paradigma de TI
 
Estadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión IntroductoriaEstadística con Lenguaje R: Sesión Introductoria
Estadística con Lenguaje R: Sesión Introductoria
 
Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6Estadística con Lenguaje R: Sesión 6
Estadística con Lenguaje R: Sesión 6
 
Introduccion al Programa R
Introduccion al Programa RIntroduccion al Programa R
Introduccion al Programa R
 
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITALLA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
LA EMPRESA DEL FUTURO EN LA ERA DIGITAL - INNOVACIÓN Y TRANSFORMACIÓN DIGITAL
 
Estadística con R Commander
Estadística con R CommanderEstadística con R Commander
Estadística con R Commander
 
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATEDEstadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
Estadisticas Descriptivas e Inferencia utilizando R (Taller Intermedio) UPDATED
 
R- Introduction
R- IntroductionR- Introduction
R- Introduction
 
Los costos en la industria
Los costos en la industriaLos costos en la industria
Los costos en la industria
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
LENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION RLENGUAJE DE PROGRAMACION R
LENGUAJE DE PROGRAMACION R
 
administracion de operaciones
administracion de operacionesadministracion de operaciones
administracion de operaciones
 
Costos industriales
Costos industrialesCostos industriales
Costos industriales
 
Costos industriales - Definición básica
Costos industriales - Definición básicaCostos industriales - Definición básica
Costos industriales - Definición básica
 
Step By Step Guide to Learn R
Step By Step Guide to Learn RStep By Step Guide to Learn R
Step By Step Guide to Learn R
 
Model building in credit card and loan approval
Model building in credit card and loan approval Model building in credit card and loan approval
Model building in credit card and loan approval
 
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
EJERCICIO PUNTO DE EQUILIBRIO DE UN HOTEL
 
Credit Risk Model Building Steps
Credit Risk Model Building StepsCredit Risk Model Building Steps
Credit Risk Model Building Steps
 
Costos y punto de equilibrio
Costos y punto de equilibrioCostos y punto de equilibrio
Costos y punto de equilibrio
 

Similar to Estadística con Lenguaje R: Sesión 7

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS Juan Carlos Durand
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoyony20
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de EstadisticaWillian Delgado
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaEstadistica1000
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadisticamecufer09
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2danilosaavedra
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v eticmarlopgon14
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Sheyla Caraballo
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdfFrankCruz49
 
8.estadistica
8.estadistica8.estadistica
8.estadisticafanufe
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mecfruizj
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoBASEK
 

Similar to Estadística con Lenguaje R: Sesión 7 (20)

TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
TABLA DE FRECUENCIAS - VARIABLE CUANTITATIVAS
 
Estadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonadoEstadistica hecha por el ing yony maldonado
Estadistica hecha por el ing yony maldonado
 
Ejercicios de Estadistica
Ejercicios de EstadisticaEjercicios de Estadistica
Ejercicios de Estadistica
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Tarea 3 Arlet Estadistica
Tarea 3 Arlet EstadisticaTarea 3 Arlet Estadistica
Tarea 3 Arlet Estadistica
 
Cursillo estadistica
Cursillo estadisticaCursillo estadistica
Cursillo estadistica
 
Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2Estadstica descriptiva-1230745228674108-2
Estadstica descriptiva-1230745228674108-2
 
Estadistica uts
Estadistica utsEstadistica uts
Estadistica uts
 
Seminario v etic
Seminario v eticSeminario v etic
Seminario v etic
 
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
Estadio cognoscente - tratamiento de datos y ajuste de curva (WORD)
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
Informe de practica 1.pdf
Informe de practica 1.pdfInforme de practica 1.pdf
Informe de practica 1.pdf
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Sol t08 mec
Sol t08 mecSol t08 mec
Sol t08 mec
 
8.estadistica
8.estadistica8.estadistica
8.estadistica
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Compendio 5
Compendio 5Compendio 5
Compendio 5
 
Técnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del MercadoTécnicas de Proyección o Pronósticos del Mercado
Técnicas de Proyección o Pronósticos del Mercado
 
+Reuniónago172014 03
+Reuniónago172014 03+Reuniónago172014 03
+Reuniónago172014 03
 

More from Luis Fernando Aguas Bucheli (20)

EFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptxEFC-ISW-Luis Fernando Aguas.pptx
EFC-ISW-Luis Fernando Aguas.pptx
 
P-S2.pptx
P-S2.pptxP-S2.pptx
P-S2.pptx
 
EBTS-S1.pptx
EBTS-S1.pptxEBTS-S1.pptx
EBTS-S1.pptx
 
P-S3.pptx
P-S3.pptxP-S3.pptx
P-S3.pptx
 
EBTS-S4.pptx
EBTS-S4.pptxEBTS-S4.pptx
EBTS-S4.pptx
 
P-S4.pptx
P-S4.pptxP-S4.pptx
P-S4.pptx
 
P-S1.pptx
P-S1.pptxP-S1.pptx
P-S1.pptx
 
EBTS-S3.pptx
EBTS-S3.pptxEBTS-S3.pptx
EBTS-S3.pptx
 
EBTS-S2.pptx
EBTS-S2.pptxEBTS-S2.pptx
EBTS-S2.pptx
 
PDIDTI-S7.pptx
PDIDTI-S7.pptxPDIDTI-S7.pptx
PDIDTI-S7.pptx
 
PDIDTI-S4.pptx
PDIDTI-S4.pptxPDIDTI-S4.pptx
PDIDTI-S4.pptx
 
PDIDTI-S2.pptx
PDIDTI-S2.pptxPDIDTI-S2.pptx
PDIDTI-S2.pptx
 
PDIDTI-S1.pptx
PDIDTI-S1.pptxPDIDTI-S1.pptx
PDIDTI-S1.pptx
 
PDIDTI-S8.pptx
PDIDTI-S8.pptxPDIDTI-S8.pptx
PDIDTI-S8.pptx
 
PDIDTI-S6.pptx
PDIDTI-S6.pptxPDIDTI-S6.pptx
PDIDTI-S6.pptx
 
PDIDTI-S5.pptx
PDIDTI-S5.pptxPDIDTI-S5.pptx
PDIDTI-S5.pptx
 
PDIDTI-S3.pptx
PDIDTI-S3.pptxPDIDTI-S3.pptx
PDIDTI-S3.pptx
 
TIC-S4.pptx
TIC-S4.pptxTIC-S4.pptx
TIC-S4.pptx
 
TIC-S3.pptx
TIC-S3.pptxTIC-S3.pptx
TIC-S3.pptx
 
TIC-S2.pptx
TIC-S2.pptxTIC-S2.pptx
TIC-S2.pptx
 

Recently uploaded

LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxlclcarmen
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxFernando Solis
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfUPTAIDELTACHIRA
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024IES Vicent Andres Estelles
 
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCCarlosEduardoSosa2
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Katherine Concepcion Gonzalez
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024IES Vicent Andres Estelles
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primariaWilian24
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfpatriciaines1993
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesMarisolMartinez707897
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxBeatrizQuijano2
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfapunteshistoriamarmo
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxpvtablets2023
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICAÁngel Encinas
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptxdeimerhdz21
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfMercedes Gonzalez
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.JonathanCovena1
 

Recently uploaded (20)

LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdfNUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
NUEVAS DIAPOSITIVAS POSGRADO Gestion Publica.pdf
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
Posición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptxPosición astronómica y geográfica de Europa.pptx
Posición astronómica y geográfica de Europa.pptx
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 
INSTRUCCION PREPARATORIA DE TIRO .pptx
INSTRUCCION PREPARATORIA DE TIRO   .pptxINSTRUCCION PREPARATORIA DE TIRO   .pptx
INSTRUCCION PREPARATORIA DE TIRO .pptx
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.Análisis de los Factores Externos de la Organización.
Análisis de los Factores Externos de la Organización.
 

Estadística con Lenguaje R: Sesión 7

  • 1. Lenguaje R: Sesión 7 ING. LUIS FERNANDO AGUAS B
  • 2. 2Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (1) Fácilmente se pueden calcular estadísticos sumario tipo media, mediana, desviación, … > x<-rnorm(50) > mean(x) [1] -0.2552258 > sd(x) [1] 1.209657 > var(x) [1] 1.463269 > median(x) [1] -0.3365646 #cuantiles empíricos > quantile(x) 0% 25% 50% 75% 100% -3.4542028 -1.1195259 -0.3365646 0.6758368 2.0094436 > pvec<-seq(0,1,0.1) > pvec [1] 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 > quantile(x,pvec) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% -3.4542028 -1.7757077 -1.1735237 -0.9867830 -0.6923767 -0.3365646 0.0907579 0.5180732 0.9876644 1.3546966 2.0094436
  • 3. 3Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (2) #exploramos el dataset juul > library(ISwR) > data(juul) > ?juul > attach(juul) > mean(igf1) [1] NA Debemos indicarle que no tenga en cuenta los valores missing: > mean(igf1,na.rm=T) [1] 340.168 > sd(igf1,na.rm=T) [1] 171.0356 #una excepción: la función length > sum(!is.na(igf1)) [1] 1018 #directamente, función summary() sobre cualquier dataset > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 Min. : 1.000 Min. :1.000 Min. : 25.0 Min. : 1.000 Min. : 1.000 1st Qu.: 9.053 1st Qu.: 1.000 1st Qu.:1.000 1st Qu.:202.3 1st Qu.: 1.000 1st Qu.: 1.000 Median :12.560 Median : 1.000 Median :2.000 Median :313.5 Median : 2.000 Median : 3.000 Mean :15.095 Mean : 1.476 Mean :1.534 Mean :340.2 Mean : 2.640 Mean : 7.896 3rd Qu.:16.855 3rd Qu.: 2.000 3rd Qu.:2.000 3rd Qu.:462.8 3rd Qu.: 5.000 3rd Qu.: 15.000 Max. :83.000 Max. : 2.000 Max. :2.000 Max. :915.0 Max. : 5.000 Max. : 30.000 NA's : 5.000 NA's :635.000 NA's :5.000 NA's :321.0 NA's :240.000 NA's :859.000
  • 4. 4Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen (3) #en el data frame tenemos variables categóricas > detach(juul) > juul$sex<-factor(juul$sex,labels=c("M","F")) > juul$menarche<-factor(juul$menarche,labels=c("No","Yes")) > juul$tanner<-factor(juul$tanner,labels=c("I","II","III","IV","V")) > attach(juul) > summary(juul) age menarche sex igf1 tanner testvol Min. : 0.170 No :369 M :621 Min. : 25.0 I :515 Min. : 1.000 1st Qu.: 9.053 Yes :335 F :713 1st Qu.:202.3 II :103 1st Qu.: 1.000 Median :12.560 NA's:635 NA's: 5 Median :313.5 III : 72 Median : 3.000 Mean :15.095 Mean :340.2 IV : 81 Mean : 7.896 3rd Qu.:16.855 3rd Qu.:462.8 V :328 3rd Qu.: 15.000 Max. :83.000 Max. :915.0 NA's:240 Max. : 30.000 NA's : 5.000 NA's :321.0 NA's :859.000 #también podríamos haber utilizado la función transform() > juul<-transform(juul, + sex=factor(sex,labels=c("M","F")), + menarche=factor(menarche,labels=c("No","Yes")), + tanner=factor(tanner,labels=c("I","II","III","IV","V")) )
  • 5. 5Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (1) #histogramas. Por defecto R, intenta hacer puntos de corte "adecuados" > hist(x)
  • 6. 6Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (2) #Ejemplo #accidentes vs edad (0-4,5-9,10-15,16,17,18-19,20-24,25-59,60-79) > mid.age<-c(2.5,7.5,13,16.5,17.5,19,22.5,44.5,70.5) > acc.count<-c(28,46,58,20,31,64,149,316,103) > age.acc<-rep(mid.age,acc.count) > brk<-c(0,5,10,16,17,18,20,25,60,80) > hist(age.acc,breaks=brk)
  • 7. 7Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (3) #distribución empírica acumulada > n<-length(x) > plot(sort(x),(1:n)/n,type="s",ylim=c(0,1))
  • 8. 8Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (4) #qqplot > qqnorm(x)
  • 9. 9Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para una variable (5) #Boxplots IgM ( Serum IgM in 298 children aged 6 months to 6 years) > data(IgM) > ?IgM > par(mfrow=c(1,2)) > boxplot(IgM) > boxplot(log(IgM)) > par(mfrow=c(1,1))
  • 10. 10Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (1) #Folate concentration in blood cells according to three types of ventilation during anesthesia > data(red.cell.folate) > attach(red.cell.folate) > ?red.cell.folate > summary(red.cell.folate) folate ventilation Min. :206.0 N2O+O2,24h:8 1st Qu.:249.5 N2O+O2,op :9 Median :274.0 O2,24h :5 Mean :283.2 3rd Qu.:305.5 Max. :392.0 > tapply(folate,ventilation,mean) N2O+O2,24h N2O+O2,op O2,24h 316.6250 256.4444 278.0000 > #Para tener más de un estadístico resumen por grupo > m<-tapply(folate,ventilation,mean) > s<-tapply(folate,ventilation,sd) > n<-tapply(folate,ventilation,length) > cbind(mean=m,std.dev=s,n=n) mean std.dev n N2O+O2,24h 316.6250 58.71709 8 N2O+O2,op 256.4444 37.12180 9 O2,24h 278.0000 33.75648 5
  • 11. 11Sesión 7 – Introducción a la estadística básica y gráficos Estadísticos resumen para grupos (2) #para el dataset juul > tapply(igf1,tanner,mean) I II III IV V NA NA NA NA NA > tapply(igf1,tanner,mean,na.rm=T) I II III IV V 207.4727 352.6714 483.2222 513.0172 465.3344
  • 12. 13Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (2) #boxplots para cada grupo > boxplot(expend~stature) > boxplot(expend.lean,expend.obese)
  • 13. 14Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para datos agrupados (3) #con muestras tan pequeñas, los boxplots pueden resultar engañosos #gráficos de los datos originales, punto a punto > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(3,3,2,1)+0.1) > stripchart(expend~stature) > stripchart(expend~stature,method="jitter") > stripchart(expend~stature,method="stack") > stripchart(expend~stature,method="stack",jitter=0.03) > par(opar)
  • 14. 15Sesión 7 – Introducción a la estadística básica y gráficos Tablas (1) #Una tabla debe estar en un objecto tipo matriz #Ejemplo mujeres consumo cafeína vs estado civil > caff.marital<-matrix(c(652,1537,598,242,36,46,38,21,218,327,106,67),nrow=3,byrow=T) > caff.marital [,1] [,2] [,3] [,4] [1,] 652 1537 598 242 [2,] 36 46 38 21 [3,] 218 327 106 67 > colnames(caff.marital)<-c("0","1-150","151-300",">300") > rownames(caff.marital)<-c("Married","Prev.married","Single") > caff.marital 0 1-150 151-300 >300 Married 652 1537 598 242 Prev.married 36 46 38 21 Single 218 327 106 67 #también podemos crearla a partir de variables categóricas de un dataset table(sex) sex M F 621 713 > table(sex,menarche) menarche sex No Yes M 0 0 F 369 335 > table(menarche,tanner) tanner menarche I II III IV V No 221 43 32 14 2 Yes 1 1 5 26 202
  • 15. 16Sesión 7 – Introducción a la estadística básica y gráficos Tablas (2) #podemos transponer las tablas > t(caff.marital) Married Prev.married Single 0 652 36 218 1-150 1537 46 327 151-300 598 38 106 >300 242 21 67 #para calcular las frecuencias marginales, perfiles fila, ... > tanner.sex<-table(tanner,sex) > tanner.sex sex tanner M F I 291 224 II 55 48 III 34 38 IV 41 40 V 124 204 > margin.table(tanner.sex,1) tanner I II III IV V 515 103 72 81 328 > margin.table(tanner.sex,2) sex M F 545 554 > prop.table(tanner.sex,1) sex tanner M F I 0.5650485 0.4349515 II 0.5339806 0.4660194 III 0.4722222 0.5277778 IV 0.5061728 0.4938272 V 0.3780488 0.6219512 > prop.table(tanner.sex,1)*100 sex tanner M F I 56.50485 43.49515 II 53.39806 46.60194 III 47.22222 52.77778 IV 50.61728 49.38272 V 37.80488 62.19512 > tanner.sex/sum(tanner.sex) sex tanner M F I 0.26478617 0.20382166 II 0.05004550 0.04367607 III 0.03093722 0.03457689 IV 0.03730664 0.03639672 V 0.11282985 0.18562329
  • 16. 17Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (1) #diagrama de barras > total.caff<-margin.table(caff.marital,2) > total.caff 0 1-150 151-300 >300 906 1910 742 330 > barplot(total.caff,col="white")
  • 17. 18Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (2) #diagramas de barras para una tabla de contingencia > par(mfrow=c(2,2)) > barplot(caff.marital,col="white") > barplot(t(caff.marital),col="white") > barplot(t(caff.marital),col="white",beside=T) > barplot(prop.table(t(caff.marital),2),col="white",beside=T) > par(mfrow=c(1,1))
  • 18. 19Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (3) #otro diagrama de barras para una tabla de contingencia > barplot(prop.table(t(caff.marital),2),beside=T, + legend.text=colnames(caff.marital), + col=c("white","grey80","grey50","black"))
  • 19. 20Sesión 7 – Introducción a la estadística básica y gráficos Gráficos para tablas (4) #diagrama de sectores para una tabla de contingencia > opar<-par(mfrow=c(2,2),mex=0.8,mar=c(1,1,2,1)) > slices<-c("white","grey80","grey50","black") > pie(caff.marital["Married",],main="Married",col=slices) > pie(caff.marital["Prev.married",],main="Previously married",col=slices) > pie(caff.marital["Single",],main="Single",col=slices) > par(opar)