-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathAnalisis inferencial.Rmd
89 lines (71 loc) · 2.3 KB
/
Analisis inferencial.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
---
title: 'Analisis inferencial: Regresion lineal'
author: "Anthony J. Servita R."
date: "16/10/2020"
output:
html_document: default
pdf_document: default
---
```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```
```{r include=FALSE}
library(lattice)
library(dplyr)
```
Entendimiento del problema:
datos representan el diseño de plantas en climas dificiles.
1.- Conocimiento de los datos
```{r plantas}
options(digits = 2)
Duracion <- c(92, 92, 96, 100, 102, 102, 106, 106, 121, 143)
Rendimiento <- c(1.7, 2.3, 1.9, 2, 1.5, 1.7, 1.6, 1.8, 1, 0.3)
datasets <- data.frame(Duracion, Rendimiento)
head(datasets)
```
Regresión lineal:
```{r}
## correlación
df <- datasets
df %>%
select_if(is.double) %>%
cor() %>%
round(digits = 2)
```
ambas variables presentan una correlacion muy alta y significativa de forma
negativa
ecuación de la recta:
```{r}
regresion <- lm(Rendimiento ~ Duracion, df)
regresion
```
la ecuación de la recta esta dada por Y = mx + b
sus valores son: y = -0.0342x + 5.2068
```{r}
summary(regresion)
```
vemos que el valor-p es significativo para la regresion, lo que quiere decir,
que la variable independiente "Duracion" describe completamente a la variable
"Rendimiento".
el valor de p es muy significativo ***. por lo que existe una regresion
lineal significativa entre la duracion y el rendimiento.
Residual standard error: En promedio, cualquier prediccion del modelo se aleja
0.8 unidades del valor real
R^2: el predictor Rendimiento puede explicar el 86.8% de la variabilidad
observada en la Duracion de las plantas.
Estimación del rendimiento:
```{r}
newdata <- c(104)
predict(regresion, newdata = data.frame(Duracion = c(104)),
interval ="prediction", level = 0.95)
```
el valor fit se encuentra dentro del intervalor lwr y upr por lo que se tiene
un 95% de confianza de que el valor esperado para la "Duracion" de una planta
en climas dificiles es de 1.6 de "Rendimiento".
Gráfica de regresion.
```{r}
attach(df)
plot(Duracion, Rendimiento, abline(regresion, col = "red"),
main = "Regresion lineal de Rendimiento Vs Duracion de la plantas")
```
La recta calculada en la regresion lineal se ajusta muy bien a los datos dispersos en las variables rendimiento y duracion.