Diseños factoriales_1

Report
DISEÑOS FACTORIALES
Ingeniería Industrial.
Estadística III
Henry Lamos Díaz
EJEMPLO
•
•
•
•
Un ingeniero diseña una batería para usar en un motor de
cierto producto. Para ello dispone de tres tipos diferentes de
material. Como considera que la temperatura es un factor
influyente en la duración de la batería, decide diseñar el
experimento combinando los tres materiales con tres
temperaturas concretas.
¿Cómo llevaría a cabo el experimento?
Realice un diseño para el experimento
Defina la unidad experimental
¿Cuántas unidades experimentales tomaría?
Diseño Factorial
2
EJEMPLO
¿ Qué efecto tienen el tipo de material y la temperatura sobre
la vida de la batería?
• ¿ Existe alguna elección del material que produzca de manera
regular una vida larga de la batería independientemente de la
temperatura? O sea, ¿Hay posibilidad de un material sea más
recomendado a una temperatura en concreto y no lo sea a otra
distinta?
Diseño Factorial
3
4
Temperatura
Experimento
Tipo de
Material
DISEÑO Y ANALISIS DE EXPERIMENTOS
Duración en
horas de la
batería
¿QUÉ ES?
Es el estudio de los efectos de dos o más factores de
interés.
Para ello en cada ensayo o réplica completa se
investigan todas las combinaciones posibles de los
niveles de los factores deseados.
Ejemplo. Si el factor A tiene a niveles, el factor
B tiene b niveles y el factor C tiene c niveles,
cada réplica contiene todas las abc
combinaciones de los tratamientos.
Diseño Factorial
5
VENTAJAS DE DISEÑOS
FACTORIALES
Son más eficientes que
estudiar cada factor solo.
Son necesarios cuando
pueden haber
interacciones presentes
a fin de evitar
conclusiones incorrectas.
Permiten conocer las
estimaciones de una
factor con varios niveles
de factores restantes.
Diseño Factorial
6
DISEÑO FACTORIAL DE DOS
FACTORES
Se tiene dos factores A y B, el factor A tiene a niveles y el factor B tiene
b niveles. Cada réplica n contiene todas las ab combinaciones de los
tratamientos. En total se tienen abn observaciones o corridas.
Factor B
Factor A
1
2
1
Y111, Y112,
…, Y11n
Y121, Y122,
…, Y12n
2
Y211, Y212,
…, Y21n
Y221, Y222,
Ya11, Ya12,
…, Ya1n
Ya21, Ya22,
…, Ya2n
…, Y22n
…
b
…
Y1b1, Y1b2,
…, Y1bn
…
Y2b1, Y2b2,
…, Y2bn
…
Yab1, Yab2,
…, Yabn
.
.
a
Diseño Factorial
7
8
NOTACIONES
1 b
1 a
i .   ij , . j   ij ,
b j 1
a j 1
1 b
 
ab j 1
a
 ,
j 1
ij
 i  i .  
 j  . j  
DISEÑO Y ANALISIS DE EXPERIMENTOS
Diseño Factorial
8
9
µ es la gran media de la población, que es el promedio de todas
las medias de los tratamientos
Se llama el i-ésimo efecto del renglón, el valor de
indica el
grado con el cual el i-ésimo nivel del factor A tiende a producir
resultados que son mayores o menores que la gran media de la
población.
Se llama el j-ésimo efecto de columna o factor B, indica el grado
con el cual el j-ésimo nivel de la columna tiene a producir
resultados que son mayores o menores que la gran media de la
población.
DISEÑO Y ANALISIS DE EXPERIMENTOS
Diseño Factorial
9
1
NOTACIONES
1 b
 
ab j 1
a
 ,
j 1
ij
ij    ( i .   )  ( . j   )  ( ij  i .  . j   )
 i  i .  
 j  . j  
( )ij  ij    ( i   j )
 ij  i .  . j  
Interacción: Cuando el efecto de un
factor depende del nivel del otro factor
DISEÑO Y ANALISIS DE EXPERIMENTOS
Diseño Factorial
10
11
Se llama interacción.
El efecto de un nivel de factor A (o B) puede depender del nivel
del factor B (o A) que esta apareado con el factor A. Los términos
de interacción miden el grado con el que este ultimo ocurre.
Por ejemplo, suponga que el factor 1 del factor A tiende a producir
un resultado grande cuando se aparea con el factor B de nivel 1,
pero un resultado pequeño cuando se aparea con una columna de
nivel 2.
En este caso
sería positivo y
sería negativa.
DISEÑO Y ANALISIS DE EXPERIMENTOS
Diseño Factorial
11
Dos conceptos importantes
EFECTO
PRINCIPAL
Cambio en la respuesta
producido por un cambio en el
nivel de un factor de interés
primario.
INTERACCIÓN
Cuando la diferencia en la
respuesta entre los niveles de
un factor no es la misma para
todos los niveles de los otros
factores.
Cuando una interacción es
grande, lo efectos principales
tienen escaso significado ya
que la interacción suele
enmascarar la significación de
los efectos principales.
Diseño Factorial
12
Modelos
• Modelo de los Efectos
y ijk     j   i   ij   ijk
Donde µ es el efecto promedio de la media global, τi es el
efecto del nivel i-ésimo del factor A de los renglones, βj es el
efecto del nivel j-ésimo del factor B de las columnas, (τβ)ij es el
efecto de la interacción entre el factor A en el nivel i y el
factor B en el nivel j, y ɛijk es un componente del error
aleatorio.
Diseño Factorial
13
• Modelo de las Medias
y ijk   ij   ijk
Donde la media de la celda ij-ésima es
 ij   j   i   ij
• Modelo de Regresión
Útiles cuando uno o más de los factores del diseño son
cuantitativos.
Diseño Factorial
14
Hipótesis
• Acerca de la igualdad de los efectos de los tratamientos de los
renglones o factor A.
Ho: τ1 = τ2 = … = τa = 0
H1: al menos una τi ≠ 0
• Acerca de la igualdad de los efectos de los tratamientos de las
columnas o factor B.
Ho: β1 = β2 = … = βb = 0
H1: al menos una βj ≠ 0
• Acerca de la interacción entre las columnas y los renglones.
H0: (τβ)ij = 0
H1: al menos una (τβ)ij ≠ 0
Diseño Factorial
15
ANÁLISIS DEL MODELO
Se definen:
Observaciones bajo el
nivel i-ésimo del factor A
Observaciones bajo el
nivel j-ésimo del factor B
Observaciones de la celda
ij-ésima
De todas las
observaciones
Diseño Factorial
16
Suma de cuadrados
La suma de cuadrados total corregida puede
escribirse como
Diseño Factorial
17
Se tiene finalmente
a
b
n
a
b
2
(
y

y
)

bn
(
y

y
)

an
(
y

y
)
 ijk ...
 i.. ...
 . j. ...
2
i 1 j 1 k 1
2
i 1
a
j 1
b
a
b
n
 n ( yij .  yi..  y. j .  y... )   ( yijk  yij . ) 2
2
i 1 j 1
i 1 j 1 k 1
Los Grados de libertad asociados son
Efecto
Grados de
Libertad
A
a-1
B
b-1
Interacción AB
(a-1)(b-1)
Error
ab(n-1)
Total
abn-1
Diseño Factorial
18
Cuadrados Medios
Cada suma de cuadrados dividida por sus grados de
libertad es un cuadrado medio, los valores
esperados de los cuadrados medios son
Si son verdaderas las
hipótesis nulas de que no
hay efectos en los
tratamientos de los
renglones, ni de los
tratamientos de las
columnas, ni interacción,
entonces los valores
esperados de los
Cuadrados Medios son
todos estimaciones de la
varianza.
Diseño Factorial
19
ANOVA
Fuente de
variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
F0
Tratamientos A
SSA
a-1
SSA
a-1
MSA
MSE
Tratamientos B
SSB
b-1
SSB
b-1
Interacción
SSAB
(a-1)(b-1)
SSAB
(a-1)(b-1)
Error
SSE
ab(n-1)
Total
SST
abn-1
MSB
MSE
MSAB
MSE
SSE
ab(n-1)
Cada Hipótesis Nula deberá rechazarse si:
Fo  F
Diseño Factorial
20
Cálculos Manuales
Diseño Factorial
21
Temperatura
Tipo de
material
15
70
125
1
130, 155,
74, 180
34, 40, 80,
75
20, 70, 82,
58
2
150, 188,
159,126
136, 122,
106, 115
25, 70, 58,
45
3
138. 110,
168, 160
174, 120,
150, 139
96, 104, 82,
60
Temperatura
Se obtienen los
totales y los
promedios por
celdas,
renglones,
columnas y Total
Tipo de
material
15
70
125
1
539/4
229/4
230/4
998/12
2
623/4
479/4
198/4
1300/12
3
576/4
583/4
342/4
1501/12
1738/12
1291/12
770/12
3799/36
Diseño Factorial
22
Efectos
Temperatura
Tipo de
material
15
70
125
1
12.28
-27-97
15.69
-22.36
2
8.11
9.36
-17.47
2.8
3
-20.38
18.61
1.78
19.55
39.3
2.06
-41.36
Diseño Factorial
23
Vida Promedio
Gráfica tipo de materialtemperatura
Se observa que en
promedio el materia C
tiene mayor duración.
El material A parece
ser inadecuado para la
batería.
Temperatura
Diseño Factorial
24
Gráfica tipo de material-temperatura
Diseño Factorial
25
Anova
Fuente de
variación
Suma de
Cuadrados
Grados
de
Libertad
Cuadrado
Medio
F0
Tipos de
Material
10,683.72
2
5,341.86
7.91
Temperatura
39,118.72
2
19,559.36
Interacción
9,613.78
4
2,403.44
Error
18,230.75
27
675.21
Total
77,646.97
35
28.97
3.56
Interacción entre las columnas y los renglones.
H0: (τβ)ij = 0
Diseño Factorial
H1: al menos
una (τβ)ij ≠ 0
26
ESTIMACIÓN DE PARÁMETROS
Los parámetros del modelo se obtienen mediante:
ˆ  y ...
ˆ j  y . j .  y...
ˆi  y i..  y...
 ij  y ij.  y i..  y . j.  y ...
Diseño Factorial
27
Conclusiones
• Tanto el material como la temperatura son factores
determinantes para la duración de las baterías. Además, por
haber interacción, puede ocurrir que un material sea más
recomendado a una temperatura, pero no lo sea a otra
distinta.
• A menor temperatura mayor duración de la batería,
independiente del material utilizado.
•
Al variar la temperatura de 15 a 70, la duración se mantiene
con el material 3, y disminuye con los materiales 1 y 2.
Diseño Factorial
28
• Si comparamos la temperatura de 70 y la de 125, la duración
disminuye con los materiales 2 y 3, y apenas cambia con el
material 1.
•
Si lo que deseamos es que al aumentar la temperatura la
duración no disminuya excesivamente, la mejor opción es el
material 3.
• Al haber interacción, tiene sentido querer comparar el tipo
de material a una temperatura en concreto; por ejemplo a
70.
Diseño Factorial
29
VERIFICACIÓN DEL MODELO
La violación de supuestos básicos y la
adecuación del modelo se investigan
mediante los residuales.
eijk  yijk  yij.
Residuales del
modelo
Se hace uso de gráficas para analizar. Si el
modelo es adecuado, los residuales deben
estar sin estructura; es decir, no deben haber
patrones obvios.
Diseño Factorial
30
Gráficas
eijk
eijk
ˆ
Q
Yˆijk
Niveles del Factor
Valores ajustados
eijk
Diseño Factorial
31
% de Probabilidad normal
Gráfica de probabilidad Normal
Residuales
Diseño Factorial
32
Residuales contra Factores
Temperatura
Tipo de Material
Gráfica de los
residuales contra el
tipo de material
para el ejemplo.
Estadística III.
Gráfica de los
residuales contra la
temperatura para el
ejemplo.
Diseño Factorial
33
Residuales contra
Diseño Factorial
34
En la práctica algunas variables de respuesta no
siguen una distribución normal sino que se
distribuyen, por ejemplo, Poisson, binomial o
Gamma, etc. En algunas de estas distribuciones la
media está relacionada con la desviación estándar, y,
al cambiar la media de un tratamiento a otro, con ella
cambia la variabilidad de la respuesta.
Soluciones: 1. Utilizar métodos de análisis no paramétricos.
Investigar
2. Hacer el análisis mediante modelos lineales generalizados
(GML)
3. Transformar la variable respuesta
35
DISEÑO Y ANALISIS DE
EXPERIMENTOS
 2  E ( y )(1  E ( y ) y '  sin 1 ( y ) y s onproporcione s
 2  E ( y)
y'  y
pois s on
 2  [ E ( y )]2
y '  ln( y )
 2  [ E ( y )]3
 2  [ E ( y )]4
y '  y 1/ 2
y '  y 1
En la tabla e l s ím bolo s ignifica" e s porporcional.
A m e didaque s e da la re laciónde porporcionalidad
con re s pe ctoa m ayorpote nciade la m e dia,s e re quie
re una trans form ción
a
m ás fue rte .
El gradode proporcionalidad s e pue deve r e n la gráfica
de residuosvs. predichos
36
DISEÑO Y ANALISIS DE
EXPERIMENTOS
INTERPRETACIÓN DE RESULTADOS
Después de realizar el experimento el experimentador
está listo para sacar conclusiones prácticas acerca del
problema bajo estudio.
Las conclusiones pueden obtenerse mediante:
Regresión Lineal.
Se desarrolla un
modelo empírico
para pronosticar y
optimizar.
Comparaciones
gráficas de las
medias.
Contrastes.
Comparaciones de
Pares de Medias de
los tratamientos.
Se grafican las
medias de los
niveles sobre el
eje x.
Diseño y Análisis de experimentos
37
Método de Tukey para intervalos
de confianza y prueba de hipótesis
MSE
ˆ i  ˆ j  qa ,ab ( n1 ),
Se tiene una confianza
bn
del 100(1-  )% de que los intervalos de confianza
deTukey contenganel verdaderode las diferencias
i  j
MSE
| ˆ i  ˆ j | qa ,ab ( n1 ),
. La hipótesis nula
bn
H 0 :  i   j  0 se rechazaconun nivel de 
Diseño y Análisis de experimentos
38
Método de Tukey para intervalos
de confianza y prueba de hipótesis
MSE
Se tiene una confianza
an
del 100(1-  )% de que los intervalos de confianza
deTukey contenganel verdaderode las diferencias
ˆ i  ˆ j  qb ,ab ( n1 ),
i   j
Diseño y Análisis de experimentos
39
COMPARACIONES MULTIPLES
PRUEBA DE TUKEY. SE FIJA EL FACTOR B EN UN NIVEL ESPECIFICO
(NIVEL 2, T=70)
• Cuando la interacción es significativa, las
comparaciones entre las medias de uno de los
factores (A o B) pueden ser oscurecidas por la
interacción AB.
• Entonces, se fija un nivel del factor B y se aplica, por
ejemplo, la prueba de Tukey a las medias del factor
A con ese nivel.
• Si la interacción es significativa se puede comparar
las medias de todas las ab celdas para determinar
cuáles difieren significativamente.
Diseño Factorial
41
Ejercicio en clase
En un artículo de Industrias Quality Control se describe un
experimento para investigar el efecto del tipo de cristal de fosforo
sobre la brillantez de un cinescopio. Los datos son los siguientes:
Tipo de cristal Tipo de fosforo
1
2
280
300
1
290
310
285
295
230
260
2
235
240
240
235
Diseño Factorial
3
290
285
290
220
225
230
42
Ejericicio continuación
¿Existe algún indicio de que alguno de los dos
factores influya en la brillantez? Utilizar α=0.05
¿Los dos factores interactúan? Utilizar α=0.05
Analizar los residuales de este experimento
Diseño Factorial
43
Ejercicio I
Los datos recogidos en la siguiente tabla son los tiempos de
supervivencia, en horas, de unos animales a los que se les
suministra al azar tres venenos y cuatro antídotos (o
tratamientos). Se pretende estudiar qué antídoto es el
adecuado para cada veneno.
Antidoto
Veneno
A1
A2
A3
I
3.1
4.6
3.6
4
2.2
1.8
4.5
4.3
2.9
2.3
2.1
2.3
II
8.2
8.8
9.2
4.9
3
3.8
11
7.2
6.1
12.4
3.7
2.9
III
4.3
6.3
4.4
3.1
2.3
2.4
Diseño Factorial
4.5
7.6
3.5
4
2.5
2.2
IV
4.5 7.1
6.6 6.2
5.6 10.2
7.1 3.8
3 3.6
3.1 3.3
44
Debe responde
Plantear el modelo adecuado.
Definir la suma de cuadrado del efecto del veneno en el
antídoto I. Determinar la distribución de probabilidad .
¿Qué valor tiene la variable aleatoria en los datos?
¿Son los venenos igual de peligrosos?
¿Los antídotos son igual de efectivos?
La efectividad de los antídotos, ¿es la misma para todos
los venenos?
Estudiar, utilizando el método de diferencias
significativas mínimas (LSD), qué antídoto(s) es el más
efectivo
Diseño Factorial
45
Modelo estadístico para tres factores
• Modelo de las Medias
y ijkl   ijk   ijkl
Donde la media de la celda ijk-ésima es
 ijk   i   j   k   ij   ik    jk   ijk
Diseño Factorial
46
Modelo estadístico para tres factores
• Una interacción de dos factores típica es
  jk
 (  . jk   ... )   j   k
La interacción de tres factores se presenta cuando las
interacciones del efecto principal y dos factores no logran
explicar la variación en las desviaciones de las medias de las
celdas
 ijk   ...
La interacción de tres factores es la diferencia entre la
desviación de la media de celdas y la suma de los efectos
principales y los efectos la interacción de dos factores
Diseño Factorial
47
Continuación
 ijk

  ijk   ...   i   j   k   ij   ik    jk
La interacción significativa de los tres factores
implica que la interacción dos de ellos nos es
constante para los niveles del tercer factor
Diseño Factorial
48

Si no hay Interacción…
Yij    i   j  
 ij  0
Entonces el Cuadrado Medio de los
residuales es un estimador insesgado de la
varianza y los efectos principales se prueba
con:
MS A
MSRsidual
MSB
MSRsidual
Diseño Factorial
49
Si no hay Interacción…
Los valores ajustado se calculan
ˆy ijk  y i ..  y . j .  y ...
Al graficar los promedios de las celdas menos el valor
ajustado y ij .  ˆy ijk contra el valor ajustado ˆy ijk .
Si llega a existir un patrón en la gráfica se
puede llegar a concluir que el supuesto sobre
no interacción entre los factores es falso.
Diseño Factorial
50
Continuar con el ejemplo de la
temperatura y el tipo de material
asumiendo que no existe
interacción
Diseño Factorial
51
UNA OBSERVACIÓN POR CELDA
Cuando se encuentran experimentos con una
sola réplica.
En este caso la varianza del error no se puede
estimar puesto que el efecto de la interacción
de los dos factores y el error experimental no
pueden separarse de alguna manera obvia. Por
ello no se cuenta con pruebas para los efectos
principales a menos que el efecto de la
interacción sea cero.
Diseño Factorial
52
Si no hay Interacción…
Yij    i   j  
 ij  0
H 0 : i  0
MS A
MS A

.
MSRe sidual
MS AB
H0 :  j  0
MS B
MS B

MSRe sidual
MS AB
Diseño Factorial
53
Para probar si hay Interacción
 ij  i  j
Tukey desarrolló una prueba


Y 

 YijYi.Y. j  Y.. SSA  SSB 

ab
 i 1 j 1


SSN 
abSSA SSB
a
2
..
b
SSE  SSRe sidual  SSN
Fo 
2
Con 1 Grado de
Libertad
Con (a-1)(b-1)-1 Grados de Libertad
SSN
SSE /(a  1)(b  1)  1
La Hipótesis Nula de que no hay ninguna
interacción deberá rechazarse si
Fo  F ;1;( a1)(b1)1
Diseño Factorial
54
Las impurezas presentes en un producto químico son afectados por dos factores, la
presión y la temperatura.
Temp
eratur
a
Presión
25
30
35
40
45
100
5
4
6
3
5
125
3
1
4
2
3
150
1
1
3
1
2
Diseño Factorial
55
2. DISEÑO FACTORIAL GENERAL
En este caso hay a Niveles del Factor A, b
Niveles del Factor B y c Niveles del Factor C.
Entonces habrá abcn observaciones si se
hacen n réplicas del experimento completo.
Modelo
Diseño Factorial
56
ANOVA
Fuente de
variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrado Medio
Fₒ
A
SSA
a-1
MSA
MSA
MSE
B
SSB
b-1
MSB
MSB
MSE
C
SSC
c-1
MSC
MSC
MSE
AB
SSAB
(a-1)(b-1)
MSAB
MSAB
MSE
AC
SSAC
(a-1)(c-1)
MSAC
MSAC
MSE
BC
SSBC
(b-1)(c-1)
MSBC
MSAC
MSE
ABC
SSABC
(a-1)(b-1)(c-1)
MSABC
MSABC
MSE
Error
SSE
abc(n-1)
MSE
Total
SST
abcn-1
Diseño Factorial
57
Cálculos Manuales
Diseño Factorial
58
Diseño Factorial
59
EJEMPLO
Una empresa embotelladora de refrescos está interesada en
obtener alturas de llenado más uniformes en las botellas que
se fabrican en su proceso de manufactura. El ingeniero de
proceso puede controlar 3 variables: El porcentaje de
carbonatación (A), la presión de operación en el llenador (B) y
las botellas producidas por minuto o rapidez de línea (C). Se
decide trabajar 3 niveles para el factor A, y 2 niveles para los
factores B y C.
Se muestran los resultados obtenidos que representan la
desviación promedio de la altura de llenado objetivo que se
observa en una corrida de producción de botellas con cada
conjunto de condiciones.
Diseño Factorial
60
Datos
Presión de operación (B)
Porcentaje de
carbonatación
(A)
25 psi
30 psi
Rapidez de línea (C)
Rapidez de línea (C)
200
10
12
14
Totales B x C y.jk.
Y.j..
-3
250
1
-4
-1
200
1
250
1
-1
-1
0
0
1
0
2
2
6
1
1
5
1
7
9
4
3
6
6
13
5
3
7
9
15
21
16
Yi…
5
10
11
20
2
-4
11
20
21
59
34
75=Y….
54
Diseño Factorial
61
Datos de la desviación de la altura de llenado
del ejemplo para la construcción del ANOVA
TOTALES A X B
TOTALES A X C
Yij..
Yi.K.
C
B
A
25
30
A
200
250
10
-5
1
10
-5
1
12
4
16
12
6
14
14
22
37
14
25
34
Diseño Factorial
62
Anova
Fuente de
variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrado Medio
F0
A
252.750
2
126.375
178.412
B
45.375
1
45.375
64.059
C
22.042
1
22.042
31.118
AB
5.250
2
2.625
3.706
AC
0.583
2
0.292
0.412
BC
1.042
1
1.042
1.471
ABC
1.083
2
0.542
0.765
Error
8.500
12
0.708
Total
336.625
23
Diseño Factorial
63
AJUSTE DE CURVAS Y SUPERFICIES
DE RESPUESTA
Es útil ajustar una curva de respuesta a los niveles de un
factor cuantitativo con el propósito de contar con una
ecuación que relacione la repuesta con el factor.
La ecuación se usa para hacer interpolaciones.
Se usan métodos de regresión lineal para ajustar estos
modelos a los datos experimentales
Diseño Factorial
64
AJUSTE DE CURVAS Y SUPERFICIES
DE RESPUESTA
Y   0  1 x   2 x  
2
Intercepción
Peso porcentual
Peso porcentual
cuadrático
Coeficientes Error típico Estadístico t Probabilidad
-39,9885714 9,78467045 -4,0868593 0,00048799
4,59257143
-0,08857143
0,82771391
5,54850094
1,4115E-05
0,0164396 -5,38768723
2,0715E-05
Ejercicio: hacer el ajuste para un polinomio de grado tres. Decidir cuál
modelo es más plausible.
Diseño Factorial
65
Modelo de regresión lineal
• Para probar la capacidad de un determinado
polímero para eliminar desechos tóxicos del
agua, se hicieron experimentos a tres
temperaturas (x=1,2,3) diferentes. Los datos
siguientes indican los porcentajes de
impurezas eliminadas (y) por el polímero en
21 ensayos independientes.
Estadística III. H Lamos
66
A baja temperatura
42
41
37
29
35
40
32
A temperatura media
36
35
32
38
39
42
34
A Alta temperatura
33
44
40
36
44
37
45
a1
yi   0    i x i  
i 1
donde a es el número de tratamientos
  1 si yi es del tratamiento a

x i   1 si yi es del tratamiento i
 0 en caso contrario

Estadística III. H Lamos
67
 i   i   , i  1,2 ,..a  1
0  
 1   2  ..   a

a
Estadística III. H Lamos
68
AJUSTE DE CURVAS Y SUPERFICIES
DE RESPUESTA
Y  0  1 A   2 A2  3 B[1]   4 B[2]  5 AB[1]  6 AB[2]  7 A2 B[1]  8 A2 B[2]  
1
Tipo de material
2
3
B[1]
1
0
-1
B[2]
0
1
-1
Ejercicio: hacer el ajuste para un polinomio de
grado tres. Decidir cuál modelo es más
plausible.
Diseño Factorial
69
Salida
Análisis de regresión: Vida vs. x1. x21. ...
La ecuación de regresión es
Vida = 108 - 40,3 x1 - 50,3 x21 + 12,2 x22 - 3,08 x1^2 + 1,71 x1x21 - 12,8 x1x22
+ 42,0 x1^2x21 - 14,0 x1^2x22
Predictor Coef
Constante 107,583
x1
-40,333
x21
-50,33
x22
12,17
x1^2
-3,083
x1x21
1,708
x1x22
-12,792
x1^2x21 41,96
x1^2x22 -14,04
SE Coef T P
7,501 14,34 0,000
5,304 -7,60 0,000
10,61 -4,74 0,000
10,61 1,15 0,261
9,187 -0,34 0,740
7,501 0,23 0,822
7,501 -1,71 0,100
12,99 3,23 0,003
12,99 -1,08 0,289
Diseño Factorial
S = 25,9849 R-cuad. = 76,5% R-cuad.(ajustado) = 69,6%
70
Salida
Análisis de varianza
Fuente
Regresión
Error residual
Total
GL
SC MC F P
8 59416,2 7427,0 11,00 0,000
27 18230,7 675,2
35 77647,0
Diseño Factorial
71
Salida
Fuente
x1
x21
x22
x1^2
X1x21
X1x22
x1^2x21
x1^2x22
GL SC Sec.
1 39042,7
1 10542,0
1 141,7
1 76,1
1 351,6
1 1963,5
1 6510,0
1 788,7
Diseño Factorial
72
BLOQUES ALEATORIZADOS,
CUADRADOS LATINOS Y DISEÑOS
RELACIONADOS
1. BLOQUES COMPLETOS
ALEATORIZADOS
En cualquier experimento, la variabilidad que surge de
un factor perturbador puede afectar los resultados.
• Factor perturbador: Factor de diseño que
probablemente tenga un efecto sobre la respuesta,
pero en el que no existe interés.
Desconocido y
no controlable
Se controla con
aleatorización.
pero no
controlable
Deben analizarse.
Y se puede
controlar
Se controla con
BLOQUES
Conocido
74
Diseño por bloques
¿QUÉ ES?
El diseño por bloques completos y aleatorizados es
un diseño en el que las unidades (unidades de
Hacer queque
el error
experimentación) a experimental
las
se aplican los
sea
tan
OBJETIVO
como sea posible.
tratamientos
son pequeño
subdivididas
en
grupos
homogéneos llamados bloques, de tal manera que el
número de unidades de experimentación en un
bloque es igual al número (o a un múltiplo del
Y reducir
el error residual
mismo) de tratamientos
en
estudio.
del experimento al eliminar
la variabilidad
Para ello el experimentador
prueba cada nivel del factor
en cada uno de los
ejemplares de prueba.
75
Diseño por bloques
UTILIDIDAD DE
BLOQUEAR
76
Los bloques o ejemplares de
prueba forman una unidad
experimental más homogénea.
Unidades de
maquinaria.
Probar la robustez de la
variable deseada frente
a las condiciones que
no se pueden controlar.
Lotes de materia prima,
personas, tiempo.
Combinaciones de
factores no
controlables.
Diseño por bloques
ANÁLISIS ESTADÍSTICO
Hay una observación por
tratamiento en cada bloque,
el orden en que se corren los
tratamientos en los bloques
se determina al azar.
Modelo para los datos
Modelo de los Efectos
 i  1, 2,..., a
yij     i   j   ij 
 j  1, 2,..., b
77
Supóngase que hay a
tratamientos y b
bloques
Diseño por bloques
  Media global.
 i  Efecto del tratamiento i-ésimo.
 j Efecto del bloque j-ésimo.
 ij  Término del error.
a

i 1
i
0
b

j 1
j
0
Hipótesis
El interés se encuentra en probar la igualdad de
las medias.
Donde
78
Diseño por bloques
Análisis del modelo con efectos
fijos
 Y
 Total de las observaciones bajo el tratamiento i-ésimo.
b
Yi.

ij
j 1
Yi.
Y i. 
b
 Promedio de las observaciones bajo el tratamiento i-ésimo.
a
Y. j   Yij
 Total de las observaciones bajo el bloque j-ésimo.
i 1
Y.j 
a
Y. j
a
 Promedio de las observaciones bajo el bloque j-ésimo.
b
Y..   Yij  Gran total de todas las observaciones.
i 1 j 1
Y..
Y .. 
 Promedio de todas las observaciones.
ab  N
79
Diseño por bloques
ANÁLISIS DE VARIANZA
Suma de cuadrados total corregida y su
partición:
a
ni
SST   ( yij  y.. )
i 1 j 1
2
de
N  1 Grados
Libertad
SST =
SSTRATAMIENTOS +
SSBLOQUES + SSE
80
Diseño por bloques
yij  y..  ( yi.  y.. )  ( y. j  y.. )  ( yij  yi.  y. j  y.. )
Observemosla expresión( y. j  y.. )  ( yij  yi.  y. j  y.. ).
Simplificando se tiene yij  yi. ; por consiguiente
( y. j  y.. )  ( yij  yi.  y. j  y.. )  yij  yi.
81
Diseño por bloques
Los grados de libertad para las sumas cuadradas en
SST = SSTRATAMIENTOS + SSBLOQUES + SSE
Son :
ab  1  a  1  b  1  (a  1)(b  1)
Cada suma de cuadrados dividida por sus Grados de
Libertad es un cuadrado medio.
SSTratamient o
,
a 1
82
SSBloque
SSE
,
b 1
(a  1)(b  1)
Diseño por bloques
Los valores esperados de los cuadrados medios
n
2
son:
b i
E ( MSTratamient o )   2 
i 1
a 1
n
E ( MS Bloque )   2 
a i
2
i 1
b 1
E ( MS E )   2
Estadístico de Prueba
Se tienen dos estadísticos de prueba los cuales se
obtienen dividiendo el cuadrado medio
correspondiente por el cuadrado medio del error.
83
Diseño por bloques
Anova
Fuente de
variación
Suma de
Cuadrados
Grados de
Libertad
Cuadrado
Medio
F0
Tratamientos
SSTRATAMIENTOS
a-1
SSTRATAMIENTOS
a-1
MSTRATAMIENTOS
MSE
SSBLOQUES
b-1
Bloques
SSBLOQUES
b-1
Error
SSE
(a-1)(b-1)
Total
SST
N-1
MSBLOQUES
MSE
SSE
(a-1)(b-1)
La Hipótesis Nula
Fo  F ,GLnum ,( a1)(b1)
deberá rechazarse si:
84
Diseño por bloques
Cálculos Manuales
a
b
SST   y ij
2
2
i 1 j 1
y..

,
N
2
a
SSTratamient os
y..
1
2
  yi. 
b i 1
N
b
2
y..
1
2
SSBloques   y. j 
a i 1
N
SSE  SST  SSTratamient os  SSBloques
85
Diseño por bloques
Ejemplo
• Objetivo de la investigación: en ciertas
situaciones, las pruebas de nitrato en los
tejidos de la espiga de trigo predecían una
mayor cantidad de nitrógeno, en
consecuencia, el investigador quería evaluar el
efecto de varios programas de fertilización
sobre esas cantidades de nitrógeno y sobre la
producción de trigo, para refinar las
recomendaciones del procedimiento.
• Diseño del tratamiento: el diseño del tratamiento incluyó seis programas
diferentes de aplicación de nitrógeno que podían proporcionar el intervalo
de condiciones necesarias para evaluar el proceso. Para la comparación se
incluyó un tratamiento sin nitrógeno al igual que la recomendación normal
vigente.
• Diseño del experimento: el experimento se llevó a cabo en un campo
irrigado, con un gradiente de agua en dirección del área de parcelas
experimentales. Como las respuestas de las plantas dependían de la
humedad disponible, las parcelas se agruparon en bloques de seis de
manera que cada bloque se encontraba en partes con el mismo gradiente
de agua, de manera que cualesquiera diferencias en las respuestas de las
plantas causadas por el gradiente de agua podía asociarse con los
bloques.
• El diseño de experimento resultante fue un diseño de bloques completo
aleatorizado, con 4 bloques de seis parcelas a las que se asignaron al azar
los tratamientos de nitrógeno.
Permutaciones
2
5
4
1
6
3
Bloque 1
40.89
37.99
37.18
34.98
34.89
42.07
Bloque 2
41,22
49.92
45.85
50.15
41.99
46.69
Bloque 3
44.57
52.68
37.61
36.94
46.65
40.23
Bloque 4
41.90
39.20
43.29
40.45
42.91
39.97
1
3
4
6
5
2
6
3
5
1
2
4
2
4
6
5
3
1
Permutaciones
Asignación de tratamientos a las unidades experimentales en un bloque completo
Permutación
2
5
4
1
6
3
Tratamientos
B
E
D
A
F
C
89
Diseño por bloques
Pruebas de los efectos i nter-sujetos
Variable dependient e: Rendimiento
Suma de
cuadrados
Media
Fuente
tipo III
gl
cuadrática
Modelo corregido
247,968a
8
30,996
Intersección
42522,685
1
42522,685
Plan
47,117
5
9,423
Bloque
200,850
3
66,950
Error
265,949
15
17,730
Total
43036,602
24
Total corregida
513,917
23
a. R cuadrado = ,483 (R cuadrado corregida = , 207)
F
1,748
2398,355
,532
3,776
Signif icación
,167
,000
,749
,034
 i  1, 2,..., a
yij     i   j   ij 
 j  1, 2,..., b
90
Diseño por bloques
9
1
ESTIMACIÓN DE LOS PARÁMETROS DEL
MODELO
ˆ  y..
ˆi  yi.  y..
ˆ j  y. j  y..
eij  yij  yi.  y. j  y..
Diseño por bloques
Estimadores
de los
parámetros
Residual
3. FORMACIÓN DE BLOQUES EN
UN DISEÑO FACTORIAL
La presencia de un factor perturbador puede
hacer necesario que el experimento de corra
en bloques.
Se corre cada una de las n réplicas utilizando
un lote o bloque separado, que representa una
restricción sobre la aleatorización.
Dentro del bloque el orden en que se corren
las combinaciones de los tratamientos está
completamente aleatorizado.
Diseño Factorial
92
• Modelo de los Efectos
Incluye el
efecto del
bloque
k-ésimo
Donde τi representa el efecto del Factor A, βj
representa el efecto del Factor B, (τβ)ij es la
interacción, δk es el efecto del bloque y ɛijk es
el componente NID (0, σ²) del error.
Se supone que la interacción entre los
bloques y los tratamientos es insignificante.
Diseño Factorial
93
Anova
Diseño Factorial
94
EJEMPLO
Un ingeniero estudia lo métodos para mejorar la
capacidad de detectar objetivos en el campo de
acción de un Radar. Dos factores que el ingeniero
considera importantes son la cantidad de ruido de
fondo, o “desorden del terreno”, en el campo de
acción del radar y el tipo de filtro colocado sobre
la pantalla. Se diseña un experimento utilizando
tres niveles del desorden del terreno y dos tipos
de filtro. Los datos se presentan a continuación.
Diseño Factorial
95
Datos
Anova
Diseño Factorial
96
Otros conceptos…
• Gráfica de superficie de respuesta: Gráfica del plano
de los valores de Y generados por las diferentes
combinaciones de X1 y X2.
Si hay alguna interacción se observará una forma
curva en el modelo.
• Interacción significativa: Cuando una interacción es
grande, lo efectos principales tienen escaso
significado ya que la interacción suele enmascarar la
significación de los efectos principales.
Diseño Factorial
97
Modelo de regresión para dos
factores
a 1
b1
a 1 b1
i 1
j 1
i 1 j 1
y ij   0    i x i    j z j    ij x i z j  
donde
 1 si y ij es del tratamient o i
xi  
 0 en caso contrario
i  1 ,2 ,..a  1
 1 si y ij es del tratamient o j
zj  
 0 en caso contrario
j  1 ,2 ,..b  1
 ij     i   j   ij   0   i   j   ij , i  1 ,2 ,..a  1 ,
j  1 ,2 ,..b  1
 aj     j
 ib     i
 ab  
Diseño Factorial
98
Modelo de regresión para dos
factores
b1

j 1
b1
b1
j 1
j1
 ij   (    i   j   ij )  ( b  1 ) 0  ( b  1 ) i   (  j   ij )
b1
 i 1  ..   ib 1
  0   i   (  j   ij ) /( b  1 )
b1
j 1
b1
 a .      j /( b  1 )
j 1
a 1

i 1
a 1
a 1
i 1
i 1
 ij   (    i   j   ij )  ( a  1 ) 0  ( a  1 ) j   (  i   ij )
a 1
 .b      i /( a  1 )
i 1
 ab  
Diseño Factorial
99
Modelo de regresiónpara experiemntos con dos factores
a1
b1
i 1
j 1
y ij   0    i x i    j z j  
donde
 1 si y ij es del tratamient o i
xi  
 0 en caso contrario
i  1 ,2 ,..a  1
 1 si y ij es del tratamient o j
zj  
 0 en caso contrario
j  1 ,2 ,..b  1
 ij     i   j   0   i   j
 aj     j
 ib     i
 ab  
Estadística III. H Lamos
100
DISEÑO FACTORIAL 2
HENRY LAMOS
k

similar documents