View
1.035
Download
1
Category
Preview:
Citation preview
www.ciat.cgiar.org Agricultura Eco-Eficiente para Reducir la Pobreza
Uso de grandes datos (Big Data) en la Agricultura- Caso de estudio
FEDEARROZ en Colombia
Big Data
Información eventos productivos (cosechas) = Grandes datos
•Utilizar información de eventos productivos para entender la variabilidad en la producción •De reduccionista a holístico (combinación de factores y sus interacciones) •Basado en los principios de investigación operacional •Generación de conocimiento para tomadores de decisiones en agricultura (investigadores, gremios, extensionistas, agricultores) •N= Todo (eventos productivos)
Identificar factores o combinaciones de factores que conducen a altas o bajas producciones
+ + =
Clima Suelo Manejo agronómico Producción
Rdto/ha
% ? + % ? + %? = A Explicar (100 %)
PARA:
Cómo hacerlo?
Información primaria: capturada a través de diferentes fuentes – Plataforma en línea Información secundaria : Bases de datos existentes
Cómo hacerlo?
Análisis
Reporte
Captura Limpieza, organización, almacenamiento
Interpretación, validación
Divulgación
Motor cuyo combustible son los datos !
Caso de estudio datos FEDEARROZ en Colombia
Colombia? laboratorio natural
Colombia? FEDEARROZ un gremio que ha compartido información
De lo general…………………………………………………………….. A lo específico
ENA (Encuesta Nacional Arrocera) 3 semestres de datos • 2010A : • 2011A : • 2012A : Total : alrededor de 400 eventos productivos
Registros de cosecha
• Saldaña y Purificación
o 08/2009 a 12/2012
o 530 eventos productivos
• Casanare – Yopal o 07 a 09/2013
o 91 eventos productivos
• Monteria (CI La Victoria) o 2012A
o 192 eventos productivos
Caso de estudio datos FEDEARROZ en Colombia
Rendimientos promedios zona llanos por sistema de riego, periodo 2010-2012. Fuente ENA FEDEARROZ
Baja productividad inhabitual
Rendimientos promedios nacionales por sistema de riego, periodo 2010-2012. Fuente ENA FEDEARROZ
3000
3800
4600
5400
6200
7000
2010A 2011A 2012A
Re
nd
imie
to (
Kg/
HA
)
Semestre evaluado
Zona llanos
Riego integral Secano mecanizado
3000
3500
4000
4500
5000
5500
6000
6500
7000
2010A 2011A 2012A
Re
nd
imie
to (
Kg/
HA
)
Semestre evaluado
Riego integral Riego complementario Secano mecanizado
N= alrededor de 400 eventos productivos
Panorama actual de la producción
Desempeño de variedades de arroz bajo 4 diferentes zonas agroecológicas
Sistema riego integral Rendimiento de las diferentes variedades en función de la zona
N= alrededor de 400 eventos productivos
• Cuenta con estación meteorológica
• Ha Compartido
información
Saldaña 08/2009 a
12/2012 N: 530 eventos
productivos
Caso específico estación de Saldaña
Clima (%) + Suelo + Manejo agronómico = Rdto/Lote
Siembra Cosecha
Un evento productivo de arroz = alrededor de 120 días
Serie climática completa para 5 variables
Lote
tiempo
Hipótesis de trabajo
la variación del rendimiento en arroz en Saldaña esta asociada al clima
6.12
5.59
5.04
3.39 2.97
2.33
0.86
0
2
4
6
8
Tmx Tmean Ener_min Ener_Accu Tmin Days_Tmax1 AccuT_Base11
% C
on
trib
uci
ón
al R
2
Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con todas las variedades, N = 329
Clima (%) + Suelo (%) + Manejo agronómico (%) = Rdto/Lote
Clima explica: 26.3 % del rendimiento
Arroz Información secundaria -> FEDEARROZ un gremio con información
Para FEDEARROZ 733, el clima explica el 37% del rendimiento
Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con por variedad
Para Lagunas, el clima explica el 22% del rendimiento
10.43
6.20 6.03 4.78
3.76 3.74
1.92
0.00
2.00
4.00
6.00
8.00
10.00
12.00
% d
e v
aria
nza
exp
licad
a
Fedearroz 733
8.05
6.57
3.53
1.26 1.03 0.94 0.50
0.00
2.00
4.00
6.00
8.00
10.00
% d
e v
aria
nza
exp
licad
a
Lagunas
Información secundaria -> FEDEARROZ un gremio con información
N = 98
N = 112
Perfiles de las variables – conocimiento valioso ! – Aprovechando el poder de la tecnología
0
1500
3000
4500
6000
7500
9000
34 35 36 37 38 39
Re
nd
imie
nto
Tmax
Tmax
0
1500
3000
4500
6000
7500
9000
52000 53000 54000 55000 56000 57000 58000
Re
nd
imie
nto
Ener_accut
Ener_accu
Análisis multivariado para Saldaña : Todos los eventos (2010 hasta 2012), con variedad FEDEARROZ 733
Arroz
10.43
6.20 6.03 4.78
3.76 3.74
1.92
0.00
2.00
4.00
6.00
8.00
10.00
12.00
% d
e v
aria
nza
exp
licad
a
Fedearroz 733
Información secundaria -> FEDEARROZ un gremio con información
No lineal - Naturaleza
N = 98
Cómo aumentar la predicción?
Análisis por etapas fenológicas : Trabajo multidiciplinario , combinación FEDEARROZ CIAT
VEG
Ini Pan
FLOR
VEG
Ini Pan
FLOR
Variedad 1 Variedad 2
Siembra Cosecha
Fase vegetativa
Iniciación panícula
Floración
Llenado grano
Arroz
Todos los eventos (2010 hasta 2012), todas las variedades, trabajando en conjunto, N= 329
• Pasamos de explicar con clima 26.3 % a 44.3 % con etapas fenológicas • Siembras orientadas a aprovechar al máximo Eneraccu_llen. Mitigar influencia del
clima • Bases de mejoramiento para el futuro
Arroz
17.76
6.03
3.06 2.74 2.56 1.87 1.56 1.51 1.46 1.38 1.31
0.85 0.69 0.53 0.53 0.50
0
5
10
15
20
Var
ian
za e
xplic
ada
Perfil de la variable – Eneraccu_LLEN
Alcanzamos a explicar más del
40 % de variación en el rendimiento
16.5
6.1 7.9
25.7
0.0
5.0
10.0
15.0
20.0
25.0
30.0
VEGETATIVA BOOT FLOR LLEN
R2 p
or
el m
od
elo
de
re
gre
sió
n
Etapa del cultivo
Análisis por ventana
7.93
6.38
2.11
0
2
4
6
8
10
Eneraccu_VEG Tmin_VEG TEMPavg_VEG
% V
aria
nza
exp
licad
a
VEGETATIVA
3.53
1.26 0.73
0
1
2
3
4
Tmax_BOOT Tmin_BOOT GDaccu11_BOOT
% V
aria
nza
exp
licad
a
BOOT
4.81
2.88
0
1
2
3
4
5
6
Tmin_FLOR Tmax_FLOR
% V
aria
nza
exp
licad
a
Axis Title
FLOR 21.79
1.52 1.06 0.88
0
5
10
15
20
25
% V
aria
nza
exp
licad
a
LLEN
Arroz
N = 329
Resultados preliminares con manejo agronómico
Clima (%) + Suelo + Manejo agronómico = Rdto/Lote
Fecha de siembra evaluada en día calendario, cuantos días tiene el cultivo
tomando como referencia el 1 de enero
canhec Cantidad de semilla por hectárea (Kg/HA)
cultant1 Cual fue el cultivo anterior
nitroge Cantidad de nitrógeno por hectárea utilizado sobre el cultivo (kg/HA)
fosfate Cantidad de fosforo por hectárea utilizado sobre el cultivo (kg/HA)
potash Cantidad de potasio por hectárea utilizado sobre el cultivo (kg/HA)
numfer Número de veces que el cultivo fue fertilizado
numher Número de veces que el cultivo fue tratado con herbicidas
numins Número de veces que el cultivo fue tratado con insecticidas
numfun Número de veces que el cultivo fue tratado con funguicidas
duracin_ciclo Duración en días del ciclo productivo
sistecose Sistema de cosecha implementado en el cultivo
humedad Humedad del grano en %
impure Impureza del grano en %
semestre Semestre en el que el cultivo es establecido
vartip Tipo de variedad (certificado/No Certificado)
variedad Variedad utilizada en el cultivo
cozona Zona en la que fue sembrada el cultivo
sistema Sistema en el que fue sembrado el cultivo
rend Rendimiento del cultivo (kg/HA)
siembra
Fedearroz 733 ZONA 1 (Centro) Sistema de riego 1 (Riego Integral)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 13448.43 1667.654 8.064 1.03E-07 ***
fosfate -18.774 5.819 -3.226 0.004236 **
potash 13.748 3.354 4.099 0.000559 ***
numins -347.542 94.22 -3.689 0.001455 **
numfun 262.812 98.161 2.677 0.014476 *
duracin_ciclo -41.153 13.212 -3.115 0.005457 **
semestre2011A -688.294 372.795 -1.846 0.079701 .
semestre2012A -1543.34 353.488 -4.366 0.000299 ***
vartipN -488.663 286.116 -1.708 0.103128
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 427.2 on 20 degrees of freedom
Multiple R-squared: 0.7863, Adjusted R-squared: 0.7009
27.37
14.14
10.09 8.76
7.40 5.49 5.37
0.00
5.00
10.00
15.00
20.00
25.00
30.00
Var
ian
za e
xplic
ada
N= 32 eventos de producción
78 % de variación en el rendimiento
Resultados preliminares con manejo agronómico
Fedearroz 733 ZONA 3 (Nororiental) Sistema de riego 1 (Riego Integral)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7180.568 996.539 7.206 5.64E-07 ***
nitroge 12.308 5.193 2.37 0.028 *
fosfate 6.473 4.671 1.386 0.181
potash -10.59 6.169 -1.717 0.1015
numfer -541.692 195.855 -2.766 0.0119 *
vartipN -960.314 350.047 -2.743 0.0125 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 779.7 on 20 degrees of freedom
Multiple R-squared: 0.5558, Adjusted R-squared: 0.4447
F-statistic: 5.005 on 5 and 20 DF, p-value: 0.003912
28.08
10.37 9.01
5.63
2.48
0.00
5.00
10.00
15.00
20.00
25.00
30.00
vartip numfer nitroge fosfate potashV
aria
nza
exp
licad
a
N=26 eventos de producción
55 % de variación en el rendimiento
Vartip: Tipo de variedad (certificado/No Certificado)
Resultados preliminares con manejo agronómico
Fedearroz 60 ZONA 1 (Centro) Sistema de riego 1 (Riego Integral)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3690.987 861.08 4.286 0.000444 ***
siembra 5.633 2.637 2.136 0.046704 *
canhec 14.776 3.703 3.991 0.000857 ***
potash 3.886 2.52 1.542 0.140414
numfer 302.712 86.07 3.517 0.002462 **
numher -451.635 109.235 -4.135 0.000623 ***
numins -213.417 105.87 -2.016 0.058995 .
semestre2011A -371.702 373.825 -0.994 0.333247
semestre2012A 1376.037 765.684 1.797 0.089113 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 508.1 on 18 degrees of freedom
Multiple R-squared: 0.7016, Adjusted R-squared: 0.569
F-statistic: 5.291 on 8 and 18 DF, p-value: 0.00162
20.47
12.40 11.39
9.14 8.64
5.37
2.76
0.00
5.00
10.00
15.00
20.00
25.00
numher semestre canhec numfer siembra potash numins
Var
ian
za e
xplic
ada
N= 27 eventos de producción
70 % de variación en el rendimiento
Resultados preliminares con manejo agronómico
Fedearroz 473 ZONA 4 (Noroccidental) Sistema de riego 1 (Riego Integral)
89.3 % de variación en el rendimiento
29.92
17.18
12.99
9.17 8.68
6.12 5.25
0.00
5.00
10.00
15.00
20.00
25.00
30.00
35.00
Var
ian
za e
xplic
ada
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 16194.3 5881.317 2.754 0.0249 *
canhec 10.56 6.08 1.737 0.1206
cultant1 -279.315 263.478 -1.06 0.32
nitroge 19.214 5.982 3.212 0.0124 *
numher 206.886 171.314 1.208 0.2617
duracin_ciclo-107.901 47.52 -2.271 0.0528 .
semestre2012A-2028.42 764.114 -2.655 0.029 *
vartipN 667.718 432.321 1.544 0.161
vartipP -264.846 599.059 -0.442 0.6701
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 510 on 8 degrees of freedom
Multiple R-squared: 0.893, Adjusted R-squared: 0.786
F-statistic: 8.347 on 8 and 8 DF, p-value: 0.00351
N= 17 eventos de producción
Resultados preliminares con manejo agronómico
Improarroz 1550 ZONA 2 (Llanos) Sistema de riego 3 (Secano Mecanizado)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6346.356 1070.254 5.93 0.00103 **
siembra -12.365 5.164 -2.395 0.05369 .
cultant1 -111.82 61.405 -1.821 0.11845
numfer -247.794 123.417 -2.008 0.09144 .
numher -623.946 201.154 -3.102 0.02107 *
numins 591.289 205.221 2.881 0.02801 *
numfun 1026.2 314.061 3.268 0.01709 *
semestre2011A -1169.03 309.927 -3.772 0.00927 **
semestre2012A -2506.37 643.193 -3.897 0.00801 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 475.2 on 6 degrees of freedom
Multiple R-squared: 0.8956, Adjusted R-squared: 0.7565
F-statistic: 6.436 on 8 and 6 DF, p-value: 0.01783
41.59
19.90
7.31 6.55 6.04 5.80
2.38
0.00
5.00
10.00
15.00
20.00
25.00
30.00
35.00
40.00
45.00
semestre numfun numins cultant1 siembra numher numferV
aria
nza
exp
licad
a
N=15 eventos de producción
89 % de variación en el rendimiento
Resultados preliminares con manejo agronómico
Conclusiones
• Las herramientas de análisis han arrojado resultados preliminares que tienen sentido
• Trabajo multidisciplinario mucho más poderoso que el individual (fisiólogos, agrónomos, estadísticos, fitomejoradores, acompañamiento de expertos)
• Por ahora clima y manejo… a probar suelos… otros factores
• A mayor cantidad de información mayor confiabilidad y robustez de los resultados
Perspectivas
• Acercamiento que responde a los propósitos de donantes
y clientes (product- outcome- impact)
• Explotación de información que ha sido obtenida con múltiples fuentes y diferentes propósitos para generar nuevo conocimiento para acelerar el desarrollo en la agricultura
• En la medida que hayan datos disponibles se puede hacer en cualquier lugar
• Mas importante….
Agricultura Específica por Sitio (AEPS) y uso de grandes datos (Big Data) en la Agricultura
http://www.youtube.com/watch?v=qju9Y-X1mN8
Información primaria: capturada a través de diferentes fuentes :
• Hoy arroz en Colombia pero las herramientas, recurso humano, tecnológico , voluntad y pasión están al
servicio de toda la región !
Muchas gracias por su atención !
Contacto : Daniel Jiménez R
d.jimenez@cgiar.org
Recommended