Informática Básica con Enfoque en IA

Informática Básica con Enfoque en IA
Bloque 3: Gestión y Análisis de Datos con IA para el Agro
Universidad de Caldas · Programa de Administración de Empresas Agropecuarias · Docente: Rubén Darío Cárdenas Espinosa PhD. DSc. MSc. Ing.
24 Horas · 4 Bloques
Bloque 3 · 6 Horas
Estructura del Bloque 3
¿Qué aprenderemos hoy?
01
Ecosistemas de Datos Abiertos
Fuentes oficiales: Agronet, FAOSTAT, IDEAM
02
Análisis Exploratorio (EDA)
Estadísticas descriptivas con lenguaje natural
03
Detección de Anomalías
Nulos, duplicados y outliers con IQR
04
Storytelling y Dashboards
Visualización gerencial y paneles interactivos
Objetivos de Aprendizaje
Objetivo General: Aplicar herramientas analíticas basadas en procesamiento de lenguaje natural para la limpieza, exploración y visualización estadística de bases de datos agropecuarias, sin requerir conocimientos de programación.
Objetivos Específicos
Al finalizar este bloque, el estudiante podrá:
Extraer y evaluar datos
Acceder a conjuntos de datos estructurados desde repositorios oficiales de acceso abierto como Agronet, FAOSTAT e IDEAM, valorando su fiabilidad y consistencia.
Ejecutar análisis exploratorios
Aplicar comandos conversacionales sobre estructuras tabulares para extraer estadísticas descriptivas cualitativas y cuantitativas sin código.
Desarrollar dashboards gerenciales
Construir tableros de control interactivos fundamentados en narrativas visuales eficientes para la toma de decisiones directivas.
Contenido 1
Ecosistemas de Datos Abiertos para el Agro
Los datos del sector agropecuario están disponibles en repositorios públicos con información histórica y actualizada. Es fundamental evaluar tres dimensiones antes de utilizarlos:
Fiabilidad
Fuente oficial verificada
Granularidad
Nivel de detalle temporal y geográfico
Consistencia
Uniformidad en formatos CSV y XLSX
Conceptos Clave con Ejemplos del Agro Colombiano
Del dato crudo al insight: entendiendo los tipos de datos en contexto
Datos Cuantitativos
Ejemplo real: Rendimiento de café en kg/ha (ej. 1.250 kg/ha en Huila), temperatura promedio mensual (23,5°C en Manizales), precipitación anual (1.800 mm en el Eje Cafetero).
Datos Cualitativos
Ejemplo real: Tipo de cultivo (café, maíz, arroz, cacao), nivel de tecnificación (tradicional, semitecnificado, tecnificado), región (Andina, Caribe, Pacífico).
Datos Estructurados
Ejemplo real: Tabla CSV de Agronet con columnas: Departamento, Cultivo, Área_sembrada_ha, Producción_ton, Rendimiento_kg_ha, Año.
Datos No Estructurados
Ejemplo real: Fotos satelitales de cultivos, reportes de campo en texto libre, grabaciones de audio de extensionistas rurales, imágenes de drones sobre parcelas.
💡 Regla práctica: Si puedes meterlo en una tabla de Excel con columnas definidas → es estructurado. Si no cabe en una tabla → es no estructurado.
Fuentes Clave
Repositorios Oficiales de Referencia
Agronet
Portal del Ministerio de Agricultura de Colombia con series históricas de producción, precios y área sembrada por cultivo y departamento.
FAOSTAT
Base de datos de la FAO con indicadores globales de producción agrícola, comercio, uso de insumos y seguridad alimentaria.
IDEAM
Datos climáticos, hidrológicos y ambientales de Colombia esenciales para correlacionar condiciones meteorológicas con rendimientos agrícolas.
Ecosistemas de Datos Abiertos para el Agro — Guía Paso a Paso
Cómo encontrar, evaluar y descargar datos reales de Agronet, FAOSTAT e IDEAM
01
Paso 1 — Identificar la fuente correcta
Producción agrícola nacional → Agronet (agronet.gov.co)
Estadísticas mundiales de alimentos → FAOSTAT (fao.org/faostat)
Clima e hidrología → IDEAM (ideam.gov.co)
Datos abiertos Colombia → datos.gov.co
Ejemplo: Para analizar rendimiento de maíz en Córdoba → ir a Agronet > Estadísticas > Producción > Maíz > Córdoba
02
Paso 2 — Navegar y buscar el dataset
En Agronet: Menú "Estadísticas" > "Producción agrícola" > Seleccionar cultivo y departamento
Palabras clave útiles: "área cosechada", "producción", "rendimiento", "municipio"
Filtrar por año (recomendado: últimos 5 años para tendencias recientes)
03
Paso 3 — Evaluar los metadatos antes de descargar
Verificar: ¿Quién publicó el dato? ¿Cuándo fue la última actualización? ¿Qué variables incluye? ¿Cuál es la unidad de medida?
Ejemplo de metadato Agronet: "Producción de café (ton), por municipio, 2018-2023, fuente: MADR-EVA"
04
Paso 4 — Descargar en formato CSV
Seleccionar formato CSV o Excel
Verificar codificación UTF-8 (importante para tildes y ñ)
Guardar con nombre descriptivo: "agronet_cafe_produccion_2018_2023.csv"
05
Paso 5 — Vista previa y verificación inicial
Abrir en Excel o Google Sheets
Verificar que las columnas tengan encabezados claros
Contar filas (registros) y columnas (variables)
Identificar si hay celdas vacías o valores "#N/A"
Contenido 2
Análisis Exploratorio de Datos (EDA) con Lenguaje Natural
El EDA conversacional permite interrogar directamente a un modelo de IA razonador con instrucciones en español. No se requiere programar: el sistema interpreta la intención analítica y devuelve resultados estructurados.
Estadísticas descriptivas esenciales: media, mediana, desviación estándar, mínimos, máximos y distribución de frecuencias por variable.
AED Conversacional — Guía Paso a Paso con Prompts Reales
Cómo interrogar tus datos agrícolas con IA sin escribir código
1
Paso 1 — Carga y confirmación del archivo
           "Confirma la carga exitosa del archivo CSV. Reporta: número exacto de           filas y columnas, tamaño del archivo, codificación detectada, y           primeras 5 filas como muestra. Identifica si hay encabezados y           separadores correctos."         
           Qué esperar: La IA confirmará dimensiones (ej. "1.247 filas × 12           columnas"), mostrará las primeras filas y alertará si hay problemas           de codificación.         
2
Paso 2 — Descripción estructural de columnas
           "Actúa como analista de datos experto en agricultura colombiana. Para           cada columna del dataset: (1) identifica el tipo de dato (numérico,           categórico, fecha, texto), (2) calcula valores únicos y frecuencias,           (3) determina el rango o categorías principales, (4) infiere el           propósito de la variable en el contexto agrícola. Presenta en tabla           markdown ordenada por relevancia."         
           Ejemplo de resultado esperado: Tabla con columnas como Cultivo           (categórico, 5 valores únicos: café 40%, maíz 30%...),           Rendimiento_kg_ha (numérico, rango 800-7.800), Departamento           (categórico, 32 valores).         
3
Paso 3 — Estadísticas descriptivas profundas
           "Genera estadísticas descriptivas completas para todas las variables           numéricas del dataset agrícola: media, mediana, moda, desviación           estándar, coeficiente de variación, percentiles (25, 50, 75, 90, 95),           mínimo y máximo. Interpreta la distribución (normal, sesgada) y           variabilidad. Indica qué variables tienen mayor dispersión y qué           significa eso para el análisis de rendimientos. Formato: tabla           markdown con 2 decimales."         
4
Paso 4 — Detección de anomalías y datos faltantes
           "Detecta valores atípicos usando dos métodos: (1) Rango Intercuartílico           (IQR × 1.5): calcula Q1, Q3, límite inferior y superior; (2) Z-score           (umbral ±3). Para cada outlier: especifica el método, el valor           exacto, la variable afectada y sugiere acción (eliminar, transformar,           investigar). Además, analiza valores faltantes: porcentaje por           columna, patrón de ausencia (aleatorio o sistemático) y estrategia de           imputación recomendada."         
5
Paso 5 — Hipótesis e insights preliminares
           "Basándote en el análisis exploratorio realizado, identifica: (1) al           menos 3 patrones o tendencias notables en los datos agrícolas, (2)           2-3 correlaciones aparentes entre variables (ej. ¿el tipo de suelo se           relaciona con el rendimiento?), (3) formula 3 hipótesis verificables           para análisis predictivos futuros. Contextualiza todos los hallazgos           en el dominio agrícola colombiano."         
¿Cómo se ve el EDA Conversacional en la Práctica?
Ejemplo real: pregunta al chat y obtén análisis instantáneo de tu dataset agrícola
Lo que tú escribes en el chat
"He cargado el archivo Esc1PracticasAgricolas.csv. ¿Cuántas filas y columnas tiene? Muéstrame las primeras 5 filas."
"¿Cuál es el rendimiento promedio, mínimo y máximo de la columna Rendimiento_kg_ha? ¿Hay valores que parezcan errores?"
"¿Qué cultivo tiene el mayor rendimiento promedio? ¿En qué departamento se concentra la mayor producción?"
Lo que la IA te responde
Respuesta 1 — Estructura: "El dataset tiene 1.247 filas y 12 columnas. Las primeras 5 filas muestran: Departamento (Huila, Nariño...), Cultivo (Café, Maíz...), Rendimiento_kg_ha (1.250, 980...), Año (2021, 2022...). No se detectan problemas de codificación."
Respuesta 2 — Estadísticas: "Rendimiento_kg_ha: Promedio = 1.847 kg/ha | Mínimo = 120 kg/ha (posible error) | Máximo = 4.800 kg/ha (posible outlier). Recomiendo revisar los 3 registros con valores < 200 kg/ha."
Respuesta 3 — Insight: "El café tiene el mayor rendimiento promedio (2.340 kg/ha). El 68% de la producción total se concentra en Huila, Nariño y Cauca. Existe una correlación positiva aparente entre altitud y rendimiento cafetero."
🚀 Ventaja clave: Lo que antes tomaba 2 horas en Excel, con IA conversacional lo obtienes en 3 minutos. El tiempo ahorrado se invierte en interpretar y decidir.
Contenido 3
Detección y Tratamiento de Anomalías
Los registros agropecuarios frecuentemente presentan tres tipos de inconsistencias que distorsionan cualquier análisis posterior. La IA los identifica y corrige de forma automática.
Duplicados
Registros idénticos generados por doble carga de formularios de campo
Valores Nulos
Celdas vacías sustituidas por la mediana de la variable para preservar la distribución
Outliers (IQR)
Valores atípicos detectados con el Rango Intercuartílico, multiplicador 1.5
Método Estadístico
El Rango Intercuartílico (IQR): Tu Detector de Datos Raros
Imagina que tienes 10 estudiantes y mides sus estaturas. La mayoría mide entre 1,60 m y 1,75 m. Si alguien mide 2,50 m o 0,30 m, claramente algo está mal. El IQR hace exactamente eso: define la zona "normal" de tus datos y detecta lo que está fuera de ella.
¿Qué significa cada término?
Q1 (Cuartil 1 = percentil 25)
El 25% de tus datos están POR DEBAJO de este valor. Es el límite inferior de la zona central.
Ejemplo: Si Q1 = 1.200 kg/ha → el 25% de los municipios produce menos de 1.200 kg/ha.
Q3 (Cuartil 3 = percentil 75)
El 75% de tus datos están POR DEBAJO de este valor. Es el límite superior de la zona central.
Ejemplo: Si Q3 = 1.450 kg/ha → el 75% de los municipios produce menos de 1.450 kg/ha.
IQR = Q3 − Q1
Es el ancho de la zona central donde vive el 50% de tus datos. Cuanto más grande, más dispersos están los datos.
Ejemplo: IQR = 1.450 − 1.200 = 250 kg/ha
Límites de normalidad
Límite inferior = Q1 − (1.5 × IQR) → todo lo que esté POR DEBAJO es sospechoso.
Límite superior = Q3 + (1.5 × IQR) → todo lo que esté POR ENCIMA es sospechoso.
¿Por qué usarlo en datos agrícolas?
✅ Ventaja principal
No le afectan los valores extremos. A diferencia del promedio, el IQR no se "distorsiona" si hay un dato muy raro. Es robusto.
🌾 Aplicación en el agro
Detecta municipios con rendimientos inusualmente bajos (posible plaga, sequía o error de registro) o inusualmente altos (tecnología avanzada o error de digitación).
⚠️ Regla de oro
Un outlier NO siempre es un error. Puede ser el dato más valioso: el municipio que encontró la técnica que todos deberían copiar.
📐 Fórmula completa: IQR = Q3 − Q1 | Límite inferior = Q1 − 1.5×IQR | Límite superior = Q3 + 1.5×IQR | Todo fuera de estos límites = OUTLIER ⚠️
Ejemplo Completo: IQR Aplicado a Rendimiento de Café en el Huila
Seguimos los 5 pasos con datos reales. Copia este ejemplo y aplícalo a tu propio dataset.
📊 Los datos: Rendimiento de café (kg/ha) en 10 municipios del Huila
01
Paso 1 — Ordenar de menor a mayor
✓ Ya están ordenados: 850, 1.100, 1.200, 1.250, 1.300, 1.350, 1.400, 1.450, 1.500, 4.800
02
Paso 2 — Encontrar Q1 y Q3
Q1 = valor en la posición 25% = 1.200 kg/ha (el 25% de municipios produce menos)
Q3 = valor en la posición 75% = 1.450 kg/ha (el 75% de municipios produce menos)
03
Paso 3 — Calcular el IQR
IQR = Q3 − Q1 = 1.450 − 1.200 = 250 kg/ha
→ La zona 'normal' tiene un ancho de 250 kg/ha
04
Paso 4 — Calcular los límites
Límite inferior = 1.200 − (1.5 × 250) = 1.200 − 375 = 825 kg/ha
Límite superior = 1.450 + (1.5 × 250) = 1.450 + 375 = 1.825 kg/ha
→ Zona normal: entre 825 y 1.825 kg/ha
05
Paso 5 — Detectar outliers
✅ 850 kg/ha → dentro del rango (825–1.825) → NORMAL
⚠️ 4.800 kg/ha → FUERA del rango → OUTLIER (supera 1.825 en 2.975 kg/ha)
🔍 ¿Qué hacemos con el outlier?
1) Investigar primero
Antes de eliminar, pregunta: ¿Acevedo tiene alguna característica especial? ¿Usa variedades mejoradas? ¿El dato fue ingresado correctamente? (¿Será 480 en lugar de 4.800?)
2) El problema del promedio sin IQR
❌ Promedio CON outlier = (850+1.100+...+4.800) ÷ 10 = 1.620 kg/ha → ENGAÑOSO
✅ Promedio SIN outlier = (850+1.100+...+1.500) ÷ 9 = 1.267 kg/ha → REAL
Diferencia: 353 kg/ha. ¡El outlier infló el promedio un 28%!
3) Decisión final
Si es ERROR de digitación → corregir a 480 kg/ha o eliminar el registro.
Si es DATO REAL → conservar pero analizar Acevedo por separado como caso de éxito excepcional.
🤖 PROMPT PARA USAR CON IA:
'Tengo un dataset de rendimiento de café por municipio del Huila. Aplica el método IQR con multiplicador 1.5 a la columna Rendimiento_kg_ha. Muéstrame: (1) tabla con los datos ordenados, (2) cálculo de Q1, Q3 e IQR, (3) límites inferior y superior, (4) lista de outliers con su municipio y valor exacto, (5) recomendación específica para cada outlier (investigar, corregir o conservar). Explica en lenguaje sencillo qué significa cada resultado.'
Contenido 4
Storytelling y Visualización Gerencial
Un informe de datos efectivo para la gerencia no presenta cifras en bruto: construye una narrativa que conecta el contexto operativo con la decisión estratégica.
Esquema de Narrativa Analítica
Estructura C-P-H-C para Informes Gerenciales
1
Contexto
¿Cuál es la situación actual del cultivo o indicador analizado?
2
Problema
¿Qué anomalía, brecha o desviación se ha detectado en los datos?
3
Hallazgo
¿Qué revela el análisis estadístico sobre las causas o patrones?
4
Conclusión Operativa
¿Qué acción concreta se recomienda para la gerencia de la finca?
Contenido 5
Construcción Automatizada de Dashboards
Las herramientas integradas en la nube permiten convertir datos limpios en paneles dinámicos con métricas clave (KPIs) sin necesidad de programar.
Un dashboard gerencial agropecuario debe consolidar:
Costos de insumos por ciclo productivo
Volumen de cosecha por hectárea
Márgenes netos de rentabilidad por lote
Tendencias históricas de precios de mercado
Prompts para Dashboards e Informes Gerenciales (Contenidos 4 y 5)
Prompts para construir narrativas analíticas y dashboards automatizados con IA
Sección A — Prompts para Narrativa Analítica (Estructura C-P-H-C)
1
CONTEXTO
"Describe el contexto actual del cultivo de [café/maíz/arroz] en [departamento/región] basándote en los datos del dataset. Incluye: área sembrada total, producción total, rendimiento promedio y comparación con el promedio nacional. Usa cifras concretas del dataset."
2
PROBLEMA
"Identifica los principales problemas o brechas detectados en el análisis de datos: ¿Qué cultivos o municipios tienen rendimientos significativamente por debajo del promedio? ¿Hay tendencias negativas en los últimos 3 años? ¿Qué variables están más correlacionadas con bajo rendimiento?"
3
HIPÓTESIS
"Basándote en los patrones detectados, formula 3 hipótesis explicativas sobre las causas del problema identificado. Para cada hipótesis: (a) enúnciala claramente, (b) indica qué variables del dataset la sustentan, (c) sugiere qué dato adicional se necesitaría para confirmarla."
4
CONCLUSIÓN
"Redacta una conclusión ejecutiva de máximo 150 palabras que sintetice: el hallazgo principal, su magnitud (con cifras), la hipótesis más probable y una recomendación accionable para el tomador de decisiones. Usa lenguaje claro, sin jerga técnica."
Sección B — Prompts para Dashboard Automatizado
Prompt Dashboard con IA:
"Actúa como diseñador de dashboards de datos agrícolas. Con base en el dataset analizado, diseña un dashboard ejecutivo que incluya: (1) KPIs principales: rendimiento promedio, producción total, área sembrada, variación anual; (2) Gráfico de barras: top 10 municipios por rendimiento; (3) Gráfico de líneas: tendencia de producción 2018-2023 por cultivo; (4) Mapa de calor conceptual: rendimiento por departamento; (5) Tabla de alertas: municipios con rendimiento <50% del promedio nacional. Describe cada visualización con los datos específicos a mostrar y el tipo de gráfico recomendado."
Prompt Informe Gerencial:
"Genera un informe gerencial de 1 página sobre el desempeño agrícola de [región] basado en el dataset. Estructura: (1) Resumen ejecutivo (3 líneas), (2) Hallazgos clave con cifras (3 bullets), (3) Tendencias preocupantes (2 bullets), (4) Oportunidades identificadas (2 bullets), (5) Recomendaciones priorizadas (3 acciones concretas con responsable sugerido y plazo). Tono: profesional, directo, orientado a la acción."
Actividades Prácticas
Taller 1: Caza y Limpieza de Datos Sectoriales
Objetivo del taller
Extraer un archivo histórico de fluctuación de precios de un cultivo andino (p.ej., papa, café o fríjol) desde Agronet y depurar sus inconsistencias mediante guías conversacionales dirigidas a un modelo de IA.
El estudiante no escribirá código. Toda la limpieza se realiza mediante prompts en lenguaje natural dentro del módulo de análisis avanzado.
Prompts para el Taller 1: Caza y Limpieza de Datos Sectoriales
Prompts listos para usar con ChatGPT, Gemini, Claude o DeepSeek
PROMPT 1 — Evaluación de calidad del dataset de Agronet
🔍 Evaluación Inicial de Calidad
           "Actúa como experto en calidad de datos agrícolas. Evalúa el siguiente dataset de Agronet:           - Nombre: Producción agrícola por municipio Colombia           - Fuente: Agronet / Ministerio de Agricultura           - Objetivo: Analizar tendencias de rendimiento de cultivos 2018-2023           - Tipo de datos: Cuantitativo y estructurado           - Variables clave: Departamento (texto), Municipio (texto), Cultivo (categórico), Área_sembrada_ha (numérico), Producción_ton (numérico), Rendimiento_kg_ha (numérico), Año (entero)            Evalúa: (1) Completitud: ¿hay valores faltantes? (2) Precisión: ¿los rangos son lógicos? (3) Consistencia: ¿hay duplicados o formatos mixtos? (4) Sesgo: ¿hay departamentos subrepresentados? Proporciona recomendaciones específicas de limpieza."         
PROMPT 2 — Limpieza y estandarización
🧹 Limpieza de Datos
           "Tengo un dataset CSV de producción agrícola con los siguientes problemas detectados: (1) nombres de municipios con variaciones ortográficas (ej. 'Bogotá', 'Bogota', 'BOGOTÁ'), (2) valores de rendimiento negativos o cero que parecen errores, (3) años fuera del rango 2018-2023. Proporciona: (a) estrategia de estandarización de nombres usando Python/Pandas o instrucciones para Excel, (b) criterio para tratar valores de rendimiento anómalos (IQR o Z-score), (c) filtro para eliminar registros con año inválido. Justifica cada decisión metodológicamente."         
PROMPT 3 — Análisis exploratorio sectorial
📊 EDA Sectorial Agrícola
           "Actúa como analista de datos senior especializado en agricultura colombiana. Con el dataset de Agronet cargado, realiza un AED completo en 5 fases:           FASE 1: Estructura (dimensiones, tipos de datos, vista previa de 7 filas)           FASE 2: Calidad (valores faltantes %, duplicados, inconsistencias)           FASE 3: Estadísticas descriptivas (media, mediana, desviación estándar, percentiles 25/75/95 para Rendimiento_kg_ha y Producción_ton)           FASE 4: Outliers (IQR y Z-score para las 3 variables numéricas principales)           FASE 5: Insights (3 patrones notables, 2 correlaciones aparentes, 3 hipótesis para análisis predictivo)           Responde exclusivamente en español. Usa tablas markdown para datos tabulares."         
PROMPT 4 — Validación cruzada entre herramientas
✅ Validación Cruzada
           "He obtenido los siguientes resultados del análisis del dataset agrícola con otra herramienta de IA:           - Media Rendimiento_kg_ha: 2.847 kg/ha           - Outliers detectados por IQR: 34 registros           - Valores faltantes en Producción_ton: 3,2%           Por favor: (1) Verifica estos valores con tu propio análisis del mismo dataset, (2) Explica cualquier discrepancia encontrada (diferencias en manejo de NaN, métodos de redondeo, implementación de IQR), (3) Indica cuál resultado consideras más confiable y por qué, (4) Sugiere una validación manual para los 5 registros más atípicos."         
Actividades Prácticas
Taller 2: Panel Gerencial Agropecuario
Creación de un dashboard interactivo en hoja de cálculo que consolide los indicadores productivos y financieros de una unidad agrícola simulada.
KPI 1
Costos de insumos por ciclo
KPI 2
Volumen de cosecha por hectárea
KPI 3
Márgenes netos de rentabilidad
Guía Paso a Paso
Análisis Conversacional de Archivos Tabulares
1
Carga y Vinculación
Exportar la base de datos de producción a CSV y cargar el archivo en el módulo de análisis avanzado del modelo de IA razonador.
2
Diagnóstico de Calidad
"Analiza la estructura de este dataset e identifica filas, columnas, tipos de datos y el porcentaje exacto de valores nulos por columna."
3
Depuración Automatizada
"Elimina las filas duplicadas y reemplaza las celdas vacías en 'Costo_Insumo' con la mediana de esa variable."
4
Cálculo de Outliers
"Aplica el método IQR con multiplicador 1.5 sobre 'Rendimiento_Toneladas'. Reporta los límites y lista las filas atípicas."
5
Sintetización Visual
"Diseña un gráfico de dispersión interactivo que relacione fertilizante aplicado con rendimiento de cosecha, incluyendo tooltips por lote."
Prompts para el Taller 2: Análisis Conversacional de Archivos Tabulares
Guía completa para el análisis conversacional del dataset Esc1PracticasAgricolas.csv
Guía de uso (steps):
Cargar el archivo en ChatGPT (con Code Interpreter activado), Gemini o Claude. Arrastrar el CSV directamente al chat.
Ejecutar el Prompt Maestro (ver derecha) — esperar respuesta completa antes de continuar.
Profundizar con preguntas de seguimiento según los hallazgos:             
Si hay outliers: "¿Cuáles son los 5 registros más atípicos en Rendimiento_kg_ha? ¿Qué tienen en común?"
Si hay datos faltantes: "¿Los valores faltantes en [columna] siguen algún patrón temporal o geográfico?"
Para correlaciones: "¿Existe correlación entre Uso_Fertilizante_kg y Rendimiento_kg_ha? Calcula Pearson y Spearman."
Comparar con segunda herramienta — copiar el mismo prompt en Gemini o Claude y comparar resultados.
Documentar discrepancias — anotar diferencias en estadísticas básicas (>5% = señal de alerta).
Prompt Maestro completo
"Actúa como analista de datos senior especializado en agricultura. He cargado el dataset 'Esc1PracticasAgricolas.csv'. Realiza un AED exhaustivo en 5 fases:
FASE 1: ESTRUCTURA
Dimensiones exactas (filas × columnas)
Vista previa de las primeras 7 filas
Tabla con: nombre de columna, tipo de dato, valores únicos, rango/categorías principales, propósito inferido en contexto agrícola
FASE 2: CALIDAD DE DATOS
Valores faltantes: cantidad y % por columna, patrón (aleatorio/sistemático)
Duplicados exactos y parciales
Inconsistencias de formato o valores fuera de rango lógico
FASE 3: ESTADÍSTICAS DESCRIPTIVAS
Variables numéricas: media, mediana, desviación estándar, CV, percentiles 5/25/50/75/95, asimetría, curtosis
Variables categóricas: frecuencia absoluta y relativa de cada categoría
FASE 4: DETECCIÓN DE ANOMALÍAS
Outliers por IQR (×1.5) y Z-score (±3) para las 5 variables numéricas más relevantes
Ejemplos específicos de valores anómalos con posibles causas agrícolas
Estrategia de tratamiento recomendada para cada tipo
FASE 5: INSIGHTS Y HIPÓTESIS
3 patrones o tendencias notables
2-3 correlaciones aparentes entre variables
3 hipótesis verificables para análisis predictivo futuro
Responde en español. Usa tablas markdown para datos tabulares. Interpreta cada hallazgo en el contexto de prácticas agrícolas."
Síntesis del Bloque 3
La gestión de datos agropecuarios con IA no requiere programación: requiere precisión en la pregunta y comprensión del contexto productivo.
Datos de calidad
Fuentes oficiales evaluadas con criterios de fiabilidad y consistencia
Análisis sin código
EDA y limpieza mediante prompts conversacionales en lenguaje natural
Decisión gerencial
Dashboards y narrativas C-P-H-C orientadas a la acción directiva
¡GRACIAS POR SU ATENCIÓN!
DECISIÓN FINAL: Si dudas, la respuesta siempre es NO.


Información de Contacto
 Sitio web: http://rubendacardenas.jimdofree.com/
 Correos electrónicos: [email protected] / [email protected]
 Redes profesionales y sociales: linkedin.com/in/rudacardenas |  @rudacardenas (Facebook) |  @rubendacardenas (Twitter)
 WhatsApp: 316 444 1755









La duda es el comienzo del conocimiento, pero la claridad es el camino hacia el impacto.
Conectemos ideas. Construyamos futuro.