Meridian Capital Advisors es una firma de investigación de inversiones con sede en EE. UU. que cubre distribuidores de salud cotizados en bolsa. James Whitfield desarrolla modelos de proyección a futuro utilizados para decisiones de inversión, revisiones de asignación de capital y planificación de escenarios. El equipo opera sin una función dedicada de ingeniería de datos: los analistas obtienen, limpian y modelan los datos de principio a fin.
La estructura de comparativos de EDGAR estaba corrompiendo las cifras reales de FY2022 antes de que pudiera comenzar el modelado
Construir una previsión creíble a 3 años requería cifras reales limpias para ocho partidas — Ingresos, COGS, SG&A, Intereses, Gastos de capital, Cuentas por cobrar, Cuentas por pagar e Inventario — para FY2022, FY2023 y FY2024, obtenidas directamente de los informes 10-K de Cardinal Health en SEC EDGAR.
Dos modos de fallo impedían una extracción manual fiable. En primer lugar, la taxonomía US-GAAP utiliza nombres de conceptos que no se corresponden de forma intuitiva con las partidas económicas, y la misma partida puede aparecer bajo distintas etiquetas según las prácticas de divulgación de cada emisor — navegar esa taxonomía para ocho conceptos no tiene atajo.
En segundo lugar, la estructura JSON de EDGAR muestra valores comparativos del año anterior junto con las cifras del año en curso. Una extracción ingenua que agrupa por la etiqueta del año fiscal recoge valores duplicados o desajustados, corrompiendo las cifras reales antes de que comience cualquier modelado. En el caso de Cardinal Health, esta característica estructural habría corrompido por completo las cifras reales de FY2022. Más allá de la integridad de la extracción, Inventario mostraba una fluctuación significativa en la retrospectiva de tres años — aplicar un simple ratio medio histórico a la capa de proyección produciría estimaciones poco fiables sin ninguna advertencia visible.
Energent.ai se convirtió en el motor de extracción y en el generador del libro en una sola sesión
El agente cargó el archivo JSON de hechos de EDGAR de Cardinal Health y gestionó toda la pila:
- Mapeó la taxonomía US-GAAP para identificar la etiqueta de concepto correcta para cada una de las ocho partidas objetivo
- Extrajo las cifras reales de FY2022, FY2023 y FY2024 agrupando por fecha de cierre del periodo — no por etiqueta del año de presentación — eliminando los duplicados comparativos en el origen
- Construyó
CAH_3Yr_Forecast.xlsxcon capas de proyección basadas en fórmulas conectadas a una única celda editable de supuesto de crecimiento (B2, establecida en 3%) - Marcó Inventario con un indicador programático de "Ratio inestable" cuando la fluctuación histórica del ratio hacía poco fiable una media móvil simple
- Generó
cah_financial_dashboard.html— una visualización interactiva de Ingresos, COGS e Ingresos netos a lo largo de los tres años históricos
Sin conciliación manual de comparativos. Sin búsqueda manual de taxonomía. Sin reconstruir el modelo cuando se presenta el siguiente 10-K.
La agrupación por fecha de periodo, no por etiquetas de presentación, es lo que hizo fiables las cifras reales
- Resolución de taxonomía en la ingesta: El agente mapeó la taxonomía completa de conceptos US-GAAP antes de extraer cualquier valor, asegurando que se asignara la etiqueta correcta a cada partida económica independientemente de las convenciones de divulgación de cada emisor.
- Filtrado de comparativos por diseño: Agrupar por fecha de cierre del periodo en lugar de por la etiqueta del año de presentación aisló cifras limpias de 12 meses para FY2022, FY2023 y FY2024 — eliminando la duplicación estructural que corrompe las extracciones estándar de EDGAR.
- Marcas programáticas de Ratio inestable: Cuando los ratios históricos fluctuaban demasiado a lo largo del periodo retrospectivo, el libro mostraba una marca explícita en lugar de aplicar en silencio una media defectuosa a la capa de proyección.
- Arquitectura de escenarios en una sola celda: Todas las fórmulas de estructura de costes se encadenan a una única celda editable de supuesto de crecimiento — el stress testing consiste en cambiar un solo valor, no en editar la estructura del modelo.

Ocho partidas, tres ejercicios fiscales, una sesión
- Cifras reales verificadas para las ocho partidas US-GAAP en FY2022, FY2023 y FY2024 — obtenidas directamente de SEC EDGAR y trazables al origen
- Errores de etiquetado de comparativos del año anterior identificados y corregidos antes de construir el libro
CAH_3Yr_Forecast.xlsxentregado con capas de proyección basadas en fórmulas y marcas de Ratio inestable en líneas volátiles de capital circulantecah_financial_dashboard.htmlproducido junto con él, listo para presentaciones de revisión interna

"La marca de Ratio inestable en Inventario es exactamente el tipo de salvaguarda que evita que una fórmula produzca en silencio una proyección absurda en el tercer año." — James Whitfield, Analista de FP&A en Meridian Capital Advisors
