Metodología
Transparencia total: cómo funciona ElObjetivo
Qué es ElObjetivo
ElObjetivo es una plataforma automatizada de análisis de sesgo mediático que monitorea 30 medios argentinos de todo el espectro político. Nuestro objetivo es hacer visible cómo diferentes medios cubren las mismas noticias: qué dicen, qué omiten, cómo lo enmarcan y qué técnicas retóricas utilizan.
No somos un medio de comunicación ni un verificador de hechos. Somos una herramienta de transparencia mediática que usa inteligencia artificial para analizar patrones que serían imposibles de detectar manualmente a esta escala.
Todo el proceso es automático y funciona las 24 horas, los 7 días de la semana. Cada 15 minutos, nuestro sistema recolecta, agrupa y analiza noticias de todo el espectro político argentino.
Pipeline de análisis
Cada historia pasa por 5 etapas antes de ser publicada
Etapa 1: Recolección
Scraping automatizado de 30 medios argentinos
Cada 15 minutos, nuestros scrapers recorren 29 sitios de noticias argentinos usando Scrapy, un framework de scraping en Python. Respetamos los archivos robots.txt de cada sitio y limitamos nuestras solicitudes a 2 concurrentes por medio con 1.5 segundos de espera entre cada una.
La extracción prioriza datos estructurados (LD+JSON / Schema.org) cuando están disponibles, con selectores CSS como respaldo. 7 de los 30 medios requieren renderizado con navegador (Playwright) porque usan JavaScript pesado o detección de bots.
De cada artículo extraemos: título, subtítulo, cuerpo completo, autores, fecha de publicación, sección, etiquetas, e imagen principal.
Etapa 2: Filtrado (Triage)
Solo noticias políticamente relevantes pasan al análisis
No todas las noticias merecen análisis de sesgo. Filtramos automáticamente por sección del artículo para concentrarnos en contenido político, económico y socialmente relevante.
SECCIONES QUE PASAN (17)
Política, economía, sociedad, internacional, opinión, seguridad, justicia, derechos humanos, educación, salud, trabajo, energía, tecnología, cultura, investigación, regional, análisis
SECCIONES RECHAZADAS (24+)
Deportes, entretenimiento, celebridades, moda, horóscopo, gaming, inmobiliaria, autos, escándalos, streaming, TV, ratings, contenido patrocinado. Las secciones desconocidas se rechazan por defecto.
Etapa 3: Agrupación (Clustering)
Artículos sobre la misma historia se agrupan automáticamente
Para comparar cómo diferentes medios cubren la misma noticia, primero necesitamos agrupar los artículos en “historias”. Usamos tres señales:
EMBEDDINGS DE TEXTO
Modelo multilingual-e5-base (768 dimensiones), ejecutado con ONNX Runtime en INT8. Compara la similitud semántica entre título y primeros párrafos.
ENTIDADES NOMBRADAS
spaCy con modelo español (es_core_news_lg) extrae personas, organizaciones y lugares. La superposición de entidades confirma que los artículos hablan del mismo evento.
EMBEDDINGS DE IMAGEN
MobileNetV3 ejecutado en la NPU del Orange Pi RK3588. Imágenes similares refuerzan la agrupación cuando los artículos comparten fotografías de la misma conferencia, evento o persona.
El algoritmo de clustering (HDBSCAN) combina estas tres señales con umbrales calibrados. Un artículo se suma a una historia existente si supera la similitud mínima con al menos un tercio de los artículos del grupo.
Etapa 4: Análisis con IA
4 agentes especializados de Claude analizan cada historia
Cada historia agrupada pasa por 4 agentes de inteligencia artificial especializados. Cada agente tiene un rol específico y acceso a herramientas de verificación.
Agente de Consenso
Claude SonnetIdentifica en qué coinciden todos los medios (hechos cruzados), dónde difieren (contradicciones), cómo cada cluster ideológico enmarca la historia, y qué temas omite cada grupo.
Agente de Retórica
Claude SonnetEvalúa técnicas de manipulación retórica en cada artículo individual. Puntúa clickbait, sensacionalismo, manipulación general y alineación entre titular y cuerpo.
Agente de Verificación
Claude OpusVerifica afirmaciones factuales específicas contra bases de datos oficiales argentinas. Cada afirmación recibe un veredicto con nivel de confianza.
Agente de Revisión
Claude OpusActúa como control de calidad final. Revisa los reportes de los otros tres agentes, sintetiza un resumen narrativo neutral, genera un titular sin sesgo, y asigna una puntuación de confianza general.
Bases de datos de verificación
Fuentes oficiales contra las que verificamos afirmaciones
INDEC
Instituto Nacional de Estadística y Censos. Datos de IPC (inflación), EMAE (actividad económica), desempleo, pobreza, canasta básica.
BCRA
Banco Central de la República Argentina. Tipo de cambio oficial, dólar blue, reservas internacionales, base monetaria, tasa de interés.
Boletín Oficial
Publicación oficial del Estado argentino. Decretos, resoluciones, leyes y disposiciones vigentes.
Clusters de sesgo
Cómo clasificamos la inclinación política de los medios
Agrupamos los 30 medios en cinco clusters según su inclinación política editorial. Esta clasificación es manual, basada en análisis histórico de cobertura, línea editorial declarada, y posicionamiento frente a los gobiernos. Se actualiza diariamente con un perfilador automático.
Izquierda
Rango: -1.0 a -0.5Centro-Izquierda
Rango: -0.5 a -0.15Centro
Rango: -0.15 a +0.15Centro-Derecha
Rango: +0.15 a +0.5Derecha
Rango: +0.5 a +1.0La escala va de -1.0 (máxima izquierda) a +1.0 (máxima derecha). El 0.0 representa el centro teórico.
Limitaciones y advertencias
- La IA puede equivocarse. Los agentes de Claude son potentes pero no infalibles. Las puntuaciones de retórica son estimaciones, no verdades absolutas.
- La clasificación de clusters es manual. La asignación inicial de cada medio a un cluster político se basa en criterio editorial humano. El perfilador diario ajusta las puntuaciones pero no cambia la asignación de cluster.
- Cobertura limitada. Monitoreamos 30 medios, lo cual cubre la mayoría del consumo informativo argentino pero no es exhaustivo. Medios locales pequeños no están incluidos.
- No reemplaza el criterio humano. ElObjetivo es una herramienta para informar mejor tu lectura de noticias, no un sustituto del pensamiento crítico.
- Agrupación imperfecta. El clustering automático puede agrupar artículos incorrectamente o no detectar conexiones temáticas sutiles.
- Sesgo del modelo. Los modelos de Claude tienen sus propios sesgos potenciales. Mitigamos esto con prompts explícitos de neutralidad y verificación cruzada entre agentes.