Metodología

Transparencia total: cómo funciona ElObjetivo

Qué es ElObjetivo

ElObjetivo es una plataforma automatizada de análisis de sesgo mediático que monitorea 30 medios argentinos de todo el espectro político. Nuestro objetivo es hacer visible cómo diferentes medios cubren las mismas noticias: qué dicen, qué omiten, cómo lo enmarcan y qué técnicas retóricas utilizan.

No somos un medio de comunicación ni un verificador de hechos. Somos una herramienta de transparencia mediática que usa inteligencia artificial para analizar patrones que serían imposibles de detectar manualmente a esta escala.

Todo el proceso es automático y funciona las 24 horas, los 7 días de la semana. Cada 15 minutos, nuestro sistema recolecta, agrupa y analiza noticias de todo el espectro político argentino.

Pipeline de análisis

Cada historia pasa por 5 etapas antes de ser publicada

1
Recolección
2
Filtrado
3
Agrupación
4
Análisis IA
5
Revisión

Etapa 1: Recolección

Scraping automatizado de 30 medios argentinos

Cada 15 minutos, nuestros scrapers recorren 29 sitios de noticias argentinos usando Scrapy, un framework de scraping en Python. Respetamos los archivos robots.txt de cada sitio y limitamos nuestras solicitudes a 2 concurrentes por medio con 1.5 segundos de espera entre cada una.

La extracción prioriza datos estructurados (LD+JSON / Schema.org) cuando están disponibles, con selectores CSS como respaldo. 7 de los 30 medios requieren renderizado con navegador (Playwright) porque usan JavaScript pesado o detección de bots.

De cada artículo extraemos: título, subtítulo, cuerpo completo, autores, fecha de publicación, sección, etiquetas, e imagen principal.

Etapa 2: Filtrado (Triage)

Solo noticias políticamente relevantes pasan al análisis

No todas las noticias merecen análisis de sesgo. Filtramos automáticamente por sección del artículo para concentrarnos en contenido político, económico y socialmente relevante.

SECCIONES QUE PASAN (17)

Política, economía, sociedad, internacional, opinión, seguridad, justicia, derechos humanos, educación, salud, trabajo, energía, tecnología, cultura, investigación, regional, análisis

SECCIONES RECHAZADAS (24+)

Deportes, entretenimiento, celebridades, moda, horóscopo, gaming, inmobiliaria, autos, escándalos, streaming, TV, ratings, contenido patrocinado. Las secciones desconocidas se rechazan por defecto.

Etapa 3: Agrupación (Clustering)

Artículos sobre la misma historia se agrupan automáticamente

Para comparar cómo diferentes medios cubren la misma noticia, primero necesitamos agrupar los artículos en “historias”. Usamos tres señales:

EMBEDDINGS DE TEXTO

Modelo multilingual-e5-base (768 dimensiones), ejecutado con ONNX Runtime en INT8. Compara la similitud semántica entre título y primeros párrafos.

ENTIDADES NOMBRADAS

spaCy con modelo español (es_core_news_lg) extrae personas, organizaciones y lugares. La superposición de entidades confirma que los artículos hablan del mismo evento.

EMBEDDINGS DE IMAGEN

MobileNetV3 ejecutado en la NPU del Orange Pi RK3588. Imágenes similares refuerzan la agrupación cuando los artículos comparten fotografías de la misma conferencia, evento o persona.

El algoritmo de clustering (HDBSCAN) combina estas tres señales con umbrales calibrados. Un artículo se suma a una historia existente si supera la similitud mínima con al menos un tercio de los artículos del grupo.

Etapa 4: Análisis con IA

4 agentes especializados de Claude analizan cada historia

Cada historia agrupada pasa por 4 agentes de inteligencia artificial especializados. Cada agente tiene un rol específico y acceso a herramientas de verificación.

Agente de Consenso

Claude Sonnet

Identifica en qué coinciden todos los medios (hechos cruzados), dónde difieren (contradicciones), cómo cada cluster ideológico enmarca la historia, y qué temas omite cada grupo.

Hechos consensuadosContradicciones entre clustersEncuadres por clusterOmisionesFuentes oscilantes

Agente de Retórica

Claude Sonnet

Evalúa técnicas de manipulación retórica en cada artículo individual. Puntúa clickbait, sensacionalismo, manipulación general y alineación entre titular y cuerpo.

Puntuación de manipulación (0-100)Falacias lógicasTérminos cargados con alternativas neutrasDensidad de fuentes citadas

Agente de Verificación

Claude Opus

Verifica afirmaciones factuales específicas contra bases de datos oficiales argentinas. Cada afirmación recibe un veredicto con nivel de confianza.

Veredicto: verificado / disputado / no verificableEvidencia y fuentes primariasNivel de confianza

Agente de Revisión

Claude Opus

Actúa como control de calidad final. Revisa los reportes de los otros tres agentes, sintetiza un resumen narrativo neutral, genera un titular sin sesgo, y asigna una puntuación de confianza general.

Titular neutralResumen narrativoPuntuación de confianza (0-100)Banderas de inconsistenciaBrechas informativas

Bases de datos de verificación

Fuentes oficiales contra las que verificamos afirmaciones

INDEC

Instituto Nacional de Estadística y Censos. Datos de IPC (inflación), EMAE (actividad económica), desempleo, pobreza, canasta básica.

BCRA

Banco Central de la República Argentina. Tipo de cambio oficial, dólar blue, reservas internacionales, base monetaria, tasa de interés.

Boletín Oficial

Publicación oficial del Estado argentino. Decretos, resoluciones, leyes y disposiciones vigentes.

Clusters de sesgo

Cómo clasificamos la inclinación política de los medios

Agrupamos los 30 medios en cinco clusters según su inclinación política editorial. Esta clasificación es manual, basada en análisis histórico de cobertura, línea editorial declarada, y posicionamiento frente a los gobiernos. Se actualiza diariamente con un perfilador automático.

Izquierda

Rango: -1.0 a -0.5
Página/12El DestapeC5NMinuto UnoLa Izquierda DiarioPrensa ObreraTiempo ArgentinoEl Cohete a la Luna

Centro-Izquierda

Rango: -0.5 a -0.15
elDiarioARÁmbito FinancieroCrónicaBAE NegociosPerfilLa Capital

Centro

Rango: -0.15 a +0.15
ChequeadoLa Política OnlineRosario3LM Neuquén

Centro-Derecha

Rango: +0.15 a +0.5
iProfesionalEl CronistaInfobaeLa Voz del InteriorMDZ OnlineClarínTNA24Los AndesLa GacetaLa Nación

Derecha

Rango: +0.5 a +1.0
La Derecha Diario

La escala va de -1.0 (máxima izquierda) a +1.0 (máxima derecha). El 0.0 representa el centro teórico.

Limitaciones y advertencias

  • La IA puede equivocarse. Los agentes de Claude son potentes pero no infalibles. Las puntuaciones de retórica son estimaciones, no verdades absolutas.
  • La clasificación de clusters es manual. La asignación inicial de cada medio a un cluster político se basa en criterio editorial humano. El perfilador diario ajusta las puntuaciones pero no cambia la asignación de cluster.
  • Cobertura limitada. Monitoreamos 30 medios, lo cual cubre la mayoría del consumo informativo argentino pero no es exhaustivo. Medios locales pequeños no están incluidos.
  • No reemplaza el criterio humano. ElObjetivo es una herramienta para informar mejor tu lectura de noticias, no un sustituto del pensamiento crítico.
  • Agrupación imperfecta. El clustering automático puede agrupar artículos incorrectamente o no detectar conexiones temáticas sutiles.
  • Sesgo del modelo. Los modelos de Claude tienen sus propios sesgos potenciales. Mitigamos esto con prompts explícitos de neutralidad y verificación cruzada entre agentes.

Stack tecnológico

Pipeline de datos:Python, Scrapy, Celery, ONNX Runtime
NLP:multilingual-e5-base, spaCy, HDBSCAN
Análisis IA:Claude Sonnet + Claude Opus (Anthropic)
Base de datos:PostgreSQL 16 + pgvector
API:FastAPI, SQLAlchemy, uvicorn
Hardware:Orange Pi 5 Plus (RK3588 NPU) + Hetzner VPS
Frontend:Next.js 14, Tailwind CSS, TypeScript
Infraestructura:Docker, GitHub Actions CI/CD, systemd