METODOLOGIA

Come funziona tutto questo

Come funziona Aggregatore Politico: fonti, analisi AI, metriche e classificazioni.

Indice

Fonti e raccolta Atteggiamento Toni giornalistici Categorie Storie Entità politiche Temi Dati parlamentari Framing Rilevanza Analisi avanzate Prospettive (bias mediatico)

Fonti e raccolta dati

Come raccogliamo le notizie

Aggregatore Politico monitora periodicamente oltre decine di fonti giornalistiche italiane tramite feed RSS. Ogni articolo viene scaricato, analizzato e arricchito automaticamente dall'intelligenza artificiale.

Le fonti includono quotidiani nazionali (Repubblica, Corriere, La Stampa), testate politiche specializzate (Formiche, Linkiesta, Il Post), agenzie di stampa (ANSA, AGI, Adnkronos) e media indipendenti.

Frequenza di aggiornamento

Ogni 15 minuti

I feed vengono controllati ogni 15 minuti. Gli articoli vengono analizzati dall'AI entro pochi minuti dalla pubblicazione. Le storie vengono raggruppate ogni ora.

Pipeline di analisi

5 fasi automatiche

Raccolta → Classificazione rilevanza → Estrazione metadati (categoria, tono, sentiment, entità, temi) → Raggruppamento in storie → Generazione bollettino.

Atteggiamento

Cos'è il sentiment

Il sentiment misura il tono emotivo di un articolo su una scala da -1 (molto negativo) a +1 (molto positivo). Non indica se la notizia è “buona” o “cattiva”, ma come viene presentata dalla testata giornalistica.

Scala e soglie

≥ 0.6

Molto positivo

Elogio, celebrazione, risultati raggiunti

0.2 — 0.6

Positivo

Toni costruttivi, ottimismo moderato

-0.2 — 0.2

Neutro

Cronaca fattuale, informazione bilanciata

-0.6 — -0.2

Negativo

Critica, controversia, tensione

≤ -0.6

Molto negativo

Attacco diretto, scandalo, emergenza

Sentiment delle entità

Ogni entità politica ha un sentiment medio a 30 giorni, calcolato come media del sentiment degli articoli in cui viene menzionata. Nella sezione “Trends” il sentiment positivo e negativo viene mostrato come percentuale (es. +12.5% o -8.3%).

Toni giornalistici

Cos'è il tono

Il tono descrive lo stile comunicativo dell'articolo. A differenza del sentiment (che misura positività/negatività), il tono classifica il modo in cui l'informazione è presentata.

Informativo

Neutrale e fattuale, riporta i fatti senza giudizio.

Istituzionale

Formale, tipico di comunicati ufficiali e dichiarazioni.

Critico

Evidenzia problematiche, contraddizioni o inadeguatezze.

Polemico

Acceso, provocatorio, alimenta il dibattito.

Celebrativo

Enfatizza risultati positivi, successi e traguardi.

Allarmista

Sottolinea rischi, pericoli e scenari negativi.

Sarcastico

Ironia e sarcasmo per commentare fatti politici.

Analitico

Approfondimento ragionato con dati e contesto.

Categorie

Come vengono assegnate

Ogni articolo viene classificato in una categoria tematica dall'AI. Un articolo può trattare più temi, ma viene assegnato alla categoria predominante.

Politica Interna

Governo, partiti, coalizioni, dinamiche parlamentari.

Politica Estera

Relazioni internazionali, diplomazia, geopolitica.

Economia

Finanza pubblica, mercati, politica economica.

Giustizia

Riforme giudiziarie, processi, legalità.

Cronaca Politica

Fatti di attualità con rilevanza politica diretta.

Diritti e Società

Diritti civili, welfare, immigrazione.

Difesa e Sicurezza

Forze armate, sicurezza nazionale.

Ambiente

Politiche ambientali, energia, transizione ecologica.

Europa e UE

Istituzioni europee, direttive comunitarie.

Storie

Cos'è una storia

Una storia è un gruppo di articoli correlati che trattano lo stesso evento da fonti diverse. Il sistema raggruppa automaticamente gli articoli usando similarità semantica (embedding vettoriali).

Come vengono create

Embedding

Ogni articolo viene convertito in un vettore numerico

Clustering

Articoli simili vengono raggruppati per distanza coseno

Conferma

≥ 3 articoli da ≥ 2 fonti → storia confermata

Sintesi

L'AI genera titolo e sommario della storia

Entità politiche

Cosa sono le entità

Le entità sono attori politici (persone, partiti, istituzioni) estratti automaticamente dagli articoli. L'AI identifica nomi propri e li collega al database di entità politiche italiane.

Arricchimento Wikidata

Le entità vengono arricchite con dati da Wikidata: foto, data di nascita, Wikipedia, profili social. I dati parlamentari provengono dai portali ufficiali.

Trend di visibilità

Il trend confronta le menzioni delle ultime 24 ore con la media dei 7 giorni precedenti. “In crescita” = visibilità sopra la media, “In calo” = sotto la media.

Temi

Cos'è un tema

I temi sono argomenti specifici estratti dagli articoli (es. “referendum”, “riforma della giustizia”). A differenza delle categorie (ampie), i temi sono granulari e cambiano con l'attualità.

Temi in evidenza

La sezione nell'Analisi mostra i temi con maggior volume negli ultimi 7 giorni. Gli indicatori (in crescita, stabile, in calo) confrontano il volume attuale con il periodo precedente. Ogni tema ha una pagina dedicata con articoli, entità collegate e fonti.

Dati parlamentari

Fonti dei dati

I dati parlamentari provengono dai portali ufficiali della Camera dei Deputati e del Senato: votazioni, DDL, composizione dei gruppi parlamentari.

Tasso di ribellione

Misura quanto spesso un parlamentare vota in disaccordo con il proprio gruppo. Alto = indipendenza o dissidenza. Basso = allineamento con il partito.

Partecipazione al voto

Percentuale di votazioni a cui il parlamentare ha partecipato, escludendo le assenze per missione ufficiale.

Framing

Cos'è il framing

Il framing è la cornice interpretativa scelta dalla testata. Due articoli sullo stesso fatto possono usare framing diversi: “opportunità economica” vs “rischio per i lavoratori”.

Nell'Analisi puoi vedere i framing più usati e confrontare come testate diverse inquadrano le stesse notizie.

Rilevanza

Come funziona il filtro

Non tutti gli articoli riguardano la politica. L'AI classifica ogni articolo come rilevante (politica, governo, economia pubblica) o non rilevante (sport, gossip, cronaca nera, intrattenimento).

Solo gli articoli rilevanti appaiono nei grafici, nelle storie e nelle statistiche.

Analisi avanzate

Panoramica

La sezione Analisi avanzate offre strumenti approfonditi per esplorare le dinamiche del discorso politico italiano, andando oltre le metriche base.

Indice di Potere

Classifica composita

Classifica le entità politiche con un indice composito che combina tre fattori: menzioni (volume), copertura fonti (quante testate ne parlano) e momentum sentiment (direzione del sentiment). Include il rilevamento di rivalità tra entità che competono per la stessa attenzione.

DNA delle Fonti

Impronta editoriale

Ogni testata ha un “DNA” unico: la distribuzione dei toni (informativo, critico, celebrativo...) e degli argomenti che copre. Rivela la sovrapposizione editoriale: fonti con copertura >80% identica nei temi trattati.

Correlazione Sentiment

Alleati e avversari

Calcola la correlazione di Pearson tra il sentiment giornaliero di coppie di entità. Correlazione positiva = quando uno sale nell'opinione pubblica, anche l'altro sale (“alleati”). Correlazione negativa = movimenti opposti (“avversari”).

Mappa Temi (Topic Velocity)

Dinamica dei temi

Visualizzazione a bolle dove ogni tema è posizionato per volume (asse X) e accelerazione (asse Y). Dimensione = importanza, colore = sentiment. Rivela quali temi stanno emergendo, quali sono stabili e quali in declino.

Prospettive (bias mediatico)

FUNZIONALITÀ SPERIMENTALE

La sezione Prospettive è una funzionalità sperimentale che analizza l'orientamento editoriale delle fonti giornalistiche. I risultati sono indicativi e non rappresentano un giudizio editoriale sulle testate analizzate.

Come viene calcolato l'orientamento

L'orientamento politico di ogni fonte non è assegnato manualmente. Viene calcolato automaticamente dall'AI analizzando il comportamento editoriale su un periodo di 30 giorni, attraverso quattro segnali:

1. Favorevolezza verso le entità (50%)

Per ogni politico e partito, misuriamo il sentiment medio con cui ogni fonte li copre, confrontato con la media globale di tutte le fonti. Se una testata copre i leader di governo più positivamente della media e quelli di opposizione più negativamente, viene posizionata verso destra, e viceversa.

2. Tono editoriale (20%)

Il rapporto tra toni critici/polemici e toni costruttivi/propositivi nella copertura della fonte. Non indica orientamento direttamente, ma contribuisce al profilo editoriale.

3. Selezione degli argomenti (15%)

Confrontiamo la distribuzione degli argomenti di ogni fonte con la distribuzione globale. Fonti che coprono temi diversi dalla media hanno un profilo editoriale più indipendente.

4. Divergenza nell'inquadramento (15%)

Per le storie coperte da più fonti, misuriamo quanto il sentiment di ogni fonte diverge dalla mediana. Fonti che inquadrano le stesse notizie in modo diverso dalla media hanno una voce più distinta.

Limitazioni importanti

Questo modello ha limitazioni significative:

• Il sentiment misurato è quello dell'articolo, non necessariamente l'opinione della testata. Un articolo critico su un politico coinvolto in uno scandalo può essere giornalismo legittimo, non bias.

• L'analisi AI del sentiment può contenere errori. Il modello funziona su grandi numeri (centinaia di articoli), non su singoli casi.

• Il posizionamento può variare significativamente nel tempo in base agli eventi di attualità. Un cambio di governo, ad esempio, invertirebbe il significato di “favorevole al governo”.

• Le etichette “sinistra”/“destra” sono semplificazioni di uno spettro complesso. La realtà editoriale italiana è più sfumata di quanto una scala unidimensionale possa catturare.

Punti ciechi (Blindspot)

I “punti ciechi” sono storie coperte da fonti con lo stesso orientamento. Se una notizia è coperta solo da fonti di centro-sinistra, potrebbe essere un segnale che il tema non è considerato rilevante (o è inquadrato diversamente) dall'altra parte dello spettro.

Note tecniche

Aggregatore Politico usa GPT-4o-mini per l'analisi del testo e nomic-embed-text per il raggruppamento semantico. I dati vengono aggiornati periodicamente e conservati per analisi storiche.

Questo strumento fornisce trasparenza sulla copertura mediatica della politica italiana, senza esprimere giudizi di valore sulle notizie o sugli attori politici.