Come funziona tutto questo
Come funziona Aggregatore Politico: fonti, analisi AI, metriche e classificazioni.
Fonti e raccolta dati
Come raccogliamo le notizie
Aggregatore Politico monitora periodicamente oltre decine di fonti giornalistiche italiane tramite feed RSS. Ogni articolo viene scaricato, analizzato e arricchito automaticamente dall'intelligenza artificiale.
Le fonti includono quotidiani nazionali (Repubblica, Corriere, La Stampa), testate politiche specializzate (Formiche, Linkiesta, Il Post), agenzie di stampa (ANSA, AGI, Adnkronos) e media indipendenti.
Frequenza di aggiornamento
I feed vengono controllati ogni 15 minuti. Gli articoli vengono analizzati dall'AI entro pochi minuti dalla pubblicazione. Le storie vengono raggruppate ogni ora.
Pipeline di analisi
Raccolta → Classificazione rilevanza → Estrazione metadati (categoria, tono, sentiment, entità, temi) → Raggruppamento in storie → Generazione bollettino.
Atteggiamento
Cos'è il sentiment
Il sentiment misura il tono emotivo di un articolo su una scala da -1 (molto negativo) a +1 (molto positivo). Non indica se la notizia è “buona” o “cattiva”, ma come viene presentata dalla testata giornalistica.
Scala e soglie
Sentiment delle entità
Ogni entità politica ha un sentiment medio a 30 giorni, calcolato come media del sentiment degli articoli in cui viene menzionata. Nella sezione “Trends” il sentiment positivo e negativo viene mostrato come percentuale (es. +12.5% o -8.3%).
Toni giornalistici
Cos'è il tono
Il tono descrive lo stile comunicativo dell'articolo. A differenza del sentiment (che misura positività/negatività), il tono classifica il modo in cui l'informazione è presentata.
Informativo
Neutrale e fattuale, riporta i fatti senza giudizio.
Istituzionale
Formale, tipico di comunicati ufficiali e dichiarazioni.
Critico
Evidenzia problematiche, contraddizioni o inadeguatezze.
Polemico
Acceso, provocatorio, alimenta il dibattito.
Celebrativo
Enfatizza risultati positivi, successi e traguardi.
Allarmista
Sottolinea rischi, pericoli e scenari negativi.
Sarcastico
Ironia e sarcasmo per commentare fatti politici.
Analitico
Approfondimento ragionato con dati e contesto.
Categorie
Come vengono assegnate
Ogni articolo viene classificato in una categoria tematica dall'AI. Un articolo può trattare più temi, ma viene assegnato alla categoria predominante.
Politica Interna
Governo, partiti, coalizioni, dinamiche parlamentari.
Politica Estera
Relazioni internazionali, diplomazia, geopolitica.
Economia
Finanza pubblica, mercati, politica economica.
Giustizia
Riforme giudiziarie, processi, legalità.
Cronaca Politica
Fatti di attualità con rilevanza politica diretta.
Diritti e Società
Diritti civili, welfare, immigrazione.
Difesa e Sicurezza
Forze armate, sicurezza nazionale.
Ambiente
Politiche ambientali, energia, transizione ecologica.
Europa e UE
Istituzioni europee, direttive comunitarie.
Storie
Cos'è una storia
Una storia è un gruppo di articoli correlati che trattano lo stesso evento da fonti diverse. Il sistema raggruppa automaticamente gli articoli usando similarità semantica (embedding vettoriali).
Come vengono create
Embedding
Ogni articolo viene convertito in un vettore numerico
Clustering
Articoli simili vengono raggruppati per distanza coseno
Conferma
≥ 3 articoli da ≥ 2 fonti → storia confermata
Sintesi
L'AI genera titolo e sommario della storia
Entità politiche
Cosa sono le entità
Le entità sono attori politici (persone, partiti, istituzioni) estratti automaticamente dagli articoli. L'AI identifica nomi propri e li collega al database di entità politiche italiane.
Arricchimento Wikidata
Le entità vengono arricchite con dati da Wikidata: foto, data di nascita, Wikipedia, profili social. I dati parlamentari provengono dai portali ufficiali.
Trend di visibilità
Il trend confronta le menzioni delle ultime 24 ore con la media dei 7 giorni precedenti. “In crescita” = visibilità sopra la media, “In calo” = sotto la media.
Temi
Cos'è un tema
I temi sono argomenti specifici estratti dagli articoli (es. “referendum”, “riforma della giustizia”). A differenza delle categorie (ampie), i temi sono granulari e cambiano con l'attualità.
Temi in evidenza
La sezione nell'Analisi mostra i temi con maggior volume negli ultimi 7 giorni. Gli indicatori (in crescita, stabile, in calo) confrontano il volume attuale con il periodo precedente. Ogni tema ha una pagina dedicata con articoli, entità collegate e fonti.
Dati parlamentari
Fonti dei dati
I dati parlamentari provengono dai portali ufficiali della Camera dei Deputati e del Senato: votazioni, DDL, composizione dei gruppi parlamentari.
Tasso di ribellione
Misura quanto spesso un parlamentare vota in disaccordo con il proprio gruppo. Alto = indipendenza o dissidenza. Basso = allineamento con il partito.
Partecipazione al voto
Percentuale di votazioni a cui il parlamentare ha partecipato, escludendo le assenze per missione ufficiale.
Framing
Cos'è il framing
Il framing è la cornice interpretativa scelta dalla testata. Due articoli sullo stesso fatto possono usare framing diversi: “opportunità economica” vs “rischio per i lavoratori”.
Nell'Analisi puoi vedere i framing più usati e confrontare come testate diverse inquadrano le stesse notizie.
Rilevanza
Come funziona il filtro
Non tutti gli articoli riguardano la politica. L'AI classifica ogni articolo come rilevante (politica, governo, economia pubblica) o non rilevante (sport, gossip, cronaca nera, intrattenimento).
Solo gli articoli rilevanti appaiono nei grafici, nelle storie e nelle statistiche.
Analisi avanzate
Panoramica
La sezione Analisi avanzate offre strumenti approfonditi per esplorare le dinamiche del discorso politico italiano, andando oltre le metriche base.
Indice di Potere
Classifica le entità politiche con un indice composito che combina tre fattori: menzioni (volume), copertura fonti (quante testate ne parlano) e momentum sentiment (direzione del sentiment). Include il rilevamento di rivalità tra entità che competono per la stessa attenzione.
DNA delle Fonti
Ogni testata ha un “DNA” unico: la distribuzione dei toni (informativo, critico, celebrativo...) e degli argomenti che copre. Rivela la sovrapposizione editoriale: fonti con copertura >80% identica nei temi trattati.
Correlazione Sentiment
Calcola la correlazione di Pearson tra il sentiment giornaliero di coppie di entità. Correlazione positiva = quando uno sale nell'opinione pubblica, anche l'altro sale (“alleati”). Correlazione negativa = movimenti opposti (“avversari”).
Mappa Temi (Topic Velocity)
Visualizzazione a bolle dove ogni tema è posizionato per volume (asse X) e accelerazione (asse Y). Dimensione = importanza, colore = sentiment. Rivela quali temi stanno emergendo, quali sono stabili e quali in declino.
Prospettive (bias mediatico)
FUNZIONALITÀ SPERIMENTALE
La sezione Prospettive è una funzionalità sperimentale che analizza l'orientamento editoriale delle fonti giornalistiche. I risultati sono indicativi e non rappresentano un giudizio editoriale sulle testate analizzate.
Come viene calcolato l'orientamento
L'orientamento politico di ogni fonte non è assegnato manualmente. Viene calcolato automaticamente dall'AI analizzando il comportamento editoriale su un periodo di 30 giorni, attraverso quattro segnali:
1. Favorevolezza verso le entità (50%)
Per ogni politico e partito, misuriamo il sentiment medio con cui ogni fonte li copre, confrontato con la media globale di tutte le fonti. Se una testata copre i leader di governo più positivamente della media e quelli di opposizione più negativamente, viene posizionata verso destra, e viceversa.
2. Tono editoriale (20%)
Il rapporto tra toni critici/polemici e toni costruttivi/propositivi nella copertura della fonte. Non indica orientamento direttamente, ma contribuisce al profilo editoriale.
3. Selezione degli argomenti (15%)
Confrontiamo la distribuzione degli argomenti di ogni fonte con la distribuzione globale. Fonti che coprono temi diversi dalla media hanno un profilo editoriale più indipendente.
4. Divergenza nell'inquadramento (15%)
Per le storie coperte da più fonti, misuriamo quanto il sentiment di ogni fonte diverge dalla mediana. Fonti che inquadrano le stesse notizie in modo diverso dalla media hanno una voce più distinta.
Limitazioni importanti
Questo modello ha limitazioni significative:
• Il sentiment misurato è quello dell'articolo, non necessariamente l'opinione della testata. Un articolo critico su un politico coinvolto in uno scandalo può essere giornalismo legittimo, non bias.
• L'analisi AI del sentiment può contenere errori. Il modello funziona su grandi numeri (centinaia di articoli), non su singoli casi.
• Il posizionamento può variare significativamente nel tempo in base agli eventi di attualità. Un cambio di governo, ad esempio, invertirebbe il significato di “favorevole al governo”.
• Le etichette “sinistra”/“destra” sono semplificazioni di uno spettro complesso. La realtà editoriale italiana è più sfumata di quanto una scala unidimensionale possa catturare.
Punti ciechi (Blindspot)
I “punti ciechi” sono storie coperte da fonti con lo stesso orientamento. Se una notizia è coperta solo da fonti di centro-sinistra, potrebbe essere un segnale che il tema non è considerato rilevante (o è inquadrato diversamente) dall'altra parte dello spettro.
Aggregatore Politico usa GPT-4o-mini per l'analisi del testo e nomic-embed-text per il raggruppamento semantico. I dati vengono aggiornati periodicamente e conservati per analisi storiche.
Questo strumento fornisce trasparenza sulla copertura mediatica della politica italiana, senza esprimere giudizi di valore sulle notizie o sugli attori politici.
