Tag Archive for 'repubblica'

Archivio di Repubblica. Fico ma…

Leggo da Mantellini che Repubblica ha messo online l’archivio dei suoi articoli dal 1984.
Fichissimo, mi fiondo a vedere. Ciò che segue è la cronaca della mia esperienza.

L’articolo di presentazione è lungo e dettagliato, lo scorro rapidamente e, primo dubbio, non vedo link.
Ritorno all’inizio e leggo effettivamente l’articolo (beh, almeno i primi 160 caratteri) e capisco che l’interfaccia verso l’archivio è il campo ricerca. Hmm, peccato, un’occasione persa: per una volta sarebbe stato bello, trattandosi di un archivio storico, provare ad estrapolare meta-dati dalle notizie, o anche semplicemente dare un’idea della mole di informazioni gestite attraverso un sistema di indicizzazione per data o argomento.
Va beh, penso, qualcuno lo farà presto utilizzando le API… uhm, no, niente di aperto, almeno per il momento.

ok, dai, chi se ne frega delle API, dopotutto è una sega mentale da geek. Proviamo piuttosto ad usufruire del servizio e trarre vantaggio dalle caratteristiche annunciate nell’articolo.
Tra il 1984 e oggi, vediamo… “muro di berlino” dovrebbe andare.

Fase 1, la Ricerca inteligente

Un archivio, ma anche qualcosa di più: uno strumento di ricerca intelligente che fornisce risposte organizzate secondo una logica giornalistica

Vediamo… 4465 risultati. Mica male!

  • Primo risultato: cronaca nera del 2007; hmm…
  • Secondo risultato: “Come il muro di Berlino il gasometro regalato in pezzi”, 2007; :-/
  • Terzo risultato: “Inversi porta in scena Berlino dopo il Muro”, 2007; meh…

Mi viene un dubbio: starò ordinando per data… e invece no, giustamente la scelta di default è Ordina per rilevanza. Per curiosità scorro la lista, e con un po’ di disappunto non trovo nessun articolo del 1989. Li trovo però in seconda pagina, poteva andare peggio. Ma magari non sto utilizzando al meglio gli altri strumenti messi a disposizione…

Torniamo all’articolo introduttivo:

appare subito, nelle colonna di sinistra, la possibilità di “raffinare” la ricerca attraverso quattro fattori che ricordano almeno tre delle cinque “w” che stanno alla base del buon giornalismo

Colto da un’improvviso crollo di fede nei Principia Mathematica, mi alzo e vado a prepararmi un caffé, ormai convinto che la missione sia più ardua del previsto.

Dicevamo? La colonna di sinistra, giusto.
C’è una sezione Periodo, fantastico. Inoltre noto che ‘è un numero tra parentesi, presumibilmente i risultati per quel dato anno, o forse il numero di articoli presenti in archivio per quel periodo. Faccio rapidamente un’altra ricerca (Bilbo, che spero dia risultati piuttosto differenti) e verifico con piacere che il numero tra parentesi cambia: ora so che rappresenta i risultati per quel periodo / termine.
Hey ma… sono visualizzati solo gli ultimi 5 anni (ovviamente in ordine cronologico inverso)! Fortunatamente ci sono solo 25 anni di storico, per cui cliccando su “altri 20″ trovo che la lista si espande e ho a disposizione l’intera vita dell’archivio. Surprise surprise, il 1990 conduce con 348 articoli, mentre il 1989 è a quota 269 (nota di contesto: il muro è stato abbattuto il 9/11/1989) ecco che tornerebbe utile uno di quei sistemi alternativi di visualizzazione tipo, che so, un fantascientifico grafo:

Ta-daaa! Forse che a fine 1989 sia successo qualcosa di particolarmente topico per questa chiave di ricerca, e che quindi gli articoli di quel periodo siano più rilevanti della storia del gasometro del 2007? Tra parentesi, ecco emergere da questa semplice visualizzazione un meta-dato interessante: il “meme” muro-di-berlino è esploso DOPO che il muro, fisicamente, ha cessato di esistere…

In tutto questo, trovo che l’iniziativa di Repubblica sia notevole. A loro farei solo l’appunto che, invece che semplicemente “adattarsi” al Web (o alla comunicazione) così come lo conosciamo ora, sarebbe bello ogni tanto vedere nei media tradizionali il desiderio e il coraggio di osare un po’: dare modo ad esempio ai lettori di “giocare” con gli archivi attraverso qualche semplice API. Non sareste neanche i primi, BBC ha aperto la strada con backstage qualche anno fa…
A Kataweb (che ha realizzato l’interfaccia dell’archivio) suggerirei invece che un motore di ricerca ed un archivio storico son due cose un po’ diverse e che i criteri di rilevanza, in primis possono variare sensibilmente. Nota: ho scritto questo post perché l’articolo su Repubblica.it si conclude dicendo che

“L’archivio e la ricerca sono adesso alla portata di tutti. Col tempo verranno affinati e allargati per diventare uno strumento sempre più affidabile per il lettore e il ricercatore. “

e anche se non credo che queste righe arriveranno a Repubblica, mi piace pensare che, magari di “sponda”, possano risultare di qualche utilità.