Vi è più di un motivo per giustificare le scelte che hanno portato il gruppo di ricerca a focalizzare l’attenzione sulla leadership, sulla figura di alcuni leader identificati come più rappresentativi della vita politica italiana di questi ultimi sessant’anni [1].
La base testuale è vasta e complessa da dominare. Si tratta di circa 10.000 resoconti stenografici, per limitarci solo alle sedute in Assemblea della Camera dei Deputati, più 30.000 resoconti delle commissioni parlamentari, per i quali, conteggiando 70.000-100.000 occorrenze di parole per documento, si possono stimare da due a quattro miliardi di occorrenze. Il nostro corpus rappresenterebbe circa il 2,5‰ del totale, se ci riferiamo ai soli discorsi in Aula. Tuttavia rispetto alla leadership, se dovessimo considerarlo un campione, la proporzione sarebbe maggiore del 30% perché i leader, come da noi definiti, sono 85 complessivamente, dalla I legislatura dell’Italia repubblicana (8 maggio 1948 – 24 giugno 1953) alla XVI, fino all’insediamento del governo Monti (29 aprile 2008 – 16 novembre 2011).
Il discorso parlamentare ha caratteristiche proprie [2] e copre solo una parte, in certi casi una piccola parte, di tutta la comunicazione dei leader politici [3]. Si tratta di testi molto eterogenei sulla “scala della formalità”, come facevano notare sia Tullio De Mauro [4] che Paola Villani: «dal parlato-(tra)scritto dei resoconti stenografici ai testi di mozioni, interpellanze e interrogazioni; dalle proposte e disegni di legge alle relazioni previsionali e programmatiche; dagli atti e dalle relazioni conclusive delle commissioni d’inchiesta ai messaggi alle Camere del Presidente della Repubblica» [5].
Certamente, nel sottoporre ad analisi automatica un corpus di discorsi parlamentari, non è possibile ignorare i rilievi e i dubbi che Michele Cortelazzo aveva già segnalato nel suo saggio del 1985 [6]: la storia della trascrizione stenografica alla Camera dei Deputati testimonia bene quanto possano essere “pesanti” gli interventi correttivi ad opera dei resocontisti (o degli oratori stessi in sede di revisione). È sufficiente riportare quanto scrive Aurelia Mohrhoff (resocontista e stenografa della Camera):
Non più tardi di una quindicina di anni fa il comandamento del nostro superiore gerarchico era, per noi giovani stenografi: « Se l'oratore ha parlato male, tu devi farlo parlare bene ». Si pretendeva cioè una rielaborazione che comportava una « composizione » : annullate le disarticolazioni tipiche del parlato, occorreva procedere ad una sorta di standardizzazione, che risentiva di quella concezione « eleatica » del linguaggio come entità omogenea astratta. Il filtro stenografico, per usare una efficace immagine del mio collega Francesco Pariset, si traduceva in una sorta di letto di Procuste, nel quale le espressioni venivano allungate o contratte, a seconda della formazione culturale dello stenografo. Ne risultava un testo asettico, « imbalsamato », e tutto sommato, diciamolo francamente, falso [7].
Sappiamo che a questo “letto di Procuste” reagirono i radicali al loro ingresso nell’Aula parlamentare (protagonista assoluto Marco Pannella); una reazione che però era già nell’aria all’interno della professionalità crescente degli stenografi e resocontisti. Il che fa dire – sempre a Aurelia Mohrhoff:
Abbiamo oramai al nostro attivo una serie di piccole conquiste: se l'oratore si rivolge a qualcuno dandogli del « tu » il suo discorso viene così trascritto; se il deputato si permette audacie verbali magari non troppo consone allo stile parlamentare, queste espressioni vengono mantenute, entro i limiti del rispetto dovuto alle altre persone; se chi parla vuole esordire dicendo «signore e signori», o « colleghi deputati », invece del rituale « signor Presidente, onorevoli colleghi », così appare nel resoconto. Abbiamo contribuito ad una nuova « fisionomia » del testo, tentando di rendere con parentesi, lineette, puntini, virgolette, quegli importantissimi elementi paralinguistici che fanno sì che il parlato si regga in quanto tale. I nostri resoconti parlano oggi non la lingua del Parlamento, ma quella del parlamentare [8].
Pertanto, nell’interpretazione dei testi e delle loro caratteristiche linguistiche, è necessario adottare la massima cautela, tenendo presente la “potenziale” natura ibrida del prodotto testuale che compare pubblicato nei resoconti stenografici: il discorso parlamentare si colloca in una “terra di mezzo” in cui è difficile distinguere tra testi elaborati direttamente dal parlante (con discorsi pronunziati sulla base di un registro parlato-parlato o scritto-parlato), testi elaborati da collaboratori del leader, testi rielaborati successivamente, ancora una volta per intervento del parlante o di collaboratori, e testi riscritti dagli stenografi e dagli addetti alla resocontazione.
Tullio De Mauro [9], già nel 2010, aveva fatto notare come, al di là degli studi che ho già citato in precedenza dedicati in gran parte allo stile dell’oratoria, alla retorica, all’argomentazione, non vi fosse una base di riferimento empirica che permettesse di gettare uno sguardo complessivo sul linguaggio parlamentare, di effettuare qualche confronto, di trarre qualche osservazione generale di sviluppo e cambiamento e forse anche di sottoporre a prova qualche ipotesi di lavoro.
Per avvicinarsi a questo obiettivo, nei limiti definiti dal gruppo di ricerca e pur tenendo conto di questi importanti rilievi metodologici, non si è trovato (ma in effetti non c’è) un approccio più efficace, affidabile e anche “economicamente” affrontabile per effettuare confronti e analisi tra leader di diversa esperienza e orientamento politico, lungo un arco temporale abbastanza esteso da risultare significativo. Se l’intento è di sottoporre il linguaggio parlamentare al “macroscopio” dell’indagine statistica, lo scritto è quanto rimane e quanto abbiamo a disposizione della complessità del linguaggio parlamentare, e di questo ci dobbiamo accontentare.
Ecco dunque che la base testuale è rappresentata, come si è detto, dagli Atti parlamentari che la Camera dei deputati pubblica con riferimento ai resoconti dei dibattiti in Assemblea.
Il corpus è stato estratto dai resoconti stenografici disponibili sul sito della Camera dei Deputati in formato pdf fino alla XII legislatura e poi in formato HTML sul stesso sito dalla XIII legislatura in poi (dal maggio 1996). L’archivio dei documenti in pdf è accessibile anche dal Portale storico della Camera.
Il corpus LP (corpus del linguaggio parlamentare dei leader della Prima e della Seconda Repubblica) ha avuto diverse versioni seguendo le fasi di sviluppo della ricerca e la continua opera di raffinamento della base testuale che si è resa necessaria a causa della pessima qualità dei documenti originali in pdf sottoposti a digitalizzazione tramite OCR (optical character recognition).
La versione LP1 cui fa riferimento la pubblicazione del volume di presentazione generale pubblicato dalla Camera dei Deputati nel dicembre 2015 [10] è costituito di 1608 frammenti (circa 5 milioni di occorrenze di parole), con riferimento a tutte le legislature della Repubblica dalla I alla XVI, interrompendo il periodo di osservazione con l’insediamento del Governo Monti (16 novembre 2011). Ogni frammento rappresenta un intervento in Aula di uno dei 30 leader leader selezionati. Per i dettagli e i problemi che pone la definizione di "intervento" è necessario leggere il documento "Problemi di costruzione del corpus" presente in questo blog sulla colonna di destra della home page.
La versione del corpus LP2 (che è stata assunta come base di alcune pubblicazioni successive, tra le quali la redazione finale dell'intervento [11] al Convegno ASLI (Associazione per la storia della lingua italiana), è costituito di 1710 frammenti (circa 5.500.000 occorrenze).
La versione LP4, assunta come riferimento nella documentazione di questo blog, è costituita di 1877 frammenti (circa 5.560.000 occorrenze). Di fatto, parlare di un unico corpus è improprio. Forse sarebbe più corretto parlare di trenta corpora costituiti dagli interventi nella Camera dei Deputati dei trenta leader selezionati.
[03/07/2019]