DI PIERLUIGI RIDOLFI
Il 9 agosto, a 98 anni, è morto a Gallarate padre Roberto Busa, gesuita.
Pioniere dell’informatica linguistica, padre Busa è stato in seminario con Albino Luciani, futuro Giovanni Paolo I. “È l’unico Papa al quale ho potuto dare del tu” diceva con noncuranza, gettando nello sconforto la maggior parte delle persone che ai Papi non ha mai avuto occasione di rivolgere la parola. Non solo sapeva di greco e di latino, ma gli era familiare l’ebraico, il francese, l’inglese, lo spagnolo, il tedesco: “Ma”- precisava- “se debbo parlare a braccio in quest’ultima lingua ho qualche difficoltà, ho bisogno di una traccia scritta”. Questo il personaggio, dal portamento autorevole, carismatico, capace di convincere chiunque con la sua parlata che tradiva l’origine vicentina, con tante storie affascinanti da raccontare e con un rapporto veramente speciale con l’opera di Tommaso d’Aquino.
L’ispirazione gli venne subito dopo la guerra, nel 1946: compiere una verifica puntuale e integrale del lessico di San Tommaso per basare su di esso una rivisitazione del suo pensiero, purificato dalle incrostazioni di sette secoli di studio e commenti. E si mise a cercare “macchine” che lo aiutassero in quest’opera, perché era impensabile esaminare a mano un autore così fecondo di scritti come San Tommaso. Nel 1949 incontrò a New York Thomas Watson, il gran capo dell’IBM: nessuno sa bene cosa sia veramente successo in quel colloquio e ciò fa parte della leggenda di padre Busa; di fatto da allora tutte le più moderne tecnologie informatiche furono al suo servizio per raggiungere l’obiettivo che si era prefisso. A dir la verità, padre Busa ha sempre avuto un concetto molto dinamico di quest’obiettivo, che ogni anno è diventato sempre più grande e ha richiesto sempre nuovo lavoro. Sono passati da allora quasi settant’anni e due generazioni di collaboratori IBM di padre Busa sono andati in pensione da un pezzo. Ma lui no: fino a un anno fa, invece di cullarsi sugli allori di tanti successi, questo prete scienziato ha continuato a insegnare, a fare scuola e a dirigere programmi di lavoro così vasti da mettere a dura prova ricercatori tanto più giovani di lui.
Quando si parla di padre Busa tutto è imponente a cominciare dalla produzione scientifica: quasi 300 voci. La più importante è la monumentale opera computerizzata e fotocomposta chiamata Index Thomisticus: 70 mila pagine, rilegate in 56 volumi formato enciclopedia, che contengono più di 20 milioni di righe, cioè quattro volte la Treccani. È la più grande opera mai stampata al mondo: dovrebbe far parte del Guiness dei primati. Incredibile a dirsi, padre Busa trovò un editore che gliela pubblicò con un apprezzabile apporto di diritti d’autore. Quando raccontava di questo lavoro, che poi si identificava con gran parte della sua vita, padre Busa amava parlare per numeri. San Tommaso scrisse moltissimo: 118 sono le sue opere certe arrivate fino a noi alle quali il padre volle affiancare, per fare dei confronti, 61 scritti di altri autori contemporanei. Si cominciò con registrare tutto, San Tommaso e gli altri, su schede perforate, tecnologia d’avanguardia nel 1949. Allora sulle schede con dei fori si identificavano cifre per formare numeri e solo raramente lettere per formare parole, ma padre Busa fece esattamente il contrario: pochi numeri e molte parole, moltissime parole, quasi undici milioni su altrettante schede: un muro spesso un metro, alto due e lungo novanta. Io questo muro l’ho visto e ho temuto che il pavimento della casa veneziana, dove a quell’epoca padre Busa studiava e lavorava, sprofondasse sotto il peso delle tante tonnellate. Un convento di suore era stato mobilitato per trascrivere i testi di San Tommaso sulle schede. Poi vennero i nastri magnetici: mille ottocento, appena una paretina. Poi i volumi a stampa: uno scaffale. Da ultimo il compact disc: uno solo, che sta in un cassetto. Ora è superato anche quello: è tutto su Internet.
Per descrivere il lavoro di padre Busa in modo superficiale basta una paginetta: per andare appena un po’ in profondità occorre leggersi l’introduzione e la conclusione contenute nei famosi 56 volumi dell’Index Thomisticus. Non ho possibilità di scelta: sarò superficiale.
Esaminando gli 11 milioni di parole, si è trovato che le forme diverse sono 150 mila, che si riducono a 20 mila lemmi o unità lessicali, cioè voci che nei dizionari rappresentano tutte le proprie flessioni e significano quel senso e valore di base che è comune a tutte. Per esempio: “sono”, “éra”, “sarai” costituiscono voci del verbo essere e vengono chiamate forme del lemma “essere”. Invece “èra”, sostantivo, fa lemma a sé. A loro volta questi 20 mila lemmi sono la combinazione di 1851 elementi differenti (prefissi + temi + suffissi) con frequenza superiore a uno su centomila, più altri 1.811 con frequenza inferiore, più 860 desinenze graficamente differenti. Per esempio, la voce “impossibilitatis” è costituita da tre elementi: im-poss-ibilitat più la desinenza -is. “Con ciò si è riscontrato che sul versante dei segni significanti 11 milioni di singole parole alla fin fine sono la combinazione di pochissimi piccoli elementi: di essi circa 2.500 sono rilevanti ma accompagnati attorno e frammezzo da un pulviscolo di asteroidi irrilevanti”. A questo a scopo è fondamentale costruire le cosiddette “concordanze”, cioè l’elenco dei lemmi con le rispettive frequenze. Il problema tecnico più serio sta nel come distinguere i casi ambigui (éra, èra).
Ho conosciuto padre Busa nel 1962, a Monaco, a un convegno mondiale di informatica dove aveva esposto lo stato di avanzamento del suo progetto. Da quell’incontro mi venne l’idea di applicare lo stesso criterio a Dante: ne nacque il progetto IBM delle concordanze della Divina Commedia che presentammo a Pisa nel ’65 al Presidente Saragat. Fu l’inizio di una intensa attività in campo linguistico sia in casa IBM sia presso il CNR di Pisa, dove nacque una vera e propria scuola, che si ispirava agli insegnamenti di padre Busa.
Incontrai nuovamente padre Busa nel 1978, a Venezia, ospite della locale residenza dei Gesuiti. Le schede ormai erano state tutte trasferite su nastro magnetico e si stava operando la fotocomposizione per stampare le concordanze. Veniva usata a questo scopo una macchina speciale progettata dall’IBM e costruita in un unico esemplare, quello appunto assegnato a padre Busa. Il lavoro andava per le lunghe e sembrava che fosse stata intrapresa una strada che non portava da nessuna parte. A quell’epoca ero appena stato nominato a capo della ricerca in IBM in Italia e fui incaricato di porre una fine, cioè di portare a termine la fotocomposizione di tutta l’opera, nel più breve tempo possibile, a qualunque costo, poi di ritirarsi da questo interminabile progetto.
L’anno dopo la fotocomposizione era finita e la stampa dei 56 immensi volumi seguì a ruota. Nel 1980 l’opera fu presentata in udienza solenne al Papa Giovanni Paolo II: erano presenti tutti quelli che in qualche maniera avevano collaborato a quest’impresa, quasi 400, tra suore e laici; c’era, naturalmente, anche lo stato maggiore dell’IBM. Il Papa fece un bellissimo discorso, nel quale, dopo gli ovvi complimenti a padre Busa, lanciò la proposta di non limitare questi studi al solo San Tommaso, ma di estenderlo a tutta la letteratura cattolica, dai Padri della Chiesa a Jacques Maritain. Ancora una volta padre Busa aveva colpito! Sarebbe stato un lavoro100 volte maggiore di quello già fatto con San Tommaso. Il Presidente dell’IBM, che mi era accanto, ebbe un brivido e mi rivolse uno sguardo atterrito: “E ora che si fa?”. Anch’io ho ricevuto un’educazione dai Gesuiti e so come gestire le non risposte. Naturalmente non se ne fece nulla.
Nel 1993 l’Università Cattolica di Milano, presenti tanti amici, collaboratori e allievi, ha festeggiato gli ottant’anni di padre Busa con una cerimonia solenne. È intervenuto il cardinal Carlo Maria Martini, ha parlato Umberto Eco sulla sua tesi di laurea dedicata propria alla lingua di Tommaso d’Aquino, mentre io ho esposto la parte più tecnica del lavoro. Abbiamo tutti riconosciuto a padre Busa il ruolo di pioniere dell’informatica linguistica, disciplina che si presta ad ampie ricerche puramente scientifiche ma che apre anche degli orizzonti applicativi straordinariamente importanti: basti pensare ai sistemi di riconoscimento del parlato, alla comprensione del linguaggio naturale, ai sistemi di ricerca libera nel testo, ai riassunti automatici. Tra l’altro questo tipo di ricerche è attivissimo in Italia a seguito sia della scuola di padre Busa sia degli investimenti paralleli che l’IBM, il Cnr e molte università hanno fatto in questo campo.
Nel suo intervento padre Busa ha stupito i presenti parlando poco del passato e molto del futuro: “Occorre promuovere una collaborazione, prima universitaria europea e poi internazionale, che, sulla scorta dell’Index Thomisticus e assumendo l’Aquinate quale rappresentativo della cultura del 1200, si incarichi del progetto di un lessico biculturale 1200 – 2000 che esprima in vocabolario di oggi i concetti culturali espressi allora dal vocabolario di quel tempo”. Era la proposta del Papa. E fa degli esempi: virtus non è solo virtù ma potrebbe anche tradursi in forza, ratio seminalis potrebbe significare codice genetico, e così via. Impresa da far tremare i polsi, ma non a padre Busa: mi aveva confidato che se qualcuno del pubblico avesse osservato che a ottant’anni non si impostano programmi così lunghi s’era preparato a replicare che non si deve mai porre limiti alla Provvidenza. Ma nessuno, vista la sua capacità di lavoro, ebbe il coraggio di fare la minima obiezione. I fatti gli hanno dato ragione, perché da allora ha continuato a produrre idee e risultati.