Interludium – Il dizionario frequenziale latino

Piano con quella cassa.

Hrumpf.

Attento che non ti scappi di mano!

Accidenti quanto pesa.

Appoggiala sul pavimento.

Aspetta, non la mollare, arf… ahh, ecco.

Finalmente! A me le tenaglie.

Ma che ci sarà mai dentro a questa cassaccia polverosa.

Adesso lo sapremo, il momento è solenne. Maledetto lucchetto, apriti, e apritiiiii…

Ma non avere tutta questa furia; fai con calma.

Aaaggghhhh… crack… ecco fatto.

E adesso?

Adesso cerchiamo questo famoso dizionario. Dunque vediamo: Un album di figurine dei calciatori, matite colorate, dieci palline di vetro, due quaderni a quadretti, una scatola del piccolo chimico, tre cuscinetti a sfera, una bussola scassata, un compasso, due manzotin, penne, libri…

Ma di chi è tutta quella roba?

Del prozio Atticus il navigatore… un paio di forbici, una fionda…

Perbacco! Abbiamo un navigatore in famiglia e tu non me ne hai mai parlato?

Beh, non ce n’è mai stata l’occasione… due dadi da gioco…

E dimmi, dimmi, ha navigato molto?

Eh, per svariati anni… un gomitolo di spago, una pila scarica…

Allora chissà quanti posti strani avrà visitato!

Tanti… un trenino elettrico rotto…

E quanta gente avrà conosciuto!

Tanta… un occhiale senza una lente… un birillo…

Ma insomma, che vascello comandava?

Vascello? Una camera d’aria di bicicletta…

Ma sì, su che navi  viaggiava? A vapore? A vela?

Navi? Il prozio odiava le navi, non sapeva nuotare e soffriva il mal di mare!… Una paletta con relativo secchiello…

Ma allora??

Navigava in internet dalla mattina alla sera, ecco tutto; …un pallone da calcio…

Ma tu guarda se !!! E io stupido che…

…Fumetti di topolino… un portachiavi fatto con lo scubidù… un rotolo di carte… una squadra da disegno… ma qui non c’è altro! Eppure mi sembrava…

E che volevi trovarci dentro quel baule ammuffito? Ma l’hai visto che roba collezionava il tuo prozio?

Taci blasfemo. Il prozio era uno spirito di notevole levatura ed una volta ricordo che mi parlò di un suo esperimento relativo al latino… e mi sembrava che… se ricordo bene… accennasse proprio ad un dizionario;. ..ma forse mi sbagliavo… è passato tanto tempo…

Beh, ti consiglio di rimettere tutto al suo posto, guarda che stanza hai ridotto con tutta quella paccottiglia.

E va bene,  ma che cos’è quel rotolo di fogli? Riviste?

E che ne so, apri e leggi.

A me le forbici, tagliamo lo spago e  e… Alter!

Sì?

L’ho trovato!

Cosa hai trovato?

Il dizionario frequenziale di latino dello zio!

Ma no?!

Sì, eccolo, è lui ti dico! E c’è pure un documento scritto di suo pugno.

Uh, ma guarda! E che dice?

Come lo feci! Diario di Atticus il navigatore sulle strane scoperte effettuate in internet alla ricerca del dizionario di latino ideale”. E’ il diario della sua avventura! Scritto di suo pugno!!

Interessante, leggi dunque.

Un momento che mi metto gli occhiali. Mumble, ecco:

Addì sei di maggio, ore ventitré. Da anni ormai navigo alla ricerca di un dizionario che possa aiutarmi nella comprensione della latina lingua, uzzolo che mi nacque or son diversi anni addietro e che mai mi abbandonò. Seguendo il mio istinto e girovagando per grammatiche mi accorsi ben presto della necessità di disporre di un dizionario che mi permettesse, senza eccessivi impegni, di acquisire un poco del  lessico di quell’antico idioma di cui volevo ad ogni costo impadronirmi. Ma fra il dire e il fare c’è di mezzo il mare, come si dice dalle mie parti, e le mie povere sostanze non mi permettevano a quel tempo di avvicinarmi ai dizionari titolati che, all’interno di scintillanti librerie, commessi senza scrupoli vendevano a peso d’oro. Andai così vagando alla ricerca di quello che il mio spirito bramava e le mie tasche rifiutavano senza mai trovare alcunchè, fino a stanotte,  quando dall’oceano di internet ho ripescato un documento che ha riacceso di colpo le mie speranze. Trattasi di uno scritto di tale professor Diederich in lingua anglofona. Alla luce tremolante di una candela ho tradotto alla bell’e meglio il documento e ho appreso come sia possibile acquisire una buona padronanza del lessico latino facendo uso di poche selezionate parole evitando così di naufragare in pubblicazioni  di troppo elevato costo e di troppa difficile comprensione per i neofiti come me,  che poco o niente conoscono della lingua.  Non mi sembra vero! Sono ansioso di leggere il suo metodo.

Addì sette maggio, ore ventiquattro. Sono stupefatto! Il professore afferma che con circa 1400 vocaboli  ben scelti egli è stato in grado di comprendere più dell’80 per cento dei suoi testi latini!! La cosa mi è sembrata impossibile, ma ho deciso di continuare ad approfondire il suo metodo che ricopio qui  in estratto:

L’indagine ha preso come base una serie di pubblicazioni:  The Oxford book of latin verse, l’Avery’s Latin Prose Literature, il Beeson’s primer of Medieval latin. Queste tre antologie contengono estratti di opere praticamente di tutti gli autori latini da Ennio a Erasmo, eccetto Plauto e Terenzio. Fra i poeti inclusi nella selezione per menzionare i più importanti figurano Lucrezio, Catullo, Virgilio, Orazio, Tibullo, Properzio, Manilio, Ovido, Seneca, Calpurnio Siculo, Lucano, Stazio, Marziale, Lattanzio, Ausonio, e Claudiano. Circa ottanta poeti sono stati presi in esame insieme a ventinove anonimi totalizzando un insieme di 75323 parole. Le prose includevano da cinque a quaranta pagine per ogni documento tratte dai seguenti autori: Catone, Varrone, Cicerone, Cesare, Sallustio, Cornelio Nepote, Livio, i due Seneca, Velleio Patercolo, Quinto Curzio, Petronio, Quintiliano, Tacito, Plinio e Svetonio, per un totale di 49.363 parole. Dal Benson’s primer of medioeval latin sono state infine collezionate 77.432 parole per un totale complessivo di 202.158 parole tratte da circa 200 autori latini.
Partendo da questa base tutte  le parole censite sono state suddivise in ordine alfabetico e ordinate per frequenza (contando le varie forme di una stessa parola come una sola occorrenza, salvo casi di manifesta irregolarità). Al termine si è ottenuta la seguente tabella:

Gruppo  Frequenza    N. parole  N. occorrenze   Percentuale 
1       più di 1000         17          45478        23,3 %
2       più di  500         42          62303        32,0 %
3       più di  200        127          87476        45,0 %
4       più di  100        307         112888        58,0 %
5       più di   50        661         137608        70,7 %
6       più di   20       1556         165521        85,1 %
7       più di   10       2583         179499        92,3 %
8       più di    5      13798         187507        96,4 %

I risultati sono stati riportati su un grafico che qui trascrivo (riga rossa):

grafico_frequenza_lessico_latino

Sull’asse orizzontale c’è il numero delle parole latine, su quello verticale la percentuale del lessico coperta. Come si evince facilmente dall’andamento della curva, partendo da zero, ad un moderato aumento del lessico  corrisponde un alto incremento percentuale nella frequenza di apparizione delle parole nei testi. La conoscenza delle prime 300 parole latine in ordine di frequenza porta già incredibilmente a coprire circa il 50 per cento di tutto il lessico utilizzato. Poi la curva decresce sempre più lentamente e sono necessarie sempre più parole per aumentare la percentuale di copertura finchè il gioco non vale più la candela.
Basandosi su queste considerazioni, il professore, ha raccolto tutte le parole con frequenza di apparizione uguale o maggiore di  20 volte  ed escludendone un’ottantina di natura medievale ha concluso che con circa 1400 parole si poteva coprire più dell’80 per cento del lessico dei testi presi in
esame. Egli ha quindi incluso tali lemmi in un dizionarietto allegato al suo documento. Meraviglia delle meraviglie! Tutto questo è stupefacente e non mi par vero! A me questo favoloso dizionario.

Addì otto di maggio a ore 22. Sono entrato in ambasce e il dubbio mi divora. E se il professore fosse stato troppo ottimista? Dopotutto la sua ricerca è stata affrontata su una base estesa ma non definitiva. E il suo dizionario poi. Tutto in inglese e di difficile comprensione. Devo indagare ancora.

Addì 15 maggio ore 19. Sono stanco e forse febbricitante ma penso di aver trovato un sistema per verificare l’attendibilità dei documenti in mio possesso. Sono riuscito, saccheggiando archivi e  biblioteche,  a scovare un’analoga ricerca effettuata da un’insegnante di lingua inglese, tale Ann Mahoney, che ha effettuato un esperimento simile prendendo come base della ricerca la ben più ampia  libreria digitale di Perseus. Al termine della sua indagine ella ha prodotto un documento con le 1000 parole latine più frequenti in letteratura con i seguenti dati:

N. parole  Frequenza precentuale 
250        50 %
400        65 %
350        70 %

Ho riportato questi dati sul grafico del professore (riga blu) e ho confrontato l’andamento delle rispettive frequenze. Stupefacente!  Se provo ad estrapolare  l’andamento della curva (riga tratteggiata) esse sembrano corrispondere  quasi perfettamente! La base più estesa di consultazione ha però abbassato le percentuali e  il 75-76 per cento del professore ( in corrispondenza del limite delle 1000 parole) si è ridotto al 70 per cento della professoressa. Sempre buono però. Peccato per quel dizionario tutto in inglese! Basta, vado a letto.

Addì 20 Maggio ore 2,00. Ho preso una decisione! Creare un nuovo dizionario frequenziale partendo dai dati del professore integrati con i risultati della professoressa !! E’ un compito immane per le mie povere forze, ma ho deciso di tentare lo stesso. Che Dio mi assista.

Addì 25 Maggio ore 15. Il lavoro procede speditamente, ma le parole sono tante ed i significati anche. Dovrò fare una cernita. Ma quali significati tenere e quali scartare? Da quant’è che non mangio? Boh! Non c’è tempo da perdere. Torniamo alle mie carte.

Addì 30 Maggio ore 22. Piove lampeggia e tuona. Sto procedendo con difficoltà  ma non sono contento di me stesso. Le forme dei verbi e dei sostantivi contenuti nel dizionario inglese non corrispondono a quelle dei nostri dizionari   italiani. E le traduzioni? Sono pieno di dubbi! Forse dovrei abbandonare tutto, ma come faccio?

Addì 15 Aprile. Un colpo di fortuna. Ho incontrato una mia vecchia amica professoressa di Latino e di Greco che si è offerta di emendare il mio lavoro, comprese forme e significati dei lemmi. Favoloso! Forse ne uscirà qualcosa di comprensibile. Che cara ragazza. Sempre disponibile e gentile. Nonostante il lavoro che le portano scuola e famiglia si è messa pure a collaborare ad un sito di latino  che offre la correzione gratuita di versioni per gli studenti!! Grazie di cuore cara Se….a.

Se….a??

Poffarre, c’è una macchia nel manoscritto e non si riesce a leggere bene il nome! Chi mai può essere costei?

Lo scopriremo dopo, vai avanti:

Addì 20 Aprile. Ho ricevuto il documento corretto ed emendato. Adesso possiedo un dizionario frequenziale latino che, essendo una collazione dei due esperimenti, dovrebbe attestarsi circa a metà fra i due.  Sono circa 1500 parole che dovrebbero corrispondere più o meno all’80 per cento del lessico latino normalmente presente nella letteratura considerata. Lo riporto sul grafico come intersezione di due rette. Adesso devo dormire, sono stanco, ho la barba lunga e mi serve una bella doccia. Devo anche mettere qualcosa sotto i denti. Da quant’è che non mangio?

Fai vedere questo dizionario frequenziale.

Eccolo qui.

Dizionario Frequenziale Latino

Creative Commons License
Dizionario Frequenziale Latino di F. Grifoni, T. Bucci è coperto da licenza Creative Commons Attribuzione-Non commerciale-Non opere derivate 2.5 Italia License.
Pubblicato su www.discipulus.it.

Accidenti! Che significano quei segni e quei numeri?

Non so, bisogna leggere le spiegazioni, ma è venuta sete e fame anche a me. Riprendiamo dopo?

Senz’altro. Che preparo per cena?

Pizza. E birra fresca.

10 Replies to “Interludium – Il dizionario frequenziale latino”

  1. Davvero un ottimo lavoro. Non sapevo della collaborazione Grifoni-Bucci, ma quel che posso ora vedere è che ha dato un risultato davvero apprezzabile! Complimenti per l’iniziativa!

  2. Il file pdf contiene una seria svista: di 4 sezioni ce ne sono solo 2!
    Le altre due (forse le più interessanti: ordinamenti per frequenza e per categoria) sono ripetizioni della prima.
    Comunque grazie, già così è un lavoro utile.

    1. Le sezioni sono quattro, come spiegato anche nell’introduzione; ovviamente l’ordinamento per frequenza e per categoria riguarda le stesse parole latine elencate alfabeticamente nella sezione 1.

  3. Vi ringrazio sinceramente per questo dizionario. Lo utilizzo da un bel po’ in classe e mi è utilissimo. Non potevo aspettarmi di meglio.

  4. Tra i lemmi del vostro dizionario figura un improbabile “murus muris” di III declinazione, con significato di “muro” mentre mi risulta attestato “murus, i ” di II e “mus, muris” di III con significato di “topo, sorcio”. Non so se si tratti di un refuso o se sia io ad ignorare questo insolito lemma in us di III.
    Spero ad ogni modo di aprire un utile ed fecondo confronto.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.