Il socio Nicola Grandi, a nome del gruppo di ricerca del progetto PRIN2017 Univers-ITA. L’italiano scritto degli studenti universitari: quadro sociolinguistico, tendenze tipologiche, implicazioni didattiche, segnala la pubblicazione del report sintetico conclusivo del progetto. Il report è online a questo link e contiene un riepilogo dell’indagine condotta (campione analizzato, metodologia di raccolta dei dati, ecc.) e alcune prime conclusioni generali relative sia alle specificità individuate nella produzione scritta formale degli studenti e delle studentesse sia alle principali correlazioni con alcuni parametri emersi dal questionario sociobiografico. Il report ha un carattere divulgativo. Un’analisi più dettagliata e tecnica dei dati sarà disponibile indicativamente a fine anno, nella pubblicazione conclusiva del progetto.
A fine 2023 sono stati pubblicati in questa pagina i tre corpora prodotti nel corso del progetto:
- Il Corpus UniverS-Ita, 810.715 parole, contiene i testi prodotti ad hoc per il progetto e permette numerose modalità di ricerca, sia in base alle caratteristiche linguistiche dei testi stessi, sia in base ai numerosissimi metadati ricavati dal questionario sociobiografico compilato dai/dalle partecipanti (età, sede dell’Ateneo, tipologia del corso di studi, città/regione di provenienza dello studente/della studentessa, sue abitudini di lettura e scrittura, scuola secondaria di provenienza, ecc.).
- Il Corpus UniverS-Ita-ProGior, 1.484.575 parole, contiene testi tratti da giornali universitari e può essere interrogato anche attraverso alcuni metadati come argomento del testo, sede dell’Ateneo in cui è pubblicato il giornale e anno di pubblicazione.
- Il Corpus UniverS-Ita-ProUniv, 5.484.429 parole, contiene testi tratti da tesi di laurea, relazioni, ecc. nella versione non corretta da relatori e relatrici. Il corpus è disponibile in due versioni: bilanciata e non bilanciata. I metadati disponibili sono: sede dell’Ateneo area di nascita, dello studente/della studentessa, corso di studi, tipologia di testi, ecc.
I corpora sono consultabili liberamente sulla piattaforma NoSketchEngine. A questo link si trova un vademecum per l’uso dei corpora.
Il gruppo di ricerca è a disposizione per fornire ulteriori dettagli tecnici sui corpora, per informazioni aggiuntive sui dati raccolti e per ogni forma di ‘restituzione’ nei confronti degli Atenei che hanno collaborato alla raccolta dei dati.