Società di Linguistica Italiana

  • La Società
    • Organi della SLI
    • Come associarsi alla SLI
    • Statuto della SLI
    • Storia della SLI
  • Congressi e convegni SLI
    • Congressi internazionali di studi della SLI
    • Convegni interannuali della SLI
    • Linee guida per le candidature
  • Pubblicazioni
    • Bollettini della SLI
    • Atti dei congressi della SLI
    • Atti dei convegni interannuali della SLI
    • Atti dei workshop
    • Annuari degli insegnamenti linguistici
    • Altre pubblicazioni
  • Gruppi
    • GISCEL
    • GSPL
    • GSCP
  • Notizie e comunicazioni
    • Congressi e convegni di interesse linguistico: notizie e call for papers
    • Pubblicazioni di interesse linguistico: notizie e call for papers
    • Annunci di scuole estive, corsi di formazione, master, ecc.
    • Annunci di bandi per premi, concorsi, assegni di ricerca, borse di studio
    • Petizioni, appelli e raccolte di firme
    • Politica universitaria
    • Relazioni con il CUN
    • Relazioni con l’ANVUR
    • Documenti prodotti da soci
    • Relazioni con altre Società
    • Iniziative e documenti intersocietari
    • CIPL
    • Soci e altri linguisti scomparsi
  • Eventi
  • Link utili
  • Canale YouTube
Home / Notizie e comunicazioni istituzionali / Iniziative e documenti intersocietari / Iniziativa Phoné per la raccolta di materiale parlato di alta qualità

6 Giugno 2024

Iniziativa Phoné per la raccolta di materiale parlato di alta qualità

Gianpaolo Coro, Franco Cutugno e Alessandro Vietti presentano l’iniziativa Phoné, mirata a raccogliere materiale parlato (annotato e non) di alta qualità per l’addestramento e la valutazione dei moderni sistemi di riconoscimento e sintesi per l’italiano, e coinvolgere chiunque della comunità scientifica voglia contribuire all’impresa secondo le proprie possibilità.

Nell’ambito del PNRR FAIR, il consorzio Phoné (formato dall’Università di Napoli Federico II, dal CNR-ISTI di Pisa, e dalla Libera Università di Bolzano) partecipa al Progetto Trasversale su “Visione, Linguaggio e Sfide Multimodali” (TP2) senza avere accesso a nessuna forma di finanziamento pubblico e si pone l’obiettivo di raccogliere dati di parlato destinati al pubblico utilizzo da parte di chiunque voglia addestrare (sia in fine-tuning che ex-novo), testare o estendere l’utilizzo dei Large Acoustic Models.

Si intende produrre un sistema di riconoscimento automatico (ASR) addestrato from scratch sull’italiano, per il quale si stima la necessità di almeno 1000 ore di parlato non trascritto e 250 ore di parlato trascritto. Oltre all’enorme quantità di dati, la raccolta di registrazioni già esistenti implica una ulteriore fase di controllo della qualità del segnale e della presenza di elementi di disturbo quali le sovrapposizioni fra parlanti, rumori e musica di sottofondo. In una seconda fase del progetto sarà proposta anche una architettura per la sintesi vocale sempre basata su architetture neurali.

Considerata la scarsità di risorse che muove la nostra impresa, si richiede il coinvolgimento della comunità scientifica per ottenere la massima collaborazione per il raggiungimento del target, attraverso:

  • la condivisione di registrazioni di parlato di buona qualità (possibilmente monologico) trascritto e non trascritto;
  • un contributo all’attività di controllo dei dati (ad esempio promuovendo attività di tirocinio mirate).

Tutti i prodotti della ricerca di Phoné (dati, software e metodi) saranno via via resi disponibili in maniera aperta a tutta la comunità scientifica e applicabili in vari modi alla ricerca linguistica.

Gli interessati possono contattare phone.fair.tp2@gmail.com e visitare il sito di Phoné, che nei prossimi giorni si arricchirà di contenuti e informazioni.

Archiviato in:Iniziative e documenti intersocietari ·

Cerca

Ultimi aggiornamenti

  • Call for papers di Babylonia, rivista svizzera per l’apprendimento e l’insegnamento delle lingue
  • Le lingue pluricentriche: il caso dell’italiano – pubblicazione
  • Simposio REAL sull’economia e la politica linguistica (VI edizione)
  • Seminario “Il plurilinguismo come progetto educativo”
  • Borsa di studio “Luca Serianni”
  • Convegno IAFLL 2026
  • Convegno dottorale “Luoghi, non-luoghi e contro-luoghi”
  • Winter School “Descrivere e Documentare la Diversità Linguistica”
  • Emanuele Banfi socio ordinario dell’Accademia della Crusca
  • Pubblicazione del primo Manuale di fraseologia italiana

Calendario eventi

LMMGVSD
1
2
3
••
4
•
5
6
7
8
9
10
11
12
13
•
14
•
15
16
17
•
18
••
19
•
20
21
•
22
23
24
•
25
26
•
27
••
28
••
29
30

Copyright © 2025 · Società di Linguistica Italiana · Codice fiscale: 97042120580 · Privacy · Contatti · Crediti