Sintesi vocale: computer parlanti e perché li amiamo
Quando un computer "legge" un documento e lo trasforma in parole pronunciate, lo chiamiamo "sintesi vocale". La produzione artificiale del linguaggio umano è stata possibile per molti anni. Solo di recente la qualità della voce è migliorata al punto che è difficile distinguere tra un computer parlante e il linguaggio umano. Ciò ha portato a molte nuove applicazioni come Text Speaker per il software di sintesi vocale.
Come funziona il text to speech?
Ci sono due componenti per ogni strumento di sintesi vocale. Innanzitutto, un programma "motore vocale" analizza il testo (compresa la punteggiatura) e sintetizza i suoni delle parole, delle pause e dell'intonazione.
Il programma del motore vocale trasforma parole come "DeskShare" in quelli che vengono chiamati "fonemi". Un fonema è uno dei suoni di base del discorso, come il suono "d" all'inizio di "doctor" o "DeskShare". L'altro componente è chiamato "voice font" o "voice". Puoi pensare alla voce come al "file di pronuncia della lingua", che viene utilizzato per creare l'audio.
La combinazione del programma di riconoscimento vocale con una voce di buona qualità produce un parlato facile da capire e dal suono naturale. Il motore vocale traduce il testo in fonemi e la voce trasforma i fonemi in audio.
Le persone possono dire la stessa parola in modo diverso. Ci sono differenze regionali, chiamate accenti o dialetti. Uomini e donne parlano in toni diversi. E, naturalmente, le parole non sono pronunciate allo stesso modo in diverse lingue. A causa di queste variazioni, i programmi di sintesi vocale usano varie voci per pronunciare il testo. Queste voci possono parlare in molti degli accenti più comuni e pronunciare le parole in base alle regole per lingue diverse. Dovresti ascoltare campioni di più voci e scegli quelli che ti suonano meglio.
Sono disponibili diverse tecnologie vocali. Raccomandiamo l'uso di voci SAPI 5 se disponibili. Leggere Software vocale: selezione vocale da testo a voce per maggiori informazioni sulle voci.
Dal momento che il motore vocale effettivamente "suona" le parole sapendo come vengono pronunciate le lettere, non vi è alcun limite al vocabolario del programma. Può leggere qualsiasi parola.
Il moderno software di sintesi vocale ha un aspetto incredibilmente realistico e le persone utilizzano software Windows Text Speaker per sempre più applicazioni:
- Formazione scolastica: Un computer che può leggere ad alta voce è un ottimo strumento per insegnare a leggere. I lettori principianti possono seguire un lon mentre il computer legge. Text Speaker evidenzia la parola attualmente in fase di lettura, aiutando lo studente a impararlo. La velocità di lettura è regolabile e può essere adattata allo studente a qualsiasi livello di abilità.
Il text to speech è utilizzato anche nell'insegnamento delle lingue straniere. Avendo una lingua madre che legge il testo, lo studente può correggere la pronuncia in qualsiasi momento, ovunque.
- Audio narrazione: Ci sono molte volte che uno script è stato trasformato in audio parlato. Ad esempio, potresti avere un sistema di menu del telefono o un'esercitazione basata su video che richiede una voce fuori campo. Il software di sintesi vocale può trasformare lo script digitato in file MP3 in modo rapido e semplice. Questo può essere particolarmente utile quando lo script cambia spesso. Non c'è bisogno di aspettare che un attore umano sia disponibile, basta cambiare lo script e utilizzare Text Speaker.
- Accessibilità: Uno degli usi più importanti per i sistemi di sintesi vocale è assistere le persone che hanno difficoltà a leggere. Questa tecnologia può essere utile a una vasta gamma di persone:
a) I non vedenti
b) Persone con difficoltà di lettura come la dislessia
c) Bambini troppo piccoli per leggere
- Correzione di bozze: Sarai sorpreso di quanto sia utile Text Speaker nel tuo lavoro quotidiano. Ad esempio, ascoltare un documento letto ad alta voce è spesso il modo migliore per correggere le bozze. Alcuni errori, come una doppia parola (hai capito?) Sono difficili da individuare durante la lettura, ma è impossibile da perdere se stai ascoltando.
La tecnologia moderna ha reso possibile a chiunque l'utilizzo del text to speech. Che tu stia imparando una nuova lingua, creando un menu vocale telefonico o problemi con la lettura, Text Speaker può rendere la tua vita più facile e migliore.