Share to: share facebook share twitter share wa share telegram print page

 

Memoria di traduzione

La memoria di traduzione (in inglese translation memory, TM) è un particolare tipo di database utilizzato in programmi software progettati per assistere e aiutare il processo di traduzione.

Alcuni programmi che usano memorie di traduzione sono noti come manager di memorie di traduzione (TMM).

Le memorie di traduzione vengono tipicamente utilizzate con strumenti dedicati, ad esempio Traduzione Assistita da Computer Computer Assisted Translation (CAT), programmi per la videoscrittura, sistemi per la gestione della terminologia, dizionari multilingue, o anche risultati grezzi di traduzione automatica.

L'idea che sta alla base delle memorie di traduzione risale alla fine degli anni settanta, tuttavia queste sono state immesse per la prima volta sul mercato solo alla fine degli anni '80.

Una memoria di traduzione è composta da segmenti di testo del brano da tradurre in una lingua emittente e dalle corrispondenti traduzioni in una o più lingue riceventi. Questi segmenti, o stringhe, possono essere interi blocchi di testo, paragrafi frasi o sintagmi. Le coppie che si creano sono chiamate "unità di traduzione". Le singole parole, invece, non vengono gestite direttamente dalle TM, ma da database terminologici.

Alcune ricerche dimostrano che molte ditte produttrici di documentazione multilingue usano sistemi di gestione di memorie di traduzioni. In un'indagine su professionisti della traduzione nel 2006, l'82,5% di 874 questionari ha confermato l'utilizzo di TM.[1]

L'uso di TM è correlato con tipi di testo caratterizzati da termini tecnici e strutture di proposizione semplici (tecniche o seppure in minor grado, commerciali e finanziarie), buona esperienza nell'ambito dei computer, e ripetitività dei contenuti[1]

Il traduttore fornisce al software di gestione della memoria di traduzione un brano origine da tradurre o prototesto. Il programma quindi divide il prototesto in segmenti, ricerca eventuali corrispondenze tra tali segmenti e i segmenti origine precedentemente tradotti e inseriti in memoria di traduzione disponibili, poi propone le corrispondenze trovate come possibili soluzioni di traduzione. Il traduttore può accettare le corrispondenze proposte ovvero sostituirle o modificarle per adattarle meglio al significato del prototesto e utilizzare la versione modificata. Negli ultimi due casi il segmento di prototesto e il corrispondente segmento tradotto metatesto, abbinati, sono inseriti nella memoria di traduzione.

Alcuni programmi per la gestione di memorie di traduzione cercano solo le concordanze al 100% (concordanze esatte), vale a dire recuperano solo segmenti di testo che corrispondono esattamente alle unità di traduzione presenti nelle memorie di traduzione. Altri invece utilizzano algoritmi di corrispondenza approssimati, fuzzy: cercano stringhe che corrispondono parzialmente al segmento origine e le propongono al traduttore evidenziando le differenze; questi potrà peraltro impostare nel programma la percentuale di concordanza minima da considerare.

La flessibilità e la robustezza degli algoritmi di ricerca delle concordanze determinano ampiamente le prestazioni del programma di gestione della memoria di traduzione, anche se per alcune applicazioni la percentuale di corrispondenze esatte è tanto alta da giustificare l'utilizzo delle sole concordanze esatte.

I segmenti che non hanno nessuna corrispondenza in memoria dovranno essere tradotti manualmente dal traduttore. Questi nuovi segmenti tradotti vengono archiviati nel database, dove possono essere utilizzati per traduzioni future e nelle ripetizioni dello stesso brano in corso di traduzione.

Le memorie di traduzione sono particolarmente efficienti per la traduzione di testi molto ripetitivi, come ad esempio i manuali tecnici. Sono utili anche per tradurre cambiamenti aggiunti man mano a un testo già tradotto in precedenza, in quanto permettono, per esempio, di trattare un minor numero di cambiamenti in una nuova versione di un manuale.

Al contrario, le TM sono tradizionalmente considerate inadeguate per la traduzione di testi letterari per il semplice motivo che in questo tipo di testi la ripetizione è assente, o quasi. Tuttavia, alcuni le trovano utili anche per testi non ripetitivi, perché le risorse database create per le ricerche di concordanza hanno un valore per determinare l'uso appropriato dei termini, per l'assicurazione della qualità (nessun segmento vuoto), e per la semplificazione del processo di revisione (segmento sorgente e destinazione sono sempre visualizzati insieme, mentre i traduttori, in un ambiente di revisione tradizionale, devono lavorare con due documenti).

Principali benefici

I sistemi di gestione di memorie di traduzione sono più adatti per la traduzione di documentazione tecnica e di documenti contenenti vocabolari specializzati. I vantaggi che offrono sono:

  • Certezza che il documento sia tradotto completamente (le memorie di traduzione non accettano segmenti destinatari vuoti)
  • Garantire che i documenti tradotti siano coerenti per le definizioni comuni, il fraseggio e la terminologia. Questo è importante quando diversi traduttori lavorano sullo stesso progetto.
  • L'attivazione di traduttori per tradurre i documenti in un'ampia varietà di formati senza dover possedere il software in genere necessario per elaborare questi formati.
  • Accelerare il processo complessivo di traduzione, dal momento che le memorie di traduzione "ricordano" il materiale precedentemente tradotto, i traduttori devono tradurre una sola volta.
  • Riduzione dei costi di traduzione di progetti di lunga durata, ad esempio il testo dei manuali, messaggi di avviso o serie di documenti hanno bisogno di essere tradotti solo una volta e possono essere utilizzati più volte.
  • Per i progetti di documentazione di grandi dimensioni, il risparmio (in tempo o denaro) grazie all'utilizzo di un pacchetto TM potrebbe già essere evidente anche per la prima traduzione di un nuovo progetto, ma di solito tali risparmi saranno visibili soltanto durante la traduzione di versioni successive di un progetto che era già stato tradotto prima di utilizzare memoria di traduzione

Principali ostacoli

I principali problemi che ostacolano un uso più ampio di programmi di gestione di memorie di traduzione sono:

  • Il concetto di "memorie di traduzione" si basa sulla premessa che le frasi utilizzate nelle traduzioni precedenti possano essere "riciclate". Tuttavia, un principio guida della traduzione è che il traduttore deve tradurre il messaggio del testo, e non le frasi che lo compongono.
  • I gestori di memoria di traduzione non rientrano facilmente negli attuali processi di traduzione e localizzazione. Per ottenere vantaggi dalla tecnologia TM i processi di traduzione devono essere riprogettati.
  • I gestori di memoria di traduzione attualmente non supportano tutti i formati di documentazione, e possono non esistere i filtri per supportare tutti i tipi di file.
  • C'è una curva di apprendimento associata all'utilizzo di gestori di memorie di traduzione, e i programmi devono essere personalizzati per la massima efficacia.
  • Nei casi in cui tutto o parte del processo di traduzione è esterno o gestito da traduttori liberi che lavorano esternamente, gli operatori esterni necessitano strumenti speciali per essere in grado di lavorare con i testi generati dal gestore della memoria di traduzione.
  • Le versioni complete di molti gestori di memorie di traduzione possono costare da €400,00 a €2000,00 per installazione, ciò può rappresentare un gravoso investimento (anche se esistono programmi meno costosi). Tuttavia, alcuni sviluppatori producono versioni gratuite o a basso costo dei loro strumenti, corredati da funzionalità ridotte, che alcuni traduttori possono utilizzare per lavorare su progetti creati con versioni complete di questi strumenti. (Si noti che ci sono pacchetti TM freeware e shareware disponibili, ma nessuno di questi ha ancora raggiunto una quota di mercato elevata).
  • I costi di importazione di traduzioni precedenti dell'utente nel database di memoria di traduzione, la formazione, nonché eventuali migliorie prodotte possono anche rappresentare un investimento considerevole.
  • La manutenzione dei database delle memorie di traduzione tende ancora ad essere un processo manuale nella maggior parte dei casi, e l'incapacità di manutenzione si può riflettere in termini di utilità significativamente diminuita e nella qualità delle corrispondenze della TM.
  • I programmi di gestione di memoria di traduzione potrebbero non essere adatti per testo che manca di ripetizioni interne o che non contiene parti immutate fra le revisioni. Il testo tecnico è generalmente più adatto per la memoria di traduzione, mentre i testi di marketing o creativi sono meno adatti.
  • La qualità del testo registrato nella memoria di traduzione non è garantita, se la traduzione di un segmento particolare non è corretta, in realtà è più probabile che la traduzione errata verrà riutilizzata la prossima volta che si traduce lo stesso testo sorgente, o un testo simile, perpetuando l'errore.
  • C'è poi una potenziale e, se presente, probabilmente inconscia influenza sul testo tradotto. Lingue differenti usano sequenze diverse per gli elementi logici all'interno di una frase e un traduttore cui è stata presentata una frase con traduzioni multiple che è in parte tradotta, è meno probabile che la ricostruisca completamente.
  • C'è anche la possibilità che il traduttore tratti il testo meccanicamente frase per frase, invece di concentrarsi su come ogni frase si riferisce a quelle attorno ad essa e al brano nel suo complesso.

Funzioni di una memoria di traduzione

Ecco un sommario delle principali funzioni di una memoria di traduzione.

Funzione esterne

Importa

Tale funzione serve per trasferire un brano e le sue traduzioni da un file di testo a una TM. Importa può essere fatto da un formato grezzo, in cui un brano esterno è disponibile per importarlo in una TM assieme alla sua traduzione. A volte i testi devono essere riprocessati dall'utente. C'è un altro formato che può essere utilizzato per importare: il formato nativo. Questo formato è quello che usa la TM per salvare le memorie di traduzione in un file.

Analisi

Il processo di analisi avviene secondo i passi seguenti:

Analisi testuale

È molto importante riconoscere correttamente la punteggiatura per distinguere ad esempio tra un punto alla fine di una frase e un punto in un'abbreviazione. Così, il mark-up è una sorta di pre-edizione. Di solito, i materiali che sono stati elaborati attraverso programmi di aiuto ai traduttori contengono mark-up, siccome la fase di traduzione è incorporata in una linea di produzione di documenti multilingue. Altri elementi di testo speciali possono essere impostati da mark-up. Ci sono elementi speciali che non hanno bisogno di essere tradotti, come i nomi propri e i codici, mentre altri possono avere bisogno di essere convertiti in formato nativo.

Analisi linguistica

La riduzione del modulo di base viene utilizzata per preparare liste di parole e un testo per il recupero automatico di termini da una banca dati specifica. D'altra parte, l'analisi sintattica può essere utilizzata per estrarre termini con più parole o la fraseologia da un testo di partenza. Quindi, l'analisi viene utilizzata per normalizzare variazioni dell'ordine delle parole della fraseologia, cioè quali parole possono formare una frase.

Segmentazione

Il suo scopo è di scegliere le unità di traduzione più utili. La segmentazione è una specie di analisi. È fatta monolingualmente con analisi superficiale e l'allineamento si basa sulla segmentazione. Se i traduttori correggono manualmente le segmentazioni, le versioni successive del documento non troveranno le corrispondenze con la TM in base alla segmentazione corretta perché il programma ripeterà i propri errori. I traduttori di solito procedono frase per frase, anche se la traduzione di una frase può dipendere della traduzione di quelle circostanti.

Allineamento

È il compito di definire le corrispondenze di traduzione tra testi origine e destinazione. Dovrebbe esserci feedback dell'allineamento per la segmentazione e un algoritmo di allineamento buono dovrebbe essere in grado di correggere la segmentazione iniziale.

Estrazione del termine

Esso può avere come ingresso un dizionario precedente. Inoltre, quando si estraggono termini sconosciuti, è possibile utilizzare l'analisi sulla base delle statistiche di testo. Queste sono destinate a stimare la quantità di lavoro svolto in una traduzione. È molto utile per la pianificazione e programmazione del lavoro. Le statistiche sulle traduzioni di solito contano le parole e valutano la quantità di ripetizioni nel testo.

Esporta

Esporta trasferisce il testo dalla TM in un file di testo esterno. Importazione ed esportazione devono essere inverse.

Funzioni on line

Quando si traduce, uno degli scopi principali della tecnologia TM è quello di recuperare le concordanze più utili nella memoria in modo che il traduttore può scegliere la migliore. La TM deve mostrare sia l'origine che testo di destinazione indicando le identità e le differenze.

Ricerca

Diversi tipi di abbinamento possono essere recuperati da una TM.

  • Concordanza esatta

Le concordanze esatte vengono visualizzate quando la corrispondenza tra il segmento di origine e quello memorizzato è una corrispondenza totale, carattere per carattere. Quando si traduce una frase, una corrispondenza esatta significa la stessa frase è stata tradotta prima. Le concordanze esatte sono anche dette "al 100%" (100% matches).

  • La concordanza esatta nel contesto (In-Context Exact match: ICE) o concordanza garantita

Una concordanza ICE è una concordanza esatta che si verifica esattamente nello stesso contesto, ovvero nella stessa posizione in un paragrafo. Il contesto spesso è definito dalle frasi circostanti e dagli attributi come il nome del file del documento, la data e le autorizzazioni.

  • Concordanza parziale

Quando la concordanza non è esatta allora è una concordanza parziale. Alcuni sistemi assegnano le percentuali per questi tipi di abbinamento, nel qual caso una corrispondenza parziale è superiore a 0% e inferiore al 100%. Questi dati non sono comparabili tra diversi sistemi a meno che il metodo di punteggio non sia specificato.

  • Concordanza

Quando il traduttore seleziona una o più parole nel segmento di origine, il sistema recupera coppie di segmenti che corrispondono ai criteri di ricerca. Questa funzione è utile per trovare le traduzioni di termini e modi di dire in assenza di un database terminologico.

Aggiornamento

Una TM si aggiorna con una nuova traduzione quando sia stata accettata da parte del traduttore. Come sempre  nell'aggiornamento di un database, si pone il problema di che cosa fare con i contenuti precedenti del database. Una TM può essere modificata cambiando o eliminando voci della TM. Alcuni sistemi consentono ai traduttori di salvare più traduzioni dello stesso segmento origine.

Traduzione automatica

Gli strumenti di memoria di traduzione prevedono spesso il reperimento automatico e la sostituzione.

  • Ricerca automatica

Nelle TM viene effettuata la ricerca e il risultato è visualizzato automaticamente mentre il traduttore si sposta nel documento.

  • Sostituzione automatica

Con la sostituzione automatica, se una corrispondenza esatta si presenta nella traduzione di una nuova versione di un documento, il software ripete la vecchia traduzione. Se il traduttore non controlla la traduzione nei confronti della sorgente, un errore della traduzione precedente verrà ripetuto.

Connessione in rete

La connessione in rete abilita un gruppo di traduttori a tradurre un brano assieme, più rapidamente di quanto ciascuno possa fare lavorando isolato, poiché le proposizioni e le frasi tradotte da un traduttore sono disponibili per gli altri. Inoltre, se le memorie di traduzione sono condivise prima della traduzione finale, vi è la possibilità per eventuali errori di un traduttore di essere corretti da altri membri della squadra.

Memoria di testo

La "memoria di testo" è la base della proposta di Lisa OSCAR di uno standard per TM in codice XML.[2] Le memorie di testo comprendono memorie d'autore e memorie di traduzione.

Memoria di traduzione

Gli identificatori univoci vengono ricordati durante la traduzione in modo che il documento nella lingua di destinazione è 'esattamente' allineato a livello di unità di testo. Se il documento sorgente è successivamente modificato, allora le unità di testo che non hanno subito modifiche possono essere direttamente tradotte nella nuova versione di destinazione del documento, senza bisogno di alcuna interazione del traduttore. È il concetto di 'esatta' o 'perfetta' concordanza con la memoria di traduzione. xml:tm può anche fornire meccanismi per corrispondenze parziali e sfruttate nel documento.

Storia delle memorie di traduzione

Il concetto alla base delle memorie di traduzione non è recente - la ricerca universitaria sul concetto iniziò alla fine degli anni '70, e le prime commercializzazioni divennero disponibili alla fine degli anni '80 - ma divennero commercialmente redditizie solo verso la fine degli anni '90. In origine i sistemi di memoria di traduzione memorizzavano allineate tra loro le frasi sorgente e destinazione in un database, da cui potevano essere richiamate durante la traduzione. Il problema con questo approccio 'sfruttato' è che non vi è alcuna garanzia se la nuova frase in lingua sorgente si trovi nello stesso contesto della frase del database sorgente. Di conseguenza tutte le corrispondenze sfruttate richiedono che un traduttore [umano] riveda la concordanza della memoria per pertinenza nel nuovo documento. Anche se inferiore, rispetto alla traduzione vera e propria, il riesame comporta ancora un costo.

Supporto per nuove lingue

Gli strumenti di memoria di traduzione dalla maggioranza delle aziende non supportano molte lingue emergenti. Recentemente i paesi asiatici come l'India si sono buttati nell'elaborazione automatica del linguaggio, e vi è una forte domanda di memorie di traduzione in tali paesi in via di sviluppo. Poiché la maggior parte delle società di software CAT si stanno concentrando sui linguaggi istituzionali, niente sta accadendo sulle lingue asiatiche.

Recenti tendenze

Un recente sviluppo è il concetto di 'memoria di testo' a differenza di memoria di traduzione.[3] Questa è anche la base del proposto standard LISA OSCAR.[4] Le 'memorie di testo' nelle xml:tm comprendono 'memorie d'autore' e 'memorie di traduzione'. La memoria d'autore viene utilizzata per tenere traccia delle modifiche durante il ciclo di creazione. Le memorie di traduzione utilizzano l'informazione dalla  memoria d'autore per implementare  l'abbinamento nelle memorie di traduzione.. Anche se destinata in primo luogo a documenti XML, xml:tm può essere utilizzata su qualsiasi documento che possa essere convertito in [5] formato XLIFF.

Memorie di traduzione di seconda generazione

Molto più potenti delle TM di prima generazione, comprendono un motore di analisi linguistica, usano la tecnologia 'chunk' per suddividere i segmenti in gruppi terminologici intelligenti, e automaticamente generano glossari specifici.

Memoria di traduzione e relativi standard

TMX

Scambio di memorie di traduzione (Translation Memory eXchange: TMX) è uno standard che favorisce l'interscambio di memorie di traduzione fra fornitori di traduzioni. TMX è stato adottato dalla comunità dei traduttori come miglior metodo per importare ed esportare le memorie di traduzione. La versione attuale, la 1.4b, permette la ri-creazione dell'originale dei documenti sorgente e destinazione dai dati TMX. Una versione aggiornata, 2.0, è in via di sviluppo.[6]

TBX

TermBase eXchange. Questo standard LISA che è stato rivisto e ripubblicato come ISO 30042, consente lo scambio di dati terminologici comprese informazioni lessicali dettagliate. Il quadro per la TBX è fornito da tre norme ISO: ISO 12620, ISO 12200 e ISO 16642. ISO 12620 fornisce un inventario delle ben definite "categorie di dati" con i nomi standardizzati che funzionano come i tipi di elementi di dati o come valori predefiniti. ISO 12200 (nota anche come MARTIF) fornisce le basi per il nucleo strutturale di TBX. ISO 16642 (noto anche come Terminological Markup Framework) comprende un metamodello strutturale per Terminologia dei Linguaggi di Marcatura in generale.[7]

UTX

Formato universale per scambio di terminologia (Universal Terminology eXchange format: UTX) è uno standard specificamente progettato per essere utilizzato per dizionari utente di traduzione automatica, ma può essere usato per glossari generali, leggibili dall'utente. Lo scopo della UTX è quello di accelerare la condivisione dei dizionari e il loro riutilizzo tramite le sue specifiche estremamente semplici e pratiche.

SRX

Scambio regole di segmentazione ('Segmentation Rules eXchange': SRX) è destinato a migliorare lo standard TMX così che i dati della memoria di traduzione che vengono scambiati tra applicazioni possano essere utilizzati più efficacemente. La capacità di specificare le regole di segmentazione che sono state usate nella traduzione precedente può aumentare lo sfruttamento che può essere raggiunto.

GMX

Metrica GILT. GILT sta per (Globalization, Internationalization, Localization, and Translation) Globalizzazione, Internazionalizzazione, Localizzazione e Traduzione. Lo standard metrica GILT consiste in tre parti: GMX-V per la metrica di volume, GMX-C per la metrica di complessità e GMX-Q per la metrica di qualità. La proposta di standard di Metriche GILT ha il compito di quantificare le esigenze del carico di lavoro e di qualità per qualsiasi attività GILT.[8]

OLIF

Formato aperto per lo scambio di lessici (Open Lexicon Interchange Format). OLIF è uno standard aperto, XML compatibile, per lo scambio di dati terminologici e lessicali0. Anche se originariamente inteso come un mezzo per lo scambio di dati lessicali tra lessici proprietari per la traduzione automatica, si è evoluto in una norma aperta e più generale per lo scambio di terminologia.[9]

XLIFF

Formati per l'interscambio di file di localizzazione XML (Localisation Interchange File Format) (XLIFF) intende fornire un singolo formato di file di scambio che può essere compreso da qualsiasi fornitore di localizzazione. XLIFF è il metodo d'elezione per l'interscambio di dati in formato XML nell'industria della traduzione.[10]

TransWS

Servizi WEB di traduzione (Translation Web Services). TransWS specifica le chiamate necessarie per utilizzare i servizi Web per la presentazione e il recupero di file e messaggi relativi a progetti di localizzazione. Essa è intesa come un quadro dettagliato per l'automazione di gran parte del processo di localizzazione corrente mediante l'uso di Web service.[11]

xml:tm

Questo approccio alla memoria di traduzione si basa sul concetto di memoria di testo che comprende memoria d'autore e memoria di traduzione. xml:tm è stato donato a Lisa OSCAR da XML-INTL

PO

Gettext Portable Object format. Anche se spesso non è considerato come un formato di memoria di traduzione, i Gettext file PO sono file bilingue che sono anche utilizzati nei processi di memoria di traduzione nello stesso modo in cui vengono utilizzate le memorie di traduzione. Tipicamente, un sistema di memoria di traduzione PO sarà composto da diversi file in una directory con struttura ad albero.. Comuni strumenti di lavoro con i file PO comprendono gli strumenti GNU gettext e il Translate Toolkit. Esistono anche diversi strumenti e programmi che modificano i file PO come se fossero semplici file di testo sorgente.

Software di memoria di traduzione per computer da tavolo

I software di memoria di traduzione per computer da tavolo sono ordinariamente utilizzati dai traduttori individuali per completare le traduzioni. Sono uno strumento specializzato per la traduzione nello stesso modo che un elaboratore di testi è uno strumento specializzato per la scrittura.

Memoria di traduzione centralizzata

I sistemi centralizzati di memoria di traduzione conservano le TM su un server centrale. Lavorano insieme con le TM tavolo e possono aumentare i tassi di concordanza delle TM del 30-60% in più rispetto allo sfruttamento raggiunto dalle sole TM da tavolo. Esportano corredi di traduzione (translation kit) o "t-kit" per gli strumenti di TM per computer da tavolo. Un t-kit contiene unità da tradurre pre-segmentate sul server centrale e un sottoinsieme della TM contenente tutte le vigenti concordanze della TM. La TM centralizzata di solito fa parte di un sistema di gestione della globalizzazione (Globalization Management System: GMS), che può anche contenere un database terminologico centralizzato (glossario), un programma gestionale (workflow engine), controllo dei costi, e altri strumenti.

Note

  1. ^ a b Elina Lagoudaki (2006), "Translation Memory systems: Enlightening users' perspective. Key finding of the TM Survey 2006 carried out during July and August 2006. (Imperial College London, Translation Memories Survey 2006), p.16 Archiviato il 25 marzo 2007 in Internet Archive.
  2. ^ Lisa OSCAR xml:tm standard, su xml-intl.com. URL consultato il 10 luglio 2012 (archiviato dall'url originale il 10 febbraio 2012).
  3. ^ Translating XML Documents with xml:tm
  4. ^ xml:tm
  5. ^ XLIFF
  6. ^ Translation Memory Exchange format Archiviato il 1º maggio 2008 in Internet Archive.>
  7. ^ Termbase Exchange format Archiviato il 24 marzo 2008 in Internet Archive.
  8. ^ GILT Metrics Archiviato il 14 marzo 2008 in Internet Archive.
  9. ^ Open Lexicon Interchange Format
  10. ^ XML Localisation Interchange File Format
  11. ^ Translation Web Services

Collegamenti esterni

Controllo di autoritàGND (DE4788416-2
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica
Prefix: a b c d e f g h i j k l m n o p q r s t u v w x y z 0 1 2 3 4 5 6 7 8 9

Portal di Ensiklopedia Dunia

Kembali kehalaman sebelumnya