Allineare dei file con LF_Aligner

In questo articolo descrivo come allineare dei file utilizzando il software open-source LF_Aligner. Alla fine del processo di allineamento, questo software produce un file tmx che è possibile utilizzare con qualsiasi strumento di traduzione assistita.

 (Versione per stampa)

[Read this post in English]

Download e installazione del software

Per prima cosa occorre scaricare la versione più recente di LF_Aligner. A oggi la versione più recente è la 4.05. Come per tutti i software open-source, è opportuno tenere d'occhio i siti di riferimento, perché gli aggiornamenti contengono spesso delle notevoli migliorie. È possibile scaricare il software dalla pagina http://sourceforge.net/projects/aligner/. LF_Aligner è progettato per funzionare sui sistemi operativi Windows, ma le versioni più vecchie (fino alla 3.11 e 3.12) sono disponibili anche per Mac e Linux (scaricabili da questo indirizzo: http://sourceforge.net/projects/aligner/files/?source=navbar). Ovviamente poiché queste sono versioni più datate, il funzionamento del software potrebbe essere più impreciso.

Il file scaricato dal sito è un file compresso contenente l'intero programma. Non è previsto un processo di installazione; questo da un lato significa che l'uso del software è immediato (è sufficiente decomprimere i file in una cartella e poi fare clic sul file LF_aligner_4.05.exe), dall'altro implica che non vengono creati automaticamente i collegamenti al menu Start e al desktop. Se si desidera che il programma sia presente nel menu Start, decomprimere il file zip (con un software di decompressione come ad esempio 7zip), copiarlo nella directory predefinita dei programmi (in Windows è C:\Program Files o C:\Programmi a seconda della versione del sistema operativo) e poi da qui creare un collegamento da copiare nella cartella del menu Start (solitamente un percorso tipo C:\Users\\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup o C:\ProgramData\Microsoft\Windows\Start Menu\Programs\StartUp).

Preparazione dei file da allineare

A questo punto per effettuare l'allineamento dobbiamo disporre di un file in lingua source e di un file in lingua target. Potrebbe trattarsi di vecchie traduzioni fatte da noi senza strumenti di traduzione assistita oppure di materiale inviatoci da un cliente. Il file source e il file target devono avere un aspetto il più possibile simile. Se i segmenti che stiamo allineando dovranno servire come riferimento, potrebbe essere opportuno copiare il testo su dei normali file di testo (.txt), in modo da eliminare eventuali formattazioni che potrebbero influire negativamente sul processo di allineamento. È inoltre importante considerare che LF_Aligner è in grado di allineare una sola coppia di file alla volta. Pertanto se desideriamo allineare molti file abbiamo due strade:

  1. Eseguiamo un processo di allineamento per ogni coppia di file
  2. Uniamo tutti i file in lingua di partenza in un unico file source e tutti i file in lingua di destinazione in un unico file target (facendo attenzione a rispettare l'ordine dei file) ed eseguiamo un solo processo di allineamento più lungo.

La strategia da scegliere dipende essenzialmente dalla complessità del testo e dell'allineamento. Si può provare un approccio e se non funziona o è troppo comlicato, si prova l'altro.

Tipi di file che è possibile allineare

LF_Aligner è in grado di allineare file in formato .txt (con codifica utf-8), rtf, doc, docx, PDF (ma con i file PDF è sempre opportuno avere cautela) o html. È inoltre in grado di allineare due pagine web di cui l'utente deve fornire l'indirizzo. Questa opzione potrebbe essere molto comoda se si vuole creare una memoria di traduzione a partire da materiale già pubblicato online.

In questo articolo prendiamo in considerazione l'allineamento di due file di testo semplice (.txt) con codifica UTF-8.

Procedura di allineamento

  1. Avviare LF_Aligner
  2. Appare la seguente finestra per la scelta dei tipi di file da allineare.

    LF_Aligner: tipo di file da selezionare

     
  3. Selezionare la prima opzione e fare clic su Next.
  4. Appare la finestra di selezione delle lingue.

    LF_Aligner: finestra di selezione delle lingue

    È importante selezionare la direzione linguistica giusta, quella cioè corrispondente al progetto per il quale intenderemo utilizzare la memoria di traduzione. Dopo aver selezionato le lingue corrette tramite le freccette Giù, fare clic su Next.
  5. Appare la finestra di selezione dei file.

    LF_Aligner: finestra di selezione dei file

    Qui occorre selezionare un file per ogni lingua. Dopo aver selezionato i file, fare clic su Next.
  6. Il software procede alla segmentazione dei file. Al termine dell'operazione, appare la seguente finestra:
     

    LF_Aligner: finestra con il risultato della segmentazione

    Questa finestra ci informa su come è andata la segmentazione e costituisce un'indicazione molto imporante. LF_Aligner tenta per prima cosa di effettuare una segmentazione basata sulle frasi. Questo vuol dire che, a seconda delle lingue, tenterà di segmentare le frasi in presenza di un punto (.). Se questo tipo di segmentazione dà risultati troppo disomogenei è possibile decidere di effettuare una segmentazione basata sul paragrafo. Questo tipo di segmentazione non è molto utile ai fini di traduzioni ripetitive, ma può essere comunque utile per creare delle TM di riferimento in modo molto rapido (solitamente l'allineamento basato su paragrafi produce meno errori) da consultare tramite ricerca di concordanze.
    In questa finestra, per ogni lingua, viene riportato il numero di paragrafi rilevato, seguito dal numero di segmenti prodotti dal software. Ad esempio English: 33 > 67. Questi valori sono molto utili. Se il numero di paragrafi e il numero di segmenti tra i due file da allineare sono molto diversi tra loro, potrebbe voler dire che i due testi che stiamo cercando di allineare non sono l'uno la traduzione dell'altro oppure che sono molto disomogenei. Uno dei due testi potrebbe contenere delle frasi in più (che per qualche motivo non sono state tradotte) oppure potrebbero essere due testi senza nulla in comune. In questo caso, quindi, è opportuno aprire i file in questione e vedere qual è il problema. Ad esempio se in uno dei due file, ci sono dei paragrafi o delle frasi in più, è opportuno eliminarle e ricominciare il processo di allineamento da zero.
  7. Selezionare l'opzione di segmentazione che ci interessa (la prima per segmentare a livello di frase o la seconda per segmentare a livello di paragrafo) e fare clic su Next.
  8. Il software procede con l'allineamento dei segmenti che ha prodotto. Al termine, visualizza la seguente finestra.

    LF_Aligner: finestra di fine allineamento

    A questo punto, in una cartella di lavoro, il software ha già prodotto un file .txt a colonne separate da tabulazione contenente l'allineamento. In questo passaggio ci chiede se vogliamo analizzare tale allineamento utilizzando l'editor grafico di LF_Aligner, se vogliamo creare un file xls (Excel) e correggere l'allineamento in Excel (il che spesso non è decisamente semplice) oppure se non vogliamo fare nessuna revisione.
    È consigliabile utilizzare l'editor grafico del software. Selezionare la prima opzione e fare clic su Next.
  9. Viene visualizzata la finestra dell'editor,che permette di correggere eventuali errori di allineamento. Nell'immagine in basso le frecce indicano un errore di segmentazione.

    LF_Aligner: editor per l'allineamento

    Nella traduzione inglese (lingua di destinazione), a fronte di una frase italiana (lingua di partenza), ne sono state create due. Per correggere questo tipo di errore, mettere il cursore sul segmento errato (in questo caso il segmento inglese della riga 2) e fare clic su Merge (F1). Il segmento verrà unito a quello sottostante.
  10. Un altro tipo di errore potrebbe verificarsi in corrispondenza di sigle contenenti un punto (come ad esempio Sig., d. C. ecc.). La maggior parte di queste sigle vengono interpretate correttamente dal software, ma talvolta può capitare che la frase venga spezzata in modo errato, come nella figura sottostante:

    LF_Aligner: errore di allineamento

     
    In questo caso il segmento in inglese della linea 12 corrisponde al segmento in italiano della linea 13. Per portarlo sulla riga 13, selezionare il segmento inglese della riga 12 e fare clic su Shift down (F4). Ora occorre unire i segmenti italiani n. 11 e 12. Per farlo, selezionare il segmento italiano della linea 11, quindi fare clic su Merge (F1)
    Alla fine del processo, tutte le linee devono essere corrette: a ogni segmento in lingua di partenza deve corrispondere la sua traduzione in lingua di arrivo. Se rimangono linee vuote o linee incomplete (perché ad esempio il testo in una lingua conteneva una frase in più), queste linee verranno ignorate e il software creerà la memoria di traduzione utilizzando solo le linee valide.
  11. Dopo aver verificato la correttezza dell'allineamento, fare clic su File > Save & Exit. Viene visualizzata la seguente finestra:

    LF_Aligner: salvataggio del file tmx

    Fare clic su Next.
  12. Viene visualizzata una finestra per definire le proprietà della memoria di traduzione:

    LF_Aligner: definizione delle proprietà della TM

     
    I primi due campi di finestra specificano le lingue di partenza e di destinazione. LF_Aligner utilizza le lingue pure, senza indicazione delle varianti. Per alcuni software di traduzione assistita, tuttavia, è necessario utilizzare le indicazioni delle lingue comprensive delle varianti. Per questo motivo è opportuno modificare le informazioni dei primi due campi e aggiungere le varianti (ad esempio EN-US per indicare l'inglese statunitense oppure EN-GB per indicare l'inglese britannico ecc.). Solitamente questa indicazione è composta da due caratteri (indicanti la lingua), un trattino e altri due caratteri (indicanti la variante linguistica). Per sapere quale indicazione utilizzare, fare riferimento al software di traduzione assistita utilizzato.
    Il terzo campo consente di inserire una nota. Lasciando l'opzione predefinita (Third column), viene inserita l'indicazione dei due file allineati. Selezionando Custom è possibile inserire una nota personalizzata. 
    Il quarto campo consente di inserire un ID indicante l'autore dei segmenti allineati. L'opzione predefinita è LF_Aligner. In questo campo è opportuno indicare sempre il fatto che questi segmenti sono il frutto di un allineamento semiautomatico, perché questa informazione sull'autore viene solitamente indicata nei CAT tool.
    L'ultimo campo è un'indicazione di data.
    Dopo aver opportunamente compilato i campi di questa schermata, fare clic su Next.
  13. Viene visualizzata una schermata che informa sul processo di creazione del file TMX. Fare clic su OK.
  14. Il programma si chiude. Tutti i file elaborati da LF_Aligner si trovano in una cartella che il software crea all'interno della cartella in cui si trova il file in lingua di partenza. La cartella ha un nome di questo tipo:
    align_2015.02.09_07.02.26
    Dentro questa cartella si trova il file tmx, frutto dell'allineamento (insieme ad altri file di lavoro del software tra cui un file txt a colonne separate da tabulazioni, che potrebbe essere utile per alcuni particolari strumenti). Questo file tmx può essere importato nel proprio strumento di traduzione assistita.

 (Versione per stampa)



dasmi Saturday 07 February 2015 - 3:19 pm | | Strumenti per traduttori

No comments

(optional field)
(optional field)

Comment moderation is enabled on this site. This means that your comment will not be visible until it has been approved by an editor.

Remember personal info?
Small print: All html tags except <b> and <i> will be removed from your comment. You can make links by just typing the url or mail-address.