AMTrad Services - Articolo sulla localizzazione e il Web 2.0

Translation & localization services
for the Italian language
 

La localizzazione e il Web 2.0

Prima parte – Introduzione teorica

Questo articolo nasce da un workshop che ho tenuto nell'ambito del Congresso Internazionale AITI svoltosi nel giugno del 2008. Rispetto a quanto pubblicato negli atti del Congresso, ho aggiunto spiegazioni dettagliate dei passaggi delle dimostrazioni pratiche (seconda e terza parte dell'articolo). Il contenuto resta comunque tecnico e per la sua piena comprensione sono necessarie determinate conoscenze di base: principali tecnologie Web server-side e client-side, uso di Word e della funzione di ricerca e sostituzione con caratteri jolly, uso di strumenti CAT integrati in Word (Wordfast e/o Trados).
Inizialmente parlerò del concetto di Web 2.0 e delle opportunità e delle sfide che presenta al localizzatore. Passerò poi a dimostrare praticamente un progetto di localizzazione di un sito basato sulle tecnologie del Web 2.0. Chi ha le competenze di base necessarie ne potrà trarre idee e spunti per arricchire il proprio bagaglio di tecniche e strumenti. Gli altri potranno farsi un'idea di quali sono le competenze necessarie per affrontare la localizzazione di questo tipo di contenuti.

Che cos'è il Web 2.0

Il termine "Web 2.0" è in circolazione da circa quattro anni, ma è ancora vivo il dibattito sulla sua definizione. Non si tratta infatti di una precisa innovazione tecnologica, ma piuttosto di un'evoluzione del Web, che fa ora uso di tecnologie disponibili da tempo in modo nuovo, creando un'esperienza più ricca e coinvolgente per gli utenti.

Le tecnologie alla base della trasformazione del Web non sono novità degli ultimi anni: linguaggi e tecnologie che affiancano l'HTML, quali XML, ASP, PHP, DOM, Java, JavaScript, fogli di stile CSS, database quali MySQL e altri sono da tempo presenti nella cassetta degli attrezzi dei webmaster e hanno dato origine ai sistemi di Content Management, che possono essere visti come uno dei primi passi nella direzione del Web 2.0. Tuttavia queste tecnologie vengono ora usate e combinate per creare un Web dinamico e interattivo, dove i concetti di dinamicità e interattività hanno compiuto un lungo percorso rispetto ai primordi, quando si concretizzavano in GIF animate, menu a tendina e moduli Web, o tecnologia Flash per i siti più pretenziosi. Il Web 2.0 si chiama ora Gmail, Flickr, YouTube, BitTorrent, Wikipedia, Google Maps, Facebook: siti che, grazie all'impiego di soluzioni quali AJAX, RSS, blog, wiki, sono diventati applicazioni Web con poco da invidiare alle classiche applicazioni desktop e, inoltre, sono diventati fenomeni sociali, che hanno inaugurato un nuovo modo di interazione con il Web e sul Web.

Varie sono le caratteristiche del Web 2.0 e le idee attorno alle quali ruota. Nel suo articolo, "What Is Web 2.0", Tim O'Reilly, fra i primi teorizzatori di questo concetto, ne propone alcune:

Mappa mentale del Web 2.0
Web2.0 Meme Map

Il Web 2.0 ruota in definitiva attorno ai concetti di:

  • Software come servizio, non pacchetto concesso in licenza
  • Distribuzione dei servizi software su più dispositivi
  • Modularità
  • Facilitazione dell'interazione dell'utente con le pagine Web (tecnologia AJAX)
  • Partecipazione, collaborazione, fiducia
  • Riutilizzo e remix dei dati
  • Decentralizzazione ("the long tail")
  • Work in progress

Web 2.0 e localizzazione

L'interesse del traduttore/localizzatore per il Web 2.0 è duplice:

  • Da una parte, il Web 2.0 rappresenta uno strumento di lavoro, anzi un insieme di strumenti: forum, wiki, blog che diventano risorse che i traduttori condividono e alle quali attingono quotidianamente. Nelle risorse bibliografiche ho riportato l'articolo di Avérous, che illustra ampiamente questo aspetto. Significativo a questo proposito è anche il workshop tenuto nell'ambito del Congresso AITI 2008 da Erik Herkner sull'uso dello strumento wiki per la gestione collaborativa della terminologia.
  • D'altra parte, il Web 2.0, in quanto luogo che contiene e produce enormi quantità di testo, è anche spesso oggetto del lavoro di traduzione/localizzazione.

In merito al secondo punto, esaminerò qui alcuni aspetti che a mio avviso sono di maggiore interesse dal punto di vista del localizzatore:

Separazione tra contenitore e contenuto

Alle origini del Web, il creatore della struttura del sito era anche la figura che inseriva (e in alcuni casi creava) il contenuto. Non vi era una distinzione funzionale netta fra struttura e contenuto del sito. Il webmaster progettava il layout, i menu, i pulsanti e inseriva il testo e le immagini. Il tutto era racchiuso nel codice HTML della pagina (tranne le immagini, per le quali nel codice HTML è presente un collegamento). Il lavoro di localizzazione di un sito consisteva quindi nella traduzione di file in formato HTML e nell'eventuale adattamento delle immagini. Gli aggiornamenti consistevano nella modifica dei file HTML. In occasione delle modifiche, il webmaster rimandava al localizzatore i file modificati e questi provvedeva a elaborarli e ad aggiornare la traduzione delle parti modificate. La traduzione di file HTML è diventato un compito abbastanza semplice quando i principali strumenti CAT hanno cominciato a supportare tale formato, ormai parecchi anni fa.

Esistono ancora molti siti strutturati in tal modo ma, con l'avvento dei sistemi di CMS e del Web 2.0, si assiste a un progressivo aumento dei siti che presentano una separazione piuttosto netta (dal punto di vista tecnico-strutturale) tra:

  • contenitore (la pagina Web con il suo layout, sistema di navigazione, parti di testo fisse) e
  • contenuto (la parte della pagina Web che cambia ed evolve con il contributo dei suoi utenti).

Tale distinzione è meno marcata dal punto di vista visivo, in quanto le due parti si fondono nella pagina Web e non è sempre agevole distinguerle. Si veda ad esempio questa pagina creata con lo strumento open source per portali Xoops:

Xoops

Ho racchiuso con una cornice rossa tutte le parti strutturali, presenti già nello strumento usato (Xoops). Il testo relativo a queste parti è contenuto nel codice stesso dello strumento (ad esempio, "Lost Password?" è una stringa contenuta in un file PHP contenuto nel pacchetto di Xoops). In verde è invece racchiuso il contenuto dinamico, memorizzato nel database utilizzato dallo strumento (ad esempio, "Long-distance track event" è contenuto in un record di una tabella denominata xoops_stories ed è stato inserito dall'utente aiti2008). Alcune parti della pagina uniscono testo statico a contenuto dinamico, come la stringa "Posted by aiti2008 on 2008/6/1 21:31:26 (0 reads)" (in rosso il contenuto statico, in verde quello dinamico, estratto dal database).

Dal punto di vista del localizzatore, ciò significa che:

  1. Quando si parla di localizzazione di un sito Web strutturato in questo modo, occorre chiarire se si intende localizzare il contenitore, il contenuto o entrambi.
  2. Gli approcci, i metodi e gli strumenti da adottare possono variare a seconda della parte da localizzare.

Informalità (impatto sul contenitore)

Il Web, per la sua stessa architettura, evolve in modo collaborativo e decentrato e sfugge quindi a ogni tentativo di formalizzazione unificante. Viene ad esempio da chiedersi che fine abbia fatto il Web semantico, di cui tanto si parlava qualche anno fa. Nelle parole di O'Reilly:
[...] the web succeeded precisely because it overthrew much of hypertext theory, substituting a simple pragmatism for ideal design [...]

I creatori di siti Web di seconda generazione utilizzano quindi strumenti vari, unendo tecnologie diverse e attingendo ampiamente al mondo delle risorse open source.

Per il localizzatore, questo significa che non è possibile utilizzare per le pagine Web gli stessi processi formalizzati applicati alla localizzazione dei prodotti software classici. I principi di internazionalizzazione che per questi ultimi vengono, bene o male, per lo più rispettati, primo fra tutti la separazione di codice e testo traducibile, sono applicati in modo molto più discontinuo e casuale ai siti Web. Il localizzatore Web si trova spesso a operare in un contesto che assomiglia molto a quello caratterizzante la localizzazione del software 15 o 20 anni fa, con la necessità di acquisire competenze in una varietà di linguaggi e tecniche di programmazione in rapida evoluzione.

Collaborazione (impatto sul contenuto)

I contenuti dei siti Web (in misura crescente anche di quelli "istituzionali" di aziende ed enti pubblici, che si arricchiscono di forum, blog e wiki) sono sempre meno prodotti in modo centralizzato e controllato e sempre più creati incrementalmente dagli utenti dei siti stessi, il cui contributo ne aumenta il valore. Per rimanere nell'ambito della traduzione, pensiamo a un sito come ProZ, il cui valore è determinato in larga misura da funzioni quali KudoZ e Blue Board, che vivono dell'apporto degli utenti. Nelle parole di O'Reilly: "the service automatically gets better the more people use it".

Per il localizzatore, questo significa che il contenuto Web non è aggiornato con ampia periodicità, come avviene per il software con le sue "release", ma è in continua evoluzione. La strategia di localizzazione di un sito Web può quindi prendere due direzioni:

  1. Localizzazione di una "fotografia" di un sito in un determinato momento. La versione localizzata sarà per la maggior parte del tempo meno aggiornata rispetto alla versione originale.
  2. Processo di localizzazione continuo, con traduzione del contenuto man mano che viene prodotto. Per i siti creati da grandi comunità di utenti questa strada non viene quasi mai seguita perché comporterebbe costi enormi. Si adottano quindi in molti casi sistemi di traduzione automatica. La traduzione umana di qualità è invece la scelta preferita dai siti istituzionali (che si tratti di aziende o enti pubblici). In questi casi vi è da superare la difficoltà tecnica dell'accesso continuo al contenuto dinamico memorizzato nei database. Come ci fa sapere Jost Zetzsche in una delle sue recenti newsletter, sono stati sviluppati appositi strumenti per rispondere a questa esigenza, come Clay Tablet. Quest'ultimo è però uno strumento non destinato al localizzatore (il che è evidente già dal prezzo) bensì al cliente dei servizi di localizzazione, che deve installarlo sul proprio server accanto al CMS. L'adozione di strumenti di questo genere potrebbe essere incentivata dalla loro offerta in modalità SaaS (Software as a Service).

Seconda parte


Bibliografia / sitografia