Basisbeginselen van vertaalgeheugens

Definitie

Een vertaalgeheugen wordt ook wel een "TM" (Translation Memory) genoemd. Een vertaalgeheugen kunt u zien als een reeks records met paarsgewijze tekstsegmenten, waarbij aan de linkerkant de brontekst en aan de rechterkant de vertaling staat. Het doel van een vertaalgeheugen is om bestaande vertalingen te hergebruiken en vooral om vertalingen op subdocumentniveau (meestal zinsniveau) te hergebruiken.
Als u niet bekend bent met deze begrippen en daar wat meer informatie over wenst, kunt u dit Word-document (4 pagina's) lezen: Inleiding tot vertaalgeheugens

Indelingen

Er zijn veel indelingen die worden gebruikt voor het opslaan van vertaalgeheugens. In werkelijkheid wordt bij elk segmentpaar veel meer informatie opgeslagen. Bij veel vertaalprogramma's worden vertaalgeheugens in paarsgewijze bestanden opgeslagen. XML wordt echter ook vaak gebruikt.

Vertaalgeheugens bij SAS/ELC

Bij ELC maken we gebruik van verschillende indelingen, afhankelijk van het programma waarvoor het vertaalgeheugen wordt gebruikt.
  • Transit-bestanden voor talenparen: Een indeling die wordt gemaakt door Transit, ons voornaamste vertaalprogramma.
  • TMX: Een standaard-XML-indeling voor het opslaan van vertaalgeheugens.
  • XLIFF: Ook een gangbare XML-indeling voor het opslaan van vertaalgeheugens en parameters van het vertaalprogramma.
  • Platte bestanden: tekstbestanden met een CSV-indeling.
  • Catalyst-toolkits: Een binaire indeling die wordt gebruikt door het vertaalprogramma Alchemy Catalyst.
  • SAS-tabellen: Ten behoeve van bepaalde interne processen slaan we onze vertaalgeheugens ook op in databases met SAS-tabellen.
In principe zijn al deze indelingen echter onderling uitwisselbaar. TMX en txt zijn de indelingen die het meest worden gebruikt voor integratie met de interne programma's die hier bij ELC worden gemaakt. Alle gerenommeerde vertaalprogramma's kunnen normaal gesproken bestanden genereren in hun eigen indeling (bedoeld voor hergebruik in hetzelfde programma), in TMX-indeling (voor uitwisseling met andere programma's) en soms ook in een CSV-tekstindeling.