TM – osnove

Definicija

TM predstavlja memoriju prevoda (Translation Memory). Memorija prevoda može da se posmatra kao upareni skup zapisa koji sadrže segmente teksta, pri čemu leva strana sadrži izvorni tekst, a desna njegovu prevedenu verziju. Svrha memorije prevoda je ponovno korišćenje postojećih prevoda i, što je najvažnije, ponovno korišćenje prevoda na nivou poddokumenta, a to je obično nivo rečenice.
Ako vam ovi koncepti nisu poznati i želite detaljniji uvod (4 stranice), možete da pročitate ovaj Word dokument: Bukvar memorije prevoda

Formati

Za skladištenje memorije prevoda se koriste mnogi formati. Zapravo se sa svakim parom segmenata skladišti mnogo širi spektar informacija. Alatke za prevođenje obično prednost daju skladištenju TM-a u uparenim skupovima datoteka. Međutim, XML se takođe često koristi.

TM u kompaniji SAS/ELC

U kompaniji ELC koristimo nekoliko formata, u zavisnosti od alatke koja će koristiti TM.
  • Transit datoteke jezičkih parova: Vlasnički format koji kreira naša glavna alatka za prevođenje – Transit.
  • TMX: Standardni XML format za skladištenje memorije prevoda.
  • XLIFF: XML format za skladištenje memorije prevoda i parametara alatke za prevođenje koji takođe ima široku primenu.
  • Obične datoteke: txt datoteke sa CSV strukturom.
  • Catalyst kompleti alatki: Vlasnički binarni format koji koristi Alchemy Catalyst alatka za prevođenje.
  • SAS tabele: Memorije prevoda skladištimo i u spremištima SAS tabela kao podršku određenim internim procesima.
Međutim, svi ovi formati su u suštini razmenljivi. TMX i txt su formati koji se prvenstveno koriste za integraciju sa internim alatkama kreiranim ovde u kompaniji ELC. Sve poznate alatke za prevođenje obično mogu da generišu sopstveni vlasnički format (namenjen za ponovno korišćenje u istoj alatki), TMX (koji može da se prenosi u druge alatke) i ponekad CSV formate teksta.