Quality on your terms

Maskinläsbara resurser

Terminologi är traditionellt sett avsedd för att användas av mänskliga läsare, men numera är det också viktigt att datorer kan använda terminologisk information. Exempelvis kan system för maskinöversättning inom specifika ämnesområden behöva tillgång till både allmänna ordlistor och specialiserade terminologiska resurser.

Typen av information som behövs skiljer sig dock åt mellan dessa båda användare:

 • En mänsklig översättare kan skapa en termpost med bara viss information om en term, som dess översättning på ett annat språk och dess definition eller kontext. Om översättaren redan känner till de inblandade språkens grammatik och morfologi kan sådan information utelämnas i termdatabasen.

  Exempel på ordlista som lätt kan användas av en mänsklig läsare:

Engelska: Svenska:
oil, lubricating olja, smörj-
soldering, soldered lödning, lödd, -tt
 • En dator kan däremot inte förstå definitioner eller kontextuella exempel, och har inte heller samma kunskap om grammatik eller omvärldskunskap som en människa. Därför måste terminologiska resurser som ska vara maskinläsbara innehålla mer språklig information (som ordklass, genus och numerus) om olika böjningsformer av termerna ska kunna hanteras på rätt sätt.

  Exempel på ordlista som lätt kan användas av en dator:

  Engelska: Svenska: Ordklass: Böjningsform:*
  lubricating oil smörjolja substantiv flicka
  oil olja substantiv flicka
  soldering lödning substantiv stol
  soldered lödd adjektiv högljudd

  * = Böjningsformen anger hur ett ord böjs, genom att ange ett mönsterord som böjs på samma sätt.

  (Vissa system, som Acrolinx, har en inbyggd morfologi, där mycket språklig information redan finns angiven. Därmed behöver systemets användare inte bidra med lika mycket språklig information.)

  Alternativt kan alla möjliga fullformer listas:

  Engelska: Svenska:
  lubricating oil smörjolja
  lubricating oil’s smörjoljas
  lubricating oils smörjoljor
  lubricating oils’ smörjoljors
  […] […]

  (Den här typen av lista blir lätt väldigt lång…)