donderdag 17 december 2009

Attila Görög, onderzoeker computationele lexicologie

Zoals mijn naam al doet vermoeden, kom ik oorspronkelijk uit Hongarije. Ik woon sinds 2000 in Amsterdam waar ik o.a. de toenmalige Master Lexicologie en Terminologie heb gevolgd. Na het afronden van deze studie heb ik in het werkveld als vertaler en projectmedewerker bij een vertaalbureau ontdekt dat er vraag is naar gespecialiseerde terminologiediensten.Vertaalbureaus hebben behoefte aan een partij die zaken als alignment, termextractie, terminologiebeheer en het bijhouden van vertaalgeheugens overneemt. Deze vier diensten zijn de core business van mijn bedrijf, ExacTerm. Alle kennis, ervaring en contacten die ik tijdens mijn studie en het oprichten van mijn bedrijf heb opgedaan, kan ik inzetten voor twee heel speciale projecten waar ik momenteel binnen de VU voor werk.

Project Steunpunt Nederlandstalige Terminologie

Het Steunpunt Nederlandstalige Terminologie is in het voorjaar van 2007 opgericht door de Nederlandse Taalunie en heeft onder meer de functie van een gratis en onafhankelijk informatie- en adviespunt voor alle aspecten rond terminologie voor het hele Nederlandse taalgebied. Het Steunpunt-team bestaat uit Hennie van der Vliet, coordinator van het project en tevens docent aan de VU, twee Belgische collega’s van het bedrijf Cross Language met als hoofdtaak websitebeheer en mezelf met o.a. de taken: planning, onderzoek en administratie. Naast het organiseren van workshops en trainingen voor vertalers over bijvoorbeeld ad-hocterminologie en systematisch terminologiebeheer, geven wij advies op maat (o.a. over het gebruiken en vertalen van vaktaal, over beschikbare taalsoftware en open source tools). Tot onze doelgroep behoren bedrijven, organisaties, vertalers, terminologen, vakexperts, docenten en uiteraard studenten.

Het Steunpunt onderhoudt ook de website NedTerm. De website bevat o.a. een bibliografie van terminologische werken, een overzicht van het opleidings- en cursusaanbod terminologie in Nederland en Vlaanderen en geeft informatie over normalisatie, standaardisatie en hulpmiddelen voor terminologiewerk (waaronder ook links naar termencollecties die gratis toegankelijk zijn op het Internet en webcursussen over terminologiebeheer). Bovendien is er een agenda met alle evenementen die met terminologie te maken hebben. Wil je up-to-date blijven van nieuwe ontwikkelingen in de wereld van taal en vertalen en wil je meer informatie over onze activiteiten? Meld je nu aan voor onze nieuwsbrief!

Project DutchSemCor
Ambiguïteit is een van de meest intrigerende aspecten van taal. Woorden in een zin kunnen heel verschillende betekenissen hebben. Computers weten dan ook geen raad met sommige zinnen. Het doel van het NWO-project DutchSemCor (een samenwerkingsproject tussen de drie universiteiten VU, UvA en Universiteit Tilburg) is het bouwen van een Nederlands tekstcorpus met betekenisaanduidingen uit een semantisch lexicon Cornetto.

Ons doel is het voorzien van grote hoeveelheden Nederlandse teksten met woordbetekenissen om computers te leren ambigue zinnen te lezen én om ons in staat te stellen om betere modellen te maken van het menselijke vermogen om taal te begrijpen en te produceren. Ongeveer één kwart van het beoogde corpus van 1 miljoen woorden wordt handmatig geannoteerd m.b.v. een workbench voor semantisch annotatie, die aan de UvA wordt ontwikkeld. De resterende driekwart van het corpus wordt automatisch geannoteerd. De projectleider van DutchSemCor is prof. Piek Vossen, hoofd van de vakgroep Computationele Lexicologie binnen de VU.

Studentassistenten gezocht!
Mijn taak binnen dit project is o.a. het begeleiden van studentassistenten die een deel van het corpus gaan annoteren m.b.v. de workbench. In het kader van het annotatieproces zal er een training worden gegeven en zullen er wekelijkse bijeenkomsten plaatsvinden waarbij de meest frequente en meest polyseme Nederlandse nomina, verba en adjectiva zullen worden behandeld.

Het handmatig annoteren van teksten binnen het DutchSemCor project gaat op 1 Februari 2010 van start met een training van de studentassistenten en duurt een jaar. Momenteel zijn we bezig met de voorbereidingen en we zijn nog op zoek naar enthousiaste studenten Taalwetenschap en Nederlands die ons willen ondersteunen in dit project en op zoek zijn naar een leuke en leerzame bijbaan. DutchSemCor is ook uitermate geschikt als onderwerp voor een bachelor- of masterscriptie evt. voor verdere onderzoek.

Heb je zelf interesse of ken je studenten die interesse zouden kunnen hebben, neem dan contact met mij op (a.gorog@let.vu.nl).

Geen opmerkingen:

Een reactie plaatsen