|
[Прочети текстаAlt-0]
Научни разработки и изследователска дейност Една от основните цели на Асоциацията е да участва и да инициира научно-изследователски проекти в областта на компютърната лингвистика. Тя обединява и
организира учени от различни дисциплини и формира екипи от специалисти за изследователска дейност. В рамките на тази дейност вече са натрупани значителен опит,
знания и ресурси в областта на езиковите технологии. Членовете на Асоциацията повече от десет години активно участват в европейски и национални научни проекти. Основните от тях са:
- 2002-2004 OCoRrect (Cyrillic and Latin OCR correction using electronic dictionaries and sentence context), Volkswagen Stiftung, Ref: I 77 863
Проектът OCoRrect разработва алгоритми и методи за автоматична корекция на текстове на български, немски, английски и руски език, получени след оптическо
разпознаване. Методите се основават на използване на големи многоезични електронни речници и на анализ на контекста в рамките на дадено изречение.
- 2001-2004 BalkaNet (A Multilingual Semantic Network for the Balkan Languages), IST-2000-29388
Проектът BalkaNet има за цел изграждането на многоезична лексикална база данни, състояща се от бази на WordNet, за множество централно и източноевропейски
езици. Всяка база на WordNet за отделен език ще бъде структурирана в съответствие с базата на WordNet на университета в Принстън и тези на EuroWordNet.
- 2002-2003 Методи за корекция и извличане на структурна информация от текстови документи, Българска асоциация за компютърна лингвистика
Целта на проекта е извличане на структурата и адекватната корекция на текстови фрагменти от електронни документи от различни източници (набран документ,
документ след оптическо разпознаване, текст, получен от автоматично разпознаване на реч и др.).
- 1999-2003 Bulgarian INTEX, Българска асоциация за компютърна лингвистика
INTEX е среда за лингвистични изследвания, която включва големи речници и
граматики. Тя осъществява обработка на текстове от милиони думи в реално време. Асоциацията разработи INTEX модул за български език, включващ: граматика за
разпознаване на граници на изречения, речници на словосъчетанията и словоформите и граматики за различни езикови фрази.
- 1999-2002 TELRI II (Trans-European Language Resources Infrastructure), CA INCO-Copernicus 97/98, PL97-7085
TELRI е инициатива за създаване на действаща инфраструктура между европейски езици и центрове за езикови технологии. Целта е осигуряване на обща платформа и
общодостъпни едно- и многоезични езикови ресурси на индустрията, изследователските институти и висши учебни заведения, работещи в областта на компютърната лингвистика.
|