Метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов

PDF
0
Recenzje
Oznacz jako przeczytane
Jak czytać książkę po zakupie
Opis książki

В статье представлен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов на основе структурных моделей терминологических словосочетаний. Описаны существующие подходы к извлечению терминов на основе метода извлечения устойчивых словосочетаний, статистических и гибридных методов, а также отмечены лингвистические аспекты терминоведения, не охваченные перечисленными методами. Охарактеризован лексический состав научно-технических текстов, приведена классификация специальной лексики в научно-технических текстах. Изучены структурные особенности терминологической лексики. Представлены наиболее продуктивные модели многокомпонентных терминологических словосочетаний в русском языке. Предложен метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов, а также описаны его этапы. Показано, что на первом этапе проводится морфолого-синтаксический анализ текста путем приписывания каждому слову его грамматических характеристик. Затем происходит исключение частей речи, которые не могут входить в состав русскоязычных многокомпонентных терминов, а также стоп-слов, которые вместе с термином образуют свободные словосочетания. Полученные цепочки слов далее соотносятся с шаблонами терминологических словосочетаний, имеющихся в базе структурных моделей терминов, а также с терминологическим словарем на предмет наличия исследуемого термина-кандидата. Обоснована необходимость привлечения терминолога для разрешения неоднозначных случаев. Каждый этап метода извлечения русскоязычных многокомпонентных терминов из научно-технических текстов проиллюстрирован примерами. Перечислены перспективы исследования, а также обоснована необходимость усложнения методов извлечения терминов путем дальнейшей классификации терминологической лексики по формальной и семантической структурам, видам антропоморфных терминов, номенклатурным названиям, нормативности/ненормативности терминологических единиц.

Szczegółowe informacje
Ograniczenie wiekowe:
0+
Data dodania do LitRes:
01 lutego 2022
Data powstania:
2021
Rozmiar:
7 str.
Całkowity rozmiar:
0 MB
Całkowity liczba stron:
7
Rozmiar stron:
180 x 255 мм
Prawa autorskie:
Синергия
Ю. И. Бутенко "Метод извлечения русскоязычных многокомпонентных терминов из научно-технических текстов" – pobierz w formacie pdf lub czytaj online. Zamieszczaj komentarze, recenzje i głosuj na swoje ulubione.
Książka należy do serii
«Прикладная информатика. Научные статьи»
Постановка задачи обеспечения автоматизации полного цикла поддержки принятия решения
Исследование цветовых отличий при воспроизведении памятных цветов на устройствах визуализации
Задача параметрического программирования с моделями прогнозирования урожайности сельскохозяйственных культур
-5%

Отзывы

Сначала популярные

Оставьте отзыв