Автоматический синтаксический анализ
Resumen
Настоящая книга является вторым томом исследования по автоматическому синтаксическому анализу русского текста. Первый том (И. А. Мельчук. Автоматический синтаксический анализ. Т. I. Общие принципы. Внутрисегментный синтаксический анализ. Новосибирск, 1964) содержит разработанный И. А. Мельчуком алгоритм внутрисегментного синтаксического анализа русского текста. Второй том посвящен межсегментному синтаксическому анализу русского текста. Задача внутрисегментного анализа - получение для каждого исходного сегмента, т. е. для каждого отрезка фразы между знаками препинания или союзами*, всех тех сведений о связях между словами, которые можно выявить в пределах одного этого сегмента. Межсегментный анализ должен завершить синтаксический анализ фразы, т. е. установить все не обнаруженные в процессе внутрисегментного анализа связи между словами и между предложениями. Книга состоит из трех глав и нескольких приложений. Наиболее принципиальные результаты работы изложены в первой главе. В § 1 дано важное для синтаксического анализа формальное определение правильной синтаксической структуры вообще, безотносительно к какому-либо конкретному языку. § 2 содержит определение правильной синтаксической структуры применительно к русскому языку, существенное для синтаксического анализа русских текстов. В § 3 описан способ синтаксического анализа, использующий в явной форме свойства правильной синтаксической структуры. Этот способ положен в основу межсегментного анализа русского текста. Во второй главе рассказано, как именно указанный способ анализа реализован в алгоритме межсегментного анализа. Сам алгоритм приводится в третьей главе. В приложениях содержится описание двух наиболее сложных (с большим числом значений) признаков информации к сегменту и данные, которые для работы с алгоритмом (например, для анализа фраз, проводимого в соответствии с ним вручную) удобно выделить из алгоритма в отдельные компактные списки.Автоматический синтаксический анализ. Том 1
Colecciones
- Libgen [81666]