Компьютерная лингвистика как термин стал все чаще использоваться в публикациях, это связанно с постоянным ростом в сфере разработки различных программных систем. Это обоснованно бурным ростом в обществе текстовой информации и в необходимости автоматической обработки текстов на естественном языке (ЕЯ). Больше всего этому подвержен "Интернет". Все это стимулирует развитие компьютерной лингвистики как область науки и принуждает вести разработку новых лингвистических технологий. В этой сфере было предложено не мало идей, но к сожалению не все смогли найти свое выражение в программных продуктах которые можно было бы использовать на практике. Я бы хотел показать вам, что из себя представляет эта область, какие связи она имеет с другими науками и дать краткий обзор существующих приложений КЛ.
Компьютерная лингвистика (КЛ) - дисциплина между лингвистикой и информатикой, которая касается вычислительных аспектов естественного языка. Это принадлежит когнитивистике и совпадения с областью искусственного интеллекта (ИИ), отраслью информатики.
Естественный язык - самый интересный аспект.
Компьютерная лингвистика поднимает проблемы в теоретической лингвистике и когнитивистике. Они помогают людям лучше понимать язык. На сегодняшний день ЕЯ настолько сложный, что им можно управлять, используя только компьютеры. Вычислительные лингвисты развивают формальные модели, моделирующие аспекты способности естественного языка, и делают на их базе компьютерные программы. Эти программы дают основание для оценки и дальнейшего развития этого направления.
Вся сложность задач КЛ, в том что ЕЯ - очень многообразная система, появившаяся в процессе деятельности человека и постоянно развивающаяся. Так же возникает проблема в разработке КЛ в связи с разнообразием ЕЯ. Различные языки в зависимости от лексики и морфологии могут выражать одно и то же разными способами.
Современный человек подвержен постоянной информационной нагрузке, он смотрит телевизор, сидит в интернете, читает газеты, слушает радио. Информация и вариации ее подачи с каждым годом возрастает в разы. Современные виды информационных технологий становятся все более автоматизированы (средства быстрого информационного поиска, системы перевода и исправления опечаток). Все наше взаимодействие с компьютером сводится к использованию более понятного для человека языка. К сожалению работа с ЕЯ очень сложна из за его структуры и это очень сильно сказывается на разработке программного обеспечения.