O‘ZBEK TILI KORPUSINI YARATISH BOSQICHLARI VA MUAMMOLI JIHATLARI

Абдуллаева Окила Холмуминовна

Авторы

Абдуллаева Окила Холмуминовна

Ключевые слова:

корпус, тег, ключевое слово в контексте, конкорданс, метаданные

Аннотация

В статье рассматриваются конкретные теоретические и практические вопросы построения корпуса информационных текстов на узбекском языке. Пошагово анализировались структура, возможности, дизайн, рабочий процесс кейса. В частности, был описан процесс разработки Технического задания на построение корпуса узбекского языка, сбор и компьютеризация данных, хранение текстов в корпусе и разметка слов. Корпус узбекского языка представляет собой обширную филологическую базу данных, позволяющую решать проблемы.