Проект ИРН AP13268833 выполняется в рамках грантового финансирования молодых учёных по проекту «Жас ғалым» финансируемого Комитетом науки Министерства науки и высшего образования Республики Казахстан.
Руководитель проекта (постдокторант): Икласова К.Е., PhD, доцент кафедры «Информационно-коммуникационные технологии» (эл. почта kiklasova1205@gmail.com, ORCID: https://orcid.org/0000-0002-8330-4282, h-индекс = 3 (Scopus), Scopus Author ID: 57209837609).
Научный консультант (консультант): Куликова В.П., к.т.н., профессор кафедры «Информационно-коммуникационные технологии» (эл. почта v4lentina@mail.ru, ORCID: https://orcid.org/0000-0001-8198-2672, h-индекс = 1 (Scopus), Scopus Author ID: 57209829779).
Сроки исполнения: 01.05.2022 - 31.12.24 г.
Продолжительность: 32 месяца.
Общий объем финансирования: 18 974 780 тенге.
Цель проекта: Исследование существующих и разработка новых методов и алгоритмов интеллектуальной обработки данных, а именно латинографического текста на казахском языке для эффективного управления процессом перехода на латиницу.
Ожидаемые результаты: Будут разработаны методы поддержки перехода на латиницу, обеспечивающие семантическую транслитерацию. Данный результат необходим для оценки механической и семантической транслитерации, для дальнейшего внедрения в разработке цифровых ресурсов. Исследовать особенности формирования подкорпуса казахского языка на латинской графике (на примере терминологического словаря). Данный результат необходим для разработки алгоритмов и методов интеллектуальной обработки естественного языка и создания основы для формирования корпуса казахского языка на латинице. Исследовать/разработать алгоритмы и методы с использованием машинного обучения для семантического анализа коротких казахских текстов на латинице. Данный результат необходим для практической оценки ресурсов и эффективности в программных средствах при извлечении информации из текста на естественном языке, представленном в латинской графике. Разработать рекомендации/алгоритмы для повышения эффективности управления процессом перехода на латиницу. Данный результат необходим для формирования стратегии/политики управления процессом перехода письменности казахского языка на латинскую графику.
Описание проекта: Одними из важных задач государственной программы по реализации языковой политики в РК на 2020- 2025 гг. являются: модернизация письменности казахского языка на основе латинографического алфавита, его совершенствование, унификацияи кодификация; совершенствование употребления казахского языка в области информатизации и коммуникации. Решение данных задач напрямую связано с исследованием, разработкой и применением информационно-коммуникационных технологий для обработки цифровых ресурсов массового потребления большого объема, на латинице, которое не исследовано в достаточной мере. Идея проекта заключается в выявлении противоречий, слабых мест, несоответствия процессов перехода на латинскую графику, а также в выработке соответствующих алгоритмов и методов интеллектуальной обработки латинографического текста на казахском языке способствующих эффективному переходу на латиницу.
Список статей: