Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта

Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта 8 Декабря 2025

Благодаря прорывной модели искусственного интеллекта для преобразования речи в текст, разработанной командой из трёх человек, системы с голосовым управлением, которые обычно испытывают трудности с пониманием островного диалекта, вскоре смогут понимать говорящих на кипрском греческом языке.

Игорь Акимов, менеджер по продуктам искусственного интеллекта в компании, представляющей иностранные интересы, объединился с двумя стажёрами — Хуссейном Хадрой и Никитой Марковым, студентами Университета Никосии и UCLan, — чтобы решить проблему недостаточного распознавания местных диалектов технологиями, от которых зависит множество людей.

Команда создала модель искусственного интеллекта для преобразования речи в текст — систему автоматического распознавания речи, настроенную для точного понимания и расшифровки кипрского греческого языка. Пользователи говорят в микрофон, а система преобразует речь в письменный текст — технологию, которую затем можно применить к голосовым агентам с искусственным интеллектом, службам перевода или автоматизированной телефонной поддержке.

Технология также имеет более широкое применение в различных секторах. В здравоохранении она может автоматически расшифровывать речь пациентов, особенно пожилых людей, и вводить её непосредственно в медицинские системы без ручного набора текста. В бизнесе она позволяет использовать автоматизированных голосовых агентов, которые могут естественно взаимодействовать с киприотами, а в образовании — помогает сохранить кипрский диалект и культуру путём оцифровки аудиоархивов острова.

Тот же подход может быть применён к другим упущенным из виду языкам и диалектам. Одной из основных целей команды было понять, как работать с языками, для которых недостаточно данных, — методология, которую, по их мнению, можно применить во всём мире.

«Это было непросто. Я думаю, мы все недооценили, насколько это будет сложно. На этом пути были взлёты и падения», — признаётся Акимов.

При поиске ресурсов данных команда обратилась к исследователям, но помощи почти не получила. Ответы варьировались от потери данных до запросов высоких гонораров или прямого отказа.

Они изучили словари, тексты и аудиозаписи, но не смогли найти высококачественные, доступные наборы данных, в которых речь сочеталась бы с расшифрованным и проверенным текстом.

Даже у компании Meta, которая собрала данные по 1600 языкам, не оказалось ни часа кипрской речи.

«Поэтому у нас не было ничего для начала, поэтому мы решили собрать все доступные аудиозаписи киприотов — от телешоу до радиостанций, подкастов и книг», — сказал Акимов. «Шаг за шагом мы создали крупнейшую в мире коллекцию кипрско-греческой речи».

Обучение искусственного интеллекта было постепенным процессом. На первом этапе система впитала повседневную речь на кипрском греческом языке, его звуки, ритмы и уникальные черты, чтобы понять, как диалект звучит естественным образом.

Затем команда скормила ему более чёткую, профессиональную речь из новостных передач и радиошоу, помогая искусственному интеллекту усовершенствовать своё понимание и уменьшить количество ошибок. Также был добавлен специальный помощник по чтению KenLM, который действовал почти как наставник, предлагая наиболее вероятные слова и повышая точность распознавания.

Чтобы модель продолжала совершенствоваться, команда создала платформу, на которой носители языка могут корректировать расшифровки искусственного интеллекта. Эти исправления возвращаются на этап обучения, делая систему со временем всё более точной и верной кипрскому диалекту.

Примечательно, что всё это было сделано при бюджете в 150 долларов благодаря творческим подходам и доступным облачным технологиям.

Тем не менее, проект далёк от завершения. «Имея всего несколько часов высококачественной транскрибированной аудиозаписи, мы не смогли создать лучшую в мире модель, но это абсолютно достижимо, — пояснил Акимов. — Сейчас это скорее технологическая проверка концепции, ожидающая дополнительных данных».

Пока команда собрала около 300 часов кипрской речи и ищет помощи у волонтёров. Потратив всего 15 минут на проверку транскрипций на сайте проекта, можно предоставить достаточно данных для создания современной модели распознавания кипрской речи и, возможно, даже системы преобразования текста в речь, которая будет говорить на аутентичном кипрском греческом языке.

Заинтересованные лица могут посетить [voiceofcyprus.org](https://voiceofcyprus.org/), чтобы проверить аудиозаписи.

«Это очень поможет нам — и Кипру. Даже 10–15 минут имеют значение, — сказал Акимов. — Мы хотим, чтобы каждый киприот мог говорить на своём диалекте и при этом быть понятым технологиями».

Материал подготовлен с использованием издания Cyprus-mail.com с обработкой ИИ.
Источник изображения: Cyprus-mail.com

Возврат к списку

Чтобы оставить свой комментарий войдите на сайт

Министерство образования напоминает родителям о необходимости немедленно сообщать об отсутствии детей	Ольгин на Кипре для встреч на следующей неделе
Фармацевтические службы предупреждают об опасном воске для волос и духах	Автомагистраль Никосия – Лимасол закрыта возле Парекклисиа
В сентябре в странах ЕЭП продолжатся установки интеллектуальных счётчиков по всему острову	Афинский филиал UNIC откроется в предстоящем учебном году

Последние новости