Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта 8 Декабря 2025
Array ( [PREVIEW_PICTURE] => Array ( [ID] => 79047 [TIMESTAMP_X] => 08.12.2025 04:30:04 [MODULE_ID] => iblock [HEIGHT] => 733 [WIDTH] => 1100 [FILE_SIZE] => 248563 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/978 [FILE_NAME] => 97844b4fc5779f354fc0f988f41dd214.jpg [ORIGINAL_NAME] => feature-staff-In-healthcare-the-application-can-automatically-transcribe-patients-speech-particularly-that-of-older-adults-Deposit-photos.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 03e79ec901caa88bb524e68e72db5807 [~src] => [SRC] => /upload/iblock/978/97844b4fc5779f354fc0f988f41dd214.jpg [ALT] => Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта [TITLE] => Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта ) [~PREVIEW_PICTURE] => 79047 [ID] => 40093 [~ID] => 40093 [NAME] => Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта [~NAME] => Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта [IBLOCK_ID] => 2 [~IBLOCK_ID] => 2 [IBLOCK_SECTION_ID] => 2 [~IBLOCK_SECTION_ID] => 2 [DETAIL_TEXT] => Благодаря прорывной модели искусственного интеллекта для преобразования речи в текст, разработанной командой из трёх человек, системы с голосовым управлением, которые обычно испытывают трудности с пониманием островного диалекта, вскоре смогут понимать говорящих на кипрском греческом языке.

Игорь Акимов, менеджер по продуктам искусственного интеллекта в компании, представляющей иностранные интересы, объединился с двумя стажёрами — Хуссейном Хадрой и Никитой Марковым, студентами Университета Никосии и UCLan, — чтобы решить проблему недостаточного распознавания местных диалектов технологиями, от которых зависит множество людей.

Команда создала модель искусственного интеллекта для преобразования речи в текст — систему автоматического распознавания речи, настроенную для точного понимания и расшифровки кипрского греческого языка. Пользователи говорят в микрофон, а система преобразует речь в письменный текст — технологию, которую затем можно применить к голосовым агентам с искусственным интеллектом, службам перевода или автоматизированной телефонной поддержке.

Технология также имеет более широкое применение в различных секторах. В здравоохранении она может автоматически расшифровывать речь пациентов, особенно пожилых людей, и вводить её непосредственно в медицинские системы без ручного набора текста. В бизнесе она позволяет использовать автоматизированных голосовых агентов, которые могут естественно взаимодействовать с киприотами, а в образовании — помогает сохранить кипрский диалект и культуру путём оцифровки аудиоархивов острова.

Тот же подход может быть применён к другим упущенным из виду языкам и диалектам. Одной из основных целей команды было понять, как работать с языками, для которых недостаточно данных, — методология, которую, по их мнению, можно применить во всём мире.

«Это было непросто. Я думаю, мы все недооценили, насколько это будет сложно. На этом пути были взлёты и падения», — признаётся Акимов.

При поиске ресурсов данных команда обратилась к исследователям, но помощи почти не получила. Ответы варьировались от потери данных до запросов высоких гонораров или прямого отказа.

Они изучили словари, тексты и аудиозаписи, но не смогли найти высококачественные, доступные наборы данных, в которых речь сочеталась бы с расшифрованным и проверенным текстом.

Даже у компании Meta, которая собрала данные по 1600 языкам, не оказалось ни часа кипрской речи.

«Поэтому у нас не было ничего для начала, поэтому мы решили собрать все доступные аудиозаписи киприотов — от телешоу до радиостанций, подкастов и книг», — сказал Акимов. «Шаг за шагом мы создали крупнейшую в мире коллекцию кипрско-греческой речи».

Обучение искусственного интеллекта было постепенным процессом. На первом этапе система впитала повседневную речь на кипрском греческом языке, его звуки, ритмы и уникальные черты, чтобы понять, как диалект звучит естественным образом.

Затем команда скормила ему более чёткую, профессиональную речь из новостных передач и радиошоу, помогая искусственному интеллекту усовершенствовать своё понимание и уменьшить количество ошибок. Также был добавлен специальный помощник по чтению KenLM, который действовал почти как наставник, предлагая наиболее вероятные слова и повышая точность распознавания.

Чтобы модель продолжала совершенствоваться, команда создала платформу, на которой носители языка могут корректировать расшифровки искусственного интеллекта. Эти исправления возвращаются на этап обучения, делая систему со временем всё более точной и верной кипрскому диалекту.

Примечательно, что всё это было сделано при бюджете в 150 долларов благодаря творческим подходам и доступным облачным технологиям.

Тем не менее, проект далёк от завершения. «Имея всего несколько часов высококачественной транскрибированной аудиозаписи, мы не смогли создать лучшую в мире модель, но это абсолютно достижимо, — пояснил Акимов. — Сейчас это скорее технологическая проверка концепции, ожидающая дополнительных данных».

Пока команда собрала около 300 часов кипрской речи и ищет помощи у волонтёров. Потратив всего 15 минут на проверку транскрипций на сайте проекта, можно предоставить достаточно данных для создания современной модели распознавания кипрской речи и, возможно, даже системы преобразования текста в речь, которая будет говорить на аутентичном кипрском греческом языке.

Заинтересованные лица могут посетить [voiceofcyprus.org](https://voiceofcyprus.org/), чтобы проверить аудиозаписи.

«Это очень поможет нам — и Кипру. Даже 10–15 минут имеют значение, — сказал Акимов. — Мы хотим, чтобы каждый киприот мог говорить на своём диалекте и при этом быть понятым технологиями». [~DETAIL_TEXT] => Благодаря прорывной модели искусственного интеллекта для преобразования речи в текст, разработанной командой из трёх человек, системы с голосовым управлением, которые обычно испытывают трудности с пониманием островного диалекта, вскоре смогут понимать говорящих на кипрском греческом языке.

Игорь Акимов, менеджер по продуктам искусственного интеллекта в компании, представляющей иностранные интересы, объединился с двумя стажёрами — Хуссейном Хадрой и Никитой Марковым, студентами Университета Никосии и UCLan, — чтобы решить проблему недостаточного распознавания местных диалектов технологиями, от которых зависит множество людей.

Команда создала модель искусственного интеллекта для преобразования речи в текст — систему автоматического распознавания речи, настроенную для точного понимания и расшифровки кипрского греческого языка. Пользователи говорят в микрофон, а система преобразует речь в письменный текст — технологию, которую затем можно применить к голосовым агентам с искусственным интеллектом, службам перевода или автоматизированной телефонной поддержке.

Технология также имеет более широкое применение в различных секторах. В здравоохранении она может автоматически расшифровывать речь пациентов, особенно пожилых людей, и вводить её непосредственно в медицинские системы без ручного набора текста. В бизнесе она позволяет использовать автоматизированных голосовых агентов, которые могут естественно взаимодействовать с киприотами, а в образовании — помогает сохранить кипрский диалект и культуру путём оцифровки аудиоархивов острова.

Тот же подход может быть применён к другим упущенным из виду языкам и диалектам. Одной из основных целей команды было понять, как работать с языками, для которых недостаточно данных, — методология, которую, по их мнению, можно применить во всём мире.

«Это было непросто. Я думаю, мы все недооценили, насколько это будет сложно. На этом пути были взлёты и падения», — признаётся Акимов.

При поиске ресурсов данных команда обратилась к исследователям, но помощи почти не получила. Ответы варьировались от потери данных до запросов высоких гонораров или прямого отказа.

Они изучили словари, тексты и аудиозаписи, но не смогли найти высококачественные, доступные наборы данных, в которых речь сочеталась бы с расшифрованным и проверенным текстом.

Даже у компании Meta, которая собрала данные по 1600 языкам, не оказалось ни часа кипрской речи.

«Поэтому у нас не было ничего для начала, поэтому мы решили собрать все доступные аудиозаписи киприотов — от телешоу до радиостанций, подкастов и книг», — сказал Акимов. «Шаг за шагом мы создали крупнейшую в мире коллекцию кипрско-греческой речи».

Обучение искусственного интеллекта было постепенным процессом. На первом этапе система впитала повседневную речь на кипрском греческом языке, его звуки, ритмы и уникальные черты, чтобы понять, как диалект звучит естественным образом.

Затем команда скормила ему более чёткую, профессиональную речь из новостных передач и радиошоу, помогая искусственному интеллекту усовершенствовать своё понимание и уменьшить количество ошибок. Также был добавлен специальный помощник по чтению KenLM, который действовал почти как наставник, предлагая наиболее вероятные слова и повышая точность распознавания.

Чтобы модель продолжала совершенствоваться, команда создала платформу, на которой носители языка могут корректировать расшифровки искусственного интеллекта. Эти исправления возвращаются на этап обучения, делая систему со временем всё более точной и верной кипрскому диалекту.

Примечательно, что всё это было сделано при бюджете в 150 долларов благодаря творческим подходам и доступным облачным технологиям.

Тем не менее, проект далёк от завершения. «Имея всего несколько часов высококачественной транскрибированной аудиозаписи, мы не смогли создать лучшую в мире модель, но это абсолютно достижимо, — пояснил Акимов. — Сейчас это скорее технологическая проверка концепции, ожидающая дополнительных данных».

Пока команда собрала около 300 часов кипрской речи и ищет помощи у волонтёров. Потратив всего 15 минут на проверку транскрипций на сайте проекта, можно предоставить достаточно данных для создания современной модели распознавания кипрской речи и, возможно, даже системы преобразования текста в речь, которая будет говорить на аутентичном кипрском греческом языке.

Заинтересованные лица могут посетить [voiceofcyprus.org](https://voiceofcyprus.org/), чтобы проверить аудиозаписи.

«Это очень поможет нам — и Кипру. Даже 10–15 минут имеют значение, — сказал Акимов. — Мы хотим, чтобы каждый киприот мог говорить на своём диалекте и при этом быть понятым технологиями». [DETAIL_TEXT_TYPE] => html [~DETAIL_TEXT_TYPE] => html [PREVIEW_TEXT] => Благодаря прорывной модели искусственного интеллекта для преобразования речи в текст... [~PREVIEW_TEXT] => Благодаря прорывной модели искусственного интеллекта для преобразования речи в текст... [PREVIEW_TEXT_TYPE] => html [~PREVIEW_TEXT_TYPE] => html [DETAIL_PICTURE] => Array ( [SRC] => /upload/resize_cache/iblock/978/600_400_1/97844b4fc5779f354fc0f988f41dd214.jpg [WIDTH] => 600 [HEIGHT] => 399 ) [~DETAIL_PICTURE] => 79048 [ACTIVE_FROM] => 08.12.2025 04:30:00 [~ACTIVE_FROM] => 08.12.2025 04:30:00 [LIST_PAGE_URL] => /news/ [~LIST_PAGE_URL] => /news/ [DETAIL_PAGE_URL] => /news/society/cypriot-greek-gets-its-own-voice-in-new-ai-system/ [~DETAIL_PAGE_URL] => /news/society/cypriot-greek-gets-its-own-voice-in-new-ai-system/ [LANG_DIR] => / [~LANG_DIR] => / [CODE] => cypriot-greek-gets-its-own-voice-in-new-ai-system [~CODE] => cypriot-greek-gets-its-own-voice-in-new-ai-system [EXTERNAL_ID] => 40093 [~EXTERNAL_ID] => 40093 [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [IBLOCK_CODE] => infoportal_news_s1 [~IBLOCK_CODE] => infoportal_news_s1 [IBLOCK_EXTERNAL_ID] => infoportal_news_s1 [~IBLOCK_EXTERNAL_ID] => infoportal_news_s1 [LID] => s1 [~LID] => s1 [NAV_RESULT] => [DISPLAY_ACTIVE_FROM] => 8 Декабря 2025 [IPROPERTY_VALUES] => Array ( ) [FIELDS] => Array ( [PREVIEW_PICTURE] => Array ( [ID] => 79047 [TIMESTAMP_X] => 08.12.2025 04:30:04 [MODULE_ID] => iblock [HEIGHT] => 733 [WIDTH] => 1100 [FILE_SIZE] => 248563 [CONTENT_TYPE] => image/jpeg [SUBDIR] => iblock/978 [FILE_NAME] => 97844b4fc5779f354fc0f988f41dd214.jpg [ORIGINAL_NAME] => feature-staff-In-healthcare-the-application-can-automatically-transcribe-patients-speech-particularly-that-of-older-adults-Deposit-photos.jpg [DESCRIPTION] => [HANDLER_ID] => [EXTERNAL_ID] => 03e79ec901caa88bb524e68e72db5807 [~src] => [SRC] => /upload/iblock/978/97844b4fc5779f354fc0f988f41dd214.jpg [ALT] => Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта [TITLE] => Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта ) ) [PROPERTIES] => Array ( [ORIGINAL_URL] => Array ( [ID] => 51 [TIMESTAMP_X] => 2017-10-03 13:37:23 [IBLOCK_ID] => 2 [NAME] => Ссылка на сайте-источнике [ACTIVE] => Y [SORT] => 10 [CODE] => ORIGINAL_URL [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => 129253 [VALUE] => /2025/12/08/cypriot-greek-gets-its-own-voice-in-new-ai-system [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => /2025/12/08/cypriot-greek-gets-its-own-voice-in-new-ai-system [~DESCRIPTION] => [~NAME] => Ссылка на сайте-источнике [~DEFAULT_VALUE] => ) [THEME_EN] => Array ( [ID] => 280 [TIMESTAMP_X] => 2025-01-08 18:01:42 [IBLOCK_ID] => 2 [NAME] => Тема (en) [ACTIVE] => Y [SORT] => 20 [CODE] => THEME_EN [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => Y [SEARCHABLE] => N [FILTRABLE] => Y [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => 129255 [VALUE] => Cypriot Greek gets its own voice in new AI system [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Cypriot Greek gets its own voice in new AI system [~DESCRIPTION] => [~NAME] => Тема (en) [~DEFAULT_VALUE] => ) [TEXT_EN] => Array ( [ID] => 281 [TIMESTAMP_X] => 2025-01-08 18:01:42 [IBLOCK_ID] => 2 [NAME] => Текст новости (en) [ACTIVE] => Y [SORT] => 40 [CODE] => TEXT_EN [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => Y [SEARCHABLE] => N [FILTRABLE] => Y [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => HTML [USER_TYPE_SETTINGS] => Array ( [height] => 200 ) [HINT] => [PROPERTY_VALUE_ID] => 129256 [VALUE] => Array ( [TEXT] => Cypriot Greek speakers may soon be understood by the same voice-activated systems that routinely struggle with the island’s dialect, thanks to a breakthrough speech-to-text AI model developed by a three-person team. Igor Akimov, an AI product manager at a foreign-interest company, has joined forces with two interns – Hussein Khadra and Nikita Markov, students at the University of Nicosia and UCLan – to tackle the problem of local dialects not being properly recognised by the technology that many people depend on. The team has created a speech-to-text AI model, an automatic speech recognition system fine-tuned to accurately understand and transcribe Cypriot Greek. Users speak into a microphone, and the system converts speech to written text, a technology which can then be applied to AI voice agents, translation services or automated phone support. The technology also has broader applications across multiple sectors. In healthcare, it can automatically transcribe patients’ speech, particularly that of older adults, and input it directly into medical systems without manual typing. In business, it enables automated voice agents that can interact naturally with Cypriot customers, while in education, it can help preserve the Cypriot dialect and culture by digitising the island’s audio archives. The same approach could be applied to other overlooked languages and dialects. One of the team’s main goals was to understand how to work with languages that lack sufficient data, a methodology they believe could be replicated globally. “It was not easy. I think we all underestimated just how complex it would be. There were definitely ups and downs along the way,” Akimov admits. When looking for data resources, the team reached out to researchers but found little help. Responses ranged from data being lost, to requests for high fees, or outright refusal. They scoured dictionaries, texts and audio samples, but could not find high-quality, accessible datasets that paired speech with transcribed and validated text. Even Meta, which has collected data for 1,600 languages, had zero hours of Cypriot speech available. “So, we had nothing to start with, therefore, we decided to gather all the available Cypriot audio from TV shows to radio stations, podcasts and books,” said Akimov. “Step by step, we created the largest Cypriot Greek speech collection ever assembled.” Training the AI was a gradual process. In the first phase, the system absorbed everyday Cypriot Greek speech, its sounds, rhythms and unique traits, to get a sense of how the dialect naturally sounds. Next, the team fed it clearer, professional speech from news broadcasts and radio shows, helping the AI refine its understanding and reduce errors. A special reading assistant, KenLM, was also added to act almost like a tutor, suggesting the most likely words and boosting recognition accuracy. To keep the model improving, the team built a platform where native speakers can correct the AI’s transcripts. These corrections are fed back into training, making the system increasingly accurate and faithful to the Cypriot dialect over time. Remarkably, all of this was accomplished on a budget of just $150, thanks to creative approaches and accessible cloud technology. Yet, the project is far from finished. “With only a few hours of high-quality transcribed audio, we couldn’t create the world’s best model yet – but it’s absolutely achievable,” Akimov explained. “Right now, it’s more of a technological proof-of-concept waiting for more data.” So far, the team has collected about 300 hours of Cypriot speech and is seeking help from volunteers. Spending just 15 minutes validating transcriptions on the project website could provide enough data to build a state-of-the-art model for Cypriot speech recognition, and potentially even a text-to-speech system that speaks in authentic Cypriot Greek. Interested individuals can visit [voiceofcyprus.org](https://voiceofcyprus.org/) to validate audio recordings. “This will help us – and Cyprus – tremendously. Even just 10-15 minutes makes a difference,” Akimov said. “We want every Cypriot to be able to speak in their own dialect and still be understood by technology.” [TYPE] => HTML ) [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => Array ( [TEXT] => Cypriot Greek speakers may soon be understood by the same voice-activated systems that routinely struggle with the island’s dialect, thanks to a breakthrough speech-to-text AI model developed by a three-person team. Igor Akimov, an AI product manager at a foreign-interest company, has joined forces with two interns – Hussein Khadra and Nikita Markov, students at the University of Nicosia and UCLan – to tackle the problem of local dialects not being properly recognised by the technology that many people depend on. The team has created a speech-to-text AI model, an automatic speech recognition system fine-tuned to accurately understand and transcribe Cypriot Greek. Users speak into a microphone, and the system converts speech to written text, a technology which can then be applied to AI voice agents, translation services or automated phone support. The technology also has broader applications across multiple sectors. In healthcare, it can automatically transcribe patients’ speech, particularly that of older adults, and input it directly into medical systems without manual typing. In business, it enables automated voice agents that can interact naturally with Cypriot customers, while in education, it can help preserve the Cypriot dialect and culture by digitising the island’s audio archives. The same approach could be applied to other overlooked languages and dialects. One of the team’s main goals was to understand how to work with languages that lack sufficient data, a methodology they believe could be replicated globally. “It was not easy. I think we all underestimated just how complex it would be. There were definitely ups and downs along the way,” Akimov admits. When looking for data resources, the team reached out to researchers but found little help. Responses ranged from data being lost, to requests for high fees, or outright refusal. They scoured dictionaries, texts and audio samples, but could not find high-quality, accessible datasets that paired speech with transcribed and validated text. Even Meta, which has collected data for 1,600 languages, had zero hours of Cypriot speech available. “So, we had nothing to start with, therefore, we decided to gather all the available Cypriot audio from TV shows to radio stations, podcasts and books,” said Akimov. “Step by step, we created the largest Cypriot Greek speech collection ever assembled.” Training the AI was a gradual process. In the first phase, the system absorbed everyday Cypriot Greek speech, its sounds, rhythms and unique traits, to get a sense of how the dialect naturally sounds. Next, the team fed it clearer, professional speech from news broadcasts and radio shows, helping the AI refine its understanding and reduce errors. A special reading assistant, KenLM, was also added to act almost like a tutor, suggesting the most likely words and boosting recognition accuracy. To keep the model improving, the team built a platform where native speakers can correct the AI’s transcripts. These corrections are fed back into training, making the system increasingly accurate and faithful to the Cypriot dialect over time. Remarkably, all of this was accomplished on a budget of just $150, thanks to creative approaches and accessible cloud technology. Yet, the project is far from finished. “With only a few hours of high-quality transcribed audio, we couldn’t create the world’s best model yet – but it’s absolutely achievable,” Akimov explained. “Right now, it’s more of a technological proof-of-concept waiting for more data.” So far, the team has collected about 300 hours of Cypriot speech and is seeking help from volunteers. Spending just 15 minutes validating transcriptions on the project website could provide enough data to build a state-of-the-art model for Cypriot speech recognition, and potentially even a text-to-speech system that speaks in authentic Cypriot Greek. Interested individuals can visit [voiceofcyprus.org](https://voiceofcyprus.org/) to validate audio recordings. “This will help us – and Cyprus – tremendously. Even just 10-15 minutes makes a difference,” Akimov said. “We want every Cypriot to be able to speak in their own dialect and still be understood by technology.” [TYPE] => HTML ) [~DESCRIPTION] => [~NAME] => Текст новости (en) [~DEFAULT_VALUE] => ) [FORUM_MESSAGE_CNT] => Array ( [ID] => 2 [TIMESTAMP_X] => 2015-04-24 10:27:06 [IBLOCK_ID] => 2 [NAME] => Количество комментариев к элементу [ACTIVE] => Y [SORT] => 500 [CODE] => FORUM_MESSAGE_CNT [DEFAULT_VALUE] => [PROPERTY_TYPE] => N [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => 63 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Количество комментариев к элементу [~DEFAULT_VALUE] => ) [FORUM_TOPIC_ID] => Array ( [ID] => 3 [TIMESTAMP_X] => 2015-04-24 10:27:06 [IBLOCK_ID] => 2 [NAME] => Тема форума для комментариев [ACTIVE] => Y [SORT] => 500 [CODE] => FORUM_TOPIC_ID [DEFAULT_VALUE] => [PROPERTY_TYPE] => N [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => 62 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Тема форума для комментариев [~DEFAULT_VALUE] => ) [MORE_PHOTO] => Array ( [ID] => 4 [TIMESTAMP_X] => 2015-04-24 10:27:06 [IBLOCK_ID] => 2 [NAME] => Изображения [ACTIVE] => Y [SORT] => 500 [CODE] => MORE_PHOTO [DEFAULT_VALUE] => [PROPERTY_TYPE] => F [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => Y [XML_ID] => 58 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Изображения [~DEFAULT_VALUE] => ) [PARTMAIN] => Array ( [ID] => 5 [TIMESTAMP_X] => 2015-04-24 10:27:06 [IBLOCK_ID] => 2 [NAME] => Главная новость раздела [ACTIVE] => Y [SORT] => 500 [CODE] => PARTMAIN [DEFAULT_VALUE] => [PROPERTY_TYPE] => L [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => C [MULTIPLE] => N [XML_ID] => 56 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [VALUE_ENUM_ID] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Главная новость раздела [~DEFAULT_VALUE] => ) [MAIN] => Array ( [ID] => 6 [TIMESTAMP_X] => 2015-04-24 10:27:06 [IBLOCK_ID] => 2 [NAME] => Главная новость главной страницы [ACTIVE] => Y [SORT] => 500 [CODE] => MAIN [DEFAULT_VALUE] => [PROPERTY_TYPE] => L [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => C [MULTIPLE] => N [XML_ID] => 55 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [VALUE_ENUM_ID] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Главная новость главной страницы [~DEFAULT_VALUE] => ) [THEME] => Array ( [ID] => 7 [TIMESTAMP_X] => 2015-04-24 10:27:06 [IBLOCK_ID] => 2 [NAME] => Тема [ACTIVE] => Y [SORT] => 500 [CODE] => THEME [DEFAULT_VALUE] => [PROPERTY_TYPE] => E [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => Y [XML_ID] => 54 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 1 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => EAutocomplete [USER_TYPE_SETTINGS] => Array ( [VIEW] => A [SHOW_ADD] => Y [MAX_WIDTH] => 250 [MIN_HEIGHT] => 24 [MAX_HEIGHT] => 1000 [BAN_SYM] => ,; [REP_SYM] => [OTHER_REP_SYM] => [IBLOCK_MESS] => Y ) [HINT] => [PROPERTY_VALUE_ID] => [VALUE] => [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => [~DESCRIPTION] => [~NAME] => Тема [~DEFAULT_VALUE] => ) [LINK_SOURCE] => Array ( [ID] => 8 [TIMESTAMP_X] => 2015-05-25 16:39:08 [IBLOCK_ID] => 2 [NAME] => Источник [ACTIVE] => Y [SORT] => 500 [CODE] => LINK_SOURCE [DEFAULT_VALUE] => russiancyprus [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => 53 [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => 129252 [VALUE] => cyprus-mail.com [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => cyprus-mail.com [~DESCRIPTION] => [~NAME] => Источник [~DEFAULT_VALUE] => russiancyprus ) [IS_SENT_TO_CHANEL] => Array ( [ID] => 167 [TIMESTAMP_X] => 2020-06-25 17:42:19 [IBLOCK_ID] => 2 [NAME] => Is sent to telegram [ACTIVE] => Y [SORT] => 500 [CODE] => IS_SENT_TO_CHANEL [DEFAULT_VALUE] => [PROPERTY_TYPE] => N [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => 129315 [VALUE] => 1 [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => 1 [~DESCRIPTION] => [~NAME] => Is sent to telegram [~DEFAULT_VALUE] => ) [YANDEX_TASK_ID_THEME] => Array ( [ID] => 285 [TIMESTAMP_X] => 2025-01-20 21:25:08 [IBLOCK_ID] => 2 [NAME] => YANDEX TASK ID FOR THEME [ACTIVE] => Y [SORT] => 900 [CODE] => YANDEX_TASK_ID_THEME [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => 129257 [VALUE] => d7qhmk28s25b4e7q3rt3 [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => d7qhmk28s25b4e7q3rt3 [~DESCRIPTION] => [~NAME] => YANDEX TASK ID FOR THEME [~DEFAULT_VALUE] => ) [YANDEX_TASK_ID] => Array ( [ID] => 284 [TIMESTAMP_X] => 2025-01-20 20:37:32 [IBLOCK_ID] => 2 [NAME] => YANDEX TASK ID [ACTIVE] => Y [SORT] => 1000 [CODE] => YANDEX_TASK_ID [DEFAULT_VALUE] => [PROPERTY_TYPE] => S [ROW_COUNT] => 1 [COL_COUNT] => 30 [LIST_TYPE] => L [MULTIPLE] => N [XML_ID] => [FILE_TYPE] => [MULTIPLE_CNT] => 5 [TMP_ID] => [LINK_IBLOCK_ID] => 0 [WITH_DESCRIPTION] => N [SEARCHABLE] => N [FILTRABLE] => N [IS_REQUIRED] => N [VERSION] => 1 [USER_TYPE] => [USER_TYPE_SETTINGS] => [HINT] => [PROPERTY_VALUE_ID] => 129258 [VALUE] => d7qglhqh2l2adpi26i4j [DESCRIPTION] => [VALUE_ENUM] => [VALUE_XML_ID] => [VALUE_SORT] => [~VALUE] => d7qglhqh2l2adpi26i4j [~DESCRIPTION] => [~NAME] => YANDEX TASK ID [~DEFAULT_VALUE] => ) ) [DISPLAY_PROPERTIES] => Array ( ) [IBLOCK] => Array ( [ID] => 2 [~ID] => 2 [TIMESTAMP_X] => 20.01.2025 22:57:06 [~TIMESTAMP_X] => 20.01.2025 22:57:06 [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [LID] => s1 [~LID] => s1 [CODE] => infoportal_news_s1 [~CODE] => infoportal_news_s1 [NAME] => Новости [~NAME] => Новости [ACTIVE] => Y [~ACTIVE] => Y [SORT] => 500 [~SORT] => 500 [LIST_PAGE_URL] => /news/ [~LIST_PAGE_URL] => /news/ [DETAIL_PAGE_URL] => #SITE_DIR#/news/#SECTION_CODE#/#CODE#/ [~DETAIL_PAGE_URL] => #SITE_DIR#/news/#SECTION_CODE#/#CODE#/ [SECTION_PAGE_URL] => #SITE_DIR#/news/#CODE#/ [~SECTION_PAGE_URL] => #SITE_DIR#/news/#CODE#/ [PICTURE] => [~PICTURE] => [DESCRIPTION] => [~DESCRIPTION] => [DESCRIPTION_TYPE] => text [~DESCRIPTION_TYPE] => text [RSS_TTL] => 24 [~RSS_TTL] => 24 [RSS_ACTIVE] => Y [~RSS_ACTIVE] => Y [RSS_FILE_ACTIVE] => N [~RSS_FILE_ACTIVE] => N [RSS_FILE_LIMIT] => 0 [~RSS_FILE_LIMIT] => 0 [RSS_FILE_DAYS] => 0 [~RSS_FILE_DAYS] => 0 [RSS_YANDEX_ACTIVE] => N [~RSS_YANDEX_ACTIVE] => N [XML_ID] => infoportal_news_s1 [~XML_ID] => infoportal_news_s1 [TMP_ID] => adf9113ce97738184efe133d53e3d656 [~TMP_ID] => adf9113ce97738184efe133d53e3d656 [INDEX_ELEMENT] => Y [~INDEX_ELEMENT] => Y [INDEX_SECTION] => N [~INDEX_SECTION] => N [WORKFLOW] => N [~WORKFLOW] => N [BIZPROC] => N [~BIZPROC] => N [SECTION_CHOOSER] => L [~SECTION_CHOOSER] => L [LIST_MODE] => [~LIST_MODE] => [RIGHTS_MODE] => S [~RIGHTS_MODE] => S [SECTION_PROPERTY] => [~SECTION_PROPERTY] => [PROPERTY_INDEX] => [~PROPERTY_INDEX] => [VERSION] => 1 [~VERSION] => 1 [LAST_CONV_ELEMENT] => 0 [~LAST_CONV_ELEMENT] => 0 [SOCNET_GROUP_ID] => [~SOCNET_GROUP_ID] => [EDIT_FILE_BEFORE] => [~EDIT_FILE_BEFORE] => [EDIT_FILE_AFTER] => [~EDIT_FILE_AFTER] => [SECTIONS_NAME] => Разделы [~SECTIONS_NAME] => Разделы [SECTION_NAME] => Раздел [~SECTION_NAME] => Раздел [ELEMENTS_NAME] => Новости [~ELEMENTS_NAME] => Новости [ELEMENT_NAME] => Новость [~ELEMENT_NAME] => Новость [EXTERNAL_ID] => infoportal_news_s1 [~EXTERNAL_ID] => infoportal_news_s1 [LANG_DIR] => / [~LANG_DIR] => / [SERVER_NAME] => russiancyprus.news [~SERVER_NAME] => russiancyprus.news ) [SECTION] => Array ( [PATH] => Array ( [0] => Array ( [ID] => 2 [~ID] => 2 [TIMESTAMP_X] => 2025-01-20 22:54:27 [~TIMESTAMP_X] => 2025-01-20 22:54:27 [MODIFIED_BY] => 1 [~MODIFIED_BY] => 1 [DATE_CREATE] => 2015-04-24 10:15:32 [~DATE_CREATE] => 2015-04-24 10:15:32 [CREATED_BY] => 1 [~CREATED_BY] => 1 [IBLOCK_ID] => 2 [~IBLOCK_ID] => 2 [IBLOCK_SECTION_ID] => [~IBLOCK_SECTION_ID] => [ACTIVE] => Y [~ACTIVE] => Y [GLOBAL_ACTIVE] => Y [~GLOBAL_ACTIVE] => Y [SORT] => 5 [~SORT] => 5 [NAME] => Общество и политика [~NAME] => Общество и политика [PICTURE] => [~PICTURE] => [LEFT_MARGIN] => 1 [~LEFT_MARGIN] => 1 [RIGHT_MARGIN] => 2 [~RIGHT_MARGIN] => 2 [DEPTH_LEVEL] => 1 [~DEPTH_LEVEL] => 1 [DESCRIPTION] => [~DESCRIPTION] => [DESCRIPTION_TYPE] => text [~DESCRIPTION_TYPE] => text [SEARCHABLE_CONTENT] => Общество и политика [~SEARCHABLE_CONTENT] => Общество и политика [CODE] => society [~CODE] => society [XML_ID] => 111 [~XML_ID] => 111 [TMP_ID] => [~TMP_ID] => [DETAIL_PICTURE] => [~DETAIL_PICTURE] => [SOCNET_GROUP_ID] => [~SOCNET_GROUP_ID] => [LIST_PAGE_URL] => /news/ [~LIST_PAGE_URL] => /news/ [SECTION_PAGE_URL] => /news/society/ [~SECTION_PAGE_URL] => /news/society/ [IBLOCK_TYPE_ID] => news [~IBLOCK_TYPE_ID] => news [IBLOCK_CODE] => infoportal_news_s1 [~IBLOCK_CODE] => infoportal_news_s1 [IBLOCK_EXTERNAL_ID] => infoportal_news_s1 [~IBLOCK_EXTERNAL_ID] => infoportal_news_s1 [EXTERNAL_ID] => 111 [~EXTERNAL_ID] => 111 [IPROPERTY_VALUES] => Array ( ) ) ) ) [SECTION_URL] => /news/society/ [ITEMS_THEME] => Array ( ) )
Греческий язык Кипра получил собственный голос в новой системе искусственного интеллекта
Благодаря прорывной модели искусственного интеллекта для преобразования речи в текст, разработанной командой из трёх человек, системы с голосовым управлением, которые обычно испытывают трудности с пониманием островного диалекта, вскоре смогут понимать говорящих на кипрском греческом языке.

Игорь Акимов, менеджер по продуктам искусственного интеллекта в компании, представляющей иностранные интересы, объединился с двумя стажёрами — Хуссейном Хадрой и Никитой Марковым, студентами Университета Никосии и UCLan, — чтобы решить проблему недостаточного распознавания местных диалектов технологиями, от которых зависит множество людей.

Команда создала модель искусственного интеллекта для преобразования речи в текст — систему автоматического распознавания речи, настроенную для точного понимания и расшифровки кипрского греческого языка. Пользователи говорят в микрофон, а система преобразует речь в письменный текст — технологию, которую затем можно применить к голосовым агентам с искусственным интеллектом, службам перевода или автоматизированной телефонной поддержке.

Технология также имеет более широкое применение в различных секторах. В здравоохранении она может автоматически расшифровывать речь пациентов, особенно пожилых людей, и вводить её непосредственно в медицинские системы без ручного набора текста. В бизнесе она позволяет использовать автоматизированных голосовых агентов, которые могут естественно взаимодействовать с киприотами, а в образовании — помогает сохранить кипрский диалект и культуру путём оцифровки аудиоархивов острова.

Тот же подход может быть применён к другим упущенным из виду языкам и диалектам. Одной из основных целей команды было понять, как работать с языками, для которых недостаточно данных, — методология, которую, по их мнению, можно применить во всём мире.

«Это было непросто. Я думаю, мы все недооценили, насколько это будет сложно. На этом пути были взлёты и падения», — признаётся Акимов.

При поиске ресурсов данных команда обратилась к исследователям, но помощи почти не получила. Ответы варьировались от потери данных до запросов высоких гонораров или прямого отказа.

Они изучили словари, тексты и аудиозаписи, но не смогли найти высококачественные, доступные наборы данных, в которых речь сочеталась бы с расшифрованным и проверенным текстом.

Даже у компании Meta, которая собрала данные по 1600 языкам, не оказалось ни часа кипрской речи.

«Поэтому у нас не было ничего для начала, поэтому мы решили собрать все доступные аудиозаписи киприотов — от телешоу до радиостанций, подкастов и книг», — сказал Акимов. «Шаг за шагом мы создали крупнейшую в мире коллекцию кипрско-греческой речи».

Обучение искусственного интеллекта было постепенным процессом. На первом этапе система впитала повседневную речь на кипрском греческом языке, его звуки, ритмы и уникальные черты, чтобы понять, как диалект звучит естественным образом.

Затем команда скормила ему более чёткую, профессиональную речь из новостных передач и радиошоу, помогая искусственному интеллекту усовершенствовать своё понимание и уменьшить количество ошибок. Также был добавлен специальный помощник по чтению KenLM, который действовал почти как наставник, предлагая наиболее вероятные слова и повышая точность распознавания.

Чтобы модель продолжала совершенствоваться, команда создала платформу, на которой носители языка могут корректировать расшифровки искусственного интеллекта. Эти исправления возвращаются на этап обучения, делая систему со временем всё более точной и верной кипрскому диалекту.

Примечательно, что всё это было сделано при бюджете в 150 долларов благодаря творческим подходам и доступным облачным технологиям.

Тем не менее, проект далёк от завершения. «Имея всего несколько часов высококачественной транскрибированной аудиозаписи, мы не смогли создать лучшую в мире модель, но это абсолютно достижимо, — пояснил Акимов. — Сейчас это скорее технологическая проверка концепции, ожидающая дополнительных данных».

Пока команда собрала около 300 часов кипрской речи и ищет помощи у волонтёров. Потратив всего 15 минут на проверку транскрипций на сайте проекта, можно предоставить достаточно данных для создания современной модели распознавания кипрской речи и, возможно, даже системы преобразования текста в речь, которая будет говорить на аутентичном кипрском греческом языке.

Заинтересованные лица могут посетить [voiceofcyprus.org](https://voiceofcyprus.org/), чтобы проверить аудиозаписи.

«Это очень поможет нам — и Кипру. Даже 10–15 минут имеют значение, — сказал Акимов. — Мы хотим, чтобы каждый киприот мог говорить на своём диалекте и при этом быть понятым технологиями».

Материал подготовлен с использованием издания Cyprus-mail.com с обработкой ИИ.
Источник изображения: Cyprus-mail.com