Диаризация — большая энциклопедия. Что такое Диаризация

Диаризация


Материал из свободной энциклопедии

Диаризация (или разделение дикторов) — процесс разделения входящего аудиопотока на однородные сегменты в соответствии с принадлежностью аудиопотока тому или иному говорящему. Диаризация повышает качество текстов при автоматическом транскрибировании, а также может использоваться совместно с системой распознавания речи, значительно её улучшая. Диаризация используется для ответа на вопрос «Кто сейчас говорит?». Диаризация является сочетанием методов сегментации и кластеризации дикторов. Первый направлен на поиск точек смены диктора, второй — на группирование выделенных в речи диктора речевых сегментов.

Одним из популярных методов при диаризации является использование алгоритмов на основе гауссовых смесей для моделирования каждого из говорящих и закрепление выделенных фрагментов за каждым из дикторов с помощью скрытой марковской модели[1].

Программное обеспечение

Программные средства для диаризации включают в себя[2][3][неавторитетный источник?]:

  • ALIZE[4]
  • LIUM_SpkDiarization[5]
  • Audioseg — сегментация и классификация аудиопотоков[6]
  • SHoUT[7]
  • pyAudioAnalysis

Примечания

Литература



О сайте infor24.ru Наш сайт является неофициальным ресурсом, который несет людям знания. Он открыт и бесплатен для любого пользователя. Сайт infor24.ru - большая статейная библиотека со статьями на различные тематики для всех и каждого.

Основа этой страницы находится в Вики. Текст доступен по официальной лицензии CC BY-SA 3.0 Unported License.

Wikipedia® — зарегистрированный товарный знак организации Wikimedia Foundation, Inc. infor24.ru является независимой компанией и не аффилирована с Фондом Викимедиа (Wikimedia Foundation). Сайт infor24.ru является неофициальным сайтом.

E-mail: admin@infor24.ru