Речь в текст

27.06.2011 11:17

На выходных заинтересовался темой конвертации речи в текст. То есть песни в .mp3 или .wav в текстовый файл. Можно, конечно, посадить секретаря с ручкой и бумагой, но айтишники не ищут прямых путей. Полевые исследования показали, что для русской речи ничего нормального еще не придумано — обуславливается это обширность словарного запаса и сложностью произношения.

Была одна программа — “Горыныч”, но работает она крайне плохо. Как выяснилось, “Горыныч” — это такой вольный перевод программы “Dragon NaturalllySpeaking”, которая конвертирует с английского и является лучшей в своем классе. “Горыныч”, по сути — просто набор плагинов для нее, адаптированных к русскому языку. Подобные программы, кстати, в первую очередь предназначены для управления компьютера голосом — они позволяют записывать речевые образцы, “обучать” софт путем расширения словарного запаса и тренировки произношения.

Попробовал “Dragon”. При создании профиля юзера он попросил речевой образец не менее 4 минут. Выяснилось, что ремиксы ему лучше не давать (путается), лучше дать англоязычный подкаст. “Обучив”, начал тестировать. Дал “Yesterday” Битлов, которую он сконвертировал, половину слов заменив на “him”, “of him” и так далее. Программу выкинул, идею пришлось выкинуть тоже.

Если у кого-то есть деньги и нет бизнес-модели — создайте хорошую программу для конвертации речи в текст. Потомки вас точно не забудут. Русские — 100%. Это сложно, но возможно.



Назад 

Комментарии на “Речь в текст”

  1. PEGAS говорит:

    Но… зачем??? оО

  2. Кашуков Андрей говорит:

    Интересно же )

  3. uzda говорит:

    видимо дабы не тыкать клаву что ли)))

Написать мне