Пропустить до основного содержимого


Захотелось странного


Наткнулся тут на описание распознавалки речи. Есть "ядро" - сама распознавалка с тулзами для компиляции и прочего. К ней некий фреймворк с API и интерфейсами. И к нему голосовой помощник с плагинами и прочим. Всё опенсорсное, свободное и работает полностью внутри, то есть, без передачи инфы яндексу, гуглю и прочим.

Когда-то я этим уже увлекался. Даже прикрутил синтезатор речи к игре "Стартрек", для озвучивания бортового компьютера подходило. Но тогда качество даже синтеза речи было так себе, на таком уровне, что приходилось напрягаться и вслушиваться, чтобы разобрать, что оно говорит.

Теперь машины стали мощнее, программы навороченнее. Решил попробовать. Скачал, почитал что там как, сейчас компилируется.

Посмотрим, что получится. Может быть не выйдет ничего путного, и я просто удалю это дело, останется только впечатление и жизненный опыт. Может, что-то полезное или приятное удастся сделать.

Неприятно удивило, что для компиляции некоторых файлов первый проход C++ забирает порядка 2 гигов оперативки. Совсем разучились писать нормальные программы, разбивать их на небольшие модули. Эх, Дейкстра, нонтешние хипстерные программеры всё просрали.
Однако, заработало. Причём, на удивление неплохо.

С большой моделью она запросила у системы 12 гигов оперативки, чего на моей машинке нет. А с небольшой вполне сносно работает, если внятно произносить слова. Такого вот беглого общения не получается, но какие-то команды вполне можно придумать. И ещё натренировать её именно для себя, что улучшит характеристики. Но это после.

И ещё нюанс. Для матричных вычичлений там используется библиотека линейной алгебры BLAST на фортране.