«ВКонтакте» улучшила работу системы транскрибации аудиосообщений

Время расшифровки аудиосообщений в «ВКонтакте» сократилось за счет усовершенствования системы транскрибации. Отныне для расшифровки аудиосообщений будут использоваться новые алгоритмы.

Голосовые сообщения траскрибируются нейросетью, созданной разработчиками «ВКонтакте». Ранее при распознавании продолжительных аудиосообщений скорость расшифровки заметно снижалась. Эта проблема была решена разработчиками соцсети с помощью нового технологического решения.

Статистика говорит о том, что продолжительность 99% аудиосообщений не превышает 2 минут. Они будут транскрибироваться системой в течение секунды. Продолжительные голосовые сообщения будут распознаваться с помощью ИИ-алгоритмов Voice Activity Detection. Длинные записи разбиваются ими на блоки. После этого они расшифровываются системой одновременно. После завершения расшифровки блоки объединяются в одно сообщение.

Процесс транскрибации полностью автоматизирован. Нейросеть обучается с помощью записей, сделанных специально для этих целей участниками VK Testers.