Возможности Voice-2-Text

Полный набор инструментов для работы с речью: распознавание аудио файлов с речью и преобразование в текст (экспорт в Word), обработка, сбор и валидация аудио датасетов, а также прямая печать в любые документы и программы голосом (без копирования и вставки). Также наши сервисы позволяют перевести текст в голос, то есть озвучить текст.

Для регистрации нужна только эл. почта. Бонус +50 р на баланс.

Возможности Voice-2-Text

🎤 Онлайн-диктовка

Речевой ввод текста — прямая печать текста голосом на компьютере. Никаких скопировал-вставил. Печатает голосом сразу в документ Word (ворде), Excel и другие приложения. Идеально подходит для заполнения документов, медицинских карт, протоколов и любой другой работы с текстом.

Основные возможности:

  • Распознавание до 30 секунд речи за раз
  • 6 языков с автоопределением
  • Горячая клавиша ПРОБЕЛ для записи
  • Автоматическая вставка в активное окно
  • Работа с любым приложением Windows
  • NLP обработка в реальном времени
  • Инструкции: Использование онлайн-диктовки

Как это работает:

  1. Нажмите ПРОБЕЛ — запись началась
  2. Говорите в микрофон
  3. Нажмите ПРОБЕЛ ещё раз — запись остановилась
  4. Текст автоматически вставится
<2с
Время распознавания
98%
Точность
30с
Макс. длительность
17
Языков
Макс. длина файла
2GB
Макс. размер
17
Языков
TXT/DOCX/PDF
Экспорт

📄 Транскрибатор

Пакетная транскрибация длинных аудиозаписей с сегментацией, веб-редактором и экспортом в различные форматы.

Основные возможности:

  • Загрузка файлов до 4 часов
  • 6 языков распознавания с выбором в интерфейсе
  • Автоматическая сегментация по тишине
  • Веб-редактор с синхронизацией аудио
  • Улучшенная транскрибация отдельных сегментов
  • Экспорт в TXT, DOCX, PDF

Редактор транскрибаций:

  • Клик по сегменту — переход к аудио
  • Редактирование текста inline
  • Подсветка NLP-исправлений
  • Отмена/повтор изменений

🔊 Озвучка текста (TTS)

Преобразование текста в естественную речь на базе Yandex SpeechKit. Озвучивайте документы, статьи, сценарии и любые текстовые материалы.

Основные возможности:

  • 29 профессиональных голосов на 6 языках
  • Настройка скорости от 0.1x до 3.0x
  • Ввод текста или загрузка .txt файла
  • Скачивание результата в MP3
  • Сохранение проектов в личном кабинете

Как это работает:

  1. Введите или вставьте текст (до 10 000 символов)
  2. Выберите голос и скорость
  3. Нажмите «Озвучить» — получите аудио за секунды
  4. Прослушайте, скачайте MP3 или сохраните в проектах
29
Голосов
3.0x
Макс. скорость
MP3
Формат аудио
10 000
Символов за раз

🧠 Интеллектуальная обработка текста

15 специализированных процессоров для разных профессий и задач

Медицинские термины

База из 25 000+ лекарственных препаратов с торговыми названиями и МНН. Полный справочник МКБ-10.

  • Лекарства: Амоксициллин, Омепразол...
  • Диагнозы: J06.9, I10, E11.9...

Юридические термины

Автоматическое форматирование номеров законов и статей. Распознавание органов власти, кодексов.

  • Законы: № 18-ФЗ, статья 151 ГК РФ...
  • Органы: Верховный Суд РФ, ФНС России...
👤

Имена и ФИО

Распознавание ФИО с учётом падежей. Определение исторических личностей. Маркеры (доктор, профессор).

  • ФИО: Иванов Иван Иванович
  • Исторические: Пётр I, Наполеон...
🌎

География

Города и страны с правильными падежами. Улицы и адреса. Формы рельефа, водоёмы.

  • Города: Москва, Санкт-Петербург...
  • Адреса: ул. Ленина, пр. Мира, д. 15
🏛

Организации

Распознавание компаний и организаций. База университетов и ВУЗов.

  • Компании: Газпром, Сбербанк...
  • ВУЗы: МГУ, МГТУ им. Баумана...
📝

Пунктуация

Автоматическая расстановка точек, запятых, заглавных букв. Определение границ предложений.

🤖 GPT-обработка

Улучшение качества транскрибации с помощью YandexGPT. Нейросеть исправляет ошибки распознавания, улучшает структуру и читаемость текста.

Основные возможности:

  • Исправление ошибок распознавания
  • Улучшение структуры текста
  • Расстановка знаков препинания
  • Обработка всего проекта или отдельных абзацев
  • Сохранение смысла и стиля оригинала

Режимы обработки:

  • При загрузке — выберите GPT-режим при создании проекта
  • В редакторе — улучшайте отдельные абзацы кнопкой ✨
  • Весь текст — обработка всего проекта целиком
GPT
YandexGPT
2₽
За 1000 токенов
~150
Токенов/минута
Улучшение текста
🎙
Биржа датасетов
95%
Порог качества
24ч
Проверка записей
ZIP
Экспорт датасета

🎙 Сбор датасетов

Биржа голосовых датасетов для машинного обучения. Создавайте заказы на озвучку текстов, получайте качественные записи от исполнителей.

Для заказчиков:

  • Создание проекта с текстами для озвучки
  • Установка стоимости за запись
  • Автоматическая валидация записей
  • Экспорт готового датасета в ZIP

Для исполнителей:

  • Выбор проектов для озвучки
  • Запись голоса прямо в браузере
  • Мгновенная проверка качества
  • Вывод заработка на карту

✅ Валидация датасетов

Автоматическая проверка качества аудиозаписей. Сравнение с эталонным текстом, оценка совпадения и фильтрация некачественных записей.

Возможности:

  • Проверка одного файла
  • Пакетная валидация (ZIP + JSON)
  • Три статуса: принято, на проверку, отклонено
  • Скачивание результатов с сортировкой

Как работает:

  1. Загрузите аудио и укажите ожидаемый текст
  2. Система распознает речь через SpeechKit
  3. Сравнение с эталоном (match ratio)
  4. Автоматическое присвоение статуса
Валидация
>95%
Принято
80-95%
На проверку
<80%
Отклонено

Технические возможности

Надёжная и безопасная инфраструктура

🔒

Шифрование

AES-256 шифрование конфигурации. HTTPS для всех соединений. HMAC подпись запросов.

Yandex SpeechKit

Профессиональный движок распознавания речи с высокой точностью для русского языка.

Облачное хранилище

Yandex Object Storage для надёжного хранения аудиофайлов с автоматическим удалением.

Попробуйте сами

Скачайте приложение для компьютера и оцените все возможности

Скачать Voice-2-Text