Заработок на дому на транскрибации аудио и видео в текст
Содержание:
- Если вам нужно перевести аудио-файл в текст.
- Где искать заказчиков
- Сколько можно заработать на транскрибации текстов
- Зачем переводить аудио в текст
- «RealSpeaker» — сверхточный распознаватель речи
- Программа Virtual Audio Cable
- Для чего нужно переводить аудио в текст
- Программы для транскрибации
- Автоматизированная транскрибация с помощью программ
- Плюсы и минусы способа заработка
- Звуковые переводчики онлайн
- Топ-5: Аудио переводчики с английского на русский
- Где брать заказы?
- Программы для перевода текста в речь для Андроид
- ВИДЫ ФОРМАТОВ
- Заключение
Если вам нужно перевести аудио-файл в текст.
Идея лежит на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate.
Как реализовать, казалось бы, простую идею: пустить в качестве сигнала микрофона — аудио файл.
УСТАНОВКА: Извлеките все файлы из ZIP и запустите программу установки в режиме администратора (перезагрузите компьютер после установки )
Настройте микрофонный вход в системе, на этот драйвер.
Со звуковыми картами Realtek устанавливать драйвер не нужно, достаточно включить «Стерео микшер» в приложении «Звук», в разделе «Запись».
Как записать аудио-файл в текст он-лайн
Есть способ без ограничений на количество символов. — это Google Docs.
Гугл Документы имеют встроенный инструмент для диктовки речи, который называется Голосовой ввод. Расшифровка голоса происходит автоматически. Когда вы говорите, этот инструмент понимает вашу речь и переводит ее в текст, который сразу печатается в Гугл Документах.
Во время транскрибации, не переходите на другие вкладки в браузере. Если вы перейдете на другой сайт, то инструмент прекратит транскрибацию.
Следите чтобы запись не прерывалась. Если данный инструмент перестал переводить запись в текст, следует снова нажать на кнопку с микрофоном чтобы он вначале отключился, а затем еще раз нажать, чтобы включить его.
Google блокирует постоянные подключения с одних IP. Поэтому ценность этого способа — в том, что все IP не заблокируешь и соответственно, этот способ более работоспособен.
Запись аудио в текст с переводом на другой язык он-лайн
Точность распознавания 85-95 %. Но, есть ограничение — 5 тыс. символов, что немало. Приходиться останавливать запись, копировать текст и продолжать далее.
Заодно происходит перевод на второй выбранный язык.
Ну и на последок, если вам не подошли данные версии, рекомендуем Онлайн блокнот, которые позволяет переводить в текст аудио, видео и речь с микрофона.
Перевод в текст он-лайн.
Голосовой блокнот позволяет вводить текст, используя микрофон, а также переводить речь из аудио и видео в печатный текст. В настоящее время голосовой ввод возможен только в браузере Chrome для OS Windows, Mac и Linux (для пользователей Андроид и iOS разработаны специальные Android, iOS приложения).
А если нужно перевести текст в звук
VoxWorker — это онлайн сервис для озвучки текста, который может переводить текст в аудиозапись.
Для перевода текста в речь, нужно написать необходимый фрагмент текста и нажать кнопку, дальше сервис все сделает сам.
Сервис не сохраняет тексты для озвучивания. Все голосовые файлы удаляются с сервера через один час. При необходимости Вы можете указать сервису хранить озвученные файлы постоянно, это удобно если вы планируете поделиться файлом с друзьями или коллегами.
Где искать заказчиков
Конечно, любого новичка интересует, где искать заказчиков, так как это один из основополагающих вопросов в фрилансе. Конечно, самое надежное место, где можно найти заказчиков, это биржи фриланса.
Именно здесь чаще всего попадаются подобные заказы. Практически каждый день, можно встретить заказы на транскрибацию.
Вы еще можете размещать в интернете типовые услуги и объявления на досках в интернете. Сразу результата это не даст, но вот в будущем к вам могут обратиться несколько заказчиков.
Самое главное, старайтесь избегать стандартных выражений типа договорная цена, лучше опишите конкретно, что вы делаете и за какую стоимость.
Сколько можно заработать на транскрибации текстов
Даже если вы новичок, но у вас хорошая скорость печати, то вы можете начать неплохо зарабатывать на транскрибации текстов.
В принципе, за день можно легко сделать два часа аудио, даже самого плохого качества. Средняя цена одной минуты транскрибации аудио в текст, 10 рублей.
Конечно если объемы большие, и у вас будет постоянная работа, то можно согласиться и на 8-9 рублей за минуту аудио, но ниже этой стоимости, не стоит даже начинать работать, так как затраченное время не окупится.
Поэтому если делать в день по два часа аудио, то можно зарабатывать больше 1000 рублей в день. Согласитесь, не на каждом заводе у вас получится получать такую зарплату.
А вот спокойно работать дома, намного лучше. Ну а, кроме того, заказы с небольшой творческой составляющей будут стоить немного дороже, и соответственно ваши заработки возрастут.
Зачем переводить аудио в текст
Расшифровывать аудиозаписи и видеоматериалы полезно с точки зрения продвижения в поисковой выдаче и расширения информационного охвата, экономии чужого времени (некоторым банально некогда просматривать ролики на YouTube), уникализации контента.
А еще полезно давать потенциальным клиентам, зрителям или подписчикам выбор: кому-то проще читать, а кто-то с радостью половину прослушает, а вторую часть – бегло пробежит глазами.
Кто платит
В транскрибации заинтересованы вебмастера, создатели интернет-курсов, ведущие вебинаров, организаторы конференций и тематических онлайн-трансляций.
Виной тому аудитория: смотреть трехчасовой ролик на YouTube согласятся далеко не все, а вот пробежать глазами текст и найти полезную информацию готовы многие (а ведь еще и поиск по тексту доступен через Ctrl + F), в особенности, если Live-вещание давно закончилось, и приходится смотреть запись.
Стоит отметить, что транскрибация популярна среди журналистов, записывающих интервью на диктофон, а после – из-за нехватки времени и сил, прибегающих к чужой помощи для адаптации материалов перед публикацией в сети.
«RealSpeaker» — сверхточный распознаватель речи
Программа для трансформации голоса в текст «RealSpeaker» кроме стандартных для программ такого рода функций, позволяет задействовать возможности веб-камеры вашего ПК. Теперь программа не только считывает аудио составляющую звука, но и фиксирует движение уголков губ говорящего, тем самым более корректно распознавая выговариваемые им слова.
«RealSpeaker» считывает не только аудио, но и визуальную составляющую процесса речи
Приложение поддерживает более десяти языков (в том числе и русский), позволяет распознавать речь с учётом акцентов и диалектов, позволяет транскрибировать аудио и видео, даёт доступ к облаку и многое другое. Программа условно бесплатна, за платную версию придётся заплатить вполне реальные деньги.
Программа Virtual Audio Cable
Для некоторых сервисов (например, для speechpad.ru) может понадобиться так называемый виртуальный кабель. Он нужен для того, чтобы напрямую передать аудиофайл в систему распознавания аудио, а не транслировать через микрофон. То есть, чтобы не терялось качество речи и все распознавалось как можно лучше.
Для настройки всего этого дела придется потанцевать с бубнами, то есть повозиться с настройками. Но, как я писал выше, некоторые программы без этой Virtual Audio Cable работать не будут.
К сожалению, проконсультировать по поводу настройки этих виртуальных кабелей я не смогу. У меня базовая система Линукс Минт. А эти программы предназначены для Windows. Впрочем, если будет интересно, скину ссылки на статьи других авторов, где все подробненько расписано.
Для чего нужно переводить аудио в текст
Для начала поговорим, для чего вообще может понадобиться транскрибация. Тут на самом деле очень много вариантов.
- Достаточно часто требуется расшифровка аудио какого-нибудь семинара очередного “гуру”. Он вещает час-два и его записывают на видео. А потом нужно все это дело издать в виде методички или книги. Это транскрибация так называемого вебинара. Кстати, вебинары расшифровывать немного легче, так как в случае невнятного звука можно иногда догадаться о чем речь по жестам и поведению спикера.
- Иногда обращаются журналисты. Они могут надиктовывать себе заметки на диктофон в течение выполнения какого-нибудь журналисткого расследования. И потом все аудио это нужно перевести в текст.
- Достаточно редкие “клиенты” транскрибатора это “настоящие писатели”. Они тоже сейчас часто любят надиктовывать книги в аудиофайл, а потом переносить на бумагу.
- Часто нужно транскрибировать аудиоподкасты. Кстати, что такое аудиоподкаст? Если по русски- это устное сообщение владельца сайта или блога своим подписчикам.
- Расшифровка аудио в текст разного рода интервью. Тут Вы понимаете, что нужно журналистам и всякого рода блоггерам.
- Иногда нужна расшифровка телефонных переговоров. Чаще всего такие работы заказывают фирмы для фиксации внутрикорпоративных переговоров.
- Еще бывает транскрибация совещаний. Но эту работу часто выполняют сами секретари и не отдают на аутсорсинг. Кстати, если Вы секретарь, то возьмите мои советы себе на вооружение.
Я перечислил только малую часть тех задач по транскрибации, для решения которых может понадобиться профессиональный транскрибатор. Этих задач может быть намного больше. Так что работа для “аудиопереводчика” всегда найдется.
Программы для транскрибации
Существует много специальных сервисов, которые позволяют облегчить работу. Сервис dictation.io считается прекрасным вариантом, который дает возможность бесплатно перевести речь в текстовый формат.
Площадка обеспечивает автоматическое сохранение готовых результатов. Это поможет избежать случайного удаления вследствие закрытия вкладки или браузера. Сервис не позволяет распознать готовые файлы. Он работает с микрофоном. При диктовке следует называть знаки препинания.
Текст удается распознать достаточно корректно, без орфографических ошибок. Также можно самостоятельно вставлять с клавиатуры знаки препинания. Сохранить готовые результаты можно на своем компьютере.
Сайт speechpad.ru представляет собой онлайн-площадку, которая позволяет через браузер Google Chrome переводить речь в текстовый формат.
Сервис работает с готовыми файлами и микрофоном. Безусловно, качество будет выше при использовании внешнего микрофона. Однако сайт неплохо трансформирует даже ролики на YouTube.
При этом нужно нажать «Включить запись», ответить на вопрос относительно использования микрофона. А затем следует нажать «Разрешить».
Готовый результат удается легко отредактировать. Для этого требуется ручным способом исправить выделенное слово или надиктовать его снова. Результаты можно сохранить в личном кабинете или скачать на компьютер.
Сервис позволяет работать с 7 языками. При этом он имеет и недостаток. Если требуется транскрибация готового аудиофайла, он звучит в колонках. Это становится причиной дополнительных помех в виде эха.
Dragon Dictation представляет собой бесплатное приложение, которое подходит для устройств компании Apple. Программа дает возможность редактировать результаты, выбирая нужные слова из списка
При этом важно четко проговаривать все звуки, без пауз. Нежелательной является и интонация
Иногда можно столкнуться с ошибками в конце слова.
Существует много программ, которые облегчают работу
Приложение Dragon Dictation подойдет и для обладателей гаджетов Android. Они могут диктовать в него список покупок или другую важную информацию.
Следующим полезным сайтом станет RealSpeaker. Эта программа с легкостью переводит речь человека в текстовый формат. Она позволяет преобразовывать речь, которая звучит в микрофон. Он может быть встроен в ноутбук. Также удается преобразовывать формат, записанный в аудиофайлы.
Программа преобразовывает 13 языков мира. Существует бета-версия, которая функционирует как онлайн-сервис. Для этого необходимо выбрать русский язык, загрузить на сайт файл. При этом за его перевод приходится платить. После этого можно скопировать готовый текст. Чем больше размер файла, тем больше времени уйдет на преобразование.
Speechnotes считается альтернативой RealSpeaker, которая позволяет работать на Android. Текст удается редактировать автоматически и расставлять в нем знаки препинания. Этот вариант удобен для составления список или заметок. В результате удается получить качественный текст. Также существует платная премиум-версия.
Автоматизированная транскрибация с помощью программ
В интернете есть программы для транскрибации, работающие с использованием нейросетей. Они распознают человеческую речь и в автоматическом режиме переводят услышанный звук в текстовый вариант.
Google Docs
Пользователь диктует с помощью микрофона, а программа со встроенным инструментом транскрибирует аудио. Вызвать соответствующую панель можно с помощью сочетания клавиш Ctrl+Shift+S. После необходимо указать язык, на котором говорит пользователь, и нажать на микрофон.
В работе Google Docs плохо справляется с записью, в которой речь произносится слишком тихо или громко. Диктовка должна быть четкой и производиться прямо в микрофон. Главный минус записи – программа работает только в активной вкладке. Диктовать что-то с другой вкладки или воспроизвести запись с компьютера не получится.
Чтобы добавить в текст знаки препинания, нужно помечать эти места голосом: точка, запятая, новая строчка, абзац и так далее.
Speechpad
Еще одна бесплатная программа для транскрибации аудио непосредственно с микрофона. Работает через браузер Google Chrome и мобильное приложение. При необходимости подключается к основным системным программам для обеспечения голосового ввода в любом поле. Аудио плохого качества расшифровать не сможет.
RealSpeaker
Это платный инструмент для транскрибации аудио из загруженных файлов. Перевод разговора в текст осуществляется бесплатно только первые 1,5 минуты. После этого стоимость расшифровки – 8 рублей в минуту. Максимально возможная продолжительность аудио составляет 180 минут. Программа не позволяет диктовать текст напрямую в микрофон и работает только с готовыми файлами. При загрузке видео можно скачать результат обработки с готовыми субтитрами.
Dictation
Программа находится в бесплатном доступе и работает со звуком через микрофон. Не поддерживает возможность обработки готовых файлов. В ходе работы пользователь может задавать команды, например, новый абзац, тире. Функционал этого инструмента включает простой редактор текста, чтобы изменять форматирование, создавать списки.
Лучше всего программа распознает тексты, надиктованные в тишине и с профессионально поставленным голосом. Без специального оборудования (петлички или микрофона) распознает только половину сказанного.
Voco
Это платный десктопный вариант, работающий на базе Windows. Для расшифровки не требуется доступ к интернету. Voco работает с микрофонными записями и обрабатывает аудио с уже готовых файлов. Программа способна к самостоятельному обучению. По мере обработки файлов она учится более глубокому пониманию лексики, пополняет словарный запас. Алгоритм способен воспринимать звук на расстоянии одного метра от микрофона.
Субтитры YouTube
Алгоритмы YouTube умеют автоматически распознавать речь на видеороликах и представляют ее в виде субтитров в нижней части экрана. Это можно использовать для расшифровки роликов при отсутствии других инструментов для работы. Чтобы транскрибировать таким образом, нужно загрузить видео на канал и ограничить доступ пользователей к нему. Файл открыть в разделе «Творческая студия», далее «Субтитры». Затем указать язык для транскрибации и скачать измененный файл со встроенными субтитрами.
Субтитры загружаются вместе с тайм-кодами и разрывом текста. Это усложняет обработку готового текста, особенно если видео достаточно длинное. В результате такой обработки его придется самостоятельно собирать в связанные абзацы и предложения.
Плюсы и минусы способа заработка
Преимущества транскрибации вращаются вокруг свободного графика, развития навыков (включая внимательность, усидчивость и терпение) и возможности влиться в атмосферу интернет-навыков и разобраться с тем, как вычислять мошенников и договариваться о премиях или предоплате.
Со временем появится шанс выбрать уже новое дело – быстрая скорость печати пригодится в копирайтинге, а усидчивость – в изучении учебных материалов.
Недостатки профессии связаны с беспрерывно растущей конкуренцией, вынуждающей или соглашаться на заказы по низкой цене или подтверждать компетенцию рекомендациями от заказчиков и добавлять портфолио в профиль.
Вторая проблема – непостоянство: найти подходящие заказы с каждым годом все сложнее, а потому приходится слишком уж часто мониторить биржи, надеясь отыскать хотя бы парочку подходящих предложений.
И куда же без мошенничества? Шансы столкнуться с обманщиком – 50 на 50, а потому на старте не рекомендуется выбираться за пределы биржи – там доказать правоту намного сложнее, чем в службе поддержки.
Вердикт
Несмотря на противоречивую репутацию, образовавшуюся вокруг транскрибации (мошенники, конкуренция, непостоянство), новичкам опробовать силы в профессии все же стоит, ведь кроме буксов с рекламными заказами и сайтов с капчами, сфера интернет-заработка едва ли способна предложить хотя бы парочку занятий, где не пригодятся ни опыт, ни навыки.
Важно помнить лишь о постоянном совершенствовании навыков, ту же скорость печати рекомендуется повышать почти круглосуточно. Если в профиле на бирже полно положительных комментариев, то почему бы не обсудить цену или не договориться о премии за проявленную скорость?
Если в профиле на бирже полно положительных комментариев, то почему бы не обсудить цену или не договориться о премии за проявленную скорость?
Звуковые переводчики онлайн
Готовы учиться переводить иностранные аудиозаписи? Тогда, приступим.
Топ-5: Аудио переводчики с английского на русский
- Использование Гугл Переводчика или Яндекс Переводчика. Этот способ хорош тем, что вы одновременно можете получить, как английский текст, так и его перевод. Настройте переводчик – над левым окном установите исходный язык аудио (английский), а над правым – язык, на который необходимо перевести (русский). Под левым окном переводчика нажмите на микрофон, разрешите использование микрофона, поднесите микрофон к колонкам, включите аудио и наслаждайтесь Подобным образом вы можете работать и с переводчиком от Яндекса:
- Еще один очень удобный сервис для распознавания речи и мгновенного перевода — speechlogger.appspot.com. Выставьте настройки – исходный язык, авто пунктуация, язык, далее также нужно поднести микрофон к колонкам, включить аудио и нажать на иконку “Микрофона”.
- С использованием speechpad.ru По работе с этим сервисом много инструкций в интернете. Особенно часто его используют для перевода речи в текст. Мы же будем использовать его для автоперевода. Перейдите на сервис speechpad, нажмите на кнопку +перевод, как показано на скриншоте ниже: Теперь выставьте настройки, как у меня на скриншоте: 1. Включите микрофон, 2. разрешите использование микрофона на сайте spechpad, 3. поднесите микрофон к колонкам, 4. Включите аудио (или видео) с иностранной речью.
- Второй вариант перевода английского аудио в текст – онлайн сервис dictation.io. Поднесите микрофон к колонкам, включите аудиозапись на английском языке и нажмите на сервисе кнопку “Start dictation”. После завершения записи нажмите “stop dictation”. Сохранить текст можно, нажав на кнопку “save”. Запись сохраниться в текстовом файле txt.
- Больше всего мне нравится третий вариант преобразования английской речи в текст. Перейти на сервис онлайн speech-to-text-demo. Он хорош тем, что не обязательно нужно проигрывать аудиофайл, хотя такая функция в сервисе тоже имеется. Благодаря этому, вы можете переводить аудио в текст в абсолютной тишине, если это требуется, например, если вы привыкли работать по ночам. Вторым вариантом является простая загрузка аудиофайла на сервис, где он автоматически распознается и будет переведен в текстовый файл. Однако не любой аудиофайл можно загрузить на сервис. Поддерживаются только расширения .wav, .flac, или .opus. Файл mp3 загрузить не получится, но и здесь есть выход – вам нужно всего лишь воспользоваться любым аудио конвертером, можно тоже онлайн. Рекомендую для конвертации аудио в другой формат сервис — online-audio-converter.com.Итак, теперь рассмотрим поэтапно процесс преобразования английской речи в текст при помощи указанного сервиса. Предположим, что у вас файл mp3. Значит, вам сначала нужно сконвертировать файл при помощи сервиса online-audio-converter.com. Вам нужно открыть аудиофайл, выбрать расширение, в которое необходимо сконвертировать (wav) и нажать кнопку “Конвертировать”. после завершения конвертации скачайте файл: Второй шаг – собственно перевод английского аудио в текст на сервисе speech-to-text-demo. Перейдите на этот сервис, нажмите на кнопку “Upload audio file” (загрузить аудио файл) и выберите из папки вашего компьютера сконвертированный в wav, flac или opus аудио файл. Через некоторое время в окне появится текст аудио. Пример:
Где брать заказы?
Только что зашёл на биржу фриланса work-zilla.com, с которой сам когда-то начинал работать, и нашёл на ней несколько заказов по транскрибации.
Вы также можете находить и брать заказы на различных биржах фриланса.
Либо, если вы хотите больше стабильности, то можете обратиться в специальные компании, которые специализируются на этом и нанимают на постоянную работу транскриберов. Вам не нужно будет искать заказы.
Как правило, в таких компаниях за 1 минуту распознавания аудио платят даже больше, чем ища работодателей и договариваясь с ними самостоятельно.
Также можете написать свои отзывы об этой профессии, если вы занимались когда-нибудь транскрибацией.
Программы для перевода текста в речь для Андроид
Для мобильной ОС «Андроид» также порекомендуем следующие программы:
- «ListNote» — позволяет создавать голосом текстовые заметки. Поддерживает русский язык, но не работает без подключения к Интернету. Для запуска распознавания нажмите на кнопку «Распознавание речи» в запущенном приложении. Работает на основании преобразователя речи от Гугл;
- «Speechnotes» — также задействует механизм речь в текст от Гугл. Полученный текст сохраняется автоматически. Активация платного функционала несёт дополнительные бонусы – голосовое управления, автоматическая постановка заглавных букв etc;
- «Voice Writer» — ещё одна альтернатива от турецких разработчиков для конверсии голоса в текст. Имеет встроенный переводчик и поддержку ряда языков азиатских стран.
ВИДЫ ФОРМАТОВ
Расшифровывать чаще
всего приходится форматы двух видов:
Аудиофайлы.
Видеофайлы.
Набираем в поисковике
Google «форматы аудио» и видим следующую картину.
Все аудио форматы
выделяют в три группы: без сжатия, со сжатием без потерь и с потерями.
На биржах заказы, чаще
всего, даются в двух форматах – это WAV и MP3. Отличить их на слух, даже если
вы музыкант, у вас вряд ли получится.
Но, далеко, не все
программы поддерживают все форматы, поэтому перед использованием нужно всё
внимательно проверять.
Видео форматы – это
AVI, MP4, MOV, FLV, DVD, MPEG2 и прочие. Каждый формат имеет ещё несколько
расширений.
Маленький совет: когда будете
подбирать себе заказы, то очень важно, чтобы выбранные форматы проигрывались на
бытовых устройствах, т.е. проигрывателях, телевизоре и т.д., иначе он может не
залиться в программу, которой вы пользуетесь, а перекодировать один видео формат
в другой, для новичка, очень сложно.. Сделать это сразу
правильно, избежав ошибок, у вас вряд ли получится
Сделать это сразу
правильно, избежав ошибок, у вас вряд ли получится.
Но, чаще всего
используются файлы, залитые на Ютуб. Предлагается два варианта действий:
Сразу указывается ссылка, которую нужно просто скопировать и вставить в
свою программу.
Для начала необходимо скачать расширение, которое позволяет использовать
популярные и наиболее часто используемые видео форматы. Например, SaveFrom.net.
Расширение удобно тем,
что можно использовать сразу два формата — видео и аудио.
Заключение
По нашему опыту, Descript, вероятно, был лучшим инструментом, из этой группы, хотя, ее цена, за минуту, не совсем приемлема. На данный момент, мы склонны к Transcribe, поскольку оно предлагает годовую подписку, без каких-либо дополнительных затрат, а режим диктовки — это шаг вперед, от Transcribe.
Были, также, несколько мобильных приложений, которые обещали аналогичный опыт, но в нашем тестировании были ограничены. Транскрибирование, которое включает в себя, достаточное количество ввода, на сенсорном экране, по-прежнему, оставляет желать лучшего и лучше всего придерживаться этих опций, на базе ПК.