• Главная
  • Карта сайта
Не найдено

Реалізація в середовищі Windows підтримки російськомовного голосового введення

  1. 1. «Ок, Аліса» і голосовий пошук Google для пошукових запитів
  2. 2. Веб-сервіс Web Speech API від Google
  3. 3. «Голосовий блокнот» на Speechpad.Ru
  4. 4. Інтеграція Speechpad в веб-форми браузера
  5. 5. Інтеграція Speechpad в середу Windows
  6. 5. Безкоштовні альтернативи інтеграції голосового введення в середу Windows

Друзі, на днях ми розглядали одне з нововведень, привнесених в Windows 10 оновленням Fall Creators Update - штатну можливість голосового введення даних англійською мовою . Підтримку голосового введення російською мовою компанія Microsoft обіцяє в майбутньому, але не уточнює, близько чи далеко це майбутнє оглядатися. Можливо, це буде тоді, коли і Кортан зможе говорити, а головне, розуміти по-російськи. Чекати, поки Microsoft навчить Windows 10 розуміти наших не варто. Якщо чогось немає в середовищі самої системи, це практично завжди можна реалізувати за рахунок сторонніх програмних засобів. Власне, про них ми і будемо говорити в цій статті. Нижче розглянемо різні способи, як можна за допомогою вбудованого в ноутбук або підключеного до ПК мікрофона вводити голосом пошукові запити і диктувати текст документів.

1. «Ок, Аліса» і голосовий пошук Google для пошукових запитів

Можливість голосового введення пошукових запитів давним-давно присутній в пошуковику Google.

Незрозуміло, чому компанія Google до сих пір не інтегрувала цю технологію в інтерфейс YouTube. Але в будь-якому випадку відеоролики можна шукати в самому пошуковику, промовляючи ключові запити. Просто потім потрібно буде в результатах видачі перемикатися на вкладку «Відео». Левова частка пошукових видач з відомих причин все одно буде з YouTube.

Встигли вже познайомитися з Алісою - гучним голосовим помічником від Яндекса - і зовсім не потрібно вирушати на сайт пошукача в вікні браузера. Після установки програми пошукове поле Яндекса з можливістю голосового введення запитів з'явиться прямо на панелі завдань Windows. А на рідкісні нескладні питання Аліса зможе відповісти і без пошукача, не виходячи за межі свого діалогового віконця.

2. Веб-сервіс Web Speech API від Google

У технології Web Speech API, за допомогою якої в пошуковику Google реалізований голосове введення запитів, є свій веб-інтерфейс за адресою:

https://www.google.com/intl/ja/chrome/demos/speech.html

Функціонал сервісу міінімалістічен: в ньому присутня кнопка включення мікрофона і результуюче поле, де потім буде відображатися розпізнаний текст.

Але в цьому результуючому поле не можна вносити правки. За підсумком отримаємо результати розпізнавання як є. І зможемо відредагувати їх тільки в якомусь текстовому редакторі або формі введення даних. Кнопка нижче результуючого поля «Copy and Paste» завершує поточну сесію введення і на весь розпізнаний текст автоматично ставить блок виділення. Так зроблено для зручності копіювання в буфер.

Для розпізнаного тексту доступна ще одна можливість, реалізована кнопкою створення електронного листа. Вона запускає поштовий клієнт, встановлений в середовищі Windows таким за замовчуванням, створює новий лист і переносить в нього розпізнаний текст.

Примітно, що Web Speech API може розпізнавати деякі знаки пунктуації, як мінімум точку і кому. Так що під час диктувань в місцях вставки крапок і ком їх можна просто промовляти.

Відсутність можливості редагування тексту всередині результуючого поля робить використання інтерфейсу Web Speech API не зовсім зручним для великих обсягів набору тексту. Для тривалих диктувань краще використовувати веб-інтерфейс сервісу «Google Документи», в який технологія Web Speech API вбудована. У «Google Документах» можна і вводити текст голосом, і тут же правити його, і ще попутно форматувати документ.

3. «Голосовий блокнот» на Speechpad.Ru

На базі технології Web Speech API працює ще сайт - найпопулярніший і найфункціональніший в Рунеті сервіс голосового введення даних «Голосовий блокнот». У числі основних його функцій:

  • Підтримка декількох мов, включаючи російську та українську;
  • Результуюче поле розпізнавання голосу з можливістю редагування тексту, його перекладу на інші мови, вивантаження результатів в TXT-файл;
  • Висновок розпізнаних фраз в буфер обміну;
  • Транскрібація;
  • Інтеграція в веб-форми Chromium-браузерів;
  • Інтеграція в середу Windows і Linux.

Плюс до цього всього, в «Голосовому блокноті» опція введення голосу вмикається та вимикається тільки після натискання відповідної кнопки. Ця опція не деактивує сама по собі, як тільки ми на час замислюватимемося в пошуках точного формулювання думки, як це відбувається в інших сервісах на базі Web Speech API.

Щоб почати використовувати можливості «Голосового блокнота», необхідно авторизуватися на сайті сервісу. Для цього потрібно або пройти реєстрацію, або задіяти наявний обліковий запис Яндекса.

Для цього потрібно або пройти реєстрацію, або задіяти наявний обліковий запис Яндекса

Далі активуємо прослуховування мікрофона кнопкою «Включити запис».

Далі активуємо прослуховування мікрофона кнопкою «Включити запис»

І відстежуємо в результуючому поле розпізнаний текст.

4. Інтеграція Speechpad в веб-форми браузера

У «Голосового блокнота» є розширення для Chrome і браузерів, що підтримують роботу з контентом з його магазину.

Після впровадження цього розширення в контекстному меню веб-форм введення тексту з'явиться пункт «Speechpad». Тиснемо цю кнопку і говоримо в мікрофон. Таким чином можемо, наприклад, диктувати замітки в Google Keep.

Або спілкуватися з людьми в соцмережах.

Єдине «але» - розширення «Голосового блокнота» працює не у всіх веб-формах сайтів.

5. Інтеграція Speechpad в середу Windows

Можливості веб-сервісу «Голосовий блокнот» можна інтегрувати в середу Windows. І здійснювати набір тексту голосом в будь-якій програмі операційної системи - штатному блокноті, Microsoft Word, інших текстових редакторах. Незрозумілий мова без посередництва веб-сервісів або буфера обміну буде вставлятися прямо в редаговані документи. Однак така функція Speechpad.Ru не безкоштовна, і коштує вона 100 руб. у місяць. Передбачаються варіанти економії: при оплаті послуг відразу за квартал вартість становитиме 250 руб., А передоплата за рік обійдеться в 800 руб. Кожен зареєстрований користувач може перш протестувати інтегрований в середу своєї операційної системи функціонал сервісу. Творці Speechpad.Ru пропонують дводенний тестовий період безкоштовно. Як безпосередньо здійснюється інтеграція «Голосового блокнота» в операційні системи, зокрема, в Windows, детально описується на сайті самого Speechpad.Ru. Кількома знак питання біля опції інтеграції.

І проходимо всі описувані в інструкції кроки:

  • Встановлюємо вищезгадане розширення сервісу;
  • Викачуємо пакет файлів інтеграції;
  • Розпаковуємо архів і запускаємо файл install_host.bat;
  • На сайті Speechpad.Ru заходимо в кабінет користувача;

Ru заходимо в кабінет користувача;

Тиснемо кнопку «Включити тестовий період».

Тиснемо кнопку «Включити тестовий період»

Тут же, нижче розташовуються і способи оплати послуг сервісу, якщо під час тестового періоду робота з ним сподобається. Далі повертаємося на головну сторінку Speechpad.Ru, активуємо опцію «Інтеграція з OS» і тиснемо кнопку «Включити запис».

Ru, активуємо опцію «Інтеграція з OS» і тиснемо кнопку «Включити запис»

І так кожен раз, коли потрібно активувати голосове введення. Ось, власне, і все. Тепер можна відкривати Microsoft Word, LibreOffice Writer, інші текстові редактори і починати диктовку. Розпізнаний текст буде з'являтися у вікні будь-якого активного застосування, що підтримує введення даних.

Важливо: щоб використовувати інтегрований в систему Speechpad, не можна закривати вкладку його сайту в вікні браузера. Закриття останньої деактивує голосове введення.

5. Безкоштовні альтернативи інтеграції голосового введення в середу Windows

Які можуть бути безкоштовні альтернативи інтеграції в середу Windows російськомовного голосового введення даних?

варіант №1

Абсолютно безкоштовно на сайті Speechpad.Ru можна використовувати опцію виведення розпізнаної мови в буфер обміну. Тиснемо на сайті кнопку «Включити запис» і рухаємось в будь-який додаток Windows.

Тепер можемо промовляти окремі фрази і вставляти їх з буфера клавішами Ctrl + V. Як тільки зробимо паузу в мові, почуємо писк Speechpad, який свідчить про те, що фраза розпізнає і скопійована в буфер обміну. Такий спосіб роботи з голосовим уведенням має свої переваги: ​​при вставці окремих фраз можна попутно редагувати текст начисто.

Як і при повноцінної інтеграції «Голосового блокнота» в середу операційної системи, сайт Speechpad.Ru повинен бути відкритий в одній з вкладок браузера.

варіант №2

Працюючим з додатками офісного пакету Microsoft має право запропонувати свою напрацювання з впровадження голосового введення - надбудову Dictate, інтегруючу в Word, Outlook і PowerPoint додаткову вкладку меню з інструментом розпізнавання мови. Надбудова може розпізнавати мову на 20 мовах, включаючи російську, і дозволяє попутно перекладати текст на 60 мов.

Сайт скачування Dictate:

http://dictate.ms

Після установки надбудови в систему необхідно перезапустити Word, якщо він відкритий, і активувати Dictate в налаштуваннях редактора. У меню «Файл» натискаємо «Параметри», далі - «Надбудови». З переліку надбудов вибираємо WordDictate і натискаємо внизу «Перейти».

Активуємо WordDictate.

Все - можемо тестувати голосове введення. Відкриваємо будь-який документ Word і рухаємось на вкладку «Dictation». Встановлюємо російську мову в якості вихідної мови, кліках кнопку зі значком мікрофона і говоримо.

Однак поряд з безкоштовністю і зручністю реалізації голосового введення таким чином, на жаль, отримаємо і зворотний бік медалі - жахливу якість самої технології розпізнавання мови. Технологія Microsoft за якістю всерйоз відстає від Web Speech API компанії Google.

***

Ще один безкоштовний спосіб голосового введення тексту - запис промови в аудіофайл з подальшою автоматичною транскрібаціей (розшифровкою в текст). Далеко на кожен може відразу викласти свої думки структурованим літературною мовою, та ще й попутно правити помилки розпізнавання, проставляти знаки пунктуації. При записи же промові на диктофон можна повністю сконцентруватися на суті викладеного матеріалу, а в процесі транскрібаціі вже всю концентрацію уваги направити на красномовство і грамотність подачі цього матеріалу. Але, друзі, автоматизація транскрібаціі аудіозаписів - це тема вже іншої, окремої статті.

Продовження в статтях:

Провайдеры:
  • 08.09.2015

    Batyevka.NET предоставляет услуги доступа к сети Интернет на территории Соломенского района г. Киева.Наша миссия —... 
    Читать полностью

  • 08.09.2015
    IPNET

    Компания IPNET — это крупнейший оператор и технологический лидер на рынке телекоммуникаций Киева. Мы предоставляем... 
    Читать полностью

  • 08.09.2015
    Boryspil.Net

    Интернет-провайдер «Boryspil.net» начал свою работу в 2008 году и на данный момент является одним из крупнейших поставщиков... 
    Читать полностью

  • 08.09.2015
    4OKNET

    Наша компания работает в сфере телекоммуникационных услуг, а именно — предоставлении доступа в сеть интернет.Уже... 
    Читать полностью

  • 08.09.2015
    Телегруп

    ДП «Телегруп-Украина» – IT-компания с 15-летним опытом работы на рынке телекоммуникационных услуг, а также официальный... 
    Читать полностью

  • 08.09.2015
    Софтлинк

    Высокая скоростьМы являемся участником Украинского центра обмена трафиком (UA — IX) с включением 10 Гбит / сек... 
    Читать полностью