Женитьба - умная вещь для дурака и глупая для умного.

А это точно поможет? ...

Facebook сменил лицензию на React Native и Yoga
Sat, 17 Feb 2018 23:54:48 +0600

Проект Wine Staging прекращает подготовку релизов
Sat, 17 Feb 2018 22:51:50 +0600

Компания Intel представила программу выплаты вознаграждений за поиск уязвимостей
Fri, 16 Feb 2018 23:47:09 +0600

За две недели загружено около миллиона копий LibreOffice 6.0
Fri, 16 Feb 2018 08:27:40 +0600

В Ubuntu 18.04 ожидается отправка сведений о системе и режим минимальной установки
Thu, 15 Feb 2018 10:07:33 +0600

Oracle перелицензировал код DTrace под GPLv2
Wed, 14 Feb 2018 23:40:58 +0600

Let's Encrypt преодолел рубеж в 50 млн активных сертификатов
Wed, 14 Feb 2018 23:13:00 +0600

Рейтинг дистрибутивов Linux по версии журнала Linux Journal
Wed, 14 Feb 2018 23:04:37 +0600

Истёк срок действия патентов на MPEG-2
Wed, 14 Feb 2018 21:42:03 +0600

Сформирован список организаций, участвующих в Summer of Code 2018
Wed, 14 Feb 2018 18:15:36 +0600

Значительное снижение производительности MyISAM при включении защиты от Meltdown
Tue, 13 Feb 2018 23:54:07 +0600

Google анонсировал активацию блокировщика рекламы в Chrome
Tue, 13 Feb 2018 21:44:31 +0600

В nginx добавлена поддержка технологии HTTP/2 Server Push
Tue, 13 Feb 2018 11:45:51 +0600

Apple безуспешно пытается противостоять утечке кода iBoot на GitHub
Tue, 13 Feb 2018 10:42:28 +0600

Компания Hitachi присоединилась к инициативе по защите Linux от патентных претензий
Mon, 12 Feb 2018 22:41:27 +0600

Новости OPENNET
Новости

Проект Mozilla опубликовал первый выпуск модели для системы машинного обучения, ориентированной на распознавание речи. Также опубликован использованный для тренировки модели набор голосовых данных, собранный в результате инициативы Common Voice и включающий примеры произношения около 20 тысяч людей, которые надиктовали почти 400 тысяч записей суммарной продолжительностью 500 часов.

Благодаря участию в проекте большого числа добровольцев, удалось сформировать одну из крупнейших баз голосовых шаблонов, учитывающих всё разнообразие голосов и манер речи. Собранная база позволила натренировать модель для системы машинного обучения до уровня распознавания речи, при котором число ошибок примерно соответствует распознаванию обычным человеком при прослушивании тех же записей. В текущем виде число ошибок распознавания составляет 6.5% при использовании тестового набора LibriSpeech. Для сравнения, уровень ошибок при распознавании человеком оценивается в 5.83%, а уровень ошибок при работе Google Speech составляет 6.64%, wit.ai - 7.94%, Bing Speech - 11.73%, Apple Dictation - 14.24%.

В основе системы распознавания речи Mozilla лежит движок

DeepSpeech, созданный с использованием открытой компанией Google платформы машинного обучения TensorFlow. DeepSpeech реализует в коде одноимённую архитектуру распознавания речи, предложенную исследователями из компании Baidu. Предложенный Mozilla набор помимо модели распознавания речи и примеров произношения включает готовые к применению модули для Python и NodeJS, позволяющие без лишних усложнений встроить в свои программы функции распознавания речи. Также поставляется инструментарий для распознавания из командной строки. Движок распознавания речи достаточно быстр и не требователен к ресурсам, что позволяет использовать его даже на платах Raspberry Pi.

DeepSpeech значительно проще традиционных систем и при этом обеспечивает более высокое качество распознавания при наличии постороннего шума. В разработке не используются традиционные акустические модели и концепция фонем, вместо них применяется хорошо оптимизированная система машинного обучения на основе нейронной сети, что позволяет обойтись без разработки отдельных компонентов для моделирования различных отклонений, таких как шум, эхо и особенности речи. Особенностью DeepSpeech является то, что для получения качественного распознавания данная архитектура требует большого объёма разнородных данных для осуществления обучения, надиктованных в реальных условиях разными голосами и при наличии естественных шумов.

Опубликованный набор голосовых данных не ограничен применением в DeepSpeech и может оказаться полезным и для других открытых проектов, занимающихся распознаванием речи, таких как Sphinx, Kaldi, VoxForge, ISIP, HTK и Julius. До сих пор исследователям и разработчикам были доступны только ограниченные наборы голосовых данных, а стоимость полноценных коллекций голосовых выборок исчислялась десятками тысяч долларов, что сильно тормозило независимые исследования в области распознавание речи. В настоящее время работа сосредоточена только на распознавании английского языка, но в первой половине 2018 года планируется приступить к сбору примеров произношения для других языков.

56.3554 70.6471 0.5322 8.8774

НОВОСТИ: Выпуск Wine 3.2 Fri, 16 Feb 2018 23:58:13 +0600

Состоялся экспериментальный выпуск открытой реализации Win32 API - Wine 3.2. С момента выпуска версии 3.1 было закрыто 34 отчётов об ошибках и внесено 340 изменений.

???????@Mail.ru Opera Firefox INFOBOX - хостинг Google Chrome