Жениться - это значит наполовину уменьшить свои права и вдвое увеличить свои обязанности.

Абрам встречает Изю. ...

Некоторым пользователям Firefox навязано непонятное дополнение Looking Glass
Fri, 15 Dec 2017 23:58:26 +0600

Федеральное агентство по связи США отменяет правила сетевого нейтралитета
Fri, 15 Dec 2017 08:51:16 +0600

HTML 5.2 получил статус рекомендованного стандарта
Thu, 14 Dec 2017 19:09:17 +0600

Red Hat Enterprise Linux 7 сертифицирован на соответствие уровню безопасности EAL4+
Thu, 14 Dec 2017 18:17:01 +0600

Сравнение качества кода Firebird, MySQL и PostgreSQL в анализаторе PVS-Studio (реклама)
Thu, 14 Dec 2017 12:54:40 +0600

Для Ubuntu 16.04 подготовлены модули, имеющие сертификат безопасности FIPS 140-2
Wed, 13 Dec 2017 23:57:06 +0600

Линус Торвальдс рассчитывает выпустить ядро Linux 5.0 летом 2018 года
Tue, 12 Dec 2017 11:33:06 +0600

Artifex и Hancom урегулировали конфликт, связанный с нарушением GPL
Tue, 12 Dec 2017 10:53:44 +0600

Проект Let's Encrypt опубликовал планы на 2018 год
Sat, 09 Dec 2017 21:52:07 +0600

Правительство Нидерландов открыло код информационной системы регистрации жителей
Fri, 08 Dec 2017 17:35:27 +0600

В OpenBSD обеспечена официальная поддержка платформы ARM64
Fri, 08 Dec 2017 17:09:18 +0600

IP-адреса сайта проекта MATE попали в реестр запрещённных в РФ ресурсов
Thu, 07 Dec 2017 16:02:23 +0600

Проект Debian ввёл в строй сайт для навигации по исходным текстам пакетов
Wed, 06 Dec 2017 10:11:25 +0600

Mozilla и Yahoo обменялись судебными исками
Wed, 06 Dec 2017 08:33:09 +0600

16 декабря в Санкт-Петербурге пройдёт семинар для разработчиков на языке Perl
Tue, 05 Dec 2017 20:13:06 +0600

Новости OPENNET
Новости

Проект Mozilla опубликовал первый выпуск модели для системы машинного обучения, ориентированной на распознавание речи. Также опубликован использованный для тренировки модели набор голосовых данных, собранный в результате инициативы Common Voice и включающий примеры произношения около 20 тысяч людей, которые надиктовали почти 400 тысяч записей суммарной продолжительностью 500 часов.

Благодаря участию в проекте большого числа добровольцев, удалось сформировать одну из крупнейших баз голосовых шаблонов, учитывающих всё разнообразие голосов и манер речи. Собранная база позволила натренировать модель для системы машинного обучения до уровня распознавания речи, при котором число ошибок примерно соответствует распознаванию обычным человеком при прослушивании тех же записей. В текущем виде число ошибок распознавания составляет 6.5% при использовании тестового набора LibriSpeech. Для сравнения, уровень ошибок при распознавании человеком оценивается в 5.83%, а уровень ошибок при работе Google Speech составляет 6.64%, wit.ai - 7.94%, Bing Speech - 11.73%, Apple Dictation - 14.24%.

В основе системы распознавания речи Mozilla лежит движок

DeepSpeech, созданный с использованием открытой компанией Google платформы машинного обучения TensorFlow. DeepSpeech реализует в коде одноимённую архитектуру распознавания речи, предложенную исследователями из компании Baidu. Предложенный Mozilla набор помимо модели распознавания речи и примеров произношения включает готовые к применению модули для Python и NodeJS, позволяющие без лишних усложнений встроить в свои программы функции распознавания речи. Также поставляется инструментарий для распознавания из командной строки. Движок распознавания речи достаточно быстр и не требователен к ресурсам, что позволяет использовать его даже на платах Raspberry Pi.

DeepSpeech значительно проще традиционных систем и при этом обеспечивает более высокое качество распознавания при наличии постороннего шума. В разработке не используются традиционные акустические модели и концепция фонем, вместо них применяется хорошо оптимизированная система машинного обучения на основе нейронной сети, что позволяет обойтись без разработки отдельных компонентов для моделирования различных отклонений, таких как шум, эхо и особенности речи. Особенностью DeepSpeech является то, что для получения качественного распознавания данная архитектура требует большого объёма разнородных данных для осуществления обучения, надиктованных в реальных условиях разными голосами и при наличии естественных шумов.

Опубликованный набор голосовых данных не ограничен применением в DeepSpeech и может оказаться полезным и для других открытых проектов, занимающихся распознаванием речи, таких как Sphinx, Kaldi, VoxForge, ISIP, HTK и Julius. До сих пор исследователям и разработчикам были доступны только ограниченные наборы голосовых данных, а стоимость полноценных коллекций голосовых выборок исчислялась десятками тысяч долларов, что сильно тормозило независимые исследования в области распознавание речи. В настоящее время работа сосредоточена только на распознавании английского языка, но в первой половине 2018 года планируется приступить к сбору примеров произношения для других языков.

58.8987 69.4298 0.5252 8.9132

НОВОСТИ: Выпуск редакций дистрибутива Linux Mint 18.3 с рабочими столами ... Fri, 15 Dec 2017 18:37:07 +0600

Доступны редакция дистрибутива Linux Mint 18.3 с рабочими столами Xfce и KDE. Редакция с Xfce (1.7 Гб) основана на пакетной базе Xubuntu 16.04 и поставляется с десктоп-окружением Xfce 4.12, дополненном серией оригинальных приложений, упрощающих настройку и работу в системе. Редакция с KDE (2 Гб) основана на пакетной базе Kubuntu 16.04, использует PPA-репозиторий с бэкпортами приложений из новых версий Kubuntu и поставляется с рабочим столом KDE Plasma 5.8. Ключевые новшества редакций с Xfce и KDE идентичны новшествам, ранее представленным для редакций Linux Mint 18.3 на базе оболочек MATE и Cinnamon.

???????@Mail.ru Opera Firefox INFOBOX - хостинг Google Chrome