Новости
  • Тренировка у Guillaume Lorentz, Париж, Франция

    Тренировка у Guillaume Lorentz, Париж, Франция

    Наша ученица Настя Цехмейструк, отдохнув в Париже, совместила приятное с еще более... 
    Читать полностью

  • Adrenaline фестиваль, Киев

    Adrenaline фестиваль, Киев

    6 октября в Киеве прошел фестиваль Adrenaline, который представлял собой отборочный тур... 
    Читать полностью

  • Melpo Melz

    Melpo Melz

    Шведская танцовщица и исполнительница дансхолла  Читать полностью →

Огляд російських голосових помічників: «Дуся», «Асистент російською», Speaktoit і «Собеседник HD»

  1. « Дуся »
  2. « Асистент російською »
  3. Speaktoit
  4. « співрозмовник HD »

Світовий ринок інтелектуальних асистентів з 2012 року по 2014 рік зріс з $ 352 млн до $ 572,2 млн. До 2020 року очікується зростання ринку до $ 3,07 млрд, що становитиме 31% у порівнянні з ростом в 2013 році.

Поки одні компанії концентруються на створенні віртуальних помічників на веб-сторінках, інші приділяють увагу мобільним. На світовому ринку поки переважають великі компанії - творці віртуальних асистентів. На їх частку припадає 80% усієї виручки галузі. Прогнозовані області для збільшення зростання в цій сфері - транспортні, комунальні послуги, телекомунікаційний сектор.

згідно звіту Transparency Market Research, найбільшою в світі виявилася частка північноамериканського ринку - 39%. З 2014 по 2022 рік, за прогнозами, найбільш швидкозростаючим стане азіатсько-тихоокеанський регіон - 33,4%.

За словами Дениса Філіппова, керівника центру мовних технологій «Яндекса», російський ринок тільки починає розвиток, тут ще не накопичено достатньо інформації і статистики для оцінки прибутковості, але потенціал у теми великий. При оптимістичному сценарії розвитку в найближчі 3-5 років ринок мовних технологій на території України може вирости до $ 100 млн в рік. У мовних технологіях і в смисловому аналізі текстів ключова роль залишиться за технологіями збору і обробки великих даних і технологіями побудови і навчання глибоких нейронних мереж.

З представником «Яндекса» згоден директор з управління пакетом ФРІІ Сергій Негодяев. Він вважає, що прибутковість даної галузі можна визначити, тільки якщо вирішити, що конкретно називати «ринком мовних технологій». Ринок програмного забезпечення для колл-центрів в Росії становить близько 2 млрд рублів на рік, на технічну підтримку користувачів по телефону великі компанії витрачають десятки мільярдів рублів на рік - так що оцінювати можна дуже по-різному.

Величезна кількість грошей отримують провайдери послуг телефонії для великих замовників. Банки, телекомунікаційні та страхові компанії мають сотні мільйонів користувачів, а це мільйони хвилин щодня. Будь-яка компанія, яка дозволяє автоматизувати роботу колл-центрів або великих замовників, має серйозні можливості для зростання, говорить Негодяев.

Творець програми « співрозмовник HD »Андрій Єрмолаєв вважає, що інтелектуальні здібності помічників будуть ускладнюватися. Можливо, одного разу настане момент, коли користувачі в розмові не зможуть відрізнити чат-бота від людини. З іншого боку, отримають розвиток спеціалізовані додатки для покупки квитків і товарів, а також для отримання довідкової інформації.

« Дуся »

«Дуся» - це голосовий асистент для Android, призначений для голосового управління смартфоном. У нього немає інтерфейсу - тільки маленька іконка в лівому верхньому кутку екрану. Додаток працює постійно у фоновому режимі і активується голосом, помахом руки, прикладанням смартфона до вуха або струшуванням і іншими способами.

Безліч можливостей для персоналізації дозволяє налаштувати асистент під себе. «Дуся» володіє значним словниковим запасом і ще більшим набором можливих скриптів для установки. Наприклад, скрипт для виклику таксі, для гри з додатком в міста, для перегляду онлайн-ТБ і пошуку музики. Спілкуватися на абстрактні теми «Дуся» не здатна - принаймні до установки відповідного чат-бот скрипта.

Вартість - 90 рублів після тижневого пробного періоду. Є безкоштовна версія для розробників.

« Асистент російською »

Творці «Асистента російською» вийшли за рамки мобільного віртуального помічника і створили API, що дозволяє додати голосове управління до будь-якого Android-додатку. Розробникам доступна відкрита версія прикладів API на GitHub.

Голосовий помічник для Android (з версії 2.3.x), розуміє запити на природному російською мовою, розпізнає зміст промови, встановлює і підтримує діалоговий контекст з користувачем. Для коректної роботи додаток запитує встановлений голосовий пошук Google.

Безкоштовна повна версія продукту доступна сім днів, після цього потрібно заплатити 500 рублів. У платній версії доступні голосова відповідь помічника і автоматична активізація мікрофона. Останні оновлення продукту датуються січнем 2014 року, і користувачі стверджують , Що розробники давно закинули «Асистент». Отримати офіційний коментар у компанії не вдалося.

Speaktoit

Цей голосовий помічник заснували вихідці з Росії Павло Сиротін, Артем Гончарук та Ілля Гельфенбейн. Після виходу він потрапив в топ-10 кращих програм для Android за версією The New York Times.

Асистент доступний на Windows Phone, Android і iOS, помічника можна навчати новим фразам.

Асистент доступний на Windows Phone, Android і iOS, помічника можна навчати новим фразам

як повідомляє The Wall Street Journal, стартап залучив $ 2,6 млн інвестицій в ході раунду B, який очолив фонд Motorola Solutions Venture Capital в липні 2014 року.

У майбутньому, за словами Іллі Гельфенбейна, віртуальні гаджети будуть дуже затребувані: «Ти даєш завдання, машина його виконує. Колись цей час має настати ». Кінцева мета розробників - «створити додаток, без якого неможливо жити», але потрібно на це близько 10 років. Гельфенбейн зазначив, що це перспективна галузь розвитку, оскільки носяться гаджетів стає більше, ніж комп'ютерів.

У найближчих планах Speaktoit - збільшити кількість підтримуваних мов і розширити діяльність. Компанія працює з великими автовиробниками і до 2018 року готує до випуску новий продукт. Головним ринком Гельфенбейн називає США. Можливо, тому, незважаючи на підтримку дев'яти мов, російська локалізація поступається в розпізнаванні мови іншим російським помічникам.

В іншому додаток мало відрізняється від конкурентів: підтримується набір номерів зі списку контактів і набір повідомлень, пошук в інтернеті, установка будильників і нагадувань.

Доступні платна ($ 1) і безкоштовна версії. Додаток скачали близько 12 мільйонів разів, а число платних користувачів перевищила 150 тисяч.

« співрозмовник HD »

Цей голосовий помічник називають російським аналогом Siri: його створила компанія-розробник iOS-додатків iDeveloper, не дочекавшись російської локалізації для iOS. Додаток практично не поступається західним зразком, а в чомусь навіть його перевершує. Наприклад, словниковий запас співрозмовника поповнюється призначеними для користувача питаннями, якщо вони не безглузді або нецензурні.

Решта функцій «Співбесідника HD» ті ж, що і у додатків-аналогів: установка будильника і, пошук в інтернеті, набір повідомлень і дзвінки контактам з адресної книги.

Одна з функцій асистента - гра в міста Одна з функцій асистента - гра в міста

Розробник «Співбесідника HD» Андрій Єрмолаєв в інтерв'ю ToWave розповів , Що програма не раз відхиляли в App Store, посилаючись на повторення функціональності Siri. Через два місяці виправлене відповідно до рекомендацій додаток надійшло в App Store і майже відразу потрапило в російський топ-5.

Доступні платна ($ 0,99) і безкоштовна версії помічника. Кількість скачувань - 70 тисяч і 400 тисяч відповідно.

Андрій Єрмолаєвтворець асистента «Собеседник HD»Андрій Єрмолаєвтворець асистента «Собеседник HD»

Стартовий капітал нашої команди був близько $ 10 тисяч, точних даних по доходах дати не можемо, але проект окупився.

Одна з головних проблем, з якими ми зіткнулися - переговори з Apple про пропуск додатки в App Store. Багато часу ми витратили на оптимізацію додатки, адже розпізнавання мови відбувалося на сервері, а потім Незрозумілий фраза відправлялася на інший сервер для підготовки відповіді.

Для розпізнавання мови ми користувалися сервісами від iSpeech, Nuance і іншими. У майбутньому, думаю, можна буде якісне перетворення мови в текст без відсилання на сервер. Можливо, років через п'ять помічники досягнуть такого рівня розвитку, що ми всі станемо ними користуватися.

Денис Філіпповкерівник напрямку мовних технологій «Яндекса»Денис Філіпповкерівник напрямку мовних технологій «Яндекса»

Для високої якості мовних технологій головне - це збір даних для навчання. Мабуть, це і є основна складність при розробці даних продуктів.

Ми тільки починаємо розвивати наші комерційні продукти лінійки Yandex SpeechKit для цього ринку, тому оцінювати нашу частку ринку ще передчасно, але плани у нас великі. В цілому у галузі хороші перспективи: ми кожен день - вдома, в місті, в машині, в офісі - стикаємося з величезною кількістю пристроїв, всі вони мають різні інтерфейси (кнопки, екрани і так далі) і широку функціональність.

При такому різноманітті можливостей виробники пристроїв прагнуть зробити взаємодію зі своїми пристроями якомога простіше і звичніше, і голосові діалогові інтерфейси ідеально вирішують цю задачу. Завдання розпізнавання і синтезу для таких інтерфейсів важливі, але їх недостатньо. Новий рівень технологій розуміння і вирішення завдання користувача в діалоговому режимі дозволить застосовувати голосові інтерфейси в різних пристроях - від холодильника до автомобіля.

Багато наших продуктів (наприклад, мобільний пошук «Яндекса», «Навігатор») є голосовими асистентами: вони допомагають користувачам вирішувати їх щоденні завдання в тому числі за допомогою голосових інтерфейсів. Коли ми говоримо: «Поїхали додому», «Навігатор» будує маршрут до будинку, і це відбувається кожен день.

Сергій Негодяевдиректор з управління портфелем ФРІІ

На російському ринку є кілька великих вітчизняних гравців, найвідоміший з них - компанія «Центр мовних технологій». Їй доводиться конкурувати з такими великими гравцями, як Nuance (Siri в iPhone працює на її технологіях), Google і Microsoft, яка виставила у відкритий продаж свої когнітивні сервіси. На велику кількість рішень у невеликих компаній, які вирішують приватні задачі, є дуже обмежене коло замовників.

Останнім часом величезну популярність придбали рішення, побудовані на різних типах нейронних мереж. Це пов'язано з тим, що вартість обчислювальних ресурсів серйозно знизилася, і стало можливо і економічно доцільно створювати системи з тисяч нейронів.

Навчання і розрахунки подібних систем зручно проводити на високопродуктивних GPU типу рішень від nVidia. Правильно побудовані і навчені мережі показують результати на 20-30% краще, ніж системи, побудовані на класичних алгоритмах. Плюс до всього, нейромережеві системи значно дешевше в розробці і обслуговуванні, ніж системи, де моделі розпізнавання описують аналітики і розробники. Але головне, що потрібно для створення такої системи, - це доступ до серйозної навчальної вибірки даних.

У ФРІІ ми бачили кілька прикладів, коли компанії, у яких був доступ до серйозної навчальної вибірки для мереж, досить швидко будували рішення, на голову перевершують аналоги від великих російських і міжнародних вендорів.

Керування голосовими даних відноситься до завдань, які зараз вирішують на основі технологій машинного навчання. Для серйозної роботи в цьому напрямку у ФРІІ була сформована «Лабораторія великих даних». Її очолив Анатолій Орлов, який багато років був одним з провідних математиків і алгоритмісти «Яндекса» і відповідав за багато завдань при створенні системи пошуку.

Молоді команди з доступом до навчальних вибірках - це сьогодні одна з найгарячіших інвестиційних тим, і ми уважно стежимо за успіхами цих команд в Росії і за кордоном. Вже зараз ми готуємо ряд пропозицій про інвестування в ці компанії і сподіваємося, що найближчим часом наш портфель поповниться новими вискотехнологічнимі рішеннями.

Дансхолл джем в «Помаде»

3 ноября, в четверг, приглашаем всех на танцевальную вечеринку, в рамках которой пройдет Дансхолл Джем!

Клуб Помада: ул. Заньковецкой, 6
Вход: 40 грн.

  • 22 апреля намечается Dancehall Party в Штанах!
    22 апреля намечается Dancehall Party в Штанах!

    Приглашаем всех-всех-всех на зажигательную вечеринку «More... 
    Читать полностью