Дипломная работа: Система голосового управления кабиной лифта

Внимание! Если размещение файла нарушает Ваши авторские права, то обязательно сообщите нам

· Поддержка распознавания русского языка (единственная среди вышепредложенных систем);

· Распространения под лицензией BSD (Berkeley Software Distribution), что позволяет интегрировать её в коммерческие проекты;

· Предоставление API, которое упрощает налаживание взаимодействия со сторонним приложениями, облегчаю разработку.

1.6 Анализ современных систем управления лифтом

Современные потребности создают современные способы их решения. Некоторые задачи приходят к нам из анализа перспектив будущего, как например «Какой необходим интерфейса управления для 1000-этажного лифта?». Однако, существуют и более актуальные проблемы. Гигиена при использовании кнопок, удобство взаимодействия для детей и людей с ограниченными возможностями, различные уровни доступа для разных групп людей - это далеко не все вопросы, решения, которые заключается в использовании более современных способов взаимодействия с интерфейсом управления лифта. Ниже будут проанализированы некоторые из них.

Стандартная кнопочная панель.

Рисунок 4 - Кнопочная панель управления

Лифт управляемый кнопками появился ещё в конце 19 века, но не смотря на это до сих пор является мировым страндартом. Данна концепция долгок время оставалась неизменной и аккумулировала различные недостатки. Кнопочная панель подразумевает под собой прикосновения к ней пользователя, что не всегда удобно, комфортно и безопасно. Кроме того, все механические детали имеют свойство приходить в негодность со временем, даже при нормальных условиях использования. Увеличение количества этажей или функций лифта приводит к соотвественному увеличению числа кнопок и занимаемой ими площади, что также отрицательно сказывается на удобстве использования. В совокупности это приводит нас к выводу, что такой интерфейс управления хоть и является привычным и для многим интуитивно понятным, всё же явлется устаревшим и требует новых идей.

Управления жестами. Данный способ интересен прежде всего тем, что интерфейс является бесконтактным, что позволяет применять его в местах с повышенными требованиями к стерильности, например в больницах. Информационная и развлекательная составляющая такого способа тоже заслуживает внимания, например, интегрируя этот интерфейс с дополненной реальностью, можно создать живописную инсталляцию в лифтах небоскреба, где пользователи смогут получить некоторые информационные или ознакомительные материалы. В исследовании [8] показано, что показатель интуитивности и удобство для пользователей данной системы, независимо от возраста и степени знаний, достигает более 80%.

Рисунок 5 - Пример интерфейся для жестового управления

Процесс ввода информации (в данном случае это выбор этажа и удержание створок лифта открытыми) в этой системе возможен при помощи следующих технологий:

· Компьютерного зрения;

· Распознавании ближнего электрического поля.

Однако несмотря на все преимущества данной системы, она всё же остается зависимой от местоположения человека в кабине лифта, от возможности человека пользоваться руками, и не способна разграничивать доступ к управлению для различных категорий людей.

Управление голосовыми командами. Применение данного способа взаимодействия с лифтом позволяет сохранить большинство положительных сторон предыдущего, а также добавить независимость от местоположения в кабине и способность к верификации пользователей, т. е. «голосовой пароль», что позволяет разграничить уровень доступа. Типичным недостатком такого подхода является не 100 % точность распознавания и следовательно ошибки при использовании. Решением этого может быть подтверждение ввода команды, активизация по ключевому слову, микрофоны более высокого качества или их дублирование, а также методы распознавания, учитывающие влияние шумной окружающей среды.

При реализации этой системы возможно настроить систему таким образом, что она будет верифицировать (идентифицировать) человека по его голосу ещё на походе к лифту или по кодовой фразе и анализирую свою внутреннюю память запускать лифт на заранее настроенный пользователем этаж. Дополнительно способом использования будет настройка названий определенных компаний на заранее заданный этаж, что позволит посетителям бизнес центров проходить сразу в лифт (и вместо этажа называть фирму), миную стойку администраторов.

Анализ современной ситуации показывает, что основная часть российского рынка распознавания речи применяется в области обработки телефонных разговоров и голосового поиска. Системы «Умного дома» и «Интеллектуального окружения» имеет пока небольшую долю рынка, что связанно с сильными иностранными конкурентами из США и Китая, однако уже существует качественные отечественные аналоги. Особенностью проектируемого устройства управления кабиной лифта является дешевая электронная составляющая, гибкое программное обеспечение с открытым кодом и компактность конечного устройства.

1.7 Анализ существующих систем голосового управления

Как показало исследование возможных решений схожего типа, каждое обладает теми или иными недостатками.

Японская Компания Mitsubishi Electric представило свой активирующийся голосом лифт ещё в 2011 году, и значительно упростила его пользование для людей с ограниченными возможностями, добавив две важные функции в свой пользовательский интерфейс лифта.

Новая система обладала функцией распознавания голоса, чтобы незрячие пользователи могли говорить номер этажа, к которому им нужно доехать, а лифт делает объявление при достижении этого этажа. Система также имела датчик снаружи лифта, который обнаруживал инвалидные коляски (в пределах 30 см от датчика). При обнаружении инвалидной коляски автоматически включалась система распознавания голоса (что означает, что человеку с ограниченными возможностями не приходилось сталкиваться с проблемой нажатия высоких кнопок или обращаться за помощью к кому-либо другому). Однако, возможно, такой акцент на людей с инвалидностью, который не позволяет использовать эту систему другим людям (например, людям с занятыми вещами руками), локализация только на одном языке, а также необходимость вручную активировать голосовое распознавания, привёл к тому, что информации о выходе на глобальный рынок подобной системы до сих пор нет.

Более современным и простым решением является использования модуля HM2007, предложенным в статье [5], представляющего собой однокристальный модуль распознавания голоса CMOS. Это встроенная в чип аналоговая интегральная схема с процессами анализа голоса, распознавания речи и распознавания голоса. HM2007 может работать в двух режимах: ручной режим и режим управления процессором.

Рисунок 6 - Модуль распознавания HM2007

В ручном режиме работы модуль распознавания голоса HM2007 используется для построения простой системы распознавания голоса путем подключения таких компонентов, как клавиатура, памяти SRAM (объемом 8 Кбайт) и другие компоненты. В режиме управления процессором в этом режиме предусмотрено несколько функций, таких как RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET модуля распознавания голоса HM2007. Подобно ручному режиму работы, в этом режиме также выполняются операции включения, распознавания, обучения, загрузки, загрузки, скачивания и сброса настроек, основанные на различных критериях.

Положительными сторонами системы, основанной на данном модуле, являются простота обучения распознаваемых команд, компактные размеры платы и низкое энергопотребление. Однако, ограниченное число памяти (позволяющая запомнить только коротких 15 слов), потребность близкого контакта при настройке (при любом обновлении словаря, нужно будет доставать плату из корпуса), а также зависимость от спикера и невозможность более тонкой и гибкой настройки, делают данный модуль неприменимым для многих проектов (например, ограничение объема словарного запаса команд даёт ограничения на количество этажей в доме).

Суммируя недостатки вышеперечисленных систем, решение, предлагаемое в данной работе, должна быть более гибкой в настройках, с возможностью бесконтактной удаленной настройки, обладать русской локализацией, поддерживать большой словарный запас, быть спикеро-независемой, активируемой по голосу, доступной и малогабаритной. Исходя их этих критериев и требований будет подобрана элементная база и программное обеспечение.

1.8 Постановка задачи

Проведенный анализ информационных и литературных источников, а также маркетинговых исследований показывает, что на данный момент не существует бюджетных систем управления кабиной лифта, в которых бы применялся интуитивный и простой способ управления с помощью голосовых команд. Зачастую современным решениям не хватает гибкости, объёма словаря распознавания и возможностям встраивать дополнительный функционал.

Таким образом, тема выпускной квалификационной работы, решающей описанные проблемы является актуальной.

Целью данной дипломной работы является повышение комфортности и доступности управления лифтом для людей с ограниченными возможностями. Для это были поставлены следующие задачи:

· Анализ предметной области;

· Разработка структурной схемы системы управления лифтом;

· Разработка принципиальной электрической схемы устройства;

· Разработка прототипа;

· Разработка алгоритма функционирования.

2. Разработки системы

2.1 Разработка структурной схемы системы

Рисунок 7 - Структурная схема система

Рисунок 7 иллюстрирует структуру системы голосового управления лифтом. Анализирую поступающие с микрофона звуковые сигналы с помощью алгоритма Виттерби и Скрытой Модели Маркова, утилита Pocketsphinx сравнивает полученные данные с заданным словарем и грамматическими конструкциями. После чего, в случае успешного распознавания, передаёт строку в созданный с помощью языка программирования Python скрипт, который управляет работой двигателя. В зависимости от полученной команды «лифт» будет подниматься или опускаться до определенного уровня. Регулирую работу GPIO выходов на Raspberry Pi 3, этот скрипт через модуль управления будет регулировать вращение двигателя. В заданный для распознавания словарь входят следующие слова: номера этаже и дополнительные команды. Дополнительные слова (не относящиеся к номеру этажа) необходимы для лучшего распознавания и отсеивания неправильных результатов с помощью грамматического конструирования предложения.

Так мощностей микроконтолеров не хватает для обработки и распознования было принято решение использовать одноплатный компьютер.

Для разработки и дальнейшего проектирования макета будет использован Raspberry Pi 3.

Данный одноплатный компьютер, основанный на 64-битном процессоре Broadcom 2873 ARMv8, имеет достаточно большую вычислительную мощность, учитывая компактные размеры, сравнимые с кредитной картой. Благодаря 4-х ядерному микропроцессору Cortex-A53 64-bit SoC @ 1.4GHz, на базе подобного устройства появилась возможность запускать «тяжелые» вычислительные процессы для технологии распознавания речи. Данный одноплатный компьютер содержит несколько электронных компонентов, которые будут перечислены ниже.

1. Broadcom BCM2387 микрочип, специально созданный для этой модели, объединяющий 1.2GHz четырёх-ядерный ARM Cortex-A53 (с 32 Кбит Level 1 и 512Кбит Level 2 кэш-памятью) и VideoCore IV графический процессор, связанный с модулем памяти 1GB LPDDR2 на задней панели платы.

Рисунок 8 - Broadcom BCM2387 микрочип

2. Микросхема SMSC LAN9514 отвечает за подключение 10/100 Ethernet и четырёх USB каналов на плате. Микросхема SMSC подключается к вычислительному процессору через один USB-канал, действуя в качестве USB-to-Ethernet адаптера и USB-концентратора.

Рисунок 9 - Микросхема SMSC LAN9514

3. Антенна - отвечает за беспроводной соединение по Wi-Fi (802.11bgn) и Bluetooth 4.1 (Bluetooth Classic and LE)

Рисунок 10 - Блок антенны

4. GPIO входы/выходы - представляют собой свободные цифровые сигнальные выводы на интегральной схеме или электронной плате, поведение которых, в том числе в качестве входа или выхода, контролируется пользователем во время работы. Они позволяют добавлять различные электронные компоненты и модули, расширяя тем самым возможности платы.

Рисунок 11 - GPIO разъёмы

Данный микрокомпьютер управляется посредством операционной системы Raspbian Stretch, оптимизированной для низкопроизводительных ARM процессоров линейки Raspberry Pi. Unix подобные системы очень эффективно используют виртуальную память, поэтому многие программы могут работать со скромным объемом физической памяти. Богатый набор небольших команд и утилит, которые хорошо справляются с конкретными задачами, не перегруженный множеством специальных опций - является ещё одним фактором выбора этой операционной системы.

Рисунок 12 - Физическое представления Raspberry Pi 3

2.2 Разработка электрической схемы устройства

Рисунок 13 - Принципиальная электрическая схема

На рисунке 13 представлена интеграция микрокомпьютера Raspberry Pi 3 в электрическую схему кнопочного управления. При распознавании определенного этажа, на GPIO выходы А1-А5 будет подавать логическая единица, которая замкнет определенной ключ в схеме