aupam.ru

Информация по реабилитации инвалида - колясочника, спинальника и др.

Инватехника

Глава 4. Технологии для незрячих

Работа на компьютере без участия зрения существенно отличается от того, на что первоначально ориентируются разработчики аппаратуры и программного обеспечения. По идее, все опирается на визуальные сигналы на экране: изображения элементов управления, подписи к ним, текст и рисунки. Однако существуют технологии, которые позволяют максимально перевести эту визуальную информацию в форму, доступную незрячим людям. Таких каналов передачи информации два: слух и осязание.

Для ввода информации слепые люди могут пользоваться обычными клавиатурами и мышами. Все клавиатуры снабжены выпуклыми метками, которые позволяют найти на ощупь две клавиши (русские <А> и <О>) в центральной части, а остальные клавиши расположены относительно них по стандартной схеме (раскладке).

Основная проблема связана с выводом информации. Первое решение — обратиться к рельефно-точечному шрифту Брайля, по использованию которого накоплен большой мировой опыт. Однако этот способ хорош для работы с чисто текстовой информацией — например, с документами, электронной почтой, моментальными сообщениями.

Голосовой интерфейс более универсален. Главное, что он во многом способен дублировать графический интерфейс операционной системы и приложений. В современных операционных системах экранный диктор является одним из стандартных приложений.

К сожалению, как и в случае распознавания речи, компания Microsoft обошла вниманием русскоязычных пользователей. Экранный диктор в Windows 7 и Windows 8 есть, даже интерфейс его в локализованной версии системы русскоязычный, но вот работает он только с английским голосом. Насколько можно судить по заметкам на официальном сайте крупнейшего разработчика операционных систем, синтез русской речи в списке приоритетных задач отсутствует.

Поэтому носителям английского и некоторых других языков стандартное приложение Windows приносит явную пользу. Нашим же соотечественникам больше подходят программы сторонних разработчиков — например, NVDA, JAWS и др. — в них поддержка русского языка реализуется «сразу от разработчика» или с помощью доступных дополнений и настроек.

Нужно заметить, что освоение и азбуки Брайля с соответствующими устройствами, и голосового интерфейса обязательно требуют участия инструктора, тифлопедагога. Ведь с чего-то нужно начинать, и на этом этапе необходим человек, который отработает с незрячим учеником базовые приемы. Лишь после того, как обучаемый начнет на слух и/или с помощью брайлевского дисплея ориентироваться в интерфейсе ОС, открывать и читать файлы, он сумеет обращаться к инструкциям и руководствам.

4.1. Тактильные устройства ввода/вывода

Шеститочечный рельефно-точечный тактильный шрифт изобрел в 1821 году француз Луи Брайль. Примечательно, что самому ему тогда было всего 15 лет. За почти два века своего существования шрифт Брайля стал общепризнанным и основным средством чтения и письма для слепых и слабовидящих. Аппаратные средства, предназначенные для незрячих людей, так или иначе связаны с азбукой Брайля.

Брайлевский символ изображается комбинацией рельефных точек высотой 0,6 мм и диаметром 1,4 мм, расположенных в ячейке размером 4,2 × 7 мм. Расстояние между ячейками составляет 3,75 мм по горизонтали и 5 мм по вертикали.

В «традиционном» шеститочечном варианте (рис. 4.1) азбука Брайля кодирует 63 символа. Этого, в принципе, достаточно для обозначения букв любого национального алфавита, цифр и знаков препинания. Служебные символы указывают, что следующие за ними символы — цифры или заглавные буквы. Однако на практике их часто опускают, а цифры от букв отличают по контексту.

При письме по Брайлю незрячие часто прибегают к различным видам скорописи, упрощая грамматику. Там, где это не мешает пониманию написанного, некоторые буквы в словах и знаки препинания пропускают, а заглавные буквы подразумеваются. Примерно так же принято писать SMS или сообщения в ICQ.

В наше время получил распространение и «расширенный» восьмиточечный вариант, которым можно изобразить уже до 255 разных символов. В компьютерной сфере применяется именно это представление, и символы шрифта Брайля включены в кодовую таблицу Unicode 6.0 наряду с символами латиницы и национальных алфавитов.

В некоторых европейских языках две нижние точки ячейки (точки 7 и 8) используются как часть стандартных для этих языков символов шрифта Брайля. Однако чаще эти точки отводятся под служебную информацию. Например, с их помощью обозначают позицию курсора, прописные буквы, выделение и другие атрибуты текста.

Варианты шрифта Брайля

Рис. 4.1. Варианты шрифта Брайля

4.1.1. Тактильные строки и дисплеи Брайля

Брайлевский дисплей (Braille Display) — электромеханическое устройство, которое отображает символы шрифтом Брайля. Рельефный рисунок создается штифтами, которые выдвигаются из отверстий в пластине и ощущаются как выпуклые точки. Когда штифт опущен, его кончик находится заподлицо с пластиной, и на ощупь сливается с поверхностью.

Дисплеи Брайля составляются из отдельных ячеек, каждая из которых содержит шесть или восемь штифтов. Из 40, 70 или 80 ячеек формируется строка. Большинство дисплеев снабжены лишь одной строкой (рис. 4.2), но есть и модели с двумя или тремя строками.

Однострочный дисплей Брайля

Рис. 4.2. Однострочный дисплей Брайля

Внутри каждой ячейки находится сложный прецизионный механизм, перемещающий штифты. Ячейки являются самым дорогостоящим элементом брайлевского дисплея. Чем из большего числа ячеек состоит брайлевский дисплей, тем дороже он стоит.

Дисплей Брайля отображает информацию построчно, а данные на него выводит одна из программ экранного доступа (см. разд. 4.3). Как правило, на дисплее представлен текст, находящийся в фокусе или на активном элементе управления. Например, при редактировании документа в текстовом редакторе брайлевский дисплей отображает строку текста, в которой сейчас находится курсор.

Если на экране открывается диалоговое окно, то на дисплей выводится информация об активном элементе управления. В зависимости от настроек программы экранного доступа, на брайлевском дисплее может отображаться информация и о соседних элементах управления. Когда пользователь перемещает курсор на следующую строку текста или переводит фокус на другой элемент управления, содержимое строк дисплея обновляется.

В брайлевских дисплеях обычно применяются ячейки с восемью точками. Два нижних штифта (точки 7 и 8) принято использовать для обозначения позиции курсора, подчеркивания, выделения. Их назначение настраивается в программе экранного доступа — каких-то единых правил здесь нет.

Для работы с брайлевским дисплеем необходима программа экранного доступа, способная взаимодействовать с дисплеями данной модели. Без программы экранного доступа дисплей практически бесполезен — он не является стандартным устройством ввода/вывода.

Для управления курсором или указателем можно пользоваться клавишами со стрелками или цифровым блоком в правой части клавиатуры. Однако пальцы должны следить за брайлевской строкой. Чтобы реже переносить руки с тактильного дисплея на клавиатуру и обратно, дисплеи Брайля обычно снабжают несколькими клавишами или кнопками навигации. Их назначение задается в программе экранного доступа.

Часто дисплей объединяется с брайлевской же восьмиклавишной клавиатурой (рис. 4.3). Некоторые малогабаритные модели брайлевских дисплеев способны работать автономно в качестве персональных помощников (записных книжек или органайзеров). По сути, это дисплей со встроенной записной книжкой. Точно так же многие карманные персональные помощники можно подключать к компьютеру и использовать как дисплей — главное, чтобы поддержка данного устройства была предусмотрена в программе экранного доступа.

Дисплей с клавиатурой Брайля

Рис. 4.3. Дисплей с клавиатурой Брайля

Брайлевские дисплеи выпускает целый ряд компаний, например:

- Baum AG (www.tibsev.org);

- Freedom Scientific (www.freedomscientific.com);

- Handy Tech (www.handytech.de);

- HumanWare (www.humanware.com);

- Papenmeier (www.papenmeier.de).

Устройства эти дорогостоящие по определению — сложная и прочная механика «упакована» в очень малый объем ячейки. Цены на самые простые однострочные брайлевские дисплеи начинаются от 1500 долларов. Более «продвинутые» модели могут стоить 2000, 3000 долларов и выше.

Как выбрать брайлевский дисплей? Прежде всего, решите, в каких задачах вы будете его использовать. Как правило, чем длиннее строка, тем с ней удобнее работать.

В большинстве случаев дисплеи с 40 ячейками хорошо подходят для повседневной работы в Windows, просмотра сайтов и общения в социальных сетях, переписки и т.п. Однако для редактирования документов в текстовых процессорах предпочтительны модели на 70 или 80 ячеек — примерно столько же знаков содержит строка на экране.

Нужны ли дополнительные кнопки, кроме почти обязательных кнопок навигациипанорамирования? Достаточное количество кнопок и их удобное расположение позволяют реже обращаться к компьютерной клавиатуре. Совмещенная с дисплеем брайлевская клавиатура полезна лишь в том случае, если вы предполагаете регулярно набирать текст шрифтом Брайля.

Узнать об особенностях разных моделей можно на сайтах производителей. Полезно прочитать руководство пользователя — как правило, они доступны для скачивания. Кроме того, технические средства реабилитации вообще и брайлевские дисплеи в частности обсуждаются на тематических сайтах (чаще англоязычных). Например, на сайте American Foundation the Blind (www.afb.org) публикуют и регулярно обновляют описания наиболее популярных моделей брайлевских дисплеев.

В идеале, среди заинтересовавших моделей «свою» нужно выбирать наощупь. Тактильные ощущения очень индивидуальны, а отзывы других пользователей могут служить лишь дополнительным ориентиром. Такие характеристики, как «мягкость» или «острота» точек, различимость символов, удобство расположения кнопок можно оценить лишь собственноручно.

В магазинах образцы вы вряд ли встретите. Скорее всего, ознакомиться с некоторыми дисплеями удастся там, где ими пользуются: в объединениях и клубах, библиотеках для слепых, а также у владельцев подобных устройств. Брайлевский дисплей — устройство довольно консервативное. Многие модели выпускаются без особых изменений в течение пяти и более лет. Поэтому шансы найти в продаже точно такой же прибор, с которым вы познакомились, например, на курсах, довольно велики.

4.1.2. Принтеры Брайля

Приспособление для письма шрифтом Брайля — шаблон с шестью отверстиями и палочка-стилус. Стилусом выдавливают точки на бумаге, при этом «пишут» с одной стороны листа, а читают — с другой.

Для механизации процесса были изобретены пишущие машинки, сначала чисто механические, потом электромеханические. Иглы бьют по бумаге, оставляя на ней рельефные точки. Некоторые из таких устройств эксплуатируются и по сей день.

Брайлевские принтеры устроены по тому же принципу. Наиболее простые модели — чисто текстовые, они выдавливают только символы шрифта Брайля построчно. Для рельефной печати рекомендуется специальная бумага, плотная, но, вместе с тем, эластичная. Допускается использование и обычной офисной бумаги, но документы на ней не так долговечны — после многократного чтения пальцами точки постепенно сглаживаются и стираются.

Современные брайлевские принтеры — их еще называют «тиснителями» (embossers) — как правило, способны печатать в виде рельефа и текст, и графику. Для перевода изображений в тактильно воспринимаемую форму служит технология Interpoint & Intergraphix. Она нашла воплощение в таких программах, как, например, QuickTac и TGD-Pro от компании Duxbury Systems (www.duxburysystems.com), Tiger Software Suite (www.viewplus.com/products/software/braille-translator/). Обычно эти или другие приложения для перевода изображений и текста в тактильно-рельефную форму идут в комплекте с принтером.

В настоящее время принято совмещать рельефную печать с цветной струйной или лазерной. Получающиеся документы равно доступны и зрячим, и незрячим. Первые видят обычный текст и иллюстрации, вторые пользуются дублирующим текстом, выдавленным шрифтом Брайля, и рельефом на изображениях. Такие документы выдает, например, принтер HP Emprint SpotDot (рис. 4.4).

Принтер HP Emprint SpotDot

Рис. 4.4. Принтер HP Emprint SpotDot

Серьезный недостаток любого матричного принтера — сильный шум при работе. Брайлевский принтер с мощной печатающей головкой шумит еще больше. Из-за этого такие устройства стараются располагать в звукоизолированных помещениях.

Перспективная технология рельефной печати — специальная струйная. Идея в том, что достаточно объемные капельки густых чернил, застывая, создают на бумаге выпуклый рисунок. Подобный метод практикуется в оперативной полиграфии, например, при изготовлении визиток. Вероятно, в ближайшем будущем появятся и промышленные образцы таких принтеров для использования незрячими людьми.

Практическое применение принтеры для печати по Брайлю нашли в образовательных учреждениях, библиотеках, клубах незрячих. В домашних условиях ими почти не пользуются: и из-за высокой цены, и из-за шума.

4.1.3. Брайль и голос

Какое место перечисленная техника занимает среди всех вспомогательных средств? Часто высказывается мнение, что при работе на компьютере шрифт Брайля в общем-то изжил себя. Обосновывают это двумя соображениями:

- голосовой интерфейс естественнее, его освоение требует меньших усилий;

- брайлевский дисплей — технически сложное дорогостоящее устройство, а реальных альтернатив электромеханическим ячейкам пока не существует. С другой стороны, синтезаторы речи предоставляют те же возможности для чтения, но реализуются программно на любом компьютере.

Как ни странно, лишь немногие слепые люди хорошо знают азбуку Брайля. В Германии примерно 30 % из них владеют ею вообще, но это не значит, что все они читают быстро и уверенно. В Соединенных Штатах этот показатель еще меньше — порядка 15–20 %. Одной из причин послужила как раз доступность на Западе компьютеров и портативных устройств с синтезом голоса. Кроме того, азбуку Брайля изучают обычно в детстве и молодом возрасте. Тому, кто потерял зрение уже будучи взрослым, проще обратиться к голосовым технологиям.

Среди российских пользователей доля владеющих азбукой Брайля выше. В недавнем прошлом рельефные книги были для незрячих основным носителем информации, а технические новинки становились доступными с большой задержкой. Вместе с тем, из-за разницы в уровне жизни и соцобеспечении покупку брайлевского дисплея могут позволить себе лишь немногие.

Скорее всего, в повседневной жизни технологии синтеза и распознавания речи на компьютере действительно становятся основными. Однако в некоторых областях дисплей Брайля незаменим. В первую очередь, в профессиональной деятельности.

В наше время незрячие люди могут эффективнее всего применить свои возможности, работая со словом и символами. Это написание текстов, обработка данных в бизнесе и управлении, работа в call-центрах, программирование. Голосовые технологии не обеспечивают абсолютную точность — например, грамматику или заполнение таблиц «на слух» проверить сложно. Тем более важно проверять каждый вводимый символ программистам, операторам баз данных и т.п. В таких случаях брайлевский дисплей просто обязан присутствовать на столе. Приобретать его может и должен работодатель. Благодаря использованию тактильного дисплея возрастают и производительность, и качество труда, так что оборудование быстро себя оправдает.

4.2. Тифлокомпьютеры

Тифлокомпьютерами иногда называют адаптированные под нужды незрячих пользователей персональные компьютеры с соответствующими периферийными устройствами и ПО. Такие компьютеры собирают и настраивают для передачи детям в рамках образовательных программ, ими оборудуют рабочие места для инвалидов по зрению и т.п.

Как минимум, «особенность» подобных систем заключается в установке одной из программ экранного доступа или специальных сборок ОС Linux. В зависимости от задач, компьютеры могут быть укомплектованы сканерами и программами распознавания символов, брайлевскими дисплеями.

Совсем другая категория — тифлокомпьютеры, устроенные по типу персональных помощников. Персональные цифровые помощники или карманные персональные компьютеры (КПК, PDA, PocketPC) были весьма популярны в недавнем прошлом. Эти миниатюрные компьютеры работают под управлением Windows CE, Symbian и других «встроенных» операционных систем. Впоследствии из массового сегмента их полностью вытеснили «умные» телефоны и смартфоны с одной стороны, а планшеты и нетбуки — с другой.

Однако концепция персонального помощника нашла свое продолжение в сфере тифлотехники. Микрокомпьютеры, лишенные экрана, но оборудованные небольшим брайлевским дисплеем, по-прежнему востребованны. Хотя габариты у них далеко уже не карманные, это все равно переносные автономные устройства. Тифлокомпьютер может питаться и от сети, и от собственного аккумулятора.

Как правило, при подключении к стационарному компьютеру или ноутбуку персональный помощник способен работать в качестве брайлевского дисплея. Для этого его нужно переключить в режим дисплея с помощью кнопки на корпусе, а на компьютере установить соответствующий драйвер внешнего устройства и программу экранного доступа. Пока тифлокомпьютер используется как дисплей Брайля, его записная книжка и другие внутренние программы недоступны, и наоборот. Подключение обычно осуществляется по USB, иногда через инфракрасный порт (IrDA), а в некоторых моделях предусмотрено и беспроводное подключение по Bluetooth.

Типичный набор приложений для портативного тифлокомпьютера включает в себя примерно такие же программы, которые установлены в смартфонах и обычных КПК:

- менеджер файлов, который позволяет открывать, копировать и удалять файлы;

- проигрыватель — для прослушивания аудиофайлов распространенных форматов, например, МР3 и WMA;

- текстовый редактор — для просмотра, создания и редактирования текстовых файлов;

- записная книжка — чтобы хранить и упорядочивать, например, фамилии, адреса, номера телефонов;

- клиент электронной почты — для работы с письмами;

- браузер — для просмотра веб-страниц в Интернете.

Во всех программах текст преобразуется в азбуку Брайля и выводится на тактильный дисплей. Кроме того, практически во всех тифлокомпьютерах присутствует программа-синтезатор речи. Она озвучивает вводимый текст (нажатия клавиш), а также дублирует голосом то, что выводится на дисплей.

Первое назначение тифлокомпьютера — чтение текстов, просмотр Интернета, электронная почта. Второе — роль записной книжки, органайзера, хранилища каких-то личных заметок. При необходимости персональный помощник может быть использован и для подготовки довольно обширных текстов, документов, статей, которые впоследствии можно переслать по электронной почте, опубликовать в Интернете или распечатать на другом компьютере.

В настоящее время наиболее известными являются тифлокомпьютеры марок PAC Mate от компании Freedom Scientific (www.freedomscientific.com) и BrailleNote Apex от новозеландской компании HumanWare Group (www.humanware.com). Первые выпускаются в двух вариантах: PAC Mate BX — с восьмиклавишной клавиатурой Брайля (рис. 4.5) и PAC Mate QX — с обычной QWERTY-клавиатурой (рис. 4.6). Крестовидный джойстик между клавишами предназначен для управления курсором, а два колесика по бокам брайлевского дисплея обеспечивают прокрутку текста.

Тифлокомпьютер PAC Mate BX 400

Рис. 4.5. Тифлокомпьютер PAC Mate BX 400

Среди продукции компании HumanWare Group присутствуют тифлокомпьютеры с брайлевским дисплеем и обычной либо брайлевской клавиатурой — соответственно серии BrailleNote Apex BT и BrailleNote Apex QT. Кроме того, существуют аппараты с исключительно голосовым выводом — VoiceNote Apex BT (с брайлевской клавиатурой) и VoiceNote Apex QT (с клавиатурой QWERTY). По образцу одного из персональных помощников HumanWare некоторое время выпускался и российский тифлокомпьютер Syscom.

Одним из самых компактных устройств подобного рода считается BrailleNote PK от компании Pulse Data International. При размерах 174 ×92×32 мм и весе около 450 граммов этот компьютер оснащен дисплеем Брайля на 18 ячеек, как и более его крупные «собратья».

Тифлокомпьютер PAC Mate QX 400

Рис. 4.6. Тифлокомпьютер PAC Mate QX 400

Цены на тифлокомпьютеры довольно высоки. Это обусловлено, в первую очередь, тем, что в них устанавливаются дорогостоящие брайлевские дисплеи. Например, компьютеры серии PAC Mate стоят около 2500 долларов. В российской действительности тифлокомпьютеры чаще всего приобретают в образовательные учреждения и библиотеки для незрячих. Однако такие устройства встречаются и в личном пользовании.

4.3. Программы экранного доступа для Windows

Роль программ экранного доступа — «промежуточное звено» между интерфейсом Windows и приложений с одной стороны, и драйверами брайлевских дисплеев и клавиатур, программ синтеза речи — с другой. Смысл в том, чтобы незрячий пользователь мог с помощью слуха и осязания ориентироваться в тех объектах, которые обычно выводятся на экран, запускать программы и управлять ими. В некотором роде эту задачу выполняет и встроенный в Windows экранный диктор, однако его возможности ограничены озвучиванием активных элементов интерфейса и чтением текста в активных окнах. Кроме того, программа игнорирует русский язык — из-за этого отечественным пользователям она не совсем подходит.

Так что основным решением остаются программы экранного доступа сторонних разработчиков. Таких существует немало, но на 2012 год наибольшей популярностью пользуется три из них:

- JAWS for Windows (www.freedomscientific.co) — 59 % пользователей;

- Window-Eyes (www.gwmicro.com) — 11,2 % пользователей;

- NVDA (www.nvda-project.org, www.ru.nvda-community.org) — 8,6 % пользователей.

Программа NVDA, в отличие от остальных, является полностью бесплатной и распространяется свободно. Кроме того, упомянем разработки компании Baum Reteg AG (www.baum.de, www.tibsev.org): VIRGO 4 и сменившую ее в настоящее время программу КОБРА.

4.3.1. Экранный диктор

Экранный диктор — стандартный инструмент Windows. Для его запуска выполните команду меню Пуск | Все программы | Стандартные | Специальные возможности | Экранный диктор (Start | Programs | Accessories | Accessibility). Откроется окно, в котором задаются основные настройки программы (рис. 4.7).

Экранный диктор Windows 7

Рис. 4.7. Экранный диктор Windows 7

Экранный диктор всегда озвучивает текст, отображаемый на экране. Обычно в этом случае для навигации пользуются клавиатурой: клавишами со стрелками, клавишей <Tab> и др. Когда на рабочем столе или в окне программы выбран какой-либо элемент (значок, кнопка, поле ввода, переключатель, пункт меню и т.п.), экранный диктор произносит название этого элемента и содержимое всплывающей подсказки (если таковая предусмотрена для выбранного объекта).

По умолчанию в окне настроек установлены флажки Эхо нажатий клавиш пользователем и Объявлять системные сообщения. Это значит, что экранный диктор будет произносить названия всех нажимаемых клавиш, а также озвучивать сообщения, появляющиеся в области уведомлений или в диалоговых окнах на рабочем столе.

Как и с другими голосовыми компонентами, интегрированными в Windows, с экранным диктором связана весьма досадная проблема — он работает лишь в нескольких языковых локализациях системы. Русской среди них, к сожалению, нет.

Так что нужно либо устанавливать английскую (немецкую, французскую...) версию системы и пользоваться распознаванием речи и озвучиванием интерфейса на этом языке, либо забыть о таких прекрасных функциях и обратиться к программам сторонних разработчиков.

Жизнь показывает, что первый вариант для подавляющего большинства наших соотечественников неприемлем. Зрячий пользователь, переходя на иноязычную (например, английскую) версию Windows, начинает ориентироваться в командах и кнопках не столько по их названиям и подписям, сколько по их расположению и аналогии. Если же воспринимать элементы управления исключительно на слух, да еще и на чужом языке, задача усложняется многократно. Самого по себе знания иностранного языка здесь недостаточно. Перевод названий команд и элементов управления далеко не буквален и не однозначен. Фактически систему нужно осваивать с самого начала, и делать это с англоязычными, например, самоучителями или помощниками.

Кроме того, стандартный экранный диктор не будет озвучивать текст на русском языке в окнах приложений. Таким образом, выбор почти неизбежно падает на одну из программ сторонних разработчиков.

4.3.2. Программа JAWS для Windows

JAWS расшифровывается как Job Access With Speech, доступ к действиям с помощью речи. Разработку этой программы для людей с ослабленным зрением начала в 1989 года группа незрячих и слабовидящих программистов, которая с 2000 года составляет ядро компании Freedom Scientific (www.freedomscientific.com).

Компания Freedom Scientific выпускает очередные версии программы сначала на английском языке (англоязычный интерфейс и английский языковой пакет). Спустя несколько месяцев на официальном сайте Freedom Scientific публикуются дистрибутивы для немецкого, французского и испанского языков. Также на официальном сайте компании доступны голосовые пакеты для многих языков, включая русский.

Полным же переводом программы на другие языки (локализацией) занимаются компании-дистрибьюторы. В России это, например, компания «Элита Групп» (www.elitagroup.ru, www.best4you.ws). Ранее локализацию JAWS для Windows выполняла и компания «Элек.Жест» (www.elecgeste.ru). Как правило, от выхода новой версии на английском языке до ее локализации проходит примерно год.

Кроме того, существуют неофициальные «русификации» — их создают программисты, многие из которых сами являются инвалидами по зрению и пользуются JAWS. Они же предлагают различные дополнения (скрипты, модули), предназначенные для улучшения работы JAWS с популярными в России приложениями. Назовем некоторые ресурсы, посвященные таким любительским локализациям, а также обсуждению настройки и использования программы:

- www.wecrasoft.16mb.com — оптимизация и настройка JAWS, NVDA, Cobra, других синтезаторов речи, полезные программы, русификаторы, скрипты;

- www.tyflo.narod.ru — сайт и форум по программам экранного доступа;

- subscribe.ru/catalog/comp.soft.others.jfwrus — рассылка по использованию JAWS на русском языке.

Программа JAWS платная. Без указания действительной лицензии и активации через Интернет программа работает в демонстрационном 40-минутном режиме — для каждого следующего запуска JAWS компьютер нужно перезагружать. В России и странах СНГ распространением лицензий занимается компания «Элита Групп» и интернет-магазины. Цена лицензии в России составляет порядка 18 тыс. руб. Дистрибутив можно заказать на лазерном диске либо скачать с сайта «Элита Групп» (www.best4you.ws).

В общем-то, установить JAWS незрячий пользователь может самостоятельно. При установке с лазерного диска или с жесткого диска компьютера сразу запускается «голосовой движок», и звучат пояснения и инструкции о дальнейших действиях. Тем не менее лучше, если в установке и начальной настройке поможет зрячий человек, уже знакомый с этой программой и документацией к ней.

Для первого запуска нажмите сочетание клавиш <Win>+<R>, чтобы открылось диалоговое окно Выполнить. Введите команду JAWSX (где X — номер версии, например, 13) и нажмите клавишу <Enter>. Откроется окно мастера запуска JAWS. По умолчанию параметры уже установлены так, чтобы программа JAWS автоматически запускалась при каждом входе пользователя в систему. Поэтому просто нажимайте клавишу <Enter>, чтобы подтвердить заданные настройки.

Сведения о работе с программой можно почерпнуть из ее справочной системы. В официальной русской версии справка тоже переведена на русский язык, поэтому она и становится основным самоучителем и руководством. Для запуска справки JAWS нажмите сочетание клавиш <Ins>+<J>.

В левой части окна справочной системы JAWS показано ее содержание. Оно состоит из нескольких книг и страниц. Каждая книга содержит страницы — это разделы справки. Для перемещения по содержанию используйте клавиши со стрелками. Стрелка вправо открывает книгу, и вы переходите к ее страницам. Чтобы закрыть книгу, нажмите стрелку влево.

Всю информацию программа проговаривает голосом. То же самое выводится и на брайлевский дисплей, если таковой подключен к компьютеру.

Чтобы отобразить текст выбранной страницы (раздела), нажмите клавишу <Enter>, а затем нажмите клавишу <F6> для перехода в окно раздела. Для возврата к содержанию нажмите снова клавишу <F6> или клавиатурную комбинацию <Alt>+ +<C> — чтобы вернуться к содержанию любого раздела справочной системы. Для переключения между вкладками справочной системы (Предметный указатель, Поиск, Глоссарий) используйте сочетание клавиш <Ctrl>+<Tab>.

Контекстно-зависимая справка JAWS выдает информацию о назначении и использовании элементов управления в диалоговых окнах и т.п. Для ее вызова перейдите к тому элементу управления, справку по которому хотите получить, и нажмите клавиатурную комбинацию <Ins>+<F1>.

Справка по «горячим клавишам» предоставляет быстрые подсказки по клавиатурным командам. Чтобы активировать ее, нажмите клавиатурную комбинацию <Ins>+<H>. Программа JAWS определяет, какое приложение используется в данный момент, и автоматически выдает справку по командам, применимым к этому приложению.

В справочной системе JAWS есть разделы, посвященные работе со многими популярными приложениями. Они содержат общую информацию о приложении, используемых в нем командах JAWS, советы по началу работы и полезные советы. Когда вы работаете в какой-либо прикладной программе, быстрое двойное нажатие клавиатурной комбинации <Ins>+<F1> открывает раздел справки JAWS для текущего приложения.

Еще одна справочная функция — подсказки по клавиатурным сокращениям JAWS. Она предоставляет информацию о комбинациях клавиш во время работы в любом приложении. Чтобы активизировать подсказки, нажмите клавиатурную комбинацию <Ins>+<1>. При этом JAWS произнесет: справка по клавиатуре включена. Нажмите любую комбинацию клавиш, и будет озвучено описание данной команды. Для получения более подробной подсказки, удерживая нажатой первую клавишу или первые клавиши этой комбинации, быстро нажмите два раза последнюю клавишу.

Работа с JAWS строится по тому же принципу, что и во всех программах экранного доступа. На рабочем столе, в меню и диалоговых окнах, окнах приложений программа озвучивает и выводит на брайлевский дисплей названия и описания элементов. Управление тем, что следует зачитывать, осуществляется с помощью «горячих клавиш» — программа может перечислять по очереди все элементы активного окна или озвучивать только выбранное.

В настройках JAWS (меню Утилиты | Центр настроек) в категории Информативность речи задается степень детализации сообщений. Высший уровень информативности подходит начинающим пользователям — программа произносит все доступные сведения о каждом элементе, включая сообщения контекстной справки. Наоборот, на низшем уровне, предназначенном для опытных пользователей, озвучивается лишь самый необходимый минимум сведений.

В окнах браузеров и редакторов JAWS озвучивает текст в рабочей области окна. Для перемещения курсора по тексту используются клавиши со стрелками. Сочетания клавиш JAWS указывают, как следует читать текст. Для этих самых востребованных команд удобно пользоваться цифровым блоком в правой части клавиатуры. Например:

<Ins>+<↓> (цифра 2) — читать все;

<Ins>+<↑> (цифра 8) — читать текущую строку;

<Ins>+<Home> (цифра 7) — читать до курсора;

<Ins>+<Page Up> (цифра 9) — читать от курсора;

<Ins>+<Page Down> (цифра 3) — читать нижнюю строку окна;

<Ins>+<End> (цифра 1) — читать верхнюю строку окна.

Из браузеров JAWS лучше всего взаимодействует с Internet Explorer версии 7 и выше. На веб-страницах JAWS использует виртуальный курсор, позволяющий перемещаться по странице так же, как по документу в текстовом редакторе.

Когда курсор наведен на изображение, произносится замещающий текст (по общепринятым правилам, веб-мастер должен предусмотреть в коде страницы такой текст с кратким описанием рисунка). Однако в JAWS встроен модуль распознавания символов. Если на рисунке изображен какой-либо текст, программа старается распознать его и прочитать голосом (вывести на брайлевский дисплей).

Попадая при просмотре веб-страниц на ссылки, JAWS произносит слово: ссылка. Чтобы перейти по ней, нажмите клавишу <Enter>. Чтобы вернуться на предыдущую страницу, нажмите клавиатурную комбинацию <Alt>+<←> или клавишу <Backspace>. Чтобы вновь перейти на следующую страницу, нажмите клавиатурную комбинацию <Alt>+<→>.

Для быстрой навигации внутри веб-страницы используются особые клавиатурные команды — они состоят всего из одной буквы. Например, нажатие клавиши <T> перемещает курсор в ближайшую таблицу, клавиши <F> — в форму, клавиши <V> — на посещенную ссылку, клавиши <H> — на заголовок. Чтобы перейти к предыдущему аналогичному элементу, нажимайте эти клавиши вместе с клавишей <Shift>.

На веб-страницах JAWS может составлять списки информации: перечислять ссылки, заголовки или поля форм. Чтобы услышать общий список элементов, нажмите клавиатурную комбинацию <Ins>+<F3>. Для перечисления элементов только определенного рода предусмотрены отдельные команды:

<Ins>+<F7> — вывод списка всех ссылок на текущей странице;

<Ins>+<F6>— вывод списка всех заголовков на текущей странице;

<Ins>+<F5> — вывод списка всех полей форм на текущей странице.

Для выбора элемента внутри списка информации используйте клавиши со стрелками. Для перехода к нему нажмите клавишу <Enter>. Таким образом, JAWS по желанию пользователя создает воспринимаемую на слух структуру веб-страницы — ведь веб-дизайнеры всегда стараются структурировать материал, оформлять его в определенный макет.

При работе с формами (например, полями поиска, регистрации на сайте, создания сообщений на форуме и т.д.) JAWS использует Автоматический режим форм. Когда курсор находится на элементе формы, вы можете просто ввести текст в поле редактирования, выбрать элемент в комбинированном списке или установить флажок.

JAWS правильнее называть пакетом программ. Помимо собственно программы экранного доступа, голосовых модулей и драйверов брайлевских дисплеев, в него входят несколько приложений и большой набор учебных и справочных материалов.

FSReader — программа для чтения книг в формате DAISY. Таких книг еще издано не так уж много, а на русском языке они пока вообще наперечет. Но именно в этом виде представлены учебники по программе JAWS, и читать их предстоит с помощью FSReader. После установки программы в диалоговом окне открытия файлов по умолчанию выбрана как раз папка с руководствами JAWS, и это очень удобно для начала работы.

HJPad — текстовый редактор, весьма напоминающий WordPad (стандартный редактор Windows). Серьезное достоинство — встроенная проверка орфографии, так что HJPad может стать для вас основным рабочим редактором. Все необходимое в нем есть, но работать в HJPad на слух или с брайлевским дисплеем намного проще, чем, например, в Microsoft Word. Кроме того, этот редактор многократно приводится в качестве примера в учебных пособиях по JAWS. В нем есть встроенные заготовки различных диалоговых окон (меню Сервис | Примеры диалогов), на которых удобно осваивать приемы работы — они тоже подробно рассматриваются в учебнике.

Брайлевский просмотрщик (BViewer) — программа для отображения набираемого текста шрифтом Брайля. Результат выводится в строке на экране. В основном такой просмотрщик нужен инструкторам и преподавателям, помогающим в освоении JAWS.

Пакет JAWS считается лидером среди программ экранного доступа по нескольким причинам. Во-первых, это действительно продуманный до мелочей и тщательно выполненный продукт. Во-вторых, популярность JAWS поддерживает саму себя — на курсах для незрячих пользователей скорее будут предлагать освоение той программы, о которой достаточно много написано и которую чаще можно встретить на рабочих местах. Соответственно, работодатели ориентируются в первую очередь на ту программу, которая знакома многим пользователям. Из всех программ экранного доступа JAWS можно назвать наиболее профессиональным инструментом.

4.3.3. Кобра

Немецкая компания Baum Reteg AG (www.baum.de), более известная как производитель брайлевских дисплеев и тифлокомпьютеров, выпускает программу экранного доступа КОБРА (COBRA). Эта программа существует в трех вариантах: COBRA Braille (вывод на брайлевский дисплей и речевой вывод) COBRA Zoom (речевой вывод и экранная лупа) и COBRA Pro (все три способа вывода).

По набору функций КОБРА довольно близка к JAWS. Приемы работы с программой тоже в целом соответствуют тому, что было сказано о работе в JAWS: «горячие клавиши», виртуальный курсор в поддерживаемых приложениях и т.д. Возможности программы могут быть расширены за счет подключаемых модулей (скриптов на языке программирования Microsoft Visual Basic). Библиотека таких скриптов постоянно пополняется. Модули позволяют эффективно использовать КОБРА в тех приложениях, поддержка которых не была заложена в программу изначально.

К достоинствам программы КОБРА следует отнести поддержку русского языка «сразу от разработчиков». Все необходимые файлы включены в стандартный дистрибутив, и язык предлагается выбрать в начале установки.

Интересная дополнительная функция программы — монитор мобильного телефона (ММТ). Когда к компьютеру подключен по USB мобильный телефон, незрячий пользователь может читать и писать SMS, просматривать и редактировать записи адресной книги телефона.

4.3.4. Window-Eyes

Window-Eyes — многофункциональное средство экранного доступа от компании GW Micro (www.gwmicro.com). В США эта программа уступает по числу пользователей только JAWS.

Однако для русскоязычных пользователей основная проблема — отсутствие поддержки родного языка. Хотя в 2011 году было объявлено о планах перевода программы на русский язык, среди 15 существующих локализаций его пока нет. Кроме того, работающий в Window-Eyes синтезатор голоса Eloquence также не поддерживает русский язык. По этой причине программа Window-Eyes распространения в России пока не получила.

4.3.5. Проект NVDA

NVDA расшифровывается как NonVisual Desktop Access, невизуальный доступ к рабочему столу. Подобно Linux, LibreOffice и другим бесплатным программам с открытым исходным кодом — это полностью свободный некоммерческий проект (www.nvda-project.org).

Программа NVDA ориентирована в основном на речевой вывод, хотя работа с брайлевскими дисплеями в ней тоже предусмотрена. В настоящее время интерфейс NVDA переведен более чем на 20 языков, среди которых есть русский и украинский. Все языковые версии входят в единый дистрибутив. В начале установки NVDA автоматически определяет язык системы, и в дальнейшем использует его как основной. В дистрибутив включен свободный, многоязычный синтезатор ESpeak. Он поддерживает более 30 языков, в том числе и русский на базовом уровне.

Помимо дистрибутива для установки на компьютер, разработана и портативная версия NVDA. В этом случае программа просто записывается на флешку или лазерный диск и запускается с такого носителя на любом компьютере.

Функции NVDA позволяют выполнять без зрительного контроля практически все задачи, с которыми сталкивается пользователь компьютера:

- просмотр веб-страниц в Internet Explorer и Mozilla Firefox;

- работа с документами в редакторах WordPad или Microsoft Word;

- создание электронных таблиц в Microsoft Excel;

- отправка и получение почты в Outlook Express;

- запуск приложений из командной строки;

- управление компьютером с помощью меню кнопки Пуск, Проводника Windows, панели управления и других стандартных средств операционной системы;

- обмен сообщениями в Miranda Instant Messenger, ICQ, QIP, работа с программой Skype.

В открытых проектах часто возникают совершенно новые решения. В NVDA есть целый ряд функций, которые еще не появились в проприетарных программах экранного доступа. Например, это объектная навигация — объекты рабочего стола представляются как древовидная иерархическая структура (примерно как пункты во вложенных меню или дерево файлов и папок в Проводнике Windows). Пользователь с помощью клавиш или мыши может перемещаться по такому дереву, а NVDA озвучивает названия объектов, их свойства, положение в иерархии и позволяет выполнять с объектами различные действия.

В NVDA реализована поддержка работы с мышью. При этом положение указателя мыши на экране контролируется с помощью звуков. При наведении мыши на объект он озвучивается. Для озвучивания индикаторов выполнения в прикладных программах и Проводнике Windows NVDA использует тоновые сигналы — чем ближе полоса индикатора к 100 %, тем выше тон сигнала.

В наших условиях бесплатная программа NVDA становится наиболее доступным, если не основным решением для домашних пользователей. Помимо основного, англоязычного, сайта, поддержка продукта осуществляется и на сайте русскоязычного сообщества программы NVDA (ru.nvda-community.org).

4.4. Синтез речи в прикладных программах

Программы экранного доступа предоставляют альтернативный доступ к системе в целом, начиная с рабочего стола и меню кнопки Пуск и заканчивая отдельными приложениями. На то, чтобы уверенно освоить такие программы, требуются месяцы упорного труда и регулярное повторение пройденного.

Однако далеко не всем пользователям с ограничениями по зрению интересен полный контроль над компьютером. Кроме всякой иронии — среди моих знакомых со 100-процентным зрением многие вполне осознанно ограничивают свое общение с компьютером всего двумя-тремя программами. Например, это браузер, чтобы просматривать новости и прогноз погоды, пасьянс и «читалка» для книг. Если вдруг понадобится сделать что-то еще, они обращаются за помощью к своим «домашним компьютерщикам» — дело здесь не в зрении, а в привычках и интересах.

Согласитесь, что и незрячий человек для такого использования компьютера вряд ли станет приобретать и осваивать программу экранного доступа. Скорее всего, он лишь захочет, чтобы какие-либо браузер и программа для чтения электронных книг озвучивали текст.

Есть разница между английским словом Accessibility и тем, как обычно переводят его на русский язык: «специальные возможности» или «вспомогательные технологии». В какой-то мере это отражает подход к решению проблемы ограниченных возможностей.

Буквально, Accessibility означает «доступность» — без участия зрения или при других ограничениях человек самостоятельно делает на компьютере почти все то же, что и другие пользователи. Применительно к ограничениям по зрению, такую возможность дают только программы экранного доступа. Они повторяют практически весь интерфейс системы и приложений невизуальными средствами.

Если же говорить о «вспомогательных технологиях», сразу представляется немного другое. Например, они позволяют незрячему человеку читать текст в окне приложения, но не более того. Чтобы найти и получить информацию из Интернета, да и просто открыть какой-либо файл на диске компьютера, таких «специальных возможностей» бывает недостаточно.

Здесь и ощущается различие между «доступностью» и «специальными возможностями». Тем не менее, при участии и поддержке близких человек все равно расширяет свои возможности с помощью компьютера.

4.4.1. Синтез речи в Microsoft Windows

Чтобы понять, как работают речевые технологии (и почему они могут не работать), обратимся к некоторым техническим подробностям. В озвучивании текста всегда участвуют несколько компонентов.

SAPI (Speech Application Programming Interface, или Speech API) — программные библиотеки, входящие в состав операционной системы Microsoft Windows. Они отвечают за взаимодействие самой ОС и различных приложений с программами синтеза и распознавания речи.

К настоящему времени актуальными являются две версии Speech API: SAPI 4 и SAPI 5. Обе эти библиотеки самодостаточны, но друг другу не мешают и могут работать на одном компьютере. Библиотеки SAPI 4 входили в состав ОС Windows 98 и Windows 2000. В операционных системах Windows XP, Windows Vista и Windows 7 обычно уже установлены библиотеки SAPI 5. При необходимости дистрибутивы SAPI 4 и SAPI 5 можно скачать с сайта компании Microsoft и установить самостоятельно.

Голосовой движок (речевой синтезатор, голос) — компонент, отвечающий непосредственно за синтез голоса. За основу берутся записи реального голоса живого диктора. Потом из них «нарезаются» отдельные звуки (фонемы), а уже из этих фрагментов программа в процессе чтения «собирает» произносимые слова. Каждый голосовой движок привязан к определенному языку, и тексты, написанные на другом языке, он не станет озвучивать ни в коем случае.

Нужен и третий компонент — программа-оболочка, которая взаимодействует с пользователем. В оболочке задаются «горячие клавиши», она получает команды от пользователя, а также служит для выбора и настройки установленных голосовых движков.

Голосовые движки, а также программы-оболочки, создаются в расчете на определенную версию SAPI. Существуют оболочки, которые одинаково способны работать и с SAPI 4, и с SAPI 5. Таким образом, на компьютере должны быть установлены совместимые между собой оболочка, голосовой движок и SAPI.

Конечно, такая схема и деление условны. Часто голосовые движки поставляются вместе с оболочками для них — из дистрибутива устанавливаются оба компонента сразу. Важно лишь, чтобы в системе присутствовала необходимая версия SAPI. В дистрибутивы программ экранного доступа обязательно входят и голосовые движки, и системные компоненты — когда на компьютере, например, отсутствуют какие-то библиотеки SAPI, они будут доустановлены автоматически.

При этом можно устанавливать несколько голосовых движков. Программы экранного доступа и другие приложения с поддержкой речевого вывода будут использовать любые совместимые с ними голоса — выбор и переключение осуществляются в настройках программы.

Голосовые движки (речевые синтезаторы) обычно называют человеческими именами. Разработкой их занимаются несколько компаний — например, Acapela Group (www.acapela-group.com), Nuance – Loquendo (www.loquendo.com) и др.

В Windows 7, в том числе и в русскую версию, в качестве стандартного компонента входит модуль синтеза английской речи Microsoft Sam. Для нас основной интерес представляют русские голоса. Их не так уж много:

- русский голосовой модуль SAPI 4 от Lernout & Hauspie;

- «Николай» (Nicolai, Digalo) — разработка Acapela Elan Speech Cube;

- Katerina — разработка ScanSoft – RealSpeak;

- «Алёна» (Alyona) — разработка Acapela Group;

- Olga — разработка Loquendo.

За исключением первого, все остальные синтезаторы платные. Их можно приобрести у разработчиков как самостоятельные продукты. Эти же голоса используются в составе других коммерческих приложений, например, программ экранного доступа.

Кроме того, для Windows 7 и Windows 8 разработана платформа распознавания и синтеза голоса Microsoft Speech Platform — спецификация, которая со временем должна прийти на смену SAPI. Платформа включает в себя серверную и клиентскую части, а также большой набор голосов и модулей распознавания речи. Среди голосов есть и русский (Elena).

Предполагается, что библиотеки и спецификации Microsoft Speech Platform разработчики будут использовать при создании новых приложений. В настоящий же момент поддержка голосов платформы реализована в программе экранного доступа NVDA (см. разд. 4.3.5) и программе «Балаболка» (см. разд. 4.4.4).

4.4.2. Чтение электронных книг вслух

Почти во всех программах-«читалках», которые мы обсуждали в главе 3, преобразование текста в речь в той или иной мере решено. Для управления в них предусмотрены «горячие клавиши», а озвучивание текста осуществляется либо встроенными средствами, либо с помощью подключаемых синтезаторов речи.

Лучше всего подходят для чтения вслух программы ICE Book Reader и CoolReader. В этих приложениях реализована поддержка SAPI 4 и SAPI 5, работают они практически со всеми голосами.

Главная проблема в том, чтобы запустить программу и открыть в ней нужную книгу на нужном месте. Здесь уместно вспомнить, что «читалки» создавались в расчете на зрячих читателей, и речь в них — всего лишь дополнительная функция. Скорее всего, посторонняя помощь все-таки понадобится. Вот возможное решение:

- создать ярлык программы на рабочем столе и назначить ему сочетание клавиш быстрого вызова или связать запуск программы с одной из дополнительных клавиш на мультимедийной клавиатуре;

- запустить программу, открыть в ней нужную книгу и закрыть программу.

После этого незрячий пользователь сможет в любой момент самостоятельно вызвать «читалку» с помощью сочетания клавиш. Программа запустится уже с последней открывавшейся в ней книгой. При этом книга будет открыта на том месте, в котором было закончено чтение в прошлый раз.

С помощью «горячих клавиш» программы можно будет запускать процесс чтения вслух, ставить его на паузу, пролистывать страницы вперед и назад. Посторонняя помощь понадобится лишь тогда, когда читатель захочет открыть другую книгу.

4.4.3. Адаптация браузеров

С браузерами все обстоит не так благополучно, как с электронными книгами. Зачитывать вслух текст, загруженный в свое окно или скопированный в буфер обмена, умеют многие программы. В общем-то, ничто не мешает скопировать в буфер обмена и все содержимое веб-страницы, открытой в любом браузере, — нажать комбинацию клавиш <Ctrl>+<A> (выделить все), а затем <Ctrl>+<C> (копировать). Программа наподобие «Балаболки» (см. разд. 4.4.4) без проблем прочитает вслух все, что в настоящий момент находится в буфере обмена, либо то, что вы вставите в ее рабочее окно из буфера обмена комбинацией клавиш <Ctrl>+<V>.

Однако задача доступности веб-страниц гораздо сложнее. Текст озвучить можно, но как быть со ссылками и полями, например, поиска? А ведь основной смысл ресурсов Интернета заключается как раз в возможности поиска и переходов по ссылкам! Во-первых, необходимо обозначить голосом, что находящийся в тексте страницы фрагмент — ссылка или поле ввода, во-вторых, у пользователя должна быть возможность перейти по этой ссылке, заполнить поле и т.п.

Такими функциями в полной мере наделены программы экранного доступа. Существуют ли более простые средства для невизуального обращения к ресурсам Интернета? Попытки создать дополнения (плагины) к браузерам или некоммерческие программы для доступа в Интернет без участия зрения предпринимались неоднократно. Например, это Голосовой браузер (govorilovo.narod.ru), надстройки Aloud4ie, WebSpeech (webspeech.soft-ware.net) и Page-Reader bar (www.text-reader.com) для Internet Explorer, Accessibar (accessibar.mozdev.org) для Firefox и др.

К сожалению, почти все эти проекты давно заброшены, а с современными версиями браузеров и в Windows 7 они практически не работают. Да и во времена своего развития упомянутые приложения и надстройки так и не были доведены до приемлемого качества.

Другие программы, например TextAloud (www.nextup.com) или CyberBuddy (www.thecyberbuddy.com), ориентированы на зрячих пользователей. Хотя вебстраницы зачитываются вслух, для навигации все равно необходим визуальный контроль. Добавим к этому проблемы с поддержкой русского языка. Скажем так — опытный компьютерщик, скорее всего, добьется относительно устойчивой работы многих приложений с русскоязычными веб-страницами и русскими голосами, но большинство «обычных» пользователей после нескольких попыток от такой затеи откажутся.

Что же из существующего в 2012 году можно рекомендовать? По личному опыту я остановился на двух вариантах.

Программа SAToGO

Программа SAToGO (System Access to Go) от компании Serotek (www.serotek.com) представляет собой веб-приложение. На компьютере запускается небольшая клиентская часть программы, а основная обработка (в том числе синтез голоса) выполняется на сервере в Интернете.

Компания Serotek выпускает целый ряд продуктов для пользователей с ограниченными возможностями. Большинство программ платные, хотя и с ограниченным по времени бесплатным пробным периодом (Trial). Однако SAToGO — бесплатное приложение, работающее с браузерами Internet Explorer 8 и 9.

Запустите Internet Explorer и перейдите по ссылке www.satogo.com/en/. Браузер предложит запустить или сохранить небольшой исполняемый файл SAToGo-en.exe. Сохраните файл, например на рабочий стол, и запустите его.

Примечание. Можно и не сохранять файл на диск, а каждый раз запускать его непосредственно из Интернета. Поскольку для работы SAToGO необходимо, чтобы сначала был открыт браузер, это тоже удобный способ. Назначьте адрес www.satogo.com/en/ домашней страницей Internet Explorer. В дальнейшем незрячий пользователь, запустив браузер с помощью сочетания клавиш, сможет просто нажать клавишу <Enter> два раза — программа SAToGO загрузится и запустится, а далее он введет имя и пароль, ориентируясь на ее голосовые подсказки.

При запуске программы открывается диалоговое окно (рис. 4.8). В нем необходимо ввести данные регистрации (уточним: Account number — имя пользователя, а не номер, и PIN — пароль, заданный при регистрации) и нажать кнопку Log In (Войти).

В первый раз, пока у вас еще нет учетной записи в службе Serotek, нажмите кнопку Create a Free Account (Создать бесплатную учетную запись).

Откроется форма регистрации. Внесите в нее сведения о себе (имя, адрес электронной почты и т.д., придуманные вами имя учетной записи и пароль). Нажмите кнопку Register (Зарегистрироваться). На указанный адрес электронной почты будет выслано письмо со ссылкой для подтверждения и завершения регистрации.

После этого вновь запустите браузер и файл SAToGo-en.exe. В окне приветствия (см. рис. 4.8) укажите данные своей учетной записи и нажмите кнопку Log In (Войти). Откроется ряд диалоговых окон с озвученным текстом. В них предлагается согласиться с лицензионным соглашением, а также установить другие продукты Serotek. Выберите ссылку Use SA to Go free of charge (Использовать SA to Go бесплатно).

Окно запуска SAToGO

Рис. 4.8. Окно запуска SAToGO

В области уведомлений панели задач появится значок SAToGO. При щелчке на нем правой кнопкой мыши открывается меню. Чтобы получить справку, выберите в нем пункт Help and Tutorials (Помощь и руководства).

Принцип работы в SAToGO тот же, что и в программах экранного доступа, рассмотренных ранее. «Горячие клавиши» позволяют зачитывать содержимое страницы, переходить от ссылки к ссылке, к полям ввода и т.д. Полный список клавиатурных сокращений приведен в справке. По существу, SAToGO и является программой экранного доступа, только со значительно «урезанными» функциями, и выполняется эта программа по большей части на серверах службы Serotek. На ваш компьютер «приходит» уже готовый звук — это чем-то напоминает интернетрадио.

Для настройки SAToGO выберите в меню пункт Preferences (Настройки). Откроется диалоговое окно настроек (рис. 4.9).

Основная проблема при работе с SAToGO — поддержка русского языка. Бесплатная программа работает только с английским языком. Так что сразу после установки она станет озвучивать на страницах только слова на английском, а при попадании на слова на другом языке будет произносить Unreadable Text (нечитаемый текст).

Первое решение — приобрести лицензию и начать пользоваться платной версией, например, System Access To Go или System Access Standalone. В них доступны речевые модули для разных языков, в том числе и русского.

Второй вариант — воспользоваться для синтеза речи голосовым движком, установленным на локальном компьютере. Предварительно установите какой-либо синтезатор русской речи SAPI 5, например «Алёна» или «Николай».

Настройка SAToGO

Рис. 4.9. Настройка SAToGO

Затем настройте SAToGO на работу с синтезатором, установленном на вашем компьютере. Для этого в окне настроек щелкните на пункте Text-to-Speech Preferences (Настройки преобразования текста в речь). В открывшемся окне настроек речи в раскрывающемся списке Text-to-Speech Engine (Голосовой движок) выберите Microsoft Speech API 5, а в списке Voice (Голос) — установленный в вашей системе русский речевой движок.

Онлайн-переводчик ImTranslator

ImTranslator (www.imtranslator.net) — дополнение (плагин) к браузеру Mozilla Firefox и надстройка для браузера Internet Explorer. Это бесплатный многофункциональный онлайн-переводчик, который работает более чем с 50 языками. В нашем случае важно, что ImTranslator включает в себя и многоязычный синтезатор речи.

После установки дополнения в контекстных меню на веб-страницах появляется пункт ImTranslator TTS (voice): (текст-в-речь), и выделенный текст зачитывается вслух. Чтение можно запустить и с помощью сочетания клавиш <Ctrl>+<Alt>+<V>. Правда, о доступности в полном смысле здесь говорить не приходится — текст сначала нужно выделить, да и ссылки плагин никак не обозначает.

* * *

Таким образом, при просмотре Интернета альтернативы программам экранного доступа если и есть, то весьма ограниченные. Главное затруднение состоит в том, что для выбора ссылок, ввода адресов все равно может понадобиться помощь зрячего человека.

4.4.4. Программа «Балаболка»

«Балаболка» (www.cross-plus-a.ru) — один из самых известных и удачных проектов по синтезу русской речи. Это программа-оболочка, работающая практически со всеми существующими голосовыми движками.

Основное назначение программы — чтение вслух файлов различных форматов. Программа поддерживает все наиболее популярные типы файлов, в которых обычно публикуются электронные книги: CHM, DjVu (с распознанным текстовым слоем), DOC, DOCX, EPUB, FB2, HTML, LIT, MOBI, ODT, PDF, PRC и RTF.

Откройте нужный файл командой меню Файл | Открыть... Текст из этого файла отобразится в рабочей области окна программы (рис. 4.10).

Окно программы «Балаболка»

Рис. 4.10. Окно программы «Балаболка»

Над рабочей областью расположена панель управления голосами с тремя вкладками: SAPI 4, SAPI 5 и Microsoft Speech Platform. На каждой из вкладок в раскрывающемся списке можно выбрать голос, который будет использовать программа. Для настройки выбранного голоса (скорости чтения, тембра и др.) служат кнопки и регуляторы панели.

Сам процесс чтения вслух управляется командами меню Речь, кнопками на панели инструментов, а также «горячими клавишами»: прочесть вслух — <F5>, пауза — <F6>, прочесть текст из буфера обмена — <F9> и т.д.

В нашем случае наиболее полезный вариант применения программы — копировать текст из различных окон в буфер обмена, чтобы затем прочитать его вслух. Примечательно, что скопированное даже не обязательно куда-то вставлять — при нажатии клавиши <F9> «Балаболка» озвучивает текст, находящийся сейчас в буфере обмена!

Программой «Балаболка» можно пользоваться и для чтения книг. В этом случае достаточно, чтобы кто-то открыл в программе файл с текстом, а далее процессом чтения незрячий пользователь сможет управлять самостоятельно с помощью «горячих клавиш».

Кроме всего прочего, в программу встроена экранная лупа (быстрый вызов клавишей <F2>). Размер ее окна и кратность увеличения можно менять произвольно.

4.5. Говорящий Linux

Операционные системы семейства Linux хорошо подходят людям с ограничениями по зрению. Как правило, незрячий пользователь в первую очередь ценит в компьютере простоту управления и стабильность. Он привыкает к определенной последовательности действий при работе с программами, а самих приложений обычно не так уж много: браузер, программа обмена сообщениями, клиент электронной почты, текстовый редактор, проигрыватель, «читалка» электронных книг. Какие-либо новые незнакомые программы такой пользователь устанавливать избегает.

Разумеется, нужен доступный интерфейс. Скорее всего, речевой — дисплей Брайля большинству из нас не по карману. В этом смысле оптимальным становится законченное решение на основе Linux — сама операционная система с минимумом «украшений», программа экранного доступа и набор необходимых прикладных программ.

Известный аргумент против Linux — то, что это «незнакомая большинству людей система», — в данном случае отпадает. Если человек раньше не работал или почти не работал с компьютером — не все ли равно, какую систему ему осваивать? Тем более, популярные самоучители и справка Windows рассчитаны на зрячих, а при освоении компьютера через клавиатуру и речевой вывод их эффективность под вопросом. Зато методических разработок по невизуальной работе в Linux ничуть не меньше, чем для Windows (а точнее, мало и тех, и других).

Если человек потерял зрение, уже будучи пользователем Windows, ему приходится осваивать систему практически заново. Пригодятся только базовые понятия («открыть», «сохранить», «файл», «выделить», «копировать» и т.д.), а в этом логика Windows и Linux почти идентична. То, что в Linux широко используется консоль (командная строка), для незрячего пользователя является только плюсом.

Как уже сказано, в большинство стандартных дистрибутивов Linux включен пакет Orca (см. разд. 3.1.4). Фактически, в нем присутствуют все черты программы экранного доступа: озвучивание элементов управления и текста, вывод на брайлевские дисплеи. Кроме того, в стандартный набор входит синтезатор eSpeak. Так что настройка, например, Ubuntu для работы незрячего пользователя вполне реальна — нужно только установить необходимые пакеты и, возможно, отредактировать некоторые файлы конфигурации.

Однако наибольший интерес представляют специальные дистрибутивы (сборки) Linux. В них все необходимые компоненты уже предустановлены и сконфигурированы. Более того, сам процесс установки или запуска Linux с лазерного диска с самого начала сопровождается речевыми комментариями. В результате с такой сборкой незрячий пользователь может работать самостоятельно, включая установку и настройку системы.

4.5.1. ALT Linux Homeros

Проект ALT Linux Homeros (homeros.altlinux.org) — ответвление дистрибутива ALT Linux, предназначенное для пользователей с ограничениями по зрению. Идея проекта заключается в том, что графический оконный интерфейс таким пользователям в принципе не нужен. Вместо этого основной рабочей средой выступает GNU Emacs.

Emacs — весьма своеобразная программа. Часто ее называют текстовым редактором, но возможности Emacs гораздо шире. Например, текст, вводимый в буфер (рабочую область), Emacs может интерпретировать как команды или скрипты.

Благодаря этому для Emacs разрабатываются пакеты с функциями полноценных приложений. Например, Gnus — клиент для чтения почты и новостей, org-mode — записная книжка. Существуют надстройки для создания и прослушивания музыки, общения через Jabber или IRC. Для Emacs создано столько приложений, что непосредственно из этого «текстового редактора» можно легко выполнять разнообразные задачи.

Кроме этого, Emacs позволяет переопределять практически любые клавиши — как глобально, так и для каждого основного режима в отдельности. Поэтому любому часто выполняемому действию можно назначить свободное сочетание клавиш.

Одним из наборов дополнений к Emacs является Emacspeak. Синтезом речи Emacspeak не занимается, а служит передаточным звеном между Emacs и синтезатором.

Исходные данные для синтеза речи должны направляться внешней программе, которая и будет осуществлять голосовой вывод. Таким исполнительным механизмом выступает связка из речевого сервера VoiceMan и синтезаторов RHVoice или ru_tts.

Поддержка русского языка в ALT Linux Homeros полная. Есть и русскоязычный интерфейс, и русский голос.

Прикладные задачи в этой сборке в основном «навешены» на программу Emacs. Некоторые из них целиком выполняются в среде Emacs, некоторые задействуют внешние приложения. Хотя главным является текстово-речевой интерфейс, часть программ выводит на экран графику. Например, пользователь может продемонстрировать кому-нибудь рисунки или мультимедиа, чтобы тот описал словами увиденное. Вот некоторые команды и функции ALT Linux Homeros:

- команда show-pdf — просмотр PDF-файла в полноэкранном режиме;

- команда show-movie — проигрывание видеоролика в полноэкранном режиме.

- команда show-photo — показ графических файлов в полноэкранном режиме;

- веб-браузер w3m — расширение Emacs;

- команда read-book выполняет чтение электронных книг из текстовых файлов на основе утилиты Textlus. Textlus зачитывает файлы вслух, позволяет выбрать синтезатор по желанию, может выводить прочитанное в файлы MP3, т.е. записывать аудиокниги. Для удобства в утилите предусмотрены поддержка закладок и составление списка книг для среды GNU Emacs;

- сервис управления медиапроигрывателем Musitorius — основа работы с мультимедиа. Проигрыватель воспроизводит музыку или аудиокниги, а Musitorius полностью управляет этим процессом и выдает дополнительную информацию о времени, закладках и т.п.

Дистрибутив ALT Linux Homeros записывается на лазерный диск или флеш-диск USB. Возможны два варианта его использования: запуск системы прямо со съемного диска (Live CD), либо установка системы на жесткий диск компьютера.

Работа в ALT Linux Homeros начинается с открытия главного меню. По умолчанию для вызова меню назначена клавиша <Win>. В заголовке открывшегося окна отображается текущее время и дата, а также уровень заряда батареи ноутбука. Перемещая курсор стрелками вверх и вниз, пользователь может получить эту информацию в речевом виде.

За информацией о дате и времени следуют пункты, позволяющие открыть папку с документами, каталог книг для чтения (из звуковых и текстовых файлов), календарь, менеджер съемных устройств хранения информации, почтовый клиент, веббраузер и т.д. При необходимости главное меню системы расширяется и настраивается.

Для быстрого вызова приложений и отдельных расширений Emacs служат «горячие клавиши». Клавиатурные сокращения сделаны предельно простыми, например, <F6> — адресная книга, <F7> — электронная почта, <F8> — браузер, <F9> — менеджер сменных носителей, <Shift>+<F5> — календарь.

Проект ALT Linux Homeros в настоящее время продолжает динамично развиваться. Другое дело, что для незрячего пользователя важна стабильность, чтобы обновление или переход на следующую версию не заставляли осваивать другие команды или новую организацию меню. В целом ALT Linux Homeros отвечает этому требованию. Еще одна важная черта проекта — последовательная и полная поддержка русского языка. В том числе, доступны документация и руководства на русском языке.

4.5.2. Vinux

Vinux (vinuxproject.org, vinux.org.uk) — дистрибутив для людей с ограниченными возможностями, основанный на Ubuntu Linux. В этой сборке используется более традиционный подход — графический интерфейс плюс программа экранного доступа.

Первая особенность Vinux заключается в устанавливаемом по умолчанию наборе прикладных программ и в том, что эти программы заранее сконфигурированы для лучшей доступности без зрительного контроля. Программой экранного доступа, как и в других дистрибутивах Linux, является Orca (см. главу 3). Среди приложений назовем BareFTP (клиент FTP), конвертор текстовых файлов в WAV-файлы

Gespeaker, Gwget (менеджер загрузок), файловые менеджеры PCManFM и Root File Browser, Smuxi (клиент IRC), почтовый клиент Thunderbird.

Кроме того, по умолчанию устанавливается пакет Speakup, который осуществляет речевой вывод из консольных приложений: почтового клиента Alpine, IRC-клиента Irssi, браузера Lynx, файлового менеджера Midnight Commander, средства управления пакетами Pdmenu. Текстовый (консольный) режим с невизуальным доступом через Speakup во многих случаях оказывается более устойчивым и эффективным, чем экранный доступ к приложениям в графическом режиме с помощью Orca.

Другое отличие Vinux от базовых дистрибутивов Ubuntu Linux — наличие различных голосовых движков, в том числе и русскоязычных (RHVoice, ru_tts, Cicero, Festival). Благодаря этому Vinux полностью поддерживает речевой вывод на русском языке.

Как и в случае с ALT Linux Homeros, дистрибутивы Vinux позволяют запускать систему без установки, устанавливать ее на винчестер как единственную или альтернативную вместе с Windows, а также запускать Vinux на виртуальной машине «внутри» Windows. «Портативные» варианты интересны тем, кто хочет опробовать Vinux на своем компьютере, не внося в его настройки каких-либо изменений.

* * *

Какой из двух дистрибутивов Linux выбрать? Как всегда в таких случаях ответ неоднозначен... Функциональность обеих систем находится примерно на одном и том же уровне. Скорее всего, на выбор повлияют люди, которые будут помогать пользователю в освоении системы. Помимо названных, существует еще и проект oralux.org (www.oralux.net). Правда, в последнее время активность его разработчиков не так заметна, а поддержка русского языка в стабильном дистрибутиве ограничена. Из-за этого для русскоязычных пользователей основными альтернативами остаются ALT Linux Homeros и Vinux.

Никто не ожидает, что тифлокомпьютер будет копировать графический интерфейс обычного цифрового помощника с «прикрученным поверх» речевым выводом. Точно так же на настольном компьютере система, в которой будет работать незрячий человек, не обязательно должна повторять оконное оформление Windows или Linux. В этом отношении концепция ALT Linux Homeros очень логична — это среда для работы без визуального контроля. Есть функция — например, обмен сообщениями электронной почты, и есть программное средство для ее реализации.

У человека, незрячего от рождения, в картине мира попросту нет места и даже аналогий графическому интерфейсу Windows или Linux. Зато он оперирует понятиями и словами. Здесь наиболее естественным как раз и будет консоль с речевым выводом. Это по определению невизуальный, словесный, интерфейс. Вместе с тем, он полностью доступен и зрячему инструктору или тифлопедагогу.

Возьмем и чисто экономический аспект. Лицензионное платное программное обеспечение компьютера для незрячего человека обходится примерно в 1000–1500 долларов. Существует бесплатная программа NVDA, но все равно остаются проприетарные голосовые движки и сама операционная система Windows. Использование Linux и открытого ПО решает проблему затрат в корне.

4.6. Мобильные телефоны и гаджеты

Мобильные устройства с каждым днем принимают на себя все больше «компьютерных» функций. С чисто технической точки зрения существенная разница между компьютером и каким-либо портативным цифровым устройством (телефоном, смартфоном, навигатором) определяется тем, что прикладные программы для компьютеров достаточно универсальны, а приложения для мобильных устройств разрабатываются под определенный круг аппаратных платформ.

В чем заключается адаптация мобильного телефона для людей с ограниченными возможностями? Сразу скажем о решении, которое в народе прозвали «бабушкофоном» (grannyphone). Это простой телефон с большими кнопками, текстовым дисплеем с крупными знаками и минимумом функций. Среди марок, известных в России, к «бабушкофонам» можно отнести Just5 (модели CP09, CP10 и др.), Voxtel (модель RX500), Fly (модель Ezzy), TeXet (TM-B100), Onext (Carephone 1).

Такие телефоны прямо адресованы пожилым людям. Дело не только в различимых кнопках, но и в том, что мобильник не отпугивает пользователя какими-то меню и настройками. Все предельно просто: есть кнопки с цифрами и кнопка вызова. Ничего лишнего!

Однако при значительных ограничениях по зрению «бабушкофон» проблему доступности не решает. А проблема эта сводится в основном к телефонной книге и возможности получать SMS. Самым простым и явным решением представляется синтез речи, и для многих мобильных платформ такие программы созданы. Для смартфонов (телефонов под управлением встроенных операционных систем) — это приложения соответствующих ОС. Телефоны с классической «телефонной» архитектурой адаптируются путем модификации прошивки или устанавливаемых Javaприложений.

4.6.1. Синтезаторы речи для Google Android

Операционная система Android широко используется на смартфонах и планшетных компьютерах. В стандартной конфигурации Android уже присутствуют компоненты, необходимые для преобразования текста в речь, но сами приложения должны устанавливаться отдельно.

Основной способ установки приложений — загрузка их из онлайн-магазина Google Play (ранее Android Market). Установку можно выполнить и без подключения к Интернету, копируя на устройство установочные пакеты (файлы с расширением apk).

Голосовое сопровождение действий (TalkBack) является стандартной функцией системы, хотя по умолчанию оно выключено. При включении голосового сопровождения устройство выдает голосовые подсказки, когда вы нажимаете на экран или перемещаетесь по меню с помощью кнопок.

Чтобы включить или отключить функцию TalkBack:

1. На главном экране или экране Приложения нажмите на значок Настройки.

2. Откройте Специальные возможности | TalkBack.

3. Установите переключатель TalkBack в положение Вкл. или Выкл.

4. Нажмите кнопку ОK.

Голосовое сопровождение включится сразу же после активации функции TalkBack. Вы услышите пояснения своих действий и уведомления о входящих звонках и сообщениях.

Стандартный голосовой движок системы — английский. Однако для Android разработан целый ряд речевых синтезаторов. Среди них есть, по крайней мере, пять русскоязычных.

Captain TTS Engine (www.tiflocomp.ru/download/dev/captaintts.apk) — свободно распространяемый синтезатор, пока находящийся на стадии тестирования. Отличается высокой скоростью речи. Из недостатков отмечено низкое качество речи и то, что этот синтезатор зачитывает длинные числа группами по 1, 2 или 3 цифры.

eSpeak TTS — некоммерческий синтезатор от сообщества разработчиков EyesFree Project (code.google.com/p/eyes-free). Преимущества этого голосового движка — высокая скорость работы и бесплатность. Качество речи относительно низкое, многие слова читаются по фрагментам.

Mobile Accessibility RU — коммерческий (69 евро) пакет приложений от компании Code Factory. Загрузка полной или 30-дневной демонстрационной версии осуществляется через Google Play. Десять приложений с упрощенными тексто® выми меню озвучиваются голосовым движком Nuance Vocalizer.

SVOX Classic TTS — голосовой движок от компании SVOX Mobile Voices (svoxmobilevoices.wordpress.com). С ним из магазина Google Play устанавливаются голоса, в том числе русские: «Катя» и «Юрий». Приложение платное — 100 руб. за каждый голос.

TTS Online — бесплатный онлайн-синтезатор, устанавливается через Google Play. Обработка данных и синтез голоса производится на сервере, поэтому для работы требуется постоянное подключение к Интернету.

Наиболее полное и законченное решение (но вместе с тем дорогостоящее) — Mobile Accessibility. В состав пакета входят программы управления звонками, телефонной книгой и контактами, чтения SMS, будильник, календарь, браузер, почтовый клиент Gmail. GPS-приложение предоставляет информацию о текущем местоположении. Еще два приложения пакета служат для быстрой настройки телефона и озвучивания сведений о его состоянии (заряде аккумулятора, количестве звонков и сообщений и т.д.). Вместе эти приложения образуют рабочую среду, в которой пользователь может управлять своим смартфоном без участия зрения, только по голосовым сообщениям и подсказкам.

Активно развивается проект с открытым кодом Spiel (spielproject.info). Его основатель и руководитель — незрячий программист Nolan Darilek. Spiel является гибко конфигурируемой программой экранного доступа для операционной системы Android. Spiel использует скрипты на популярном языке программирования Jawa Script, что позволяет легко добавлять новые модули и обрабатывать любые события. В текущей версии программа полностью озвучивает экранный интерфейс Android на английском и чешском языках.

4.6.2. Программы для Symbian

Под управлением операционной системы Symbian работают многие смартфоны, главным образом Nokia. Эта операционная система использовалась и на многих персональных цифровых помощниках (PDA), но сегодня эти карманные компьютеры уже «вымерли как класс».

Наиболее известный продукт, дающий людям с ограничениями по зрению доступ к большинству функций смартфонов, — Mobile Speak (другие названия: Mobile Speak Symbian, Mobile Speak S60, MS, MS-S, MS-S60). Это пакет программ от компании Code Factory (www.codefactory.es).

Основной компонент пакета — программа речевого доступа к экрану смартфона. Дополнительно она может выводить текст и на брайлевский дисплей, подключаемый, например, по Bluetooth. При работе программа использует синтезатор русской речи Sakrament, а на некоторых моделях Nokia под управлением Symbian 9.x еще и голоса от Nokia.

В зависимости от версии, программа работает на Symbian 6, 7, 8. x, 9.x — Series 60 edition. Очередные версии Mobile Speak выходят регулярно, и в них появляется поддержка новых моделей телефонов. В программный пакет также входят калькулятор, программа звукозаписи (диктофон), MP3-плеер компании Viking Informatics и файловый менеджер FExplorer.

Color Recognizer — бесплатное приложение от той же компании Code Factory. Когда камера смартфона наведена на какой-либо объект, программа распознает основные цвета и проговаривает их названия вслух. Более того, для каждого цвета она воспринимает три градации яркости: темный, светлый и обычный (Dark, Light, Normal). Правда, программа англоязычная, но запомнить названия цветов легко.

Бесплатная программа Nokia Screen Reader от Code Factory во многом повторяет функционал Mobile Speak. Предназначена она лишь для телефонов Nokia C5-00, Nokia C5 5MP, Nokia 700 и Nokia 701, и работает только с голосами от Nokia. Русскоязычные голосовые движки можно загрузить с сайта Nokia.

Компания Nuance (www.nuance.com) предлагает программу экранного доступа для смартфонов TALKS&ZOOMS. Поддержка русского языка и русский голос в ней есть.

Основные функции программы:

- чтение вслух содержимого главного экрана;

- озвучивание списка контактов;

- чтение вслух номера звонящего;

europe.nokia.com/support/product-support/text-to-speech.

- календарь-планировщик;

- чтение SMS;

- озвучивание стандартного клиента электронной почты;

- озвучивание браузера Nokia web browser;

- голосовые подсказки при работе с приложением Nokia maps.

Кроме того, TALKS&ZOOMS взаимодействует со многими приложениями сторонних разработчиков.

Особенность программ для Symbian в том, что они в значительной мере «привязаны» к конкретным аппаратным платформам и версиям самой ОС Symbian. Поэтому на выбор приложений обязательно влияет модель смартфона — списки поддерживаемого оборудования публикуются на сайтах разработчиков и периодически обновляются.

Некоторые российские компании, например интернет-магазин «Плазма» (7daysget.ru) или Цифровой центр ИОН (new.i-on.ru), предлагают смартфоны, адаптированные для незрячих пользователей. Достоинство таких аппаратов в том, что необходимое ПО в них уже установлено и настроено.

4.6.3. Доступность в iPhone и iPad

В продуктах Apple проблема доступности решена на уровне самой системы Apple iOS. Стандартной ее частью является полноценная программа экранного доступа Screen reader VoiceOver, а в текущих версиях системы установлен и русский голосовой движок «Милена» (Milena).

Смартфон-коммуникатор iPhone 3GS, выпущенный 2009 году, стал первым сенсорным устройством, доступным для незрячих. Как ни удивительно, но технология экранного доступа VoiceOver была отлично реализована именно с сенсорным дисплеем.

Взаимодействие с iPhone или iPad через VoiceOver осуществляется с помощью специального языка жестов, которые отличаются от стандартных жестов управления. Когда пользователь проводит пальцем над значком, телефон называет соответствующее приложение. При перемещении между значками или пунктами меню раздаются щелчки. Если коснуться значка, над которым отображается какое-либо число (непрочитанных сообщений, пропущенных звонков и т.д.), то iPhone вместе с названием приложения озвучивает и это число.

Для переключения между экранами необходимо пролистывать их тремя пальцами. В ответ на щелчок тремя пальцами по экрану VoiceOver произносит, сколько всего экранов открыто на телефоне и на каком по счету вы в данный момент находитесь. Кнопка Home всегда возвращает фокус на первый экран.

Выбрав касанием значок приложения, которое вы собираетесь запустить, дважды ударьте пальцем в любом месте экрана, и приложение откроется. В открытом приложении VoiceOver зачитывает различные пункты, отображаемые в данный момент на экране, а перемещение между пунктами производится точно так же, как и в главном меню телефона. Принцип работы одинаков во всех приложениях и осваивается моментально: пролистывание по экрану для навигации по пунктам и затем двойной щелчок в любом месте экрана для выбора этого пункта.

Немного отличается последовательность действий для набора текста. Возьмите телефон двумя руками, одним пальцем водите по экрану, пока не найдете необходимую букву (буквы под пальцем озвучиваются). Найдя ее, ударьте другим пальцем в любом месте экрана.

Для телефонных звонков и запуска проигрывателя удобнее пользоваться голосовым управлением. Программа Voice Control тоже является стандартным приложением Apple iOS.

Осваивая сенсорное управление, важно преодолеть психологический барьер. Хотя выражение «интуитивно понятный интерфейс» полностью применимо и к VoiceOver, в самом начале, вероятно, потребуется посторонняя помощь. Однако после нескольких занятий незрячий человек пользуется экранным доступом к iPhone вполне уверенно.

Если в целом сравнивать по доступности смартфоны под управлением Android или Symbian с аппаратами Apple, то выигрывают последние. Главный аргумент в пользу iPhone — то, что всю необходимую функциональность обеспечивает в нем уже стандартный набор приложений.

4.6.4. Проект slepsung.com (адаптация телефонов Samsung)

Российско-белорусская компания «Слепсунг» (slepsung.com) с 2006 года предлагает телефоны Samsung с «говорящими» прошивками. Принципиальное отличие их от смартфонов с установленными на них программами экранного доступа в том, что модифицированная микропрограмма записывается в постоянную память телефона.

Микропрограмма телефона озвучивает номер звонящего, текущее время, заряд батареи и уровень радиосигнала. Номера телефонов произносятся в общепринятом для России формате. Меню и телефонный справочник дублируются голосом. Входящие SMS телефон зачитывает вслух по команде пользователя.

Все пункты меню вызываются комбинациями цифровых клавиш, что позволяет добраться до пунктов меню любой вложенности. Можно легко узнать только интересующую вас на данный момент информацию, не выслушивая лишнее. Например, в журнале вызовов можно отдельно прослушать сведения о длительности разговора, времени поступления звонка, типе вызова. В меню SMS озвучиваются размер сообщения и его состояние (прочитано или не прочитано).

Такие функции телефона, как редактирование адресной книги и создание SMS, можно вызывать во время разговора. Микрофон и динамик на это время отключаются. Предусмотрен и режим диктофона для записи заметок или разговоров.

В «Слепсунгах» озвучены все функции, присутствующие в оригинальной прошивке соответствующей модели телефона. Например, это MP3-плеер, календарь, калькулятор, будильник и т.п.

В настоящее время компания адаптирует телефоны Samsung GT-E2121B, GT-E2370, GT-С5212, GT-C3322, GT-C3520, а конечная цена аппаратов составляет от 4000 до 7500 руб. Пункт продаж находится в Москве в Центральном доме культуры ВОС. В регионы телефоны высылаются наложенным платежом, а заказы принимаются через Интернет.

4.7. Заключение

Первоначально в этой главе предполагалось обсудить еще некоторые устройства и программы. Что же в нее не вошло?

Прежде всего, это описание встроенных в Windows экранного диктора и голосового ввода. Причина та же, что и у остальных «сокращений», — отсутствие поддержки русского языка. Смутные надежды мы возлагали на Windows 8, но и в системе образца 2012 года ни распознавание, ни синтез русской речи пока не появились. Таким образом, для русскоязычных пользователей основным средством доступа к компьютеру остаются хорошо известные программы: JAWS, КОБРА, NVDA.

Оптическое распознавание символов и синтез речи в связке друг с другом работают давно. «Читающие машины», в том числе и отечественной сборки, можно встретить в некоторых учебных заведениях и библиотеках для слепых. Однако актуальность такие аппараты почти утратили — любой текст в электронном виде найти проще, чем книгу, а читается файл на любом компьютере.

Почему западные производители продолжают выпускать сканеры с распознаванием и чтением вслух? Видимо, все дело в трепетном отношении к авторским правам — если книга не продается в электронном виде, на файлообменниках искать ее постесняются, а купят экземпляр у букинистов или возьмут в библиотеке.

Намного интереснее мобильный вариант «говорящего сканера». Он пригодится во многих ситуациях. Тем более, с повсеместным внедрением штрих-кодов такой сканер становится незаменимым помощником и при покупках, и на транспорте, и в государственных или финансовых учреждениях. Подобные устройства выпускают и продают, но все снова упирается в проблему русского языка. Если в «русификации» компьютерного и телефонного ПО достигнуты определенные успехи, то микропрограммы портативных сканеров «переделывать на коленке» мы пока не умеем.

Тем не менее, незрячим русскоязычным пользователям уже сегодня доступен целый ряд недорогих или полностью бесплатных решений. Во-первых, это специализированные сборки Linux и программа NVDA для Windows. Во-вторых, это мобильные телефоны с альтернативными «говорящими» прошивками. Скорее всего, ассортимент таких решений будет расширяться — ведь речевые технологии все больше интересуют массового пользователя.

И, наконец: почему в этой главе почти нет иллюстраций? Считайте это данью доступности — я постарался сделать так, чтобы текст одинаково воспринимался и с листа, и на слух, в электронном виде.

Назад Оглавление Далее