Распознавание человека по движениям мышки
Группа итальянских компьютерных специалистов разработала алгоритм, позволяющий опознавать человека, выдающего себя за другого, по движениям компьютерной мышки. Ученые рассчитывают, что он поможет защищать данные пользователей при взломе или находить тех, кто подает ложную информацию о себе. Исследование опубликовано в журнале PLOS ONE.
Разработчики алгоритма нашли способ определять, что человек за компьютером лжет, когда заполняет поля с информацией о себе. Главное отличие этого алгоритма от обычных методов выявления лжи (например, полиграфа) в том, что его можно использовать удаленно и для большого количества людей одновременно.
Проверяя работу алгоритма, ученые попросили 20 добровольцев запомнить детали выдуманной биографии и постараться воспринимать ее как свою собственную. После этого им дали анкету с закрытыми вопросами (предполагающими ответы «да» или «нет»). На те же вопросы отвечали 20 испытуемых из контрольной группы. Исследователи наблюдали за участниками и фиксировали движения их мышек.
К простым вопросам вроде «Ваше имя Джулия?» или «Вы родились в 1995 году?» ученые добавили несколько неожиданных, например, про знак зодиака или столицу региона, откуда приехал герой выдуманной биографии. Лжец может хорошо запомнить дату рождения, но на вопрос про знак зодиака не сможет ответить так же быстро, как и человек, заполняющий анкету правдивой информацией. Авторы исследования натренировали программу выявлять лжецов по количеству неправильных ответов и получили точность 77,5-85%. Добавив в алгоритм данные о движениях мышки, они увеличили его надежность до 90-95%.
По мнению разработчиков, такой алгоритм может служить «первым рубежом» проверки человека во время расследований или при заполнении персональных данных в Интернете. Они отмечают, что ко многим «неожиданным» вопросам можно подготовиться, хорошо изучив биографию подложной личности, но надеются, что набор таких вопросов практически безграничен.
Актуальность вопросов сохранности персональных данных и массовой слежки в настоящее время трудно переоценить. Такие инженеры как Джулиан Ассанж и Эдвард Сноуден открыли глаза мировой общественности на реальные возможности вездесущих спецслужб разных стран. Чуть меньше внимания мировой общественности уделяется возможностям крупных информационных компаний, таких как Гугл, Яндекс, Фейсбук или Вконтакте.
А теперь речь пойдет об одном из методов неявного слежения за пользователями персональных компьютеров, основанном на анализе биометрических данных, поставляемых пользователями добровольно и в большом объеме: о анализе данных движений мыши.
Автор не имеет подтверждений использования описываемого подхода крупными компаниями и спецслужбами.
Теоретическое обоснование
Хотя пользователю кажется, что курсор мыши перемещается плавно, для компьютера движение мыши представляется последовательным набором дискретных данных. Одна единица таких данных содержит положение курсора, состояние кнопок мыши и текущее время события. Под событием мыши понимается как нажатие кнопки, так и движение самой мыши.
Пользователь перемещает курсор мыши по сложной кривой и с изменяющейся в процессе перемещения скоростью. Как сама кривая движения курсора, так и скорость движения обусловлены рядом физиологических и психологических факторов. Движение мыши зависит не только от таких факторов как размер и масса руки, положение руки и всего тела, но и от состояния нервной системы и привычек пользователя. Движение курсора мыши можно сравнить с почерком: как текст на бумаге состоит из линий, так из движений мыши состоит цифровой почерк. Каждый, кто использует мышь оставляет подпись таким почерком в памяти компьютера.
Согласно Википедии, биометрия - распознавание людей по одной или более физических, или поведенческих черт. Движения мыши являются биометрическими данными, потому как представляют возможность однозначного определения пользователя компьютера.
Методы сбора и анализа данных
Биометрия на основе данных мыши и клавиатуры рассматривается в научном сообществе с 2007 года. Первые исследования, согласно опубликованной диссертации на соискание степени кандидата наук Диденко Сергея Михайловича, были начаты еще в 2003 году. Разные авторы используют разные наборы ключевых характеристик, однако общая методология сбора и анализа схожа.
На основе анализа научных работ по данной тематике представляется возможным выделение следующих ключевых этапов:
- сбор и передача сырых данных;
- хранение сырых данных;
- выделение ключевых характеристик данных («фич»);
- обучение нейронной сети;
- хранение состояния нейронной сети;
- классификация (определение) пользователей с помощью обученной нейронной сети.
Имеются варианты касательно обработки сырых данных. Одни системы на компьютере пользователя собирают данные и отправляют их на сервер для анализа, в то время, как другие – вычисляют ключевые характеристики непосредственно на компьютере пользователя и отправляют на сервер уже обработанные данные. Уже в 2007 году системы определения пользователя на основе биометрических данных, полученных при помощи мыши давали точность 95%. Позднее ученым удалось увеличить точность до 99,7% (три ошибочных срабатывания на 1000 порций данных).
Характеристики собираемых персональных данных
В основном ученые ставят перед собой задачу идентификации пользователя по полученным биометрическим данным. Однако, идентификация – не единственная возможная сфера применения данного подхода. В ряде работ имеются заявления о получении следующих типов информации:
- идентификация пользователя;
- определение настроения;
- определение эмоциональной реакции на изучаемый материал;
- определение психофизических характеристик (например, усталость);
- определение физических характеристик (рост, вес);
Данный список может быть расширен посредством анализа влияющих на рассматриваемую биометрию факторов организма и личности.
Возможные области применения
При анализе биометрических данных чаще всего используются нейронные сети. Особенностью нейронные сетей является возрастающая эффективность при возрастающем числе обучающей выборки. Чем большим набором собранных данных сеть обладает, тем точнее работает система.
Рассмотрим основные группы организаций, которые могут обладать большим набором обучающих данных в рассматриваемой области:
- Поисковые системы. Как Яндекс, так и Гугл предоставляют разработчикам сайтов удобный инструмент анализа посещаемости сайта (Аналитикс и Метрика соответственно). Данные о движениях мыши поступают к поисковым гигантам в огромном количестве. Не будет преувеличением сказать, что Яндекс может обладать биометрическими данными всех граждан России. Даже если пользователь напрямую не использует поисковик, данные пересылаются непосредственно с посещаемых им сайтов.
- Разработчики ПО. Не является секретом, что многие программы отправляют своим разработчикам данные об использовании их программ. Даже если программа непосредственно не отправляет указанные пользователем личные данные, она может отправлять данные движения мыши, тем самым позволяя однозначно идентифицировать пользователя. Операционная система компьютера также является подобной программой.
- ПРОГРАММА РАСПОЗНАВАНИЯ ЭМОЦИЙ ЧЕЛОВЕКА ПО ДВИЖЕНИЯМ МЫШКИ
Программное обеспечение, которое разработал профессор Джеффри Дженкинс из университета Бригама Янга, позволит определять эмоциональное состояние человека по движению курсора мыши. Ученые не перестают удивлять мир своими технологическими разработками и открытиями. Не так давно специалисты создали методику «клавиатурного подчерка», и вот на днях американский профессор заявил, что движения компьютерной мышкой зависят от настроения.
В ходе испытаний Дженкинс выявил, что раздражение или злость заставляют человека двигать мышку быстрее и более резко, а разочарование или грусть вызывают обратный эффект – курсор перемещается медленней и неточно. Во время исследования ученый целенаправленно злил участников: тесты загружались медленно, а за неправильные ответы следовало наказание.
Дженкинс уверен в том, что его разработка будет полезной в сфере интернет-маркетинга и конструировании сайтов. Программа поможет выявить реакцию пользователей того или иного ресурса, их разочарование или же благосклонность.
Профессор не исключает возможности использовать эту разработку в различных гаджетах. В ближайшее время он планирует заняться созданием мобильной версии программного обеспечения, в которой будут учитываться движения пальцев по сенсорному экрану.