четверг, 19 февраля 2015 г.

Varonis DatAnswers - корпоративная система поиска по неструктурированным данным

Не знаю как вы, но я за собой многократно замечал, если мне нужен какой-то документ (и я понимаю, что он мне понадобится еще несколько раз в ближайшие дни), я просто кладу его на рабочий стол или в какую-то папку, которую я год назад создал, специально для “очень нужного документа”, и сам себе пообещал удалить через недельку, не позднее. Только сейчас в этой папке 200 (и хорошо, если 200, а не 1000) разных файлов и понять что есть что уже почти не реально.

Есть конечно еще один хороший способ - отправить нужный документ самому себе по почте, указав в теме письма несколько ключевых слов, но либо таких документов накапливается в ящике столько, что заканчивается место, либо опять эти аттачи приходится складывать во временную папки и см. выше.

Почему так происходит? Чаще всего из-за того, что найти нужный документ, расположенный где-то на одном из файловых серверов (или в корпоративном портале), используя только стандартный механизм поиска и какие-то ключевые слова, довольно сложно - либо получаешь на выходе нерелевантный результат из сотни документов, в которых “на ощупь” пытаешься найти нужный, либо не получаешь вообще ничего. А если совсем не повезет, то можно случайно найти и “чужие” файлы, доступа к которым вообще не должно быть. Все это не способствует повышению продуктивности сотрудников - если человек вынужден потратить 30 минут на поиск документа (а таких сотрудников в компании 100), несложно посчитать какая часть заработного фонда вылетает “в трубу”.

Если для небольших компаний задача управления неструктурированными данными может решаться “наколенным” способом, то для крупных корпораций с сотнями пользователей и несколькими (а иногда и десятками) файловыми серверами требуется искать более продвинутые решения. Уже несколько лет для ряда заказчиков таким продвинутым решением является система Varonis DatAdvantage (в составе комплекса Data Governance Suite). Этот программный комплекс не только позволяет быстро увидеть права доступа в разрезе пользователь-ресурс (и наоборот), но система аналитики позволяет выйти далеко за рамки простой утилиты контроля доступа к файлам. [Неожиданно для себя, заметил, что упомянул DatAdvantage единожды и то только по случаю выхода очередного апдейта - постараюсь исправиться в ближайшее время.] Подсистема сбора статистических данных (IDU Analytics) собирает полную статистику доступа пользователей к файлам - кто и когда открывал файл, кто записывал, кто пытался получить доступ, но не получил и т.д. На основе накопленных данных можно построить своего рода “рекомендательную систему”. Такие системы часто используются в интернет-магазинах или соц-сетях - вам рекомендуются те товары (или публикации), которые заинтересовали других людей, чье поведение было схоже с вашим. Однако, в Varonis DatAdvantage, накопленная статистика активности используется не для того, чтобы что-то предложить пользователю, а чтобы помочь классифицировать пользователей и показать, правильно ли настроены группы доступа. Также система позволяет выявить неправомерные попытки получить доступ к данным.

В конце прошлого года Varonis объявил о доступности (т.е. его уже можно попробовать в пилоте или приобрести) нового компонента своей системы - системы поиска DatAnswers. Это корпоративная система поиска файлов на файловых серверах и портале Sharepoint. Поскольку ядро системы (IDU) уже собирает и анализирует как статистику доступа к файлам, так и их содержимое, разработчикам оставалось только добавить индекс и, уже на его основе, построить поисковую систему.

Благодаря тому, что содержимое файлов не единственный источник данных для поисковой системы, DatAnswers имеет ряд уникальных преимуществ перед другими корпоративными поисковыми системами:

Улучшение релевантности поисковых результатов
Используя статистический анализ активности, пользователям разных групп предлагаются различные результаты поиска. Например, если менеджер по продажам ищет данные по названию продукта, то его вероятно интересуют общие информационные материалы, кейсы удачных сделок и другие подобные материалы, в то время как инженера, напротив, интересует техническая документация. Ранжирование, учитывающее ролевую статистику, позволяет быстро находить нужный материал.

Эффективное индексирование
Так как система сбора статистики всегда “знает” какие файлы были добавлены, а какие изменялись, полного переиндексирования не требуется никогда. Не нужно даже проверять метки о последнем времени модификации файла - информация о том, какие файлы нужно индексировать, берется непосредственно из данных IDU Analytics. Такой подход позволяет существенно снизить нагрузку от процесса индексирования на всю инфраструктуру заказчика и не зависеть от корректности временных меток на файлах и каталогах.

Уже сейчас DatAnswers предоставляет следующие возможности:
  • находить “похожие” документы - здесь на помощь снова приходит статистика доступа
  • искать файлы на серверах Windows, NAS устройствах и SharePoint портале
  • позволяет пользователю сразу перейти в родительский каталог, где был найден документ
  • использовать для фильтрации результатов рекомендации DatAdvantage
  • с использованием IDU Classsification Framework из результатов поиска можно исключать определенные данные, такие как номера кредитных карт, зарплатных ведомости и другие финансовые данные
  • исключать из результатов поиска файлы, попадающие под всевозможные регулирующие законы (правда пока это актуально скорее для западных компаний)
Кроме того, API DatAnswers позволяет интегрировать систему поиска в свои приложения, что может быть востребовано для крупных компаний, которым организационно нет смысла добавлять еще одну программную оболочку, а гораздо удобнее интегрировать поиск в свою ИС.

И, на всякий случай, еще раз хочу отметить, что комплекс программных решений Varonis ориентирован, в первую очередь, на крупные компании с большим количеством сотрудников и большим объемом неструктурированных данных (т.е. на те случаи, когда "ручное" администрирование начинает приносить больше вреда, чем пользы и требует слишком больших людских ресурсов). По этой же причине всем проектам по внедрению предшествует пилотная эксплуатация, в ходе которой можно оценить преимущества решения и те плюсы, которые оно предоставляет. За пилотом можно смело обращаться к партнеру Varonis в России.

Понравился пост? Подпишись через RSSRSS, EmailEmail или twitter!

Комментариев нет: