Большие данные — утечка данных по сравнению с утечкой данных

Возможности и опасности больших данных

Данные и информация играют все более важную роль в компаниях и все в большей степени представляют собой значительный производственный фактор. Концепция так называемых «озер данных» много обещает, когда речь заходит об анализе таких данных и информации, который поддерживается машинным обучением и искусственным интеллектом. Однако есть не только преимущества.

Данные и информация играют все более важную роль в компаниях и все в большей степени представляют собой значительный производственный фактор. Концепция так называемых «озер данных» много обещает, когда речь заходит об анализе таких данных и информации, который поддерживается машинным обучением и искусственным интеллектом. Однако есть не только преимущества.

Появление «Больших данных» и масштабируемого поиска информации, опирающегося, среди прочего, на кластеры хранения данных на базе Lucene, привело к ренессансу методов анализа. Отслеживание знаний по всему предприятию стало возможным, и многие из них получили пользу. То, что вы теперь можете определить связь между временем отклика онлайн-продаж является огромным. Вы можете узнать, что производительность снижается при увеличении времени простоя производства и какие именно задержки имеют наибольшее экономическое воздействие на авиакомпанию. Это ценная бизнес-информация, которая не проявляется в больших объемах исходных данных. Машинное обучение теперь делает это чрезвычайно просто и, благодаря своей высокой производительности и охвату объемов, может быть применено к огромным объемам данных, хранящихся в так называемых «озерах данных».

Озеро данных способно хранить очень неоднородные и неструктурированные данные. Примеры включают фотографии, видео, электронную почту, документы Word или данные из других систем, а также другие несвязанные данные. Data Lakes особенно популярны там, где, например, существуют большие объемы данных датчиков, или данные, которые фиксируют состояние устройств IoT об их здоровье. Благодаря этому разнообразию данных, которые необходимо собирать и объединять для анализа, концепция озера данных получила широкое распространение.

Тем не менее, озера данных также скрывают опасности, о которых не все знают.

Может, хвост начал вилять собакой. Но так как много «стратегически выбранных данных» может быть объединено с «выбранными алгоритмами машинного обучения», это добавило значительную ценность бизнесу. Поэтому было бы логично погружаться во все новые и новые данные, чтобы создать из них еще большую ценность. Верно и обратное: добавленная стоимость уменьшается с увеличением данных. Каждый дополнительный набор данных пересекается с информацией, которая уже известна, и таким образом добавленная стоимость становится все меньше и меньше. Однако этот факт не заставил большинство компаний прекратить просто собирать все данные, которые они могут получить из как можно большего количества различных источников. Многие компании надеются в конечном итоге создать добавленную стоимость с помощью машинного обучения.

Цена играет другую роль. Поскольку место для хранения стало настолько дешевым, его полезность уже не вызывает сомнений, и никто не спрашивает, какое зло он может нести с собой. В конце концов, удаление всегда является опцией, если выяснится, что данные вам не нужны. Однако, вопреки всему, мы видели значительное количество атак, направленных на эти кластеры хранения. От атак грубой силы на пароли до злоупотреблений программными недостатками, хакеры и злоумышленники всегда находят способы добраться до этих корпоративных хранилищ данных. Чем больше данных централизовано в одном «месте», тем больше ущерб, если он когда-нибудь попадет не в те руки. Эти озера данных могут привести к неудачной утечке данных.

Хотя объединение данных для аналитических целей имеет явное преимущество, риск возможной утечки данных все же должен быть четко оценен и принят во внимание. Когда данные децентрализованы, существует сравнительно неявный уровень безопасности данных. Это также усложняет хакеру или злоумышленнику задачу сразу же уйти со всеми драгоценными камнями в короне. Поэтому компания должна знать, что как только данные попадают в озеро данных, они одновременно принимают потерю контроля.

Уделение приоритетного внимания защите данных и сетевой безопасности

Аналогичные аргументы приводились и приводились в ходе дискуссий вокруг решений для облачных вычислений и резервного копирования. Другие продукты, которые существенно повлияли на спектр решений по защите данных, централизации данных и контролю доступа, также играют важную роль в этом контексте. Для предприятий это очевидная проблема, а озера данных или централизация данных, следовательно, имеют двойственное значение.

В конечном счете, компании должны тщательно продумать, как должны предоставляться и использоваться данные озер. То, что течет, может вытекать. Поэтому при принятии решений о стратегиях хранения и разгрузки данных следует с самого начала учитывать потенциальное воздействие утечки данных. Часто существует нейтральный способ децентрализации данных. Конечно, здесь также должны соблюдаться надлежащие меры по сетевой безопасности. Кроме того, многие методы анализа могут использовать существующие API баз данных. Это позволяет анализировать данные из многих децентрализованных источников. Это решение не требует, чтобы все данные были втянуты в озеро данных. Децентрализованными данными можно управлять с помощью встроенных механизмов контроля доступа. Конечно, даже при таком раскладе утечка данных не может быть полностью предотвращена, но ее масштабы остаются значительно меньше.

Klaus-Peter Kaul ist Regional Sales Director für Alpine (Schweiz und Österreich) bei Riverbed Technology. Der in den Bereichen Server, Storage, Security und Netzwerke versierte Manager schaut auf eine bereits über 22 Jahre dauernde Karriere bei führenden Unternehmen zurück, darunter McAfee, Secure Computing, Veritas Software und SGI Silicon Graphics.

Комментарии закрыты.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More