В мире

Хранение данных: проблемы и риски

Хранение данных, фото
1.4K

В 2022 году эксперты прогнозировали, что объем данных, создаваемых ежегодно, будет расти со совокупным годовым темпом роста более 21% и к 2026 году достигнет более 221 000 экзабайт. Это очень и очень много данных. Кроме того, эксперты отмечали, что более 90% данных, создаваемых каждый год, представляют собой неструктурированные данные. О глобальных проблемах хранения данных рассказали разработчики протокола хранения DeNet. К слову, протокол, о котором подробнее можно узнать на https://denet.pro/, предназначен именно для предотвращения недостатков централизации и обеспечения безопасного, анонимного и удобного доступа к децентрализованному хранилищу для всех.

Неструктурированные данные

Как уже было отмечен выше, большую часть всех данных можно отнести к неструктурированным. По сути, это данные любого типа, которые не имеют определенного, предопределенного формата или структуры. В отличие от структурированных данных, которые организованы в виде таблиц, полей и столбцов, они обычно хранятся в свободной форме или в полуструктурированном формате, например текстовые файлы, изображения, видео, электронные письма, презентации, сообщения в социальных сетях и другие типы мультимедиа. Ожидается, что процент неструктурированных данных будет расти еще больше с внедрением новых технологий, такими как метавселенная, нейросети и машинное обучение.

Но что делается со всеми неструктурированными данными, создаваемыми каждый год? Большую часть этих данных нужно где-то хранить, особенно если информация представляет ценность для бизнеса. Организации должны понимать стоимость существующих данных и обеспечивать их хранение в оптимальном месте или на оптимальном уровне хранения. Данные должны быть оптимально размещены в облаке или локально в соответствии с потребностями бизнеса.

Хранение данных и риски

Риск проявляется в разных формах. Сюда входят сбои оборудования, заражение программами-вымогателями, злонамеренное или случайное удаление данных, личные данные, хранящиеся вместе с данными, не связанными с бизнесом, данные, хранящиеся сверх требований по хранению, и бесхозные данные (данные, не имеющие активного владельца в организации). Первое, что нужно сделать, — это создать возможность заранее предотвращать проблемы.

Чтобы свести риск к минимуму риски, организации могут реплицировать данные и/или создавать дополнительные копии, используя альтернативные методы резервного копирования. Можно перемещать устаревшие данные на уровень архива. Когда дело доходит до решения таких проблем, как потерянные и/или не связанные с бизнесом данные, данные можно либо переместить в область карантина для дальнейшего изучения, либо, возможно, даже удалить недействительные данные, чтобы снизить риск, связанный с этими наборами данных.

Управление данными

Правильное управление данными порой имеет решающее значение для бизнеса. Все данные, которые собирают компании, содержат огромное количество ценной информации. Важно иметь данные в нужном месте в нужное время, чтобы извлечь максимальную пользу. Например, перемещение данных из периферийных местоположений в центральное для защиты, а также для распространения в другие места для использования аналитическими приложениями становится все более важным.

Данные больше не могут находиться статически на платформе хранения, где они были изначально записаны. Удобнее и выгоднее размещать данные там, где они будут пригодны для быстрой обработки или анализа.

Удаление данных

Чтобы минимизировать риски возникновения разного рода проблем, данные, которые больше не нужны, лучше удалять. Это включает удаление ненужных копий данных, устаревших данных, данных, принадлежащих сотрудникам, которые больше не работают в организации, а также резервных копий и архивов данных с истекшим сроком действия.

Есть много других проблем в управлении данными сейчас и в ближайшем будущем. К ним относятся конфиденциальность и безопасность данных, интеграция данных и неработоспособность, управление данными и качество данных.

Вверх