13 апреля 2021

Big data: собираем, анализируем, создаем ценность

Big data в промышленности

Использование Big data сегодня уже не новый тренд. Любая компания обладает огромным массивом информации обо всем, что связано с бизнесом – от информации о клиентах до показаний производственного оборудования. И наиболее продвинутые отрасли, такие как ритейл, телеком, банки, уже научились извлекать выгоду из этих данных. Они оптимизируют затраты, используют аналитику для управления рисками, прогнозируют спрос и повышают эффективность бизнес-процессов.

Однако промышленные предприятия, даже с учетом заметных успехов в цифровой трансформации* (согласно материалам исследования KMDA, 2020), пока не используют все возможности больших данных. Это обусловлено несколькими факторами.

В первую очередь, это необходимость оцифровки аналоговых данных с оборудования и машин. Как правило, в других отраслях такого фактора просто нет. 

Во-вторых, объем информации. К примеру, один локомотив может быть оснащен 500 датчиками, поезд – это уже 4000 датчиков. А при условии работы в режиме 24/7 получаются петафлопсы данных в год. В проекте «Умный локомотив» мы использовали огромное количество виртуальных машин, включая ML модели и сложные алгоритмы, которые постоянно обрабатывают информацию. В других отраслях с такими объемами данных никто не сталкивался.

В-третьих, нехватка сотрудников с релевантными компетенциями. Несмотря на то, что аналитика и работа с данными являются наиболее востребованными навыками для цифровой трансформации* (согласно материалам исследования KMDA, 2020), пока в этом плане реальный сектор находится в начале пути.

«IT-задачи на любом производстве решаются просто. Нет проблемы в том, чтобы оснастить оборудование любым количеством датчиков. Но понять, куда их поставить, с какой частотой замерять и как интерпретировать данные – это вопрос опыта», - объясняет операционный директор Ctrl2GO Александр Дмитриев.

В целом промышленность все еще присматривается к существующим методологиям, и по мере того, как начинает доверять данным и результатам анализа, появляются новые требования к цифровизации. В любом случае, использование Big Data неизбежно в условиях высокой конкуренции и волатильности рынка.

Что собирать?

Универсального ответа на вопрос “что же собирать?” - нет. Все зависит от оборудования, от режима эксплуатации, от того, какие модели уже созданы и апробированы, и в каждом конкретном случае это вопрос проектирования.

В основном источники данных – это датчики, видеокамеры, системы с ручным вводом информации, журналы инцидентов, которые нередко ведутся на производстве. Стоит отметить, что сложность сбора данных обычно определяется условиями предприятия и тем, насколько оборудование оснащено необходимыми датчиками. В большинстве случаев дооснащение связано с вмешательством в конструкцию устройства — а это потеря гарантии, создание рисков функционированию и безопасности дорогого оборудования. Есть неинвазивное дооснащение, но тут возникает вопрос точности. Ведь существуют узлы, с которых данные таким образом просто нельзя снять: например, с внутренней изоляции в электродвигателях.

В итоге какую именно информацию стоит собирать решает бизнес-аналитик. Он понимает, как устроен производственный процесс и оборудование, какие узлы оно в себя включает, и как они связаны между собой с точки зрения логики, механики, термодинамики. Получив данные, начинается процесс их очистки. Многие чистят, просто отсекая пороговые значения. В Ctrl2GO другой подход: нужны умные алгоритмы отслеживания того, какой датчик мог выйти из строя или показывает неверные значения, чтобы исключить вероятность ошибки. Для этого используем платформу интеллектуального анализа данных.

«Это отечественное ПО, которое является основой для реализации многих проектов в различных направлениях экономики. Промышленные предприятия понимают, что правильное использование данных в работе дает конкурентное преимущество, помогает добиться реальных бизнес-результатов - как оперативных, так и стратегических. Ценность платформы – сбор информации, умение ее правильно структурировать, даже имея неполные данные, и собрать в единую точку объединения», - подчеркнул Александр Дмитриев.

Зачем анализировать данные?

Можно собрать огромный массив данных о работе оборудования, записав определенные параметры в рамках производственного цикла. Однако вся эта информация без аналитики будет почти бесполезной: никаких открытий сама по себе она не предоставит.

Здесь все решает специалист по работе с данными - Data Scientist. В зависимости от задачи и объема данных он определяет, какие алгоритмы, в какой последовательности можно применять, к какому результату они могут привести. Обычно строится несколько гипотез, которые затем тестируют. Доказанная версия, как правило, становится решением задачи – аналитической моделью, которую внедряют в промышленное использование.

После обучения на исторических данных ML-модель может не только мониторить состояние оборудования в реальном времени, но и осуществлять предиктивную аналитику, то есть заранее предсказывать время и вероятность отказа узла или агрегата. Можно также рассчитывать “индекс здоровья” оборудования, что позволяет переходить от планового ремонта на ремонт по состоянию.

Так, например, на основе исторических данных нашей команде удалось обнаружить неисправность в турбогенераторе тепловой электростанции за 1,5 года до наступления отказа. Это сэкономило компании около 140 млн. рублей.

«Нередко анализ данных также позволяет выявить неочевидные зависимости, обнаруживая скрытые потери. На проекте в нефтегазовой компании мы обнаружили рост потребления энергии центробежными насосами. Причиной оказался такой износ оборудования, который никак не влиял на основные показатели его работы и поэтому оставался незамеченным». 

Что это дает бизнесу?

Правильный подход к использованию данных о работе оборудования и производстве позволяет промышленным предприятиям оперативно решать задачи и получать нужный бизнес-эффект.

Используя поступающие в реальном времени данные, можно вносить необходимые корректировки в производственные процессы. Например, регулировать режимы работы флотационной установки на обогатительной фабрике, что позволит сократить расход реагентов и повысить извлечение. 

Металлургическому предприятию данные о качестве сырья помогают обеспечить правильное соотношение концентратов при шихтовании и за счет этого увеличить производительность печей на 2-5% и повысить качество выходного продукта на 1-6%.  

А данные телеметрии, например, с тепловоза, позволяют снизить время простоя на сервисном обслуживании на 12%, в 4 раза сократить время диагностики подвижного состава, уменьшить затраты на техническое обслуживание и ремонт.

Как и в других отраслях, анализ данных повышает эффективность управления бизнесом. Однако есть стратегические плюсы, специфические именно для промышленных предприятий - например, продление срока эксплуатации существующего оборудования с удерживанием его работы на пике производительности, а также снижение экологических рисков.