Название книги:

Ценность ваших данных

Автор:
Николай Скворцов
Ценность ваших данных

000

ОтложитьЧитал

Шрифт:
-100%+

Литературный редактор В. Доценко

Руководитель проекта А. Туровская

Дизайн обложки Е. Алёнушкина

Дизайн блока Т. Саркисян

Корректоры Н. Ерохина, Н. Казакова

Компьютерная верстка Б. Руссо

© С. Кузнецов, А. Константинов, Н. Скворцов, 2022

© Оформление. ООО «Альпина ПРО», 2022

Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.

Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.

* * *

Когда шла работа над книгой «Ценность ваших данных», одному из авторов случилось оказаться в экстремальной ситуации. И та выявила все действительно важные для человека качества и ценности, но в особенности продемонстрировала ЦЕННОСТЬ ВАШИХ ДРУЗЕЙ и СЕМЬИ. Именно ДРУЗЬЯМ и СЕМЬЯМ мы и хотели бы посвятить эту книгу.

Сергей Кузнецов, Александр Константинов, Николай Скворцов


Предисловие

В XXI веке много говорят о данных: эксперты спорят, стоит ли уделять правильной организации работы с ними столь много внимания или все это хайп и надумано. Авторы этой книги уже более 20 лет наблюдают за развитием различных технологий, за тем, как рождаются методологии работы с данными, в компаниях появляются специалисты по этому направлению.

Мы постарались собрать воедино исторические, организационно-методические и технологические аспекты данных, раскрыть для читателя многообразие терминов и аббревиатур. Также вас ждет рассказ о существующем инструментарии работы с данными и о трендах, которые мы наблюдаем сегодня и увидим завтра. Все это – на языке, доступном людям без специального ИТ-образования.

Мы долго шли к решению о написании этой книги, и, как бы ни откладывали это решение, наша жизнь и работа все время подводили к необходимости описания данных, которые буквально пронизывают нашу жизнь. Для нас же ситуация получилась и вовсе уникальной, потому что мы, как профессионалы в этой области, находимся, если можно так выразиться, по обе стороны проникновения данных в жизнь общества. Именно поэтому мы все-таки решились погрузиться с головой в эту работу, которая стала, неожиданно для нас, возможностью всесторонне систематизировать не только опыт и знания, но и отраслевые компетенции заказчиков и партнеров.

Еще одним важным фактором, побудившим написать книгу, стала полуторагодичная работа нашего коллектива над переводом и научной редактурой второго издания легендарной книги «DAMA-DMBOK: Свод знаний по управлению данными». Результаты этой работы по достоинству оценены российскими читателями, которым книга позволила получить новые и систематизировать уже имеющиеся знания, а также стать частью международного сообщества и даже целой индустрии работы с данными, говорить с ним на языке единых терминов и подходов к процессам работы с данными.

Важно отметить, что создание книги – это процесс, напрямую связанный с импортозамещением программных продуктов, когда на смену зарубежному софту приходят российские разработки. И этот процесс стал гораздо важнее в условиях санкций против России. Период с конца февраля 2022 года стал крайне тяжелым для отечественных компаний, закупивших зарубежный софт. Особенно болезненным было «расставание» с иностранными организациями, которые в течение долгих лет поставляли нам продукты в области управления данными.

Такие компании, как IBM, SAP, Oracle, объявили об уходе из России, т. е. продаж, а главное, поддержки, выполнения проектов и много другого больше не будет. Конечно, в такой ситуации все большее количество организаций начинает принимать активные меры по импортозамещению. Это движение существовало и раньше, просто сейчас, в силу понятных причин, оно ускорилось. Во многом предвидя такую ситуацию, мы постарались учесть опыт применения российского программного обеспечения в области управления данными. Уверены, наша книга будет способствовать расширению круга отечественных литературных источников по тематике управления данными и тем самым сыграет значимую роль в ускорении всех процессов, связанных с заменой иностранных программных продуктов на отечественные.

И конечно, стоит представить уважаемым читателям одного из главных героев книги. Начиная со второй ее части, мы вводим в повествование некую абстрактную корпорацию «Телеком Дубль». Это необходимо для большей связи с реальностью, с проектами внедрения, опыт в которых у коллектива авторов суммарно более семи лет. Именно с помощью «Телеком Дубль» мы будем приводить конкретные примеры, чтобы читателям было удобнее визуализировать те понятия, концепции и инструменты, о которых будет идти речь на страницах книги. Название у компании абстрактное, она нужна нам лишь для примера увеличения эффективности ее работы при внедрении различных практик в области управления данными. Соответственно, любые сходства с реальными компаниями случайны. В начале повествования компания не обладает какими-то серьезными знаниями в области управления данными. Она ведет свою деятельность на рынке телекоммуникаций, ее клиентами являются как частные лица, так и компании. Она имеет сложную филиальную организационную структуру, информационные системы, отвечающие за различные функции, включая фронт- и бэк-офисы. Особых успехов нет. Но с каждой новой главой ситуация будет меняться! В каждой главе мы будем описывать, как рассматриваемая проблематика выглядит на примере «Телеком Дубль», что для нее значит внедрение того или иного инструмента, что получается в результате как для ИТ-ландшафта, так и с организационной и эксплуатационной точки зрения.

Ценность ваших данных… Эти три слова описывают книгу целиком. Данные, информация, знания – все эти понятия окружают нас каждый день. Но ценность данных нужно еще раскрыть с помощью грамотного управления: без этого они могут быть лишь балластом, тянущим на дно.

При обсуждении процессов управления данными часто рассматривают две цепочки – цепочку ценности данных и цепочку поставок данных. Эти обобщенные концепции настолько важны, что мы решили отразить их на обложке. Что это за цепочки, как они соотносятся друг с другом и как выстроить их таким образом, чтобы извлечь из данных максимальную ценность? Об этом мы тоже поговорим на страницах предлагаемой книги.

Надеемся, что наша работа будет интересна самому широкому кругу читателей, которые интересуются данными. А учитывая тот факт, что данные в последние годы окутывают нас все больше и больше, круг будет расширяться.

Книга состоит из двух частей.

В первой части описывается многообразие окружающих нас данных и связанных с ними технологий, рассматривается последовательность преобразований «данные – информация – знания – мудрость», обсуждаются эволюция отношения к данным в организациях и задачи, стоящие перед ними в связи с переходом к представлению о данных как ценнейшем стратегическом активе.

Во второй части анализируются особенности данных как объекта управления, описываются функции управления информационными активами в контексте построения цепочек ценности данных и цепочек их поставок, обсуждаются основные тренды будущего в области технологий управления данными.

Введение

В 2006 году британский математик и бизнесмен Клайв Хамби ввел в обращение фразу «Данные – это новая нефть»[1]. Он произнес ее на саммите топ-менеджеров по маркетингу, который проводился американской Ассоциацией национальных рекламодателей (Association of National Advertisers, ANA) в Школе менеджмента им. Келлога (Kellogg School of Management).

В том же году вице-президент ANA Майкл Палмер (Michael Palmer) в статье, посвященной тезису Хамби, развил его мысль: «Данные похожи на сырье. Оно полезно, но в необработанном виде непригодно для использования. Его необходимо преобразовать в газ, пластмассу, химикаты и тому подобные вещи, чтобы создать имеющие ценность объекты, которые обеспечили бы деятельность, приносящую прибыль; аналогичным образом и данные должны быть разложены на элементы и проанализированы, чтобы они обрели ценность»[2].

 

Спустя несколько лет, в 2013 году, глава IBM Вирджиния Рометти (Virginia Rometty), выступая перед представителями американского Совета по международным отношениям (Council on Foreign Relations, CFR), несколько перефразировала эту мысль, сравнив с новой нефтью большие данные (Big Data)[3].

Сравнение данных с нефтью стало использоваться еще активнее после появления в 2017 году в журнале The Economist статьи «Самый ценный ресурс в мире больше не нефть, а данные»[4].

Наконец, не менее ярко высказался авторитетный китайский ученый и эксперт Кай-Фу Ли (Kai-Fu Lee)[5]. В своей книге «Сверхдержавы искусственного интеллекта. Китай, Кремниевая долина и новый мировой порядок», вышедшей в 2019 году, он пишет: «Если данные – это новая нефть, то Китай – это новая Саудовская Аравия»[6].

Но одновременно с ростом количества упоминаний о данных как о новой нефти возрастало и число публикаций, выдвигающих обратный тезис: «Данные – это не новая нефть»[7]. В последнее время стали появляться статьи, рассматривающие вопросы токсичности данных[8] и даже высказывающие мнение, что данные – это «новый мусор», не имеющий особой ценности[9].

Очевидно, ключ к разрешению противоречия – приведенные выше слова вице-президента ANA Майкла Палмера о том, что данные похожи на сырье и для того, чтобы они обрели ценность, необходима их предварительная обработка. Но следует учитывать, что это особое сырье, во многом отличающееся от нефти и других природных ресурсов. Так как же правильно организовать его обработку? Существуют ли рациональные методы работы с данными? Ответы на эти вопросы – в соответствующем отношении к данным как отдельных компаний и организаций, так и целых государств.

Последние 10–15 лет в среде специалистов, занимающихся вопросами работы с данными, последовательно формируется представление об управлении данными как активом[10]. Созданы профессиональные организации, развивающие это направление. В частности, функционирует Международная ассоциация управления данными (Data Management Association International, DAMA), объединившая профессионалов в области управления данными по всему миру. Она призвана собирать, систематизировать и пропагандировать прогрессивный опыт. Регулярно проводятся различные тематические форумы, появилось большое количество книг и статей на эту тему, включая вышедшее в 2017 году (и переведенное на русский язык) уже второе издание руководства DAMA к своду знаний по управлению данными (DAMA-DMBOK2)[11]

Что же нужно делать компании или организации, чтобы начать обращаться с данными как с активом? Базовые шаги, позволяющие обеспечивать и наращивать монетизацию данных, известны. Они изложены, например, в книге ведущего аналитика Gartner Дагласа Лейни[12] «Инфономика: информация как актив: монетизация, оценка, управление»[13]. Тем не менее в этой же книге подчеркивается, что в большинстве организаций не введена практика последовательного управления информационными активами, как это сделано в отношении материальных или финансовых активов. Сотрудники компаний продолжают действовать по старинке. В частности, сохраняется несогласованность между управлением информационными технологиями и управлением данными. В своей переписке с Лейни Джон Лэдли[14] отмечал: «Пока мне приходится наблюдать, как команды разработчиков поспешно производят сотни приложений и сервисов, не принимая во внимание вопросов использования связанных с ними данных, мне будет обеспечена полная занятость».

Недооценка перехода на новые подходы к работе с данными рискованна. В 2016 году Клаус Шваб (Klaus Schwab), основатель и президент Всемирного экономического форума в Давосе, в своей одноименной книге провозгласил четвертую промышленную революцию. Революцию, которая основана на цифровизации и характеризуется дизруптивным (ломающим привычные представления)[15] воздействием на утвердившиеся традиционные компании. Чтобы удержаться на плаву, компании вынуждены трансформировать себя, используя для этого цифровые и информационные технологии (рис. В1). Шваб подчеркивает, что особую тревогу в связи с осуществлением стоящих на повестке дня революционных преобразований у него вызывают два фактора, ограничивающие их позитивный потенциал. Первый – низкий уровень управления текущими изменениями. Второй – отсутствие единой последовательной концепции их осуществления. Оба фактора распространяются и на вопросы работы с данными.

Четвертая промышленная революция основана на цифровизации и характеризуется дизруптивным (ломающим привычные представления) воздействием на утвердившиеся традиционные компании.

Чтобы оставаться на плаву, компании вынуждены трансформ ироваться, используя для этого цифровые технологии, – проводить цифровую трансформацию.

Компания изобретает заново саму себя, директор по цифровой трансформации (CDTO) выступает в роли «внутреннего предпринимателя».



Некоторые ключевые этапы развития представлений о ценности данных и цифровой трансформации начиная с начала 2000-х отражены на рисунке В2.

Появившийся во время первой президентской кампании Билла Клинтона в 1992 году популярный слоган «Это экономика, тупица» (It’s the economy, stupid), подчеркивающий важность и сложность решения экономических проблем, с тех пор трансформировался применительно ко многим контекстам. В частности, в контексте цифровизации широко распространилось клише «Это данные, тупица» (It’s the data, stupid)[16]. А чтобы привлечь еще большее внимание к необходимости комплексного учета всех аспектов работы с данными и управления ими, стала использоваться фраза «Это не просто данные, тупица» (It’s not just the data, stupid)[17]. Важность всестороннего взгляда на данные убедительно подтверждает практика реализации проектов, связанных с уберизацией (uberization), внедрением концепции «умного города» (smart city) и другими проявлениями того, что называется цифровой экономикой (digital economy) или экономикой, управляемой на основе данных (data-driven economy).

 

Как наладить управление данными, чтобы достойно противостоять дизруптивным воздействиям, извлечь ценность из имеющихся информационных ресурсов (превратить их из «мусора» в «нефть») и неуклонно ее повышать? Разобраться в этих вопросах руководителям и рядовым сотрудникам предприятий и организаций, не имеющим прямого отношения к сфере ИТ, порой бывает непросто. Да и у специалистов в области ИТ, как показывает наш опыт, возникает немало вопросов.

К сожалению, литературы на русском языке на эту тему еще очень мало, а информация из многочисленных иностранных источников не всегда доступна, в том числе из-за языкового барьера. Хорошо осознавая эти проблемы, мы решили поделиться собственным накопленным опытом и видением ситуации. Надеемся также, что наша книга дополнит набор русскоязычных материалов, используемых преподавателями и обучающимися по такому недавно возникшему и стремительно развивающемуся образовательному направлению, как data literacy (грамотность в области данных).

Часть 1. Данные: Смена парадигм
От первой научной революции до четвертой промышленной

Глава 1. Цифровое многообразие

1.1. В чем ценность данных

Стоит только задуматься, в каком мире мы живем, и сразу обнаруживаешь, какое количество технологий нас окружает. Сейчас мы уже не представляем себе жизни без них. Мало кто задумывается, что с каждым годом динамика формирования наших потребностей во всем новом растет невероятными темпами. Даже такие крайне необходимые и уже привычные вещи, как мобильный телефон, еще 30 лет назад вызывали восхищение. Тогда пользоваться ими могли лишь избранные, сейчас же этот девайс стал постоянным спутником современного человека и уже не воспринимается как мобильное средство голосовой коммуникации. iPhone первого поколения, разработанный корпорацией Apple, поступил в продажу в 2007 году и перевернул представление о мобильном телефоне, сделав его центром коммуникаций, развлечений, устройством для получения всевозможных электронных услуг и средством платежей. Функциональные возможности современных телефонов становятся все шире. И сейчас, по прошествии 15 лет, мы себе уже не представляем, как можно жить без всего этого.

Таких примеров сотни тысяч – в самых разных областях нашей жизни. Все они стали настолько повседневными примерами нашего общения с технологиями, что мы к ним привыкли и перестали замечать.

Но несмотря на эту кажущуюся повседневность современных технологий, мировая экономика очень чутко реагирует на происходящие в нашей жизни изменения. Эта реакция проявляется повышенным интересом инвесторов в сторону технологического сегмента, который позволяет на основе человеческого интеллекта, предпринимательской смелости и современных процессов управления создавать крупнейшие мировые компании, каждая из которых может в любой момент обогнать, казалось бы, незыблемые столпы мировой экономики.

Давайте взглянем на рейтинг 100 крупнейших компаний мира (табл. 1.1)[18]:



Обращает на себя внимание количество технологических компаний в первой десятке. Если быть точными, их пять, а в первой сотне – уже 30. Помимо этого, в рейтинге еще 19 компаний, занимающихся здоровьем и биотехнологиями, что также относится к технологическому сегменту деятельности. По прогнозам аналитиков, количество высокотехнологических компаний будет возрастать еще большими темпами, а одним из основных критериев успешности для компаний из других областей станет использование высоких технологий в развитии своих решений.

Экономическая важность высокотехнологических компаний уже сейчас оказывается основополагающей для развития мировой и национальных экономик. Из 20 крупнейших компаний мира 10 (Apple, Alphabet, Amazon, Microsoft, Alibaba, Walmart, Tencent, Johnson & Johnson, Procter & Gamble, Nestlé), по мнению Boston Consulting Group, являются самыми инновационными на планете (рис. 1.1)[19]. Вывод прост: сегодня, чтобы стать успешной компанией, необходимо быть инновационной и высокотехнологичной независимо от отрасли деятельности. Именно это становится фундаментом для развития.



При всем многообразии высоких технологий в различных областях нашей жизни есть несколько ключевых технологий, на которых исследователи и разработчики строят свои открытия. Одной из групп таких технологий являются решения для работы с данными, которые не только помогают в создании новых продуктов, но и позволяют повысить эффективность действующих решений.

Одним из самых ценных активов компаний в ближайшем будущем станут данные, накопленные ими за годы деятельности: информация о клиентах, поставщиках, номенклатуре закупаемой и продаваемой продукции, о сотрудниках, оборудовании, исследовании рынков, а также статистика, публикуемая различными государственными, общественными и частными организациями. Возможность анализировать и использовать огромные массивы данных позволит государствам и организациям стать более эффективными – создать огромное количество новых направлений деятельности и совсем по-иному взглянуть на давно сложившиеся стороны жизни.

В последнее время появляется все больше и больше исследований, описывающих человека как огромный массив информации, связанной с его документами, услугами, которыми он пользуется, аккаунтами в социальных сетях, транзакциями, платежными инструментами и другими цифровыми следами повседневной жизни. Еще 100 лет назад человека, его внешность, знания, устремления, жизненный опыт, чувства, таланты, эмоции и желания изображали художники и литераторы, сейчас же цифровые следы человека заметны везде.

Как мы уже говорили, мы живем в эпоху технологий и открытий, происходящих с немыслимой скоростью, когда с момента фундаментальных открытий до повседневности технологий проходят считанные годы, а объем хранимых человечеством данных прирастает ежегодно десятками процентов. Согласно результатам исследования аналитической фирмы IDC, опубликованным в докладе «Эра данных – 2025» (Data Age 2025), в ближайшие годы основной объем данных будут производить не отдельные пользователи, а организации. На промышленность и другие сферы экономики придется до 60 % всех данных мира. Для сравнения, в 2015 году предприятия генерировали треть всех мировых данных. При этом, как утверждают авторы исследования, в будущем более важную роль будет играть качество данных, а не их количество. «Не все данные одинаково важны, а без контекста они и вовсе бесполезны. В этот период перемен лидерство будет принадлежать организациям, которые сумеют определить наиболее критичные подгруппы информации с максимальным влиянием на нужную сферу деятельности и сосредоточатся именно на них» – говорится в отчете. Пятая часть всех данных к 2025 году станет критически важной, считают исследователи. Речь идет о сведениях, от которых будет зависеть жизнь и безопасность людей, международная обстановка и мир на планете.

При этом в ближайшие годы разрыв между объемом данных, нуждающихся в защите, и реально защищенной информацией будет только расти. К 2025 году до 90 % всей информации должно быть так или иначе защищено. Авторы доклада также отмечают, что значительный объем данных будет исходить от устройств, которые окружают нас каждый день. Во-первых, к 2025 году 75 % всего населения Земли будет иметь постоянный доступ в интернет. Во-вторых, многократно возрастет количество умных гаджетов и домашних роботов, которые будут производить так называемые метаданные – служебную информацию, которой машины будут обмениваться между собой для слаженной работы. По сравнению с сегодняшним днем каждый человек будет в 20 раз чаще взаимодействовать с интернетом или с устройствами с выходом в интернет. Если сейчас среднее количество взаимодействий чуть больше 600, то к 2025 году мы будет сталкиваться с сетью 4800 раз в день[20].

Работа тысяч корпораций и государственных структур по созданию различного рода сервисов, предоставляющих услуги посредством интернета, уже привела к тому, что в крупных городах люди зачастую получают существенную долю государственных сервисов и приобретают различные товары и услуги за пару минут, пользуясь приложениями в телефоне. Более того, зачастую мы сталкиваемся с тем, что компании знают о наших предпочтениях и предпочтениях членов наших семей гораздо больше, чем мы сами, напоминая нам о том, какие продукты мы предпочитаем, когда необходимо запланировать очередную покупку и доставку этих продуктов к нам домой, когда необходимо сделать очередное ТО автомобиля, когда заканчиваются страховки и какие страховые продукты мы предпочли в прошлом периоде.

Все это, с одной стороны, делает жизнь легче и позволяет сосредоточиться на самом важном – семье, работе, хобби, общении с друзьями и родственниками, с другой стороны, еще больше ускоряет темп нашей жизни. Если вдуматься, мы экономим огромное количество времени на дороге, очереди, ожидании консультантов и оформлении документов в страховых компаниях, посещении всевозможных центров, предоставляющих различные государственные услуги.

Отдельно стоит отметить возможности для ИТ-специалистов, разработчиков различных приложений.

1Клайв Хамби (Clive Humby) – создатель успешной программы лояльности «Клубная карта» для клиентов розничной сети супермаркетов Tesco. Подавляющее большинство источников приписывают авторство этой фразы именно ему.
  https://ana.blogs.com/maestros/2006/11/data_is_the_new.html.   https://siliconangle.com/2013/03/11/ibms-ceo-says-big-data-is-like-oil-enterprises-need-help-extracting-the-value.   https://www.economist.com/leaders/2017/05/06/the-worlds-most-valuable-resource-is-no-longer-oil-but-data.
5Кай-Фу Ли – экс-президент Google China, руководитель инвестиционного фонда для китайских стартапов в области искусственного интеллекта Sinovation Ventures.
  https://www.mann-ivanov-ferber.ru/books/sverhderzhavy-iskusstvennogo-intellekta/.   В качестве примера приводим следующие публикации:   https://hbr.org/2012/11/data-humans-and-the-new-oil.   https://towardsdatascience.com/data-is-not-the-new-oil-bdb31f61bc2d.   https://towardsdatascience.com/data-is-not-the-new-oil-721f5109851b.   https://enterprisersproject.com/article/2019/7/data-science-data-can-be-toxic.   https://expert.ru/2020/08/6/dannyie-eto-novyij-musor/.
10Под активом понимается имеющийся в собственности или контролируемый экономический ресурс, содержащий в себе или производящий ценность. При этом он может быть конвертирован в деньги (монетизирован).
11DAMA-DMBOK: Свод знаний по управлению данными. Второе издание / Dama International. – М.: Олимп-Бизнес, 2020 (издание подготовлено при поддержке компаний «Юнидата» и BSSG).
12Даглас Лейни (Douglas Laney) – известный специалист в области хранилищ данных и стратегического управления данными, автор модели зрелости процессов управления корпоративной информацией компании Gartner, а также один из авторов термина Big Data (большие данные).
13Laney D. B. (2017). Infonomics: How to Monetize, Manage, and Measure Information as an Asset for Competitive Advantage; Routledge; 1st edition.
14Джон Лэдли (John Ladley) – признанный в мире авторитет в области управления данными. Автор книг Making Enterprise Information Management (EIM) Work for Business: A Guide to Understanding Information as an Asset («Управление корпоративной информацией в интересах бизнеса: Руководство по выработке отношения к информации как к активу») и How to Design, Deploy and Sustain an Effective Data Governance Program («Как разработать, внедрить и поддерживать эффективную программу руководства данными»).
  https://cyberleninka.ru/article/n/gumanitarnost-v-obrazovanii-kak-otvet-na-dizruptivnye-innovatsii.   https://atos.net/en/blog/its-the-data-stupid.   https://www.osp.ru/news/articles/2016/25/13049787.   https://www.pwc.com/gx/en/audit-services/publications/assets/pwc-global-top-100-companies-2021.pdf.
19The Most Innovative Companies 2021. The Serial Innovation Imperative. Boston Consulting Group 2021.
  https://www.seagate.com/files/www-content/our-story/trends/files/idc-seagate-dataage-whitepaper.pdf.

Издательство:
Альпина Диджитал
Поделиться: