Ричард Винтер из фирмы WinterCorp опубликовал потрясающую статью «Большие данные: сколько они стоят на самом деле?»{35}
. В ней он описывает структуру, в рамках которой можно будет принять во внимание все типы затрат и использовать показатель, названный Винтером “total cost of data” (TCOD) – «суммарная стоимость данных», при инвестировании в аппаратное и программное обеспечение для поддержки аналитики. TCOD отражает общую стоимость широкого разнообразия необходимых компонентов, их мы рассмотрим далее в этой главе.Обратите внимание на то, что модель TCOD Винтера, а также бо́льшая часть этого раздела сосредоточены главным образом на одной стороне баланса, а именно на затратах. Я поступил так преднамеренно, поскольку компоненты затрат в разных организациях довольно схожи, тогда как получаемые за счет их преимущества могут значительно варьироваться в зависимости от конкретных аналитических процессов. Кроме того, когда речь идет об аналитике, точная оценка затрат часто упускается из виду. Вот почему я предлагаю сосредоточиться на этой стороне вопроса.
Большое преимущество модели TCOD Винтера состоит в том, что она не склоняется в пользу того или иного конкретного решения, а просто предлагает способ, который позволяет оценить и принять в расчет различные компоненты стоимости. Например, в статье описываются две различные ситуации, когда использование этой модели привело к двум совершенно противоположным выводам. В первом случае на основе свойств, требуемых для данных и обработки, был сделан вывод о том, что создание массивного параллельного окружения обойдется в три-четыре раза дороже, чем использование Hadoop. В другом случае с учетом свойств, требуемых для данных и обработки, был сделан вывод о том, что инвестиции в Hadoop обойдутся в три-четыре раза дороже, чем создание необходимого окружения.
Использование этой модели, нейтральной по отношению к оценке инструментов и технологий, позволяет объективно учесть все затраты. Применительно к операционной аналитике модель TCOD требует некоторой модификации, поскольку предусматривает слегка иной характер инвестирования. Однако, как мы увидим в следующем разделе, сочетание модели TCOD с дополнительными метриками, привязанными конкретно к операционной аналитике, создает великолепную стартовую позицию.
Каковы совокупные расходы на операционную аналитику?
При рассмотрении вариантов инвестирования в аналитику очень важно точно оценить совокупные расходы. Например, рассматривая инструменты с открытым исходным кодом, организации не должны слишком радоваться, получив бесплатную лицензию на программное обеспечение. Необходимо представить полную картину затрат с течением времени. Да, инструменты с открытым исходным кодом могут оказаться полезнейшим дополнением к аналитической среде. Однако при этом необходимо учесть все совокупные расходы и с осторожностью воспринимать ложные стимулы, чтобы по своему недосмотру не попасть со временем на повышенные издержки.
Итак, что следует учесть, оценивая затраты, связанные с внедрением операционной аналитики? Вам придется потратиться на следующее (а возможно, и не ограничиться этим){36}
:• оборудование для поддержки аналитической обработки;
• программное обеспечение (обратите внимание, что даже в случае с открытым исходным кодом возникнут затраты, связанные с установкой и настройкой ПО);
• пространство для размещения оборудования и потребляемую электроэнергию;
• полностью загруженную рабочую силу, потребную для обеспечения безопасности, назначения приоритетов ресурсов и настройки связности сети;
• сбор, загрузку и подготовку данных;
• рабочую силу для развития аналитического процесса;
• действия по тестированию логики программы и точности результатов процесса;
• обслуживание платформы, ПО и аналитических процессов с течением времени;
• обучение персонала навыкам пользования всеми различными компонентами аналитического окружения.
Все эти затраты должны быть оценены, исходя из периода в несколько лет до завершения инвестиционного цикла.
Легко упустить из виду некоторые важные компоненты затрат на фоне совокупных инвестиций в поддержку аналитики. За первоначальными расходами последуют текущие затраты на рабочую силу и обслуживание технологий в течение всего инвестиционного цикла. Эти текущие затраты в конечном итоге могут значительно превысить первоначальные.