вторник, 28 августа 2012 г.

АСУ ТП: Требуются коммерческие представители

АСУ ТП: Требуются коммерческие представители: Требуются коммерческие представители На наш ресурс в отдел продвижения продуктов, требуются инициативные, днловые люди для продвижен...

АСУ ТП: Как стать коммерческим представителем ?

АСУ ТП: Как стать коммерческим представителем ?: Как стать коммерческим представителем ? Мы предлагаем всем желающим стать региональными коммерческими представителми и продвигать информ...

АСУ ТП: Этапы создания информационных систем

АСУ ТП: Этапы создания информационных систем: Этапы создания информационных систем I этап — предпроектный (обследование, составление отчета, технико-экономического обоснования и техн...

АСУ ТП: Что мне нужно знать?

АСУ ТП: Что мне нужно знать?: Что мне нужно знать?   Что предлагается и какова оплата ? Как стать коммерческим представителем ? Что мне нужно знать ? Отзы...

Информационное обеспечение

Информационное обеспечение


Информационное обеспечение (ИО) — важнейшая обеспечивающая подсистема АИС, предназначеная для снабжения пользователей информацией, характеризующей состояние управляемого объекта и являющейся основой для принятия управленческих решений.
ИО — это совокупность средств и методов построения информационной системы экономического объекта.

Внемашинное и внутримашинное обеспечение

Внемашинное информационное обеспечение — это системы показателей, классификаторов, кодов и документации.
Внутримашинное информационное обеспечение — это различные файлы на машинных носителях, автоматизированные банки данных (АБД).
Информационное обеспечениеИнформационное обеспечение

Проектирования информационного обеспечения

Проектирования ИО, выполняется совместно с пользователями АИС, ведется с системных позиций параллельно с проектированием технологического, программного и математического обеспечения.
В ходе проектирования информационного обеспечения выполняются следующие работы:
  • определение состава показателей, необходимых для решения экономических задач, их объемно-временных характеристик и информационных связей;
  • исследование возможностей использования общегосударственных и отраслевых классификаторов, разработка локальных классификаторов и кодов;
  • проектирование форм новых первичных документов и выявление возможностей применения унифицированной системы документации;
  • определение типа организации автоматизированного банка данных (АБД);
  • проектирование форм вывода результатных сведений.
Целью внедрения АИС является дальнейшая информатизация конечного пользователя, поэтому его участие в проводимых информационных и внедренческих работах необходимо и является важной предпосылкой их успешного выполнения.
Появляются дополнительные возможности: ведение в компьютер справочников, формирование всевозможных докладов и таблиц произвольной формы, широкий обмен информацией между пользователями и пр.

воскресенье, 26 августа 2012 г.

Стать коммерческим представителем

Как стать коммерческим представителем ?

Мы предлагаем всем желающим стать региональными коммерческими представителми и продвигать информационные продукты - автоматизированныце систн\емф управления предприятием.
 
 
 Для того, чтобы зарегистрироваться в качестве коммерческого представителя и начать работу по продвижению систем управления предприятием, Вам необходимо:

1) Направить письмо на адрес alt.soft@mail.ru со своего почтового ящика и указать в нем свое имя, фамилию и регион проживания. В ответном письме Вам придет соглашение и необходимые обучыающие материалы и инструкции

2) Оплатить регистрационный взнос, подтверждающий серъезность Ваших намерений в количестве 5 долларов США.


четверг, 23 августа 2012 г.

Комплексная система резервного копирования

Комплексная система резервного копирования Это система обеспечивающая процесс создания копии информации на носителе, надежно хранящейся, предназначенной для восстановления данных в оригинальном или новом месте ее расположении в случае повреждения, некорректного изменения, разрушения. Надёжность хранения информации обеспечивается применением отказоустойчивого оборудования систем хранения, дублированием информации и заменой утерянной копии другой в случае уничтожения одной из копий (в том числе как часть отказоустойчивости). Сегодня для любой индустрии информация является настолько же ценной, как и валюта. Однако она может быть легко потеряна или искажена. Жесткий диск при всей своей надежности может сломаться, стихийное бедствие может уничтожить оборудование, а нерадивый или обиженный сотрудник – просто стереть данные. И когда компания теряет информацию, ее работа парализуется, что может грозить потерей денег и репутации компании. Вот почему необходимо резервное копирование данных. Несомненно, системы резервного копирования исключают значительные материальные затраты на восстановление утраченной, поврежденной информации, позволяют быстро оперировать с различными версиями данных, обусловленных разным временем их создания. Защита информации Программы резервного копирования

Виртуализация ИС

Виртуализация ИС Это проверенная программная технология, которая в ускоренном темпе преобразует информационную систему и вносит принципиальные изменения в процессы вычислительной деятельности. В основе виртуализации серверов лежит возможность одного компьютера выполнять работу нескольких компьютеров благодаря распределению его ресурсов. С помощью виртуальных серверов можно разместить несколько ОС и несколько приложений в едином местоположении, в т.ч. удаленно. Таким образом, физические и географические ограничения перестанут иметь какое-либо значение. Помимо энергосбережения и сокращения расходов благодаря более эффективному использованию аппаратных ресурсов, виртуальная инфраструктура обеспечит вам высокий уровень доступности ресурсов, более эффективную систему управления настольными ПК, повышенную безопасность и усовершенствованную систему восстановления в критических ситуациях. Экономические выгоды виртуализации Виртуализация — это технология, которая приносит выгоду любому пользователю компьютера. Миллионы людей и тысячи организаций мира применяют решения виртуализации для сокращения расходов на ИТ и одновременного повышения производительности, эффективности использования и гибкости имеющегося в наличии вычислительного оборудования. Причины внедрения виртуализации Консолидация серверов и оптимизация инфраструктуры: С помощью виртуализации можно достичь значительно более эффективного использования ресурсов, поскольку она обеспечивает объединение стандартных ресурсов инфраструктуры в единый пул и преодолевает ограничения устаревшей модели «одно приложений на сервер». Сокращение расходов на физическую инфраструктуру: Виртуализация позволяет сократить количество серверов и связанного с ними ИТ оборудования в информационном центре. В результате этого потребности в обслуживании, электропитании и охлаждении материальных ресурсов сокращаются, и на ИТ затрачивается гораздо меньше средств. Повышение гибкости и скорости реагирования системы: Виртуализация предлагает новый метод управления ИТ-инфраструктурой и помогает ИТ-администраторам затрачивать меньше времени на выполнение повторяющихся заданий — например, на инициацию, настройку, отслеживание и техническое обслуживание. Повышение доступности приложений и обеспечение непрерывности работы предприятия: Благодаря надежной системе резервного копирования и миграции виртуальных сред целиком без перерывов в обслуживании вы сможете сократить периоды планового простоя и обеспечить быстрое восстановление системы в критических ситуациях. Усовершенствованная система управления и безопасности: Кроме того, вы сможете развертывать, управлять и отслеживать процессы защищенных настольных сред, к которым конечным пользователям будет предоставляться локальный или удаленный доступ при наличии подключения к сети или без него, практически с любого стандартного настольного ПК, ноутбука или планшетного ПК. Системы виртуализации Технологии виртуализации

Проектирование информационных систем

Проектирование информационных систем Внедрение информационных систем на предприятии может быть сопряжено с некоторыми трудностями. Однако некоторые из них можно предотвратить еще на этапе проектирования. Детальный анализ бизнес-процессов предприятия позволяет очертить круг задач, с которыми столкнутся руководители, специалисты IT-служб и рядовые сотрудники компании. Для успешного построения информационных систем необходим грамотный консалтинг. Таким образом проводится сравнение нынешнего процесса управления информацией и тех условий, которые предполагаются в будущем. В процессе разработки технического задания определяется соотношение затрат и выгод, обозначаются технические требования, которым должно соответствовать оборудование и программное обеспечение. В процесс проектирования информационных систем входит создание нормативной базы предприятия: распоряжений, инструкций, руководств пользователей. Информация строго соотносится с должностными инструкциями сотрудников организации и привязывается к функциям подразделений. В процессе построения информационных систем учитывается расположение отделов и рабочих групп, финансовая структура организации, технологические процессы и маршруты движения информации, а также особенности ведения учета выполненных работ и контроля рабочего времени. Следующим этапом является подбор технических средств и программ на основе предложений рынка программных решений. В случае, если особенностью предприятия является работа с большим количеством данных, не последнюю роль в выборе играют простота и гибкость интерфейса. Перед внедрением информационных систем проводится тестирование, позволяющее выявить возможные трудности и внести необходимые корректировки до начала эксплуатации. При необходимости руководство компании может принять решение об обучении сотрудников использованию новых программных средств.

Информационное общество

Информационное общество Информационное общество — общество, в котором большинство работающих занято производством, хранением, переработкой и реализацией информации, особенно высшей ее формы — знаний. Ученые считают, что в информационном обществе процесс компьютеризации даст людям доступ к надежным источникам информации, избавит их от рутинной работы, обеспечит высокий уровень автоматизации обработки информации в производственной и социальной сферах. Движущей силой развития общества должно стать производство информационного, а не материального продукта. Материальный же продукт станет более информационно емким, что означает увеличение доли инноваций, дизайна и маркетинга в его стоимости. В информационном обществе изменятся не только производство, но и весь уклад жизни, система ценностей, возрастет значимость культурного досуга по отношению к материальным ценностям. По сравнению с индустриальным обществом, где все направлено на производство и потребление товаров, в информационном обществе производятся и потребляются интеллект, знания, что приводит к увеличению доли умственного труда. От человека потребуется способность к творчеству, возрастет спрос на знания. Материальной и технологической базой информационного общества станут различного рода системы на базе компьютерной техники и компьютерных сетей, информационной технологии, телекоммуникационной связи. ПРИЗНАКИ ИНФОРМАЦИОННОГО ОБЩЕСТВА Осознание обществом приоритетности информации перед другим продуктом деятельности человека. Первоосновой всех направлений деятельности человека (экономической, производственной, политической, образовательной, научной, творческой, культурной и т.п.) является информация. Информация же является продуктом деятельности современного человека. Информация в чистом виде (сама по себе) является предметом купли – продажи. Равные возможности в доступе к информации всех слоев населения. Безопасность информационного общества, информации. Защита интеллектуальной собственности. Взаимодействие всех структур государства и государств между собой на основе ИКТ. Управление информационным обществом со стороны государства, общественных организаций. Кроме положительных моментов прогнозируются и опасные тенденции: все большее влияние на общество средств массовой информации; информационные технологиимогут разрушить частную жизнь людей и организаций; существует проблема отбора качественной и достоверной информации; многим людям будет трудно адаптироваться к среде информационного общества. существует опасность разрыва между "информационной элитой" (людьми, занимающимися разработкой информационных технологий) и потребителями.

четверг, 12 января 2012 г.

Афоризмы и высказывания о информации

Афоризмы и высказывания о информации



Каждый хочет, чтобы его информировали честно, беспристрастно, правдиво — и в полном соответствии с его взглядами.

Гилберт Честертон



Чем меньше мы знаем, тем больше подозреваем.

Генри Уилер Шоу



Чем менее точна информация, тем более бурно мы на нее реагируем.
«Замечание Уэдервакса»


Бывает информация из первых рук, высосанная из пальца.
Роберт Карпач


1. Каждый может принять решение, располагая достаточной информацией.

2. Хороший руководитель способен принять решение, располагая недостаточной информацией.

3. Идеальный руководитель способен принять решение, не зная решительно ничего.
«Законы информации Спенсера»

Четыре закона теории информации:

1. Информация, которая у вас есть, не та, которую вам хотелось бы получить.

2. Информация, которую вам хотелось бы получить, не та, которая вам на самом деле нужна.

3. Информация, которая вам на самом деле нужна, вам недоступна.

4. Информация, которая в принципе вам доступна, стоит больше, чем вы можете за нее заплатить.



Умный человек знает всё; мудрый — всех.

«Quotable Business»



Хорошо информированного человека сразу видно: это тот, чье мнение совпадает с вашим.

Илка Чейз



Мы тонем в информации и задыхаемся от нехватки знаний.

Джон Нейзбитт



Информация сама по себе — не сила, иначе самыми могущественными людьми на свете были бы библиотекари.

Брюс Стерлинг



Кто держит в поле зрения все, не замечает ничего.

Марк Клейман



Семь восьмых чего бы то ни было невозможно увидеть.

«Теорема айсберга»



Невозможно собрать всю информацию, необходимую, чтобы принять решение. Если вся информация у вас на руках, это уже не решение, а заключение, сделанное задним числом.

Дэвид Махоуни



В достаточно сложных системах сбор информации не имеет связи с принятием решения.

«8-й закон Хорвуда»



Информация — основная валюта демократии.

Ралф Нейдер



Оптимизм — это недостаток информации.

Раневская Фаина Георгиевна



Тайная [важная] информация - это почти всегда источник большого состояния и результат публичного скандала.

Уайльд Оскар



Если думаешь, что тебе всё известно - ты чего-то не заметил.

Томас Роберт Дьюар



Никогда не отвечайте на вопрос, пока не выясните точно, кто и почему его задает и куда дальше пойдет эта информация.

Скотт Адамс



В наше время мы страдаем не столько из-за недостатка информации, сколько от избытка ненужной, бесполезной информации, не имеющей никакого отношения к выходу из кризисных ситуаций. Найдите возможности отделить бесполезное от важного, и вы почувствуете, что владеете ситуацией.

Джефф О`Лири



Вы можете согласиться на роль обучаемого и принять новую информацию, или же вы можете почивать на лаврах собственной образованности и бесконечно повторять круги собственных успехов и ошибок.

Даг Холл



Человек, лишенный информации, не может нести ответственность; человек, которому предоставлена информация, не может ее на себя не взять.

Ян Карлзон



Существует огромная разница между знанием и пониманием: вы можете много знать о чем-то, по-настоящему не понимая этого.

Чарльз Кеттеринг



В жизни, как правило, преуспевает больше других тот, кто располагает большей информацией

Бенджамин Дизраэли



Я твердо верю в одну простую вещь: самый надежный способ выделить свою компанию среди конкурентов, оторваться от толпы преследователей - это хорошо организовать работу с информацией. Именно то, как вы собираете, организуете и используете информацию, определяет, победите вы или проиграете.

Билл Гейтс



Весь секрет бизнеса в том, чтобы знать что-то такое, чего не знает больше никто.

Аристотель Онассис



Факты не перестают существовать оттого, что ими пренебрегают.

О. Хаксли



Факты - лучшие доказательства, они и прекращают спор.

Ф.Дюпанлу



Хорошо информированный человек — самый бесполезный зануда на свете.
Алфред Уайтхед

Информация (Известие, Сообщение, Факт)

Информация (Известие, Сообщение, Факт)

Тайная информация - это почти всегда источник большого состояния и результат публичного скандала. - О. Уайльд

Бывает легче читать между строк, чем строку за строкой. - Г. Джеймс

С течением времени старые бредни становятся мудростью, а старые маленькие небылицы, довольно небрежно сплетенные, порождают большие-пребольшие истины. - П. Бомарше

Чем менее точна информация, тем более бурно мы на нее реагируем. А.Блох

Факты не перестают существовать оттого, что ими пренебрегают. - О. Хаксли

Когда факты доказаны, их сопоставляют и выводят из них правила. Ж.Шапталь

Принято считать, что любой факт, каким бы он ни был сомнительным, значительней любой игры ума, какой бы она ни была глубокой. Г.Видал

Не все, что является фактом, заслуживает того, чтобы быть описанным. - Вольтер

Факты - лучшие доказательства, они и прекращают спор. Ф.Дюпанлу

За исключением цифр, нет ничего более обманчивого, чем факты. - С. Смит

Факты дружелюбны. - Г. Миллер

Я не выношу, когда мне подсказывают, что я должен испытывать, потому что тогда я сам кажусь себе слепцом, хотя и могу понять, о чем идет речь. М.Фриш

Каждый хочет, чтобы его информировали честно, беспристрастно, правдиво - и в полном соответствии с его взглядами. - Г. Честертон

Прекрасное рассуждение не уничтожает факта. П.Лашоссе

Знание некоторых принципов легко возмещает незнание некоторых фактов. - К. Гельвеций

Сообщать о себе - природное стремление; воспринимать сообщенное так, как оно дается, - способность образования. - И. Гете

АФОРИЗМЫ И ЦИТАТЫ ОБ ИНФОРМАЦИИ

АФОРИЗМЫ И ЦИТАТЫ ОБ ИНФОРМАЦИИ


1. Каждый может принять решение, располагая достаточной информацией.

2. Хороший руководитель способен принять решение, располагая недостаточной информацией.

3. Идеальный руководитель способен принять решение, не зная решительно ничего.
«Законы информации Спенсера»

***
Четыре закона теории информации:

1. Информация, которая у вас есть, не та, которую вам хотелось бы получить.

2. Информация, которую вам хотелось бы получить, не та, которая вам на самом деле нужна.

3. Информация, которая вам на самом деле нужна, вам недоступна.

4. Информация, которая в принципе вам доступна, стоит больше, чем вы можете за нее заплатить.

***

Хорошо информированный человек — самый бесполезный зануда на свете.
Алфред Уайтхед

***

Каждый хочет, чтобы его информировали честно, беспристрастно, правдиво — и в полном соответствии с его взглядами.

Гилберт Честертон

***

Если ты все понимаешь, значит, тебе не обо всем говорят.
«Пшекруй»

***

Бывает информация из первых рук, высосанная из пальца.
Роберт Карпач

***

Чем менее точна информация, тем более бурно мы на нее реагируем.
«Замечание Уэдервакса»

***

Чем меньше мы знаем, тем больше подозреваем.

Генри Уилер Шоу

вторник, 10 января 2012 г.

Data Mining - интеллектуальный анализ данных


Краткий обзор существующих систем

Краткий обзор существующих систем

Нижеприведенные системы не случайно были выбраны для краткого обзора. Все эти системы относятся к классу MRPII/ERP и являются лидерами на международном и, в частности, российском рынке.

1.4.1 R\3 от SAP AG
На сегодняшний день компания SAP лидирует среди независимых производителей бизнес-приложений и занимает 36% этого рынка ПО. В России инсталлировано более 100 SAP систем, на локализацию систем R\2 и R\3 компания затратила более 6 млн. немецких марок.
Описание системы:
Основные модули:
-    финансовая бухгалтерия
-    контроллинг
-    управление материальными потоками
-    техническое обслуживание и ремонт оборудования
-    продажа, отгрузка, фактурирование
-    система проектов
-    управление, планирование и контроль основных средств
-    управление персоналом.
Базовая система R\3 предоставляет набор функциональных возможностей для решения организационно-экономических задач, включая гибкое производство, планирование производственных мощностей и техническое обслуживание предприятия, систему сбыта, прием и исполнение заказов в условиях существования различных валют, языков, прочих особенностей, планирование и осуществление транспортных операций.

1.4.2 Oracle Applications от Oracle
Представляет собой набор из более чем 35 интегрированных приложений, в которые входят:
-    приложения для управления финансами
-    приложения для управления материальными потоками
-    приложения для управления производством
-    приложения для управления проектами
-    приложения для управления персоналом
-    приложения для управления маркетингом
Данные программные модули для автоматизации всех аспектов деятельности предприятия.

1.4.3 BAAN IV от BAAN
Базовая система BAAN IV создана для комплексной поддержки системы управления предприятием. Все подсистемы конфигурируются под конкретные процедуры и задачи управления. Самое главное в системе – ее гибкость и функциональное наполнение.
Состав базовой системы BAAN IV.
-    программные инструментальные средства
-    производство
-    сбыт, снабжение, склады
-    сервис
-    финансы
-    транспорт
-    проект
-    организатор
Несомненным плюсом системы является то, что она легко может быть адаптирована к любому пользовательскому интерфейсу. Доступ к базе данных системы возможен из любых прикладных программ.
Программно обеспечение BAAN может применяться в широком диапазоне предприятий – от средних до самых крупных.

1.4.4 Система управления БОСС компании АйТи
Функциональные возможности комплексной интегрированной системы управления БОСС охватывают все основные бизнес процессы организации:
-    управление и бухгалтерский учет
-    финансовый менеджмент
-    управление персоналом
-    логистика
-    маркетинг и продажи
-    управление производством
-    делопроизводство и документооборот.
Система состоит из отдельных, полностью самостоятельных и в то же время интегрированных продуктов. Это позволяет создавать систему предприятия поэтапно, начиная с того функционального подразделения, автоматизация которого наиболее актуальна в настоящий момент.
БОСС-КОРПОРАЦИЯ – полномасштабная система управления финансово-хозяйственной деятельностью, разработанная для крупных корпораций и торговых объединений. Состоит из четырех взаимодействующих подсистем (финансы, логистика, маркетинг и персонал).
Эту систему отличает легкость настройки и адаптации, открытость исходных материалов, масштабируемость, надежность, ориентация на российскую специфику ведения учета.


Методы внедрения системы

Методы внедрения системы

Компания, собирающаяся внедрить компьютерную систему управления, как правило, дает следующую установку: система должна начать действовать как можно скорее, в срок и в рамках бюджета. Некоторые организации избегают внедрять подобные системы, опасаясь, что ее не будут использовать, а если будут, то неэффективно. К тому же сотрудники, которые приобретут новые навыки в процессе внедрения системы, покинут компанию, и тогда будет трудно найти технические ресурсы для поддержания ее функционирования. Не получится ни экономии ресурсов, ни реализации функционального предназначения внедренной системы.
Эти опасения вполне оправданны. Проекты по внедрению систем и в самом деле терпят неудачу, даже в компаниях с эффективным в остальных отношениях управлением. В тех же случаях, когда все идет более или менее нормально, зачастую не выполняются сроки начала промышленной эксплуатации и не удается остаться в рамках выделенного бюджета. Тем не менее, описанные ниже методы при их правильном применении могут способствовать сведению риска неудачного внедрения к минимуму. При надлежащем планировании и управлении вполне можно соблюсти намеченные сроки и остаться в рамках бюджета. С самого начала необходимо убедиться, что проект правильно организован.
Необходимо:
1.    Добиться веры в успех и преданности делу со стороны тех, кто играет ключевую роль в реализации проекта.
2.    Определить, кто будет штатным руководителем проекта по внедрению системы. Этот человек должен обладать необходимыми навыками для выполнения такой работы, желательно, чтобы он имел опыт внедрения систем.
3.    Четко определить и отразить в документах функции и обязанности, а также сферу компетенции каждого члена группы специалистов по работе над проектом.
4.    Убедиться, что люди, выполняющие эти функции, обладают необходимыми навыками.
5.    Разработать подробный план работы, разбить его на этапы, определить сроки выполнения задач и придерживаться их.
Прежде чем приступить к внедрению системы, необходимо:
 а) Продумать организационную структуру и бизнес-процессы:
1.    Убедиться, что правила и процедуры бухучета зафиксированы в документах по установленной форме и понятны работникам бухгалтерии.
2.    Описать методы ведения хозяйственной деятельности и действия, которые должны быть выполнены в результате их применения.
3.    При необходимости изменить эти методы так, чтобы они обеспечивали более эффективную работу и интеграцию новой системы.
4.    Описать организационную структуру и подумать о том, в максимальной ли степени она отвечает целям предприятия.
5.    Изучить наиболее эффективные методы, применяемые в отрасли.
б) Обеспечить создание необходимой технической инфраструктуры:
1.    Поручить соответствующим специалистам оценку нынешней инфраструктуры на основе требований, предъявляемых новой системой. Определить роль отдела информационных систем и продумать, каким изменениям он подвергнется в новой среде.
2.    Осуществить необходимые изменения в перечисленных областях перед тем, как передать систему в промышленную эксплуатацию. Убедиться, что система отвечает основным потребностям всех пользователей.
3.    Документально зафиксировать потребности бизнеса с той степенью подробности, которой будет достаточно для сравнения одной системы с другой.
4.    Пользоваться полученными документами, чтобы убедиться, что реализованные функции отвечают потребностям.
в) Управлять изменениями, подстраиваясь под сотрудников:
1.    Проводить изменения постепенно, не забывая о том, что за один раз сотрудники могут освоить лишь определенное количество информации.
2.    С самого начала задействовать всех, кто играет основную роль в осуществлении проекта. Хороший способ добиться этого – попросить их высказывать свое мнение в процессе подробного определения потребностей бизнеса.
3.    Регулярно общаться с такими сотрудниками, давая им возможность быть услышанными.
4.    Разработать план обучения таким образом, чтобы люди не просто научились осуществлять ввод данных в систему, но поняли, как изменится их работа.
После проведенных мероприятий можно приступать непосредственно к внедрению системы. Типовой план внедрения был разработан в компании Oliver Wight, но опыт показывает, что в той или иной степени практически все фирмы следуют этой стратегии.
Данный план состоит из следующих этапов:
1.    Предварительное обследование и оценка состояния компании.
2.    Предварительная переподготовка.
3.    Техническое задание (анализ проблемы построения системы)
4.    Технико-экономическое обоснование (анализ «затраты-эффект»)
5.    Организация проекта (назначение ответственных лиц, состав комитетов)
6.    Выработка целей (что мы ожидаем от проекта)
7.    Техническое задание на управление процессами
8.    Начальная переподготовка (переподготовка сотрудников)
9.    Планирование и управление верхнего уровня
10.    Управление данными
11.    Одновременное внедрение различных технологий организации и управления
12.    Программное обеспечение
13.    Опытный пример
14.    Получение результатов
15.    Анализ текущего состояния
16.    Постоянная переподготовка

Критерии выбора системы

Критерии выбора системы

Под функциональными возможностями системы понимается ее соответствие тем бизнес-функциям, которые уже существуют или только планируются к внедрению в организации. Например, если целью организации является снижение финансовых потерь за счет уменьшения брака, то выбранная система должна обеспечивать автоматизацию процесса контроля качества.
Обычно для определения соответствия системы выдвигаемым функциональным требованиям достаточно иметь четкое представление о стратегии развития бизнеса, контекстного описания бизнеса и формализованного описания деятельности предприятия. Если все эти компоненты, необходимые для выбора системы отсутствуют, то их включают в этап по подготовке исходных данных для выбора системы. Для осуществления подобного масштаба работ необходимо наличие довольно большого числа сотрудников, но поскольку содержать такой штат на предприятии постоянно не имеет смысла, то наиболее целесообразным представляется приглашение внешних консультантов.
Четко структурированное понимание бизнес процессов собственной организации, полученное в результате взаимодействия с внешними консультантами, помогает не только в построении информационной системы предприятия, но и высшему руководству лучше представить себе работу своей организации, а также позаимствовать опыт других организаций.
Совокупная стоимость владения – сравнительно новое понятие. Под ним понимается сумма прямых и косвенных затрат, которые несет владелец системы за период ее жизненного цикла.
Необходимо четко определить жизненный цикл каждой из предложенных систем, куда входит время жизни существующей системы, время на проектирование новой, время на закупку компонентов и внедрение новой системы, время эксплуатации, которое ограничивается сроком, когда возвращается 90% стоимости системы от результата ее работы, и сумму всех прямых и косвенных затрат.
Перспективы развития закладываются в систему поставщиком системы и комплексом стандартов, которым она удовлетворяет.
Очевидно, что на перспективу развития также огромное влияние оказывает и устойчивость поставщика системы на рынке. Для определения устойчивости необходимо четко знать какова форма собственности на систему у поставщика, какую долю он занимает на рынке, сколько он существует на рынке.
Понимание технических характеристик в наибольшей степени гарантирует соответствие системы поставленным перед ней задачам. К техническим характеристикам можно отнести:
-    архитектуру системы,
-    надежность,
-    масштабируемость,
-    способность к восстановлению,
-    наличие средств резервного копирования,
-    средства защиты от технических нападений,
-    возможность интеграции с другими системами.
Под риском обычно понимается некая вероятность того, что при внедрении информационной системы управления какие-то цели так и не будут достигнуты. Очевидно, что в этом случае организацию может ожидать как единовременная потеря денег, что существенно влияет на жизненный цикл системы, так и долгосрочная и постоянная утечка средств.
Для снижения такой вероятности проводится комплексный анализ факторов риска и поэтапное воплощение решения. Каждый этап предваряется новой оценкой действительности и решение модифицируется определенным образом.
Для минимизации инвестиционных рисков выделяют следующие объекты затрат:
-    процесс создания системы
-    оборудование
-    программное обеспечение
-    персонал
-    управление задачами
Для каждого объекта затрат выдвигается целый ряд характеристик, которому он должен удовлетворять с целью снижения рисков.

Системы высшего класса

Системы высшего класса

Современные версии систем высшего уровня обеспечивают планирование и управление всеми ресурсами организации. Количество различных параметров настроек достигает десятков тысяч. Однако одновременно возрастает и стоимость внедрения подобной системы.
Следует также учитывать следующий набор минусов, возникающих при введении в строй подобной системы:
-    может потребоваться привлечение внешних консультантов, что приведет к значительному росту затрат;
-    внедрение сложной системы зачастую требует некоторой реорганизации деятельности;
-    необходимо наличие специального подразделения, которое бы перенастраивало систему под требования бизнеса.
С другой стороны, руководители организации и ее персонал получают великолепный инструмент, позволяющий планировать и управлять производством.

1.3 Выбор, внедрение и эксплуатация системы

1.3.1 Проблема выбора информационной системы
Информационная система управления для промышленного предприятия не должна замыкаться только в рамках управления бизнес-процессами. Данная система должна объединить в себе все три уровня управления процессами происходящими на предприятии:
-    управление бизнес процессами
-    управление проектно-конструкторскими разработками
-    управление технологическим процессом производства.
Единство информационной системы управления предприятием состоит в том, что данные, полученные или введённые на любом уровне системы, должны быть доступны всем её компонентам (принцип однократного ввода).
Мировой опыт применения информационных технологий говорит что структура такой единой информационной системы управления предприятием должна быть следующей:
«Становым хребтом» единой информационной системы управления предприятием является система управления бизнес процессами предприятия система класса ERP (Enterprise Resources Planning – Планирование ресурсов предприятия). Необходимым элементом являются системы автоматизации проектно конструкторской деятельности и технологической подготовки производства (САПР/АСТПП – CAD/CAM/CAE/PDM), обеспечивающие снижение времени производственного цикла и повышения качества продукции. Третий элемент – системы управления технологическим процессом производства. Связующее программное обеспечение обеспечивает взаимодействие всех ранее описанных решений в рамках единой информационно – аналитической системы управления предприятием.
Классические системы ERP обеспечивают управление следующими задачами:
-    Управление финансами.
-    Планирование и управление производством.
-    Управление размещением и распределением запасов.
-    Управление реализацией и маркетингом.
-    Управление снабжением.
-    Управление проектами.
-    Управление сервисным обслуживанием.
-    Управление процедурами обеспечения качества продукции.
Современная автоматизированная система управления должна сочетать в себе максимально возможный комплекс функций для управления всеми бизнес-процессами предприятия: управления маркетингом и продажами, управления снабжением, управление финансами, жизненный цикл изделия от конструкторских разработок до массового производства и сервисного обслуживания.
В системе должна быть реализована стратегия производства, ориентированного на потребителя, независимо от того, разрабатывает предприятие продукцию под заказ, производит на склад, ведет единичное, мелкосерийное или крупносерийное производство.
Система должна управлять производственным процессом и непрерывно контролировать его параметры на отклонение от допустимых значений, начиная со стадии планирования заказа на реализацию до отгрузки готовой продукции потребителю
Система должна реализовывать методику управления затратами и центрами затрат. Такая методика требует планирования себестоимости изделий, утверждения плановых нормативов и контроль отклонений фактических затрат от их нормативов для своевременного принятия мер. Учет затрат должен осуществляться по местам их возникновения и позволять управленческому персоналу вести анализ.
На основе производственного плана и нормативной себестоимости система должна рассчитать смету затрат на производство. Система должна обеспечить единство данных финансового и управленческого учета.
В современных условиях функционирования предприятия совершенно необходимо, чтобы данные, введенные в систему, были доступны сразу после регистрации хозяйственной операции всем, кто испытывает в них потребность: от учетчика в цеху до управляющего предприятием. Например, единство данных финансового и управленческого учета. Финансово-хозяйственные операции должны регистрироваться в системе сразу после их совершения. Это позволит осуществлять контроль за производством на уровне производственных смет.
Сталкиваясь с потребностями во внедрении на предприятии информационных систем, руководство оказывается перед проблемой выбора. Разрабатывать самим или покупать, и если покупать – то что.
Объективно оценивая вероятность самостоятельной разработки современной системы управления, можно смело сказать, что она равна нулю. То, что разработано или разрабатывается сейчас на российских предприятиях является отражением вчерашних взглядов управленческого персонала предприятия и требует постоянной переработки. И это не вина отделов АСУ, это объективный процесс.
Если предприятие решило ориентироваться на готовые системы – то ему нужно решить, с кем ему работать, какую систему выбрать – с российскими разработчиками или с поставщиков готовых систем ведущих западных производителей.
При всем уважении к нашим разработчикам можно сказать с уверенностью, что если они и смогут разработать систему управления предприятиями, то очень не скоро. История развития наиболее популярных современных систем управления имеет 20 - 25 лет и многие тысячи работающих установок. А ведь каждая установка системы – это не только деньги на новые разработки, это в первую очередь обратная связь с потребностями клиента.
Российским разработкам еще очень далеко до уровня полнофункциональной системы. Выросшие из автоматизации рабочих мест советских бухгалтеров, они несут в себе эти следы. Решив функции автоматизации бухгалтерии они только пытаются двинуться в направлении производства, а это задача по объемам несравнимая с бухгалтерским учетом.
По моему мнению, крупным предприятиям следует ориентироваться на западные системы. И следующий вопрос, на который необходимо дать ответ какую западную систему выбрать?
Для российского пользователя выбор таких систем ограничен. Не так уж много западных фирм вышли на российский рынок. Реально это SAP, Computer Associates, BAAN и ISF. Попытки выйти делали ORACLE, JDEdvards, SSA, JBA и QAD. Причем реальные внедрения имеются только у продуктов SAP и Computer Associates. Кроме того, различные системы предназначены для разных предприятий. Одни, такие как SAP или CA Masterpiece, ориентированны на корпоративный рынок, другие, как BAAN или MK Enterprise (ранее MANMAN/X) на рынок промышленных предприятий или компаний. И предприятию нужно сделать правильный выбор, чтобы в результате ошибки не оказаться обладателем системы не подходящей для него.

Системы среднего уровня

Системы среднего уровня

Появление систем среднего уровня обусловлено потребностью в программном продукте с более широкими возможностями, нежели системы начального уровня. Таким образом, некоторые производители на основе современных способов и средств разработки создали готовые решения для довольно широкого круга потребностей предприятия. В состав таких систем обычно входят следующие подсистемы:

-    бухгалтерский учет
-    управление производством
-    материально-техническое снабжение и сбыт
-    планирование
-    производство.

Несмотря на способность таких систем вести учет практически по всем направлениям деятельности предприятия, некоторые подсистемы реализованы в них в весьма усеченном виде. Тем не менее, количество различных параметров настройки у такой системы достигает значительного числа, что приводит потребителя к неспособности самостоятельно установить продукт. Зачастую, большую часть стоимости программного продукта среднего уровня составляют услуги по установке и настройке системы, сервисное обслуживание. Дороговизна таких систем делает их недоступными для небольших фирм.

Немаловажным минусом подобной системы является то, что успех внедрения системы среднего уровня во многом зависит от качества выполнения анализа деятельности предприятия.


Системы начального уровня

Системы начального уровня

Системы начального уровня широко распространены среди предприятий небольшого размера, которые успешно используют их в своей повседневной деятельности. Отличительной чертой таких информационных систем является ограниченный охват бизнес-процессов предприятия.
Программные продукты данного класса могут сильно отличаться друг от друга по целевому назначению: сюда можно отнести как бухгалтерские, так и складские и торговые системы. Но, тем не менее, эти системы имеют много общих черт:

-    невысокая требовательность к выделяемым ресурсам. Системы данного класса могут работать под управлением современных промышленных СУБД, однако могут эксплуатироваться и на небольших предприятиях. Количество возможных пользователей такой системы колеблется от 1 до нескольких десятков.

-    подразумевается, что пользователь может приобрести, установить и начать эксплуатацию самостоятельно, однако разработчики стараются делать программы с как можно более широкими возможностями, что позволяет интегрировать такие системы с другими системами этого и более высокого классов.

Значение информационных технологий в управлении предприятием

Значение информационных технологий в управлении предприятием

Сегодня положение дел в рассматриваемой области характеризуется крайней неопределенностью. Во-первых, это связано с непрерывным увеличением объема технологических предложений, требующих высоких инвестиций, и соответственно с усилением зависимости от внешних услуг (например, от поставщиков программного обеспечения). Внутрифирменные ассигнования на нужды ИТ растут опережающими темпами по сравнению с другими затратами предприятия. При этом высший менеджмент мало осведомлен об общих расходах в сфере ИТ. Так, компетентные решения фирменного руководства охватывают примерно лишь 5% соответствующих затрат.

Во-вторых, изменяется роль ИТ в хозяйственной деятельности многих предприятий. При выполнении внутрифирменных процессов функция ИТ перестала быть вспомогательной, превратившись в важнейшую составную часть продукта или производственных мощностей. Хозяйственные риски в настоящее время во многом определяются рисками в данной сфере. Реализация же современных высокопроизводительных организационных проектов (например, "виртуальных организаций" без жесткой привязки производственных участков к определенному месту), требует полного использования потенциала ИТ с помощью телекоммуникационных средств.

Не способствует стабилизации быстрый рост издержек в сфере ИТ. Чтобы контролировать их увеличение и добиться большей гибкости в решении информационно-технологических проблем, многие предприятия идут в основном двумя путями. Первый заключается в том, что фирма создает внутрифирменный информационно-технологический участок, который предлагает услуги и вне фирменному рынку, доказывая тем самым возможность рентабельного использования своих мощностей.

Чаще предприятия выбирают другой путь, когда большая часть собственного информационно-технологического персонала переводится в распоряжение вновь создаваемых дочерних компаний или совместных со специализированными информационно-технологическими партнерами предприятий, также самостоятельно выступающих на рынке. На материнском предприятии остается небольшая группа сотрудников, на которую возлагаются функции информационного менеджмента.
Высший менеджмент начинает осознавать, какое важное воздействие оказывают информационно-технологические решения на сам хозяйственный процесс и культуру предприятия. Поэтому он чувствует себя все более ущемленным в том плане, что вынужден делегировать соответствующие вопросы внутрифирменным подразделениям или внешним организациям. К тому же первый опыт работы вне фирменных информационно-технологических служб не дает особых поводов для оптимизма относительно эффективности решения указанных проблем. В этой связи возникают следующие ключевые вопросы:
-    каково отношение ведущего персонала к ИТ, какие последствия вытекают из более эффективной ее организации и использования в производстве новых товаров и услуг;
-    что должно знать высшее руководство фирмы в области ИТ, чтобы принимать компетентные решения, в частности в отношении инвестиций;
-    в какой мере допустимо делегирование функций в сфере ИТ;
-    какова должна быть роль высшего менеджмента в управлении информационно-технологическим потенциалом.
Можно выделить шесть заинтересованных групп, от которых зависит принятие решений в сфере ИТ:
-    высшее руководство, которое должно управлять ИТ как стратегическим потенциалом предприятия;
-    специалисты, занимающиеся поиском системных решений для оптимизации специальных функциональных задач;
-    менеджеры отдельных хозяйственных подразделений, которые должны использовать ИТ в силу логики своей хозяйственной деятельности, чтобы удовлетворять запросы клиентов, снижать издержки и т.д.;
-    менеджеры служб бухгалтерско-финансового учета, если таковые предусмотрены организационной структурой предприятия:
-    поставщики ИТ, которые должны предлагать услуги в строгом соответствии с проблемными установками своих потребителей;
-    собственное информационно-технологическое подразделение.
На многих предприятиях подобные группы интересов не получают признания. Высшее руководящее звено часто делегирует соответствующие функции группе руководителей, следя за выполнением нескольких заданных показателей. Сознательный отказ высшего менеджмента от своих обязанностей приводит к принятию малокомпетентных решений, постановке нереальных плановых задач. Отсутствует также должная мотивация в этой сфере.
В связи с ростом значения ИТ в обеспечении успеха фирмы подобная политика неприемлема. Общефирменное руководство должно в настоящее время найти ответы на следующие два вопроса.

Во-первых, нужно точно определить, какой вклад должна внести ИТ в процесс производства товаров и услуг. Внимания здесь заслуживают главным образом три аспекта:
1) ИТ как функция обеспечения производственного процесса, например в области коммуникаций или автоматизации производства, а также при генерации и передаче управленческих знаний и информации для управления хозяйственными операциями;
2) ИТ как интегральная составная часть продукта;
3) ИТ как организационный инструмент для создания виртуальных форм предприятия.
Во-вторых, кто должен выполнять перечисленные и другие функции. На первый план выдвигается вопрос о координационном механизме для отдельных видов информационно-технологических услуг. Решение может быть найдено в использовании указанных выше специализированных внутрифирменных подразделений и внефирменных филиалов. Возможно и промежуточное решение в виде создания стратегических альянсов между собственным подразделением и внешними партнерами. В двух последних случаях предприятие теряет прямой контроль над своим информационно-технологическим потенциалом. Следует отметить, что подобные услуги могут быть эффективны только при тесном сотрудничестве с их поставщиками. Общефирменный менеджмент должен искать пути устранения или компенсации слабых мест в своей работе.

Перестройка структуры управления

 Перестройка структуры управления

Главным направлением перестройки структуры управления и его радикального усовершенствования, приспособления к современным условиям стало массовое использование новейшей компьютерной и телекоммуникационной техники, формирование на ее основе высокоэффективных информационно-управленческих технологий. Средства и методы прикладной информатики используются в планировании, менеджменте, маркетинге и других сферах управления и регулирования деятельности предприятий. Новые технологии, основанные на компьютерной технике, требуют радикальных изменений организационных структур менеджмента, его регламента, кадрового потенциала, системы документации, фиксирования и передачи информации. Особое значение имеет внедрение информационного менеджмента, значительно расширяющее возможности использования компаниями информационных ресурсов. Развитие информационного менеджмента связано с организацией системы обработки данных и знаний, последовательного их развития до уровня интегрированных автоматизированных систем управления, охватывающих по вертикали и горизонтали все уровни и звенья производства и сбыта.

В современных условиях эффективное управление представляет собой ценный ресурс организации, наряду с финансовыми, материальными, человеческими и другими ресурсами. Следовательно, повышение эффективности управленческой деятельности становится одним из направлений совершенствования деятельности предприятия в целом. Наиболее очевидным способом повышения эффективности протекания трудового процесса является его автоматизация. Но то, что действительно, скажем, для строго формализованного производственного процесса, отнюдь не столь очевидно для такой изящной сферы, как управление. Трудности, возникающие при решении задачи автоматизированной поддержки управленческого труда, связаны с его спецификой. Управленческий труд отличается сложностью и многообразием, наличием большого числа форм и видов, многосторонними связями с различными явлениями и процессами. Это, прежде всего, труд творческий и интеллектуальный. На первый взгляд, большая его часть вообще не поддается какой-либо формализации. Поэтому автоматизация управленческой деятельности изначально связывалась только с автоматизацией некоторых вспомогательных, рутинных операций. Но бурное развитие информационных компьютерных технологий, совершенствование технической платформы и появление принципиально новых классов программных продуктов привело в наши дни к изменению подходов к автоматизации управления производством.


Проектирование корпоративной информационно-аналитической системы

Проектирование корпоративной информационно-аналитической системы

Илья Галахов, начальник управления методологии
программных систем компании «Сибинтек» (Москва).


Средства формирования запросов и отчетов, многомерного анализа и разведки данных повсеместно рекламируются и продвигаются сегодня, как помощники бизнеса. Однако стать таковыми они могут лишь благодаря ИТ-специалистам, понимающим основы стратегического менеджмента на своем предприятии. В статье предлагаются рекомендации по проектированию корпоративной информационно-аналитической системы на основе построения системы сбалансированных показателей, определяющих состав и семантику данных для разработки BI-приложений.

Потребность в средствах анализа финансовой и производственной деятельности, оценки эффективности бизнеса, привела к распространению специальных решений, использующих комбинации технологий категории Business Intelligence, которые за несколько лет превратились в полнофункциональные специализированные приложения. Появилась категория аналитических приложений, предоставляющих средства анализа для сбыта, закупок, маркетинга, производства, управления цепочками поставок и управления взаимоотношениями с клиентами.

В аналитических приложениях средства BI используются для работы с данными, характеризующими определенные аспекты бизнеса, однако, чтобы построить целостную картину бизнеса, на предприятиях создаются корпоративные информационно-аналитические системы, особую роль в которых играет хранилище данных. В хранилище загружаются и обобщаются данные из различных источников, как внутренних, так и внешних для последующего комплексного анализа средствами BI.
Подходы к созданию информационно-аналитических систем
Традиционные подходы к построению информационно-аналитических систем исходят из того, что в начале проекта сложно сказать, что должно быть помещено в хранилище данных и какие аналитические задачи будут решаться конечными пользователями. Например, методология Oracle DWM FT (Datawarehouse Method Fast Track — метод создания хранилищ «высокоскоростная трасса») исходит из предположения, что разработчики на протяжении практически всего жизненного цикла информационно-аналитической системы будут заниматься определением и анализом требований к хранилищу данных. Основанная на DSDM (Dynamic System Development Method — метод разработки динамических систем) эта методология реализует подход RAD (Rapid Application Development — быстрая разработка приложений).

Согласно DSDM и Oracle DWM FT, цикл проектирования проходит через создание ряда прототипов до тех пор, пока не будут удовлетворены требования конечных пользователей. Чтобы этот цикл не стал бесконечным, разработка делится на 120-дневные временные отрезки (timebox), за которые реально выполнить определенный, не расширяющийся набор требований (по аналогии с ящиком для игрушек toybox, в который невозможно поместить дополнительные игрушки, не вытащив уже лежащие там). Утверждается, что благодаря гибкости и простоте использования инструментов Business Intelligence, прототипирование не составляет труда. Однако, такой подход оправдан для его применения ИТ-специалистами, которые стараются не слишком расширять свои познания в предметной области.

Метод RAD хорошо зарекомендовал себя при создании небольших приложений. Однако подобно тому как при создании сложных транзакционных систем уровня предприятия возникает потребность в реинжиниринге бизнес-процессов, так при создании корпоративных информационно-аналитических систем будет востребован бизнес-инжиниринг — создание организации, ориентированной на выполнение определенной стратегии. Хотя разработчики информационно-аналитических систем, будут продолжать итеративное проектирование по принципу «Чего изволите?», сегодня наиболее перспективным является выработка бизнес-ориентированного подхода, основанного на BSC (Balanced Scorecard — система сбалансированных показателей).

Подход BSC с самого начала определяет бизнес-аспекты анализируемых данных, что позволяет проектировать информационно-аналитическую систему сверху-вниз параллельно с внедрением на предприятии MBO (Management by objectives — управление, основанное на достижении целей). Вместо исключительно ретроспективных финансовых метрик, в хранилищах данных, созданных на основе подхода BSC, станут учитываться «опережающие индикаторы» (leading indicator), позволяющие прогнозировать изменения в бизнесе. Такие хранилища дадут аналитикам целостную картину развития предприятия, как минимум по четырем направлениям:

    финансовое направление, рассматривающее эффективность деятельности с точки зрения возврата инвестиций;
    маркетинговое направление, включающее оценку полезности товаров и услуг с точки зрения конечных потребителей;
    организационно-технологическое направление, оценивающее внутреннюю операционную эффективность и эффективность организации бизнес-процессов;
    направление инноваций и обучения, раскрывающее способность к постоянным улучшениям и восприятию новых идей.

Проектирование системы сбалансированных показателей
Проектирование информационно-аналитических систем на основе BSC начинается с проектирования карты стратегии — ее графического описания в виде набора причинно-следственных связей. Для каждой перспективы (финансы, маркетинг, технологии, инновации) должны быть определены стратегические цели и построено дерево целей.

Для торговой организации основной стратегической целью может быть увеличение объема реализации товаров. Это — финансовая перспектива. Достижение этой цели лежит в области маркетинга. Например, для достижения этой цели компания может выбрать два пути: расширение клиентской базы и удержание «старых» клиентов. Первое может быть достигнуто, за счет расширения географии сбыта. Для этого компания может сформулировать организационную задачу развития сети представительств. Эта задача относится к внутренней технологии развития компании и отражает организационно-технологическую перспективу.

Клиентская база может быть расширена не только за счет выхода на новые региональные рынки, но и за счет неохваченных сегментов рынка комплексных заказов. Ориентация на крупных комплексных заказчиков может потребовать улучшения управления цепочками поставок, что представляет собой еще одну целевую установку для перспективы развития технологий. Сама по себе организация гибких цепочек поставок невозможна без развития партнерских отношений с поставщиками, перевозчиками, кредитными и страховыми компаниями. Поиск таких партнеров и разработка цепочек представляют собой инновационную деятельность торговой организации, а соответствующие цели относятся к перспективе инноваций.

Росту объемов реализации способствует удержание «старых» клиентов, однако относительно сложно дважды продать один и тот же товар, если это товар длительного пользования, поэтому для «старых» клиентов необходимо расширение ассортимента. Торговая организация будет вести постоянный поиск, что нового можно предложить «старым» клиентам — способность гибко реагировать на потенциальный спрос является одной из целей инноваций. В технологической перспективе удержание «старых» клиентов может быть поддержано за счет повышения эффективности взаимодействия подразделений компании. Если какое-то подразделение нашло клиента по своему товарному профилю, то, возможно, и другое подразделение может также что-то ему предложить из своего ассортимента.

Таким образом, для каждой перспективы необходимо определить цели и установить между ними причинно-следственные связи, а инструментальные средства BSC обеспечат формирование графического образа карты стратегии.

При выборе инструментов BSC важно знать, что существует добровольная программа их сертификации, проводимая компанией Balanced Scorecard Collaborative, организованная авторами методологии Balanced Scorecard. Сертификация осуществляется на основе функциональных стандартов (BSC Functional Standards). К данному моменту сертификацию прошли BSC-инструменты компаний Cognos, Crystal Decisions, Fiber FlexSI, Hyperion, InPhase, Oracle, Peoplesoft, Pilot Software, QPR, SAP, SAS и ряда других.

Следующий этап проектирования информационно-аналитической системы — определение «ключевых показателей эффективности» (KPI, Key Performance Indicator), численных характеристик выбранных целей (метрик, которые необходимо собирать в хранилище данных). По сути, эти метрики задают состав данных в хранилище.

Наиболее просто оценить достижение финансовых целей, например, объема продаж в денежном выражении. Эффективность достижения этой цели оценивается также просто путем сравнения фактических значений с целевыми. Достижение целей маркетинга оценить несколько сложнее. Для расширения клиентской базы ключевым показателем можно выбрать количество новых клиентов за определенный период (месяц, год) и из сравнения этого показателя с целевым значением будет ясно, достигается ли эта цель или нет. Степень удержания «старых» клиентов можно оценивать по их доле в общем числе клиентов. Установив порог, например, в 50% для этого показателя, можно отслеживать, насколько велики потери «старых» клиентов.

Наиболее сложно оценить эффективность внутренних технологических процессов компании, но и они поддаются измерению. Например, эффективность взаимодействия подразделений может быть оценена по среднему количеству подразделений, участвующих в обслуживании одного клиента. Развитие сети представительств удобно оценивать по росту количества представительств в каждом регионе. Степень улучшения управления цепочками поставок можно увидеть по такому индикатору, как доля сделок, в которых такие цепочки были использованы.

Для перспективы инноваций также должны быть определены KPI. Например, чтобы расширение ассортимента предлагаемых товаров не стало самоцелью, нужно отслеживать не пополнение списка наименований товаров, а долю проданных единиц новых товаров. Эффективность расширения партнерских отношений также лучше оценивать с помощью относительной величины, характеризующей долю сделок с участием партнеров.

Следует различать KPI верхнего и нижнего уровня. В хранилище данных должна содержаться как информация для стратегического управления, так и детальные данные, на основе которых эта информация была получена, чтобы обеспечить возможность перехода от стратегических целей к фактическим данным, которые стоят за этими целями. Такой переход (drill-down — спуск по данным) в информационно-аналитической системе реализуется с помощью OLAP-инструментов, реализующих многомерное (и одновременно многоуровневое) представление данных.
Многомерное проектирование
Проектирование многомерного представления данных начинается с формирования карты измерений. Например, при анализе сбыта может быть целесообразно выделить отдельные части рынка (развивающиеся, стабильные, крупные и мелкие потребители, вероятность появления новых потребителей и т.п.) и оценить объемы продаж по продуктам, территориям, покупателям, сегментам рынка, каналам сбыта и размерам заказов. Эти направления образуют координатную сетку многомерного представления сбыта — структуру его измерений.

Поскольку деятельность любого предприятия протекает во времени, первый вопрос, который возникает при анализе, это вопрос о динамике развития бизнеса. Правильная организация оси времени позволит качественно ответить на этот вопрос. Обычно ось времени делится на годы, кварталы и месяцы. Возможно еще большее дробление на недели и дни. Структура временного измерения формируется с учетом периодичности поступления данных; может обуславливаться также периодичностью востребования информации. Для временного измерения возможно создание специальных категорий, например, ‘текущий месяц’ или ‘текущий день’ когда для удобства интервал с начала месяца до текущего дня или аналогичный промежуток времени в истекшем году могут быть выделены в особые категории. Тогда ежедневные типовые отчеты пользователя, использующие подобные категории с переменными временными интервалами всегда будут содержать готовую к анализу информацию на текущий момент. В некоторых компаниях анализ во времени ведется относительно финансового года. В этом случае можно поступить двояко: либо изменить разбиение временного измерения так, чтобы началом года являлось, например, 1 апреля, либо ввести второе (альтернативное) деление оси времени специально для финансового анализа. В последнем случае анализ будет возможен как относительно календарного, так и финансового года. При этом дополнительную ось времени создавать не требуется.

Измерение «группы товаров» разрабатывается так, чтобы в максимальной степени отразить структуру продаваемой продукции. При этом важно соблюсти определенный баланс, чтобы, с одной стороны, избежать излишней детализации (количество групп должно быть обозримым), а с другой — не упустить существенный сегмент рынка. Обычно продукция делится на «традиционную» — выпускаемую достаточно давно, и «новую», инновационную. Однако очевидно, что для долгосрочного рыночного успеха, каждая группа должна иметь некоторую инновационную составляющую. Оптимальным для определения групп продукта является комбинация «каскадного подхода» и матричного представления. При каскадном подходе (известном также под названием «сверху вниз») весь ассортимент последовательно делиться по схожести удовлетворяемых потребностей на иерархические уровни с любыми удобными названиями (направления, типы, виды, группы, подгруппы и т.п.) до желаемой глубины проникновения (вплоть до каждого продукта).

Измерение «Заказчики» отражает структуру сбыта по территориально-географическому признаку. Верхний уровень этого измерения могут составить федеральные округа, следующий уровень детализации образуют субъекты федерации, которые могут быть определены, например, по ИНН заказчика. На нижнем уровне находятся конкретные организации — покупатели товаров. Такого рода иерархическая структура измерения «Заказчики» позволит пользователю легко охватить весь спектр регионов сбыта. Кроме того, исследуя географию сбыта, уместно вспомнить и о характеристиках покупателей. Важно знать профиль заказчика, чтобы правильно спланировать политику продаж и рекламную кампанию. В некоторых случаях требуется вести анализ не по регионам сбыта, а по категориям заказчиков, например, «старые» заказчики, «новые» заказчики, партнеры и т.д. Это может быть альтернативной классификацией для измерения «Заказчики».

Если же аналитика интересует сопоставление категорий заказчиков с их размером: объемом проданных товаров данной категории заказчиков, то не следует вводить альтернативную классификацию по размерам заказчиков. Анализ выиграет, если предоставить возможность пользователю вычленять из той или иной категории заказчиков крупных и мелких клиентов. Поэтому, хотя в обоих случаях речь идет о классификации одних и тех же объектов-заказчиков, необходимо организовать два измерения: «Заказчики по категориям» и «Заказчики по размерам». Разница между альтернативной классификацией и организацией дополнительного измерения состоит в том, что в первом случае одна и та же ось разбита различными способами, а во втором используются две различных оси. Имея несколько измерений для классификации одних и тех же объектов, становится возможным вычленение подмножеств не по одной, а по нескольким характеристикам: виду, категории, новизне и т.д.

Для анализа эффективности деятельности подразделений следует создать свое измерение. Например, можно выделить два уровня иерархии: департаменты и входящие в них отделы, что и должно найти отражение в измерении «Подразделения».

По сути, измерения «Время», «Товары», «Заказчики» достаточно полно определяют пространство предметной области. Дополнительно, полезно разбить это пространство на условные области, взяв за основу вычисляемые характеристики, например, диапазоны объема сделок в стоимостном выражении. Тогда весь бизнес можно разделить на ряд стоимостных диапазонов, в котором он осуществляется. В данном примере можно ограничиться следующими показателями: суммами продаж товаров, количеством проданных товаров, величиной дохода, количеством сделок, количеством клиентов, объемом закупок у производителей.

Важно отличать значения KPI в заданной координатной сетке от собственно KPI. Например, количество сделок — это показатель, характеризующий операционную активность предприятия, а количество сделок в заданном регионе за прошедший месяц — это значение данного KPI. Кроме того, из перечисленных показателей особо можно выделить показатель величины дохода, который является вычисляемым, как разность между ценой продажи товара и его стоимостью у производителя.
Выбор архитектуры OLAP-приложения
При реализации информационно-аналитической системы важно не ошибиться в выборе архитектуры OLAP-приложения. Дословный перевод термина On-Line Analytical Process — «оперативная аналитическая обработка» — часто воспринимается буквально в том смысле, что поступающие в систему данные оперативно анализируются. Это заблуждение — оперативность анализа никак не связана с реальным временем обновления данных в системе. Эта характеристика относится к времени реакции OLAP-системы на запросы пользователя. При этом зачастую анализируемые данные представляют собой снимок информации «на вчерашний день», если, например, данные в хранилищах обновляются раз в сутки.

В этом контексте более точен перевод OLAP как «интерактивная аналитическая обработка». Именно возможность анализа данных в интерактивном режиме отличает OLAP-системы от систем подготовки регламентированных отчетов.

Другой особенностью интерактивной обработки в формулировке родоначальника OLAP Э. Кодда является возможность «объединять, просматривать и анализировать данные с точки зрения множественности измерений, т. е. самым понятным для корпоративных аналитиков способом». У самого Кодда термин OLAP обозначает исключительно конкретный способ представления данных на концептуальном уровне — многомерный. На физическом уровне данные могут храниться в реляционных базах данных, однако на деле OLAP-инструменты, как правило, работают с многомерными базами данных, в которых данные упорядочены в виде гиперкуба. При этом актуальность этих данных определяется моментом наполнения гиперкуба новыми данными.

Очевидно, что время формирования многомерной базы данных существенно зависит от объема загружаемых в нее данных, поэтому разумно ограничить этот объем. Но как при этом не сузить возможности анализа и не лишить пользователя доступа ко всей интересующей информации? Существует два альтернативных пути: Analyze then query («Сначала проанализируй — затем запроси дополнительную информацию») и Query then analyze («Сначала запроси данные — затем анализируй»).

Последователи первого пути предлагают загружать в многомерную базу данных обобщенную информацию, например, месячные, квартальные, годовые итоги по подразделениям. А при необходимости детализации данных пользователю предлагается сформировать отчет по реляционной базе, содержащей требуемую выборку, например, по дням для данного подразделения или по месяцам и сотрудникам выбранного подразделения. Сторонники второго пути, напротив, предлагают пользователю прежде всего определиться с данными, которые он собирается анализировать и именно их загружать в микрокуб — небольшую многомерную базу данных. Оба подхода отличаются на концептуальном уровне и имеют свои достоинства и недостатки.

К достоинствам второго подхода следует отнести «свежесть» информации, которую пользователь получает в виде многомерного отчета — «микрокуба». Микрокуб формируется на основе только что запрошенной информации из актуальной реляционной базы данных. Работа с микрокубом осуществляется в интерактивном режиме — получение срезов информации и ее детализация в рамках микрокуба осуществляется моментально. Другим положительным моментом является то, что проектирование структуры и наполнение микрокуба осуществляется пользователем «на лету», без участия администратора баз данных. Однако подход страдает и серьезными недостатками. Пользователь, не видит общей картины и должен заранее определяться с направлением своего исследования. В противном случае запрошенный микрокуб может оказаться слишком мал и не содержать всех интересующих данных, а пользователю придется запрашивать новый микрокуб, затем новый, затем еще и еще.

В рассмотренном выше примере, пользователь не сможет сразу начать исследовать географию сбыта, если первоначальный микрокуб содержит детальные данные по измерениям «Время», «Подразделения» и «Товары» — придется подождать, когда будет сгенерирован новый микрокуб, содержащий дополнительные данные по измерению «Заказчики». Вспомним, что «оперативность» анализа гарантируется только в процессе работы с многомерной базой данных, однако время ее построения может быть сравнительно велико. Соответственно будет расти разочарование пользователя, вынужденного ожидать построения то одного, то другого микрокуба. Кроме того, постоянные обращения к реляционной базе данных могут снизить ее производительность. Подход Query then analyze реализует инструментальное средство BusinessObjects одноименной компании.

При подходе Analyze then query объем данных, загружаемых в многомерную базу данных, может быть достаточно велик, наполнение должно выполняться по регламенту и может занимать достаточно много времени. Однако все эти недостатки окупаются впоследствии, когда пользователь имеет доступ практически ко всем необходимым данным в любой комбинации. Обращение к исходным данным в реляционной базе данных осуществляется лишь в крайнем случае, когда необходима детальная информация, например, по конкретной накладной.

На работе единой многомерной базы данных практически не сказывается количество обращающихся к ней пользователей. Они лишь читают имеющиеся там данные в отличие от подхода Query then analyze, при котором количество микрокубов в предельном случае может расти с той же скоростью, что и количество пользователей.

Еще одним преимуществом существования полноценной многомерной базы данных с устойчивой структурой является принципиальная возможность адресации каждой ее ячейки. Доступ к данным по ссылке осуществляется моментально в отличие от доступа к данным по запросу, поэтому пользователь может включать, например, в отчеты Excel ссылки на данные из многомерных баз, не испытывая задержек, которые неминуемо возникли бы при использовании SQL-запросов для доступа к аналогичным данным в реляционных базах.

При данном подходе увеличивается нагрузка на ИТ-службы, которые кроме реляционных вынуждены обслуживать еще и многомерные базы данных. Именно эти службы несут ответственность за своевременное автоматическое обновление данных в многомерных базах данных.

Наиболее яркими представителями подхода «Analyze then query» являются инструментальные средства PowerPlay и Impromptu компании Cognos.

Исходя из приведенных характеристик подходов к реализации OLAP, можно предположить, что инструментарий BusinessObjects более всего любим сотрудниками ИТ-служб, так как дает им возможность «откупиться» от назойливых пользователей путем простой установки и настройки этого инструментального средства. Конечные пользователи-непрограммисты скорее всего предпочли бы работать с готовой многомерной базой данных с помощью Cognos PowerPlay.

Cпроектировать готовую среду для многомерного анализа можно инструментами и от Cognos, и от BusinessObjects, которых аналитики Gartner и META Group относят к лидерам рынка OLAP. Интересные решения предлагают также компании Actuate, Arcplan, Brio, Computer Associates, Crystal, Hummingbird, Hyperion, Informatica, Information Builders, Microsoft, MicroStrategy, Oracle, Peoplesoft, ProClarity, SAP, SAS, Siebel и других (www.olapreport.com/Architectures.htm).

Выбор и подхода, и инструмента его реализующего, зависит в первую очередь от преследуемой цели: всегда приходится балансировать между экономией бюджета и повышением качества обслуживания конечных пользователей. При этом надо учитывать, что в стратегическом плане создание информационно-аналитических систем преследует цели достижения конкурентного преимущества, а не избежания расходов на автоматизацию. Например, корпоративная информационно-аналитическая система может предоставлять необходимую, своевременную и достоверную информацию о компании, публикация которой для потенциальных инвесторов обеспечит прозрачность и предсказуемость данной компании, что неизбежно станет условием ее инвестиционной привлекательности.
Заключение
Решение стратегических задач бизнеса является целью корпоративной информационно-аналитической системы, поэтому ИТ-специалисты и дальше будут вынуждены все больше задаваться вопросами типа: «Зачем существует наше предприятие? Какова его миссия? Есть ли у него стратегия?». В противном случае создание BI-приложений будет лишь бессмысленной тратой ресурсов.

Общая структура мер и измерений
Общую структуру мер и измерений представляют в виде таблицы. Структура измерений описывается столбцами в основной таблице. Заголовки столбцов определяют названия измерений. По строкам в каждом столбце перечисляются уровни иерархии для каждого измерения. Эти уровни определяют количество «ступенек», которые пользователь может пройти для каждого измерения при выполнении операции drill-down — спуска по данным, т. е. на какую степень детализации данных он может рассчитывать. В приведенном примере в скобках для каждого уровня дано количество категорий — наименований групп товаров, товаров, названий заказчиков, регионов сбыта и т.д. Строка снизу содержит перечисление мер — количественных величин, значения которых привязаны к координатной сетке, образуемой измерениями.

Таблица мер и измерений позволяет заранее представить данные в структурированном виде для проведения аналитических исследований. Такая модель легко воспринимается пользователями и позволит ему перемещаться в многомерном пространстве данных. Пользователь, анализируя имеющуюся у него информацию, сможет делать воображаемые срезы вдоль любого измерения, создавать произвольные отчеты, детализировать данные до нужной степени, наглядно видеть динамику различных показателей, одновременно просматривая любые их сочетания.
***

Подобно тому, как при создании сложных транзакционных систем уровня предприятия возникает потребность в реинжиниринге бизнес-процессов, так при создании корпоративных информационно-аналитических систем будет востребован бизнес-инжиниринг — создание организации, ориентированной на выполнение стратегии.

В стратегическом плане создание информационно-аналитических систем преследует цели достижения конкурентного преимущества на рынке, а не избежания расходов на автоматизацию.

Cпроектировать готовую среду для многомерного анализа можно инструментами и от Cognos, и от BusinessObjects, которых аналитики Gartner и META Group относят к лидерам рынка OLAP. Интересные решения предлагают также компании Actuate, Arcplan, Brio, Computer Associates, Crystal, Hummingbird, Hyperion, Informatica, Information Builders, Microsoft, MicroStrategy, Oracle, Peoplesoft, ProClarity, SAP, SAS, Siebel.

Data Mining - интеллектуальный анализ данных

Data Mining - интеллектуальный анализ данных

Вячеслав Дюк
Санкт-Петербургский институт
информатики и автоматизации РАН


1. Что такое Data Mining?

Data Mining переводится как "добыча" или "раскопка данных". Нередко рядом с Data Mining встречаются слова "обнаружение знаний в базах данных" (knowledge discovery in databases) и "интеллектуальный анализ данных". Их можно считать синонимами Data Mining. Возникновение всех указанных терминов связано с новым витком в развитии средств и методов обработки данных.

До начала 90-х годов, казалось, не было особой нужды переосмысливать ситуацию в этой области. Все шло своим чередом в рамках направления, называемого прикладной статистикой (см. например, [1]). Теоретики проводили конференции и семинары, писали внушительные статьи и монографии, изобиловавшие аналитическими выкладками.

Вместе с тем, практики всегда знали, что попытки применить теоретические экзерсисы для решения реальных задач в большинстве случаев оказываются бесплодными. Но на озабоченность практиков до поры до времени можно было не обращать особого внимания - они решали главным образом свои частные проблемы обработки небольших локальных баз данных.

И вот прозвенел звонок. В связи с совершенствованием технологий записи и хранения данных на людей обрушились колоссальные потоки информационной руды в самых различных областях. Деятельность любого предприятия (коммерческого, производственного, медицинского, научного и т.д.) теперь сопровождается регистрацией и записью всех подробностей его деятельности. Что делать с этой информацией? Стало ясно, что без продуктивной переработки потоки сырых данных образуют никому не нужную свалку.

Специфика современных требований к такой переработке следующие:

    Данные имеют неограниченный объем
    Данные являются разнородными (количественными, качественными, текстовыми)
    Результаты должны быть конкретны и понятны
    Инструменты для обработки сырых данных должны быть просты в использовании

Традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, откровенно спасовала перед лицом возникших проблем. Главная причина - концепция усреднения по выборке, приводящая к операциям над фиктивными величинами (типа средней температуры пациентов по больнице, средней высоты дома на улице, состоящей из дворцов и лачуг и т.п.). Методы математической статистики оказались полезными главным образом для проверки заранее сформулированных гипотез (verification-driven data mining) и для "грубого" разведочного анализа, составляющего основу оперативной аналитической обработки данных (online analytical processing, OLAP).

В основу современной технологии Data Mining (discovery-driven data mining) положена концепция шаблонов (паттернов), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборке и виде распределений значений анализируемых показателей. Примеры заданий на такой поиск при использовании Data Mining приведены в табл. 1.

Таблица 1. Примеры формулировок задач при использовании методов OLAP и Data Mining [2]

OLAP
   
Data Mining

Каковы средние показатели травматизма для курящих и некурящих?
   

Какие факторы лучше всего предсказывают несчастные случаи?

Каковы средние размеры телефонных счетов существующих клиентов в сравнении со счетами бывших клиентов (отказавшихся от услуг телефонной компании)?
   

Какие характеристики отличают клиентов, которые, по всей вероятности, собираются отказаться от услуг телефонной компании?

Какова средняя величина ежедневных покупок по украденной и не украденной кредитной карточке?
   

Какие схемы покупок характерны для мошенничества с кредитными карточками?

Важное положение Data Mining - нетривиальность разыскиваемых шаблонов. Это означает, что найденные шаблоны должны отражать неочевидные, неожиданные (unexpected) регулярности в данных, составляющие так называемые скрытые знания (hidden knowledge). К обществу пришло понимание, что сырые данные (raw data) содержат глубинный пласт знаний, при грамотной раскопке которого могут быть обнаружены настоящие самородки (рис.1).

В целом технологию Data Mining достаточно точно определяет Григорий Пиатецкий-Шапиро - один из основателей этого направления:

    Data Mining - это процесс обнаружения в сырых данных

        ранее неизвестных
        нетривиальных
        практически полезных
        и доступных интерпретации знаний,
        необходимых для принятия решений в различных сферах
        человеческой деятельности.

    G. Piatetsky-Shapiro, Knowledge Stream Partners

2. Кому это нужно?

Сфера применения Data Mining ничем не ограничена - она везде, где имеются какие-либо данные. Но в первую очередь методы Data Mining сегодня, мягко говоря, заинтриговали коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных (Data Warehousing). Опыт многих таких предприятий показывает, что отдача от использования Data Mining может достигать 1000%. Например, известны сообщения об экономическом эффекте, в 10-70 раз превысившем первоначальные затраты от 350 до 750 тыс. дол. [3]. Известны сведения о проекте в 20 млн. дол., который окупился всего за 4 месяца. Другой пример - годовая экономия 700 тыс. дол. за счет внедрения Data Mining в сети универсамов в Великобритании.

Data Mining представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью методов Data Mining они могут получить ощутимые преимущества в конкурентной борьбе. Кратко охарактеризуем некоторые возможные бизнес-приложения Data Mining [2].
2.1. Некоторые бизнес-приложения Data Mining
Розничная торговля

Предприятия розничной торговли сегодня собирают подробную информацию о каждой отдельной покупке, используя кредитные карточки с маркой магазина и компьютеризованные системы контроля. Вот типичные задачи, которые можно решать с помощью Data Mining в сфере розничной торговли:

    анализ покупательской корзины (анализ сходства) предназначен для выявления товаров, которые покупатели стремятся приобретать вместе. Знание покупательской корзины необходимо для улучшения рекламы, выработки стратегии создания запасов товаров и способов их раскладки в торговых залах.
    исследование временных шаблонов помогает торговым предприятиям принимать решения о создании товарных запасов. Оно дает ответы на вопросы типа "Если сегодня покупатель приобрел видеокамеру, то через какое время он вероятнее всего купит новые батарейки и пленку?"
    создание прогнозирующих моделей дает возможность торговым предприятиям узнавать характер потребностей различных категорий клиентов с определенным поведением, например, покупающих товары известных дизайнеров или посещающих распродажи. Эти знания нужны для разработки точно направленных, экономичных мероприятий по продвижению товаров.

Банковское дело

Достижения технологии Data Mining используются в банковском деле для решения следующих распространенных задач:

    выявление мошенничества с кредитными карточками. Путем анализа прошлых транзакций, которые впоследствии оказались мошенническими, банк выявляет некоторые стереотипы такого мошенничества.
    сегментация клиентов. Разбивая клиентов на различные категории, банки делают свою маркетинговую политику более целенаправленной и результативной, предлагая различные виды услуг разным группам клиентов.
    прогнозирование изменений клиентуры. Data Mining помогает банкам строить прогнозные модели ценности своих клиентов, и соответствующим образом обслуживать каждую категорию.

Телекоммуникации

В области телекоммуникаций  методы Data Mining помогают компаниям более энергично продвигать свои программы маркетинга и ценообразования, чтобы удерживать существующих клиентов и привлекать новых. Среди типичных мероприятий отметим следующие:

    анализ записей о подробных характеристиках вызовов. Назначение такого анализа - выявление категорий клиентов с похожими стереотипами пользования их услугами и разработка привлекательных наборов цен и услуг;
    выявление лояльности клиентов.  Data Mining можно использовать для определения характеристик клиентов, которые, один раз воспользовавшись услугами данной компании, с большой долей вероятности останутся ей верными. В итоге средства, выделяемые на маркетинг, можно тратить там, где отдача больше всего.

Страхование

Страховые компании в течение ряда лет накапливают большие объемы данных. Здесь обширное поле деятельности для методов Data Mining:

    выявление мошенничества. Страховые компании могут снизить уровень мошенничества, отыскивая определенные стереотипы в заявлениях о выплате страхового возмещения, характеризующих взаимоотношения между юристами, врачами и заявителями.
    анализ риска. Путем выявления сочетаний факторов, связанных с оплаченными заявлениями, страховщики могут уменьшить свои потери по обязательствам. Известен случай, когда в США крупная страховая компания обнаружила, что суммы, выплаченные по заявлениям людей, состоящих в браке, вдвое превышает суммы по заявлениям одиноких людей. Компания отреагировала на это новое знание пересмотром своей общей политики предоставления скидок семейным клиентам.

Другие приложения в бизнесе

Data Mining может применяться во множестве других областей:

    развитие автомобильной промышленности. При сборке автомобилей производители должны учитывать требования каждого отдельного клиента, поэтому им нужны возможность прогнозирования популярности определенных характеристик и знание того, какие характеристики обычно заказываются вместе;
    политика гарантий. Производителям нужно предсказывать число клиентов, которые подадут гарантийные заявки, и среднюю стоимость заявок;
    поощрение часто летающих клиентов. Авиакомпании могут обнаружить группу клиентов, которых данными поощрительными мерами можно побудить летать больше. Например, одна авиакомпания обнаружила категорию клиентов, которые совершали много полетов на короткие расстояния, не накапливая достаточно миль для вступления в их клубы, поэтому она таким образом изменила правила приема в клуб, чтобы поощрять число полетов так же, как и мили.

2.2. Специальные приложения
Медицина

Известно много экспертных систем для постановки медицинских диагнозов. Они построены главным образом на основе правил, описывающих сочетания различных симптомов различных заболеваний. С помощью таких правил узнают не только, чем болен пациент, но и как нужно его лечить. Правила помогают выбирать средства медикаментозного воздействия, определять показания - противопоказания, ориентироваться в лечебных процедурах, создавать условия наиболее эффективного лечения, предсказывать исходы назначенного курса лечения и т. п. Технологии Data Mining позволяют обнаруживать в медицинских данных шаблоны, составляющие основу указанных правил.
Молекулярная генетика и генная инженерия

Пожалуй, наиболее остро и вместе с тем четко задача обнаружения закономерностей в экспериментальных данных стоит в молекулярной генетике и генной инженерии. Здесь она формулируется как определение так называемых маркеров, под которыми понимают генетические коды, контролирующие те или иные фенотипические признаки живого организма. Такие коды могут содержать сотни, тысячи и более связанных элементов.

На развитие генетических исследований выделяются большие средства. В последнее время в данной области возник особый интерес к применению методов Data Mining. Известно несколько крупных фирм, специализирующихся на применении этих методов для расшифровки генома человека и растений.
Прикладная химия

Методы Data Mining находят широкое применение в прикладной химии (органической и неорганической). Здесь нередко возникает вопрос о выяснении особенностей химического строения тех или иных соединений, определяющих их свойства. Особенно актуальна такая задача при анализе сложных химических соединений, описание которых включает сотни и тысячи структурных элементов и их связей.

Можно привести еще много примеров различных областей знания, где методы Data Mining играют ведущую роль. Особенность этих областей заключается в их сложной системной организации. Они относятся главным образом к надкибернетическому уровню организации систем [4], закономерности которого не могут быть достаточно точно описаны на языке статистических или иных аналитических математических моделей [5]. Данные в указанных областях неоднородны, гетерогенны, нестационарны и часто отличаются высокой размерностью.

3. Типы закономерностей

Выделяют пять стандартных типов закономерностей, которые позволяют выявлять  методы Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование (рис. 2).


Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить найти шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.
4. Классы систем Data Mining

Data Mining является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. (рис. 3). Отсюда обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining. Многие из таких систем интегрируют в себе сразу несколько подходов. Тем не менее, как правило, в каждой системе имеется какая-то ключевая компонента, на которую делается главная ставка. Ниже приводится классификация указанных ключевых компонент на основе работы [6]. Выделенным классам дается краткая характеристика.

4.1. Предметно-ориентированные аналитические системы

Предметно-ориентированные аналитические системы очень разнообразны. Наиболее широкий подкласс таких систем, получивший распространение в области исследования финансовых рынков, носит название "технический анализ". Он представляет собой совокупность нескольких десятков методов прогноза динамики цен и выбора оптимальной структуры инвестиционного портфеля, основанных на различных эмпирических моделях динамики рынка. Эти методы часто используют несложный статистический аппарат, но максимально учитывают сложившуюся своей области специфику (профессиональный язык, системы различных индексов и пр.). На рынке имеется множество программ этого класса. Как правило, они довольно дешевы (обычно $300-1000).
4.2. Статистические пакеты

Последние версии почти всех известных статистических пакетов включают наряду с традиционными статистическими методами также элементы Data Mining. Но основное внимание в них уделяется все же классическим методикам - корреляционному, регрессионному, факторному анализу и другим. Самый свежий детальный обзор пакетов для статистического анализа приведен на страницах ЦЭМИ http://is1.cemi.rssi.ru/ruswin/index.htm. Недостатком систем этого класса считают требование к специальной подготовке пользователя. Также отмечают, что мощные современные статистические пакеты являются слишком "тяжеловесными" для массового применения в финансах и бизнесе. К тому же часто эти системы весьма дороги - от $1000 до $15000.

Есть еще более серьезный принципиальный недостаток статистических пакетов, ограничивающий их применение в Data Mining. Большинство методов, входящих в состав пакетов опираются на статистическую парадигму, в которой главными фигурантами служат усредненные характеристики выборки. А эти характеристики, как указывалось выше, при исследовании реальных сложных жизненных феноменов часто являются фиктивными величинами.

В качестве примеров наиболее мощных и распространенных статистических пакетов можно назвать SAS (компания SAS Institute), SPSS (SPSS), STATGRAPICS (Manugistics), STATISTICA, STADIA и другие.
4.3. Нейронные сети

Это большой класс систем, архитектура которых имеет аналогию (как теперь известно, довольно слабую) с построением нервной ткани из нейронов. В одной из наиболее распространенных архитектур, многослойном перцептроне с обратным распространением ошибки, имитируется работа нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов нижележащего слоя. На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д. Эти значения рассматриваются как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ - реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, ее прежде надо "натренировать" на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Тренировка состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам.

Основным недостатком нейросетевой парадигмы является необходимость иметь очень большой объем обучающей выборки. Другой существенный недостаток заключается в том, что даже натренированная нейронная сеть представляет собой черный ящик. Знания, зафиксированные как веса нескольких сотен межнейронных связей, совершенно не поддаются анализу и интерпретации человеком (известные попытки дать интерпретацию структуре настроенной нейросети выглядят неубедительными - система "KINOsuite-PR").

Примеры нейросетевых систем - BrainMaker (CSS), NeuroShell (Ward Systems Group), OWL (HyperLogic). Стоимость их довольно значительна: $1500-8000.



4.4. Системы рассуждений на основе аналогичных случаев

Идея систем case based reasoning - CBR - на первый взгляд крайне проста. Для того чтобы сделать прогноз на будущее или выбрать правильное решение, эти системы находят в прошлом близкие аналоги наличной ситуации и выбирают тот же ответ, который был для них правильным. Поэтому этот метод еще называют методом "ближайшего соседа" (nearest neighbour). В последнее время распространение получил также термин memory based reasoning, который акцентирует внимание, что решение принимается на основании всей информации, накопленной в памяти.

Системы CBR показывают неплохие результаты в самых разнообразных задачах. Главным их минусом считают то, что они вообще не создают каких-либо моделей или правил, обобщающих предыдущий опыт, - в выборе решения они основываются на всем массиве доступных исторических данных, поэтому невозможно сказать, на основе каких конкретно факторов CBR системы строят свои ответы.

Другой минус заключается в произволе, который допускают системы CBR при выборе меры "близости". От этой меры самым решительным образом зависит объем множества прецедентов, которые нужно хранить в памяти для достижения удовлетворительной классификации или прогноза [7].

Примеры систем, использующих CBR, - KATE tools (Acknosoft, Франция), Pattern Recognition Workbench (Unica, США).
4.5. Деревья решений (decision trees)

Деревья решения являются одним из наиболее популярных подходов к решению задач Data Mining. Они создают иерархическую структуру классифицирующих правил типа "ЕСЛИ... ТО..." (if-then), имеющую вид дерева. Для принятия решения, к какому классу отнести некоторый объект или ситуацию, требуется ответить на вопросы, стоящие в узлах этого дерева, начиная с его корня. Вопросы имеют вид "значение параметра A больше x?". Если ответ положительный, осуществляется переход к правому узлу следующего уровня, если отрицательный - то к левому узлу; затем снова следует вопрос, связанный с соответствующим узлом.

Популярность подхода связана как бы с наглядностью и понятностью. Но деревья решений принципиально не способны находить "лучшие" (наиболее полные и точные) правила в данных. Они реализуют наивный принцип последовательного просмотра признаков и "цепляют" фактически осколки настоящих закономерностей, создавая лишь иллюзию логического вывода.

Вместе с тем, большинство систем используют именно этот метод. Самыми известными являются See5/С5.0 (RuleQuest, Австралия), Clementine (Integral Solutions, Великобритания), SIPINA (University of Lyon, Франция), IDIS (Information Discovery, США), KnowledgeSeeker (ANGOSS, Канада). Стоимость этих систем варьируется от 1 до 10 тыс. долл.


4.6. Эволюционное программирование

Проиллюстрируем современное состояние данного подхода на примере системы PolyAnalyst - отечественной разработке, получившей сегодня общее признание на рынке Data Mining. В данной системе гипотезы о виде зависимости целевой переменной от других переменных формулируются в виде программ на некотором внутреннем языке программирования. Процесс построения программ строится как эволюция в мире программ (этим подход немного похож на генетические алгоритмы). Когда система находит программу, более или менее удовлетворительно выражающую искомую зависимость, она начинает вносить в нее небольшие модификации и отбирает среди построенных дочерних программ те, которые повышают точность. Таким образом система "выращивает" несколько генетических линий программ, которые конкурируют между собой в точности выражения искомой зависимости. Специальный модуль системы PolyAnalyst переводит найденные зависимости с внутреннего языка системы на понятный пользователю язык (математические формулы, таблицы и пр.).

Другое направление эволюционного программирования связано с поиском зависимости целевых переменных от остальных в форме функций какого-то определенного вида. Например, в одном из наиболее удачных алгоритмов этого типа - методе группового учета аргументов (МГУА) зависимость ищут в форме полиномов. В настоящее время из продающихся в России систем МГУА реализован в системе NeuroShell компании Ward Systems Group.

Стоимость систем до $ 5000.
4.7. Генетические алгоритмы

Data Mining не основная область применения генетических алгоритмов. Их нужно рассматривать скорее как мощное средство решения разнообразных комбинаторных задач и задач оптимизации. Тем не менее генетические алгоритмы вошли сейчас в стандартный инструментарий методов Data Mining, поэтому они и включены в данный обзор.

Первый шаг при построении генетических алгоритмов - это кодировка исходных логических закономерностей в базе данных, которые именуют хромосомами, а весь набор таких закономерностей называют популяцией хромосом. Далее для реализации концепции отбора вводится способ сопоставления различных хромосом. Популяция обрабатывается с помощью процедур репродукции, изменчивости (мутаций), генетической композиции. Эти процедуры имитируют биологические процессы. Наиболее важные среди них: случайные мутации данных в индивидуальных хромосомах, переходы (кроссинговер) и рекомбинация генетического материала, содержащегося в индивидуальных родительских хромосомах (аналогично гетеросексуальной репродукции), и миграции генов. В ходе работы процедур на каждой стадии эволюции получаются популяции со все более совершенными индивидуумами.

Генетические алгоритмы удобны тем, что их легко распараллеливать. Например, можно разбить поколение на несколько групп и работать с каждой из них независимо, обмениваясь время от времени несколькими хромосомами. Существуют также и другие методы распараллеливания генетических алгоритмов.

Генетические алгоритмы имеют ряд недостатков. Критерий отбора хромосом и используемые процедуры являются эвристическими и далеко не гарантируют нахождения "лучшего" решения. Как и в реальной жизни, эволюцию может "заклинить" на какой-либо непродуктивной ветви. И, наоборот, можно привести примеры, как два неперспективных родителя, которые будут исключены из эволюции генетическим алгоритмом, оказываются способными произвести высокоэффективного потомка. Это особенно становится заметно при решении высокоразмерных задач со сложными внутренними связями.

Примером может служить система GeneHunter фирмы Ward Systems Group. Его стоимость - около $1000.
4.8. Алгоритмы ограниченного перебора

Алгоритмы ограниченного перебора были предложены в середине 60-х годов М.М. Бонгардом для поиска логических закономерностей в данных. С тех пор они продемонстрировали свою эффективность при решении множества задач из самых различных областей.

Эти алгоритмы вычисляют частоты комбинаций простых логических событий в подгруппах данных. Примеры простых логических событий: X = a; X < a; X a; a < X < b и др., где X - какой либо параметр, "a" и "b" - константы. Ограничением служит длина комбинации простых логических событий (у М. Бонгарда она была равна 3). На основании анализа вычисленных частот делается заключение о полезности той или иной комбинации для установления ассоциации в данных, для классификации, прогнозирования и пр.

Наиболее ярким современным представителем этого подхода является система WizWhy предприятия WizSoft. Хотя автор системы Абрахам Мейдан не раскрывает специфику алгоритма, положенного в основу работы WizWhy, по результатам тщательного тестирования системы были сделаны выводы о наличии здесь ограниченного перебора (изучались результаты, зависимости времени их получения от числа анализируемых параметров и др.).

Автор WizWhy утверждает, что его система обнаруживает ВСЕ логические if-then правила в данных. На самом деле это, конечно, не так. Во-первых, максимальная длина комбинации в if-then правиле в системе WizWhy равна 6, и, во-вторых, с самого начала работы алгоритма производится эвристический поиск простых логических событий, на которых потом строится весь дальнейший анализ. Поняв эти особенности WizWhy, нетрудно было предложить простейшую тестовую задачу, которую система не смогла вообще решить. Другой момент - система выдает решение за приемлемое время только для сравнительно небольшой размерности данных.

Тем не менее, система WizWhy является на сегодняшний день одним из лидеров на рынке продуктов Data Mining. Это не лишено оснований. Система постоянно демонстрирует более высокие показатели при решении практических задач, чем все остальные алгоритмы. Стоимость системы около $ 4000, количество продаж - 30000.

4.9. Системы для визуализации многомерных данных

В той или иной мере средства для графического отображения данных поддерживаются всеми системами Data Mining. Вместе с тем, весьма внушительную долю рынка занимают системы, специализирующиеся исключительно на этой функции. Примером здесь может служить программа DataMiner 3D словацкой фирмы Dimension5 (5-е измерение).

В подобных системах основное внимание сконцентрировано на дружелюбности пользовательского интерфейса, позволяющего ассоциировать с анализируемыми показателями различные параметры диаграммы рассеивания объектов (записей) базы данных. К таким параметрам относятся цвет, форма, ориентация относительно собственной оси, размеры и другие свойства графических элементов изображения. Кроме того, системы визуализации данных снабжены удобными средствами для масштабирования и вращения изображений. Стоимость систем визуализации может достигать нескольких сотен долларов.


5. Резюме

1. Рынок систем Data Mining экспоненциально развивается. В этом развитии принимают участие практически все крупнейшие корпорации (см. например http://www.kdnuggets.com). В частности, Microsoft непосредственно руководит большим сектором данного рынка (издает специальный журнал, проводит конференции, разрабатывает собственные продукты).

2. Системы Data Mining применяются по двум основным направлениям: 1) как массовый продукт для бизнес-приложений; 2) как инструменты для проведения уникальных исследований (генетика, химия, медицина и пр.). В настоящее время стоимость массового продукта от $1000 до $10000. Количество инсталляций массовых продуктов, судя по имеющимся сведениям, сегодня достигает десятков тысяч. Лидеры Data Mining связывают будущее этих систем с использованием их в качестве интеллектуальных приложений, встроенных в корпоративные хранилища данных.

3. Несмотря на обилие методов Data Mining, приоритет постепенно все более смещается в сторону логических алгоритмов поиска в данных if-then правил. С их помощью решаются задачи прогнозирования, классификации, распознавания образов, сегментации БД, извлечения из данных "скрытых" знаний, интерпретации данных, установления ассоциаций в БД и др. Результаты таких алгоритмов эффективны и легко интерпретируются.

4. Вместе с тем, главной проблемой логических методов обнаружения закономерностей является проблема перебора вариантов за приемлемое время. Известные методы либо искусственно ограничивают такой перебор (алгоритмы КОРА, WizWhy), либо строят деревья решений (алгоритмы CART, CHAID, ID3, See5, Sipina и др.), имеющих принципиальные ограничения эффективности поиска if-then правил. Другие проблемы связаны с тем, что известные методы поиска логических правил не поддерживают функцию обобщения найденных правил и функцию поиска оптимальной композиции таких правил. Удачное решение указанных проблем может составить предмет новых конкурентоспособных разработок.
Литература

     Айвазян С. А., Бухштабер В. М., Юнюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. - М.: Финансы и статистика, 1989.
     Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? - Tandem Computers Inc., 1996.
     Кречетов Н.. Продукты для интеллектуального анализа данных. - Рынок программных средств, N14-15_97, c. 32-39.
     Boulding K. E. General Systems Theory - The Skeleton of Science//Management Science, 2, 1956.
     Гик Дж., ван. Прикладная общая теория систем. - М.: Мир, 1981.
     Киселев М., Соломатин Е.. Средства добычи знаний в бизнесе и финансах. - Открытые системы, № 4, 1997, с. 41-44.
     Дюк В.А. Обработка данных на ПК в примерах. - СПб: Питер, 1997.