Анализ данных и прогнозирование. Общая информация
Общий объект АнализДанных предназначен для выполнения анализа данных (кластерный анализ, поиск ассоциативных правил, поиск последовательностей и другие виды анализа). Результат работы зависит от типа производимого анализа.
Конструктор объекта:
Анализ = Новый АнализДанных;
Свойства объекта:
- ИсточникДанных – Содержит источник данных анализа , например. ТаблицаЗначений; РезультатЗапроса; ОбластьЯчеекТабличногоДокумента
- НастройкаКолонок – Содержит настройку колонок источника данных. Это коллекция входных колонок анализа данных. Для каждой колонки указывается тип данных, содержащихся в ней, роль, выполняемая колонкой, дополнительные настройки, зависящие от типа производимого анализа
- Параметры – Параметры анализа данных. Состав параметров зависит от типа анализа.
- ТипАнализа – Тип производимого анализа. Одно из: Тип(“АнализДанныхКластеризация”), Тип(“АнализДанныхПоискАссоциаций”) , Тип(“АнализДанныхПоискПоследовательностей”) , Тип(“АнализДанныхДеревоРешений”), Тип(“АнализДанныхОбщаяСтатистика”),
Методы:
- Выполнить() – Выполняет анализ и получает результат. Возвращаемое значение результата зависит от свойства
ТипАнализа
Механизм анализа данных и прогнозирования позволяет реализовывать в прикладных решениях различные средства для выявления закономерностей, которые обычно скрываются за большими объемами информации.
Например, проанализировав данные о продажах товаров, можно выявить группы товаров, которые обычно покупаются вместе. В дальнейшем (один из многочисленных вариантов) эта информация может использоваться при раскладке товара в розничном магазине. Товары могут располагаться рядом (пришел покупатель за мангалом, увидел рядом жидкость для растопки, угли, мясо, удочки, резиновую лодку… в итоге купил все), могут располагаться в разных углах торгового зала (пришел покупатель за молоком, пока дойдет до хлеба, пройдет через весь магазин и еще чего-нибудь купит).
Другим примером использования механизма анализа данных является прогнозирование поведения контрагента, исходя из имеющихся данных о нем. Проведя такой анализ, можно выяснить, как зависит объем их закупок от территориального расположения, размера компании, времени сотрудничества и прочих показателей. На основании этих зависимостей можно спрогнозировать поведение нового контрагента и выбрать соответствующую стратегию для работы с ним.
Используя возможность построения прогнозов, можно планировать закупочную кампанию. Рассмотрим пример: в прошлом месяце зоомагазин продал 100 морских свинок. Нужно спланировать закупку товара на следующий месяц. Одним из вариантов (очень часто используемых) является ввод поправочного коэффициента на продажи прошлых периодов. Считаем, что поправочный коэффициент (коэффициент повышения спроса) равен 1,5. В итоге при планировании закупок описанным методом будем к следующему месяцу планировать закупку 150 морских свинок. Но если проанализировать, что обычно покупают клиенты после покупки таких питомцев, то можно прийти к совершенно другому выводу. Воспользовавшись возможностью проведения анализа данных, построения прогноза по этому анализу, можно прийти к выводу, что закупать на следующий месяц нужно корм, различные наполнители, сено и другие «аксессуары».
Схема механизма
Общую схему работы механизма анализа и прогнозирования данных можно представить следующим образом:
Первый этап – Получение данных из базы данных 1С: предприятие или из другого источника, предварительно загруженных в таблицу значений или табличный документ.
Этап второй – Применяя к исходным данным один из видов анализа, можно получить результат анализа. Результат анализа представляет собой некую модель поведения данных; может быть отображен в итоговом документе или сохранен для дальнейшего использования.
Этап третий – Создание модели прогноза на основе результата анализа, которая позволяет прогнозировать поведение новых данных в соответствии с имеющейся моделью. Модели прогноза, создаваемые механизмом, представляют собой специальные объекты, которые создаются из результата анализа данных и позволяют в дальнейшем автоматически выполнять прогноз для новых данных.
Например, можно проанализировать, какие товары приобретаются вместе (в одной накладной), и сохранить созданную на основе данного анализа модель прогноза в базе данных. В дальнейшем при создании очередной накладной ранее сохраненную модель прогноза можно извлечь из информационной базы, подать ей на вход новые данные, содержащиеся в этой накладной, и на выходе получить прогноз ‑ список товаров, которые очередной клиент тоже приобретет (с определенной долей вероятности), если их ему предложить.
Основные объекты механизма
Схематично взаимосвязь основных объектов механизма анализа данных и прогнозирования можно показать следующим образом:
Типы анализа данных
Свойства ТипАнализа объекта АнализДанных (анализ данных и прогнозирования) имеет 5 типов значений:
● Тип(“АнализДанныхОбщаяСтатистика”) – общая статистика
представляет собой механизм для сбора общей информации о данных, находящихся в полученном источнике данных. Этот тип анализа предназначен для предварительного исследования анализируемой информации. Анализ показывает ряд характеристик дискретных и непрерывных полей. При выводе отчета в табличный документ заполняются круговые диаграммы для отображения состава полей. Пример данного типа анализа можно посмотреть здесь
● Тип(“АнализДанныхПоискАссоциаций”) – Тип анализа поиск ассоциаций осуществляет поиск часто встречаемых вместе групп объектов или значений характеристик, а также производит поиск правил ассоциаций. Поиск ассоциаций может использоваться, например, для определения часто приобретаемых вместе товаров или услуг. Этот тип анализа может работать с иерархическими данными, что позволяет, например, находить правила не только для конкретных товаров, но и для их групп. Важной особенностью этого типа анализа является возможность работать как с объектным источником данных, в котором каждая колонка содержит некоторую характеристику объекта, так и с событийным источником, где характеристики объекта располагаются в одной колонке.
Пример данного типа анализа можно посмотреть здесь
● Тип(“АнализДанныхПоискПоследовательностей”) – Тип анализа Поиск последовательностей позволяет выявлять в источнике данных последовательные цепочки событий. Например, это может быть цепочка товаров или услуг, которые часто последовательно приобретают клиенты. Этот тип анализа позволяет осуществлять поиск по иерархии, что дает возможность отслеживать не только последовательности конкретных событий, но и последовательности родительских групп. Пример данного типа анализа можно посмотреть здесь
● Тип(“АнализДанныхКластеризация”) – Кластерный анализ позволяет разделить исходный набор исследуемых объектов на группы объектов таким образом, чтобы каждый объект был более схож с объектами из своей группы, чем с объектами других групп. Анализируя в дальнейшем полученные группы, называемые кластерами, можно определить, чем характеризуется та или иная группа, принять решение о методах работы с объектами различных групп. Например, при помощи кластерного анализа можно разделить клиентов, с которыми работает компания, на группы, для того, чтобы применять различные стратегии при работе с ними. При помощи параметров кластерного анализа пользователь может настроить алгоритм, по которому будет производиться разбиение, а также может динамически изменять состав характеристик, учитываемых при анализе, настраивать для них весовые коэффициенты.
Результат кластеризации может быть выведен в дендрограмму ‑ специальный вид диаграммы, предназначенный для графического отображения результатов кластерного анализа.
● Тип(“АнализДанныхДеревоРешений”) – Тип анализа Дерево решений позволяет построить иерархическую структуру классифицирующих правил, представленную в виде дерева.
Для построения дерева решений необходимо выбрать целевой атрибут, по которому будет строиться классификатор, и ряд входных атрибутов, которые будут использоваться для создания правил. Целевой атрибут может содержать, например, информацию о том, перешел ли клиент к другому поставщику услуг, удачна ли была сделка, качественно ли была выполнена работа и т. д. Входными атрибутами, например, могут выступать возраст сотрудника, стаж его работы, материальное состояние клиента, количество сотрудников в компании и т. п.
Результат работы анализа представляется в виде дерева, каждый узел которого содержит некоторое условие. Для принятия решения, к какому классу следует отнести некий новый объект, необходимо, отвечая на вопросы в узлах, пройти цепочку от корня до листа дерева, переходя к дочерним узлам в случае утвердительного ответа и к соседнему узлу ‑ в случае отрицательного.
Набор параметров анализа позволяет регулировать точность полученного дерева.