Как сделать кластерный анализ

Пример использования кластерного анализа STATISTICA в автостраховании

Посмотреть видеоурок на Statistica

В STATISTICA реализованы классические методы кластерного анализа, включая методы k-средних, иерархической кластеризации и двухвходового объединения.

Данные могут поступать как в исходном виде, так и в виде матрицы расстояний между объектами.

Наблюдения и переменные можно кластеризовать, используя различные меры расстояния (евклидово, квадрат евклидова, манхэттеновское, Чебышева и др.) и различные правила объединения кластеров (одиночная, полная связь, невзвешенное и взвешенное попарное среднее по группам и др.).

Постановка задачи

Исходный файл данных содержит следующую информацию об автомобилях и их владельцах:

марка автомобиля – первая переменная;

стоимость автомобиля – вторая переменная;

возраст водителя – третья переменная;

стаж водителя – четвертая переменная;

возраст автомобиля – пятая переменная;

Как сделать кластерный анализ

Целью данного анализа является разбиение автомобилей и их владельцев на классы, каждый из которых соответствует определенной рисковой группе. Наблюдения, попавшие в одну группу, характеризуются одинаковой вероятностью наступления страхового случая, которая впоследствии оценивается страховщиком.

Использование кластер-анализа для решения данной задачи наиболее эффективно. В общем случае кластер-анализ предназначен для объединения некоторых объектов в классы (кластеры) таким образом, чтобы в один класс попадали максимально схожие, а объекты различных классов максимально отличались друг от друга. Количественный показатель сходства рассчитывается заданным способом на основании данных, характеризующих объекты.

Масштаб измерений

Все кластерные алгоритмы нуждаются в оценках расстояний между кластерами или объектами, и ясно, что при вычислении расстояния необходимо задать масштаб измерений.

Поскольку различные измерения используют абсолютно различные типы шкал, данные необходимо стандартизовать (в меню Данные выберете пункт Стандартизовать), так что каждая переменная будет иметь среднее 0 и стандартное отклонение 1.

Таблица со стандартизованными переменными приведена ниже.

Как сделать кластерный анализ

Шаг 1. Иерархическая классификация

На первом этапе выясним, формируют ли автомобили «естественные» кластеры, которые могут быть осмыслены.

Как сделать кластерный анализ

Нажмем кнопку Переменные, выберем Все, в поле Объекты выберем Наблюдения (строки). В качестве правила объединения отметим Метод полной связи, в качестве меры близости – Евклидово расстояние. Нажмем ОК.

Как сделать кластерный анализ

Метод полной связи определяет расстояние между кластерами как наибольшее расстояние между любыми двумя объектами в различных кластерах (т.е. «наиболее удаленными соседями»).

Мера близости, определяемая евклидовым расстоянием, является геометрическим расстоянием в n- мерном пространстве и вычисляется следующим образом:

Как сделать кластерный анализ

Наиболее важным результатом, получаемым в результате древовидной кластеризации, является иерархическое дерево. Нажмем на кнопку Вертикальная дендрограмма.

Как сделать кластерный анализ

Как сделать кластерный анализ

Вначале древовидные диаграммы могут показаться немного запутанными, однако после некоторого изучения они становятся более понятными. Диаграмма начинается сверху (для вертикальной дендрограммы) с каждого автомобиля в своем собственном кластере.

Как только вы начнете двигаться вниз, автомобили, которые «теснее соприкасаются друг с другом» объединяются и формируют кластеры. Каждый узел диаграммы, приведенной выше, представляет объединение двух или более кластеров, положение узлов на вертикальной оси определяет расстояние, на котором были объединены соответствующие кластеры.

Шаг 2. Кластеризация методом К средних

Исходя из визуального представления результатов, можно сделать предположение, что автомобили образуют четыре естественных кластера. Проверим данное предположение, разбив исходные данные методом К средних на 4 кластера, и проверим значимость различия между полученными группами.

В Стартовой панели модуля Кластерный анализ выберем Кластеризация методом К средних.

Как сделать кластерный анализ

Нажмем кнопку Переменные и выберем Все, в поле Объекты выберем Наблюдения (строки), зададим 4 кластера разбиения.

Как сделать кластерный анализ

Метод K-средних заключается в следующем: вычисления начинаются с k случайно выбранных наблюдений (в нашем случае k=4), которые становятся центрами групп, после чего объектный состав кластеров меняется с целью минимизации изменчивости внутри кластеров и максимизации изменчивости между кластерами.

Каждое следующее наблюдение (K+1) относится к той группе, мера сходства с центром тяжести которого минимальна.

После изменения состава кластера вычисляется новый центр тяжести, чаще всего как вектор средних по каждому параметру. Алгоритм продолжается до тех пор, пока состав кластеров не перестанет меняться.

Когда результаты классификации получены, можно рассчитать среднее значение показателей по каждому кластеру, чтобы оценить, насколько они различаются между собой.

В окне Результаты метода К средних выберем Дисперсионный анализ для определения значимости различия между полученными кластерами.

Источник

Кластерный анализ в трейдинге: особенности и методы

Данная статья посвящена такому техническому приему как кластерный анализ. Кто-то слышит об этом впервые, для кого-то это знакомо, но непонятно. На примере рекомендаций от брокера FinmaxFX разбираемся детально, что это такое и как грамотно применять в торговле на финансовых рынках.

Кластерный анализ выступает в роли весьма полезного инструмента, позволяющего найти лучшие точки для входа в сделку, таким образом, повышая эффективность работы трейдера. По нему можно понять, как представлена реальная картина на рынке и какое соотношение наблюдается между покупателями и продавцами.

Кратко о рыночном профиле

Перед тем как разбираться с кластерами, первым делом нужно понимать рыночный профиль. Под данным понятием подразумеваются данные по объему контрактов, которые были совершены на конкретном ценовом уровне. Если мы говорим о тиковом объеме Форекса, тогда рассматриваются исключительно эти данные и не обращается внимание на реальный поток ордеров.

Пример профиля рынка может выглядеть таким образом, как представлено на рисунке ниже.

Как сделать кластерный анализ

Кластерный анализ тоже является объемным профилем, однако по каждой конкретной свече или тику, где указывается конкретное количество совершенных сделок. Данное явление можно сравнить с графической интерпретацией стакана или ленты, однако объем в этом случае неполный.

Можно представить это следующим образом, как на изображении.

Как сделать кластерный анализ

Или же картинка может быть подана в таком виде, как на Volfix, в зависимости от настроек и спецификации торгового терминала.

Как сделать кластерный анализ

Инструменты кластерного анализа

Существует очень мало вариантов использовать кластерный анализ на бесплатной основе, при этом большинство вариантов – это пробные версии сроком до двух недель или же очень примитивный и неграмотный функционал.

Среди топовых вариантов кластерного анализа можно выделить следующие:

В функционале терминалов МТ4 и МТ5 есть не только платные, но и свободные к доступу версии объемных индикаторов и рыночных профилей, однако сам кластерный анализ присутствует только в названии, не более. Выделяют такие популярные инструменты:

Что такое кластер на финансовом рынке?

Когда-то Джозефом Гранвилом были произнесены такие слова, что объемом является количество пара, позволяющее ехать паровозу. Здесь можно провести аналогию с валютным рынком. Сегодня многие трейдеры акцентируют свое внимание на торговых объемах и их интерпретации, чтобы вычислять будущее ценовое движение. Это актуально для всех – и для тех, кто торгует в краткосроке, и для тех, кто предпочитает долгосрочные сделки. Именно кластерный анализ помогает работать в объемом рынка.

Под кластером следует подразумевать объединение нескольких похожих или одинаковых элементов, которые образуют самостоятельную единицу с конкретными свойствами. У нас происходит торговля на рынке, мы сосредоточены в рамках какого-либо таймфрейма, при этом на конкретных ценах будут проявляться однородные элементы в виде длинных и коротких позиций с активами. Суммируя такие элементы, мы получаем кластеры – общие объемы по покупкам и продажам валютных пар с учетом определенного временного интервала и ценовых показателей.

Кластерный анализ направлен на изучение таких ордеров и их объемов, присущих определенных ценовым уровням, а трейдер сможет более детально понимать, в каком направлении с наибольшей вероятностью будет продвигаться целевой актив.
Для наглядного представления такого типа анализа используется специальный график, когда на свечу каждого ценового уровня накладывается торговый объем.

Ниже на рисунке показано, как выглядит кластерный и свечной графики.

Как сделать кластерный анализ

Если обратить к терминалу QUIK, в нем можно найти обезличенную таблицу всех проведенных сделок, при этом трейдер может выводить данные для интересующего его актива. В данной таблице объединены все текущие ордера и их объемы. Речь идет именно об активных сделках, ведь в стакане всегда присутствует спред между наилучшим ценовым значением на покупку и продажу. Для совершения сделки одному из контрагентов необходимо согласиться на цену, предлагаемую оппонентом. Все эти операции попадают в таблицу обезличенных сделок, которая также именуется как лента.

Важно учитывать тот факт, что в случае успеха по сделке у нас есть два действующих субъекта, которые формируют торговый объем: с одной стороны выступает инициатор, а с другой – контрагент, который и предоставил этот объем. Данные таких сделок будут попадать на кластерный график, а трейдер сможет получать еще более точные данные и важные детали о том, как образуются свечи и что происходит в такие моменты.

А что происходит в момент вырисовывания очередного бара на графике? Давайте разбираться. Сначала все заявки разделяются на две группы:

На кластерах наглядно представлена ситуация, как ведут себя влиятельные участники рынка – ориентированы на покупку или продажу, какие цены актуальны для них. Все данные по сделкам формируются в соответствующем кластере. Если на одной свече проводятся операции по одинаковым ценам от разных трейдеров, все объемы суммируются в единый и трейдер получает актуальные показатели проведенного анализа.

В системе кластерного анализа главными понятиями, которые важно знать и уметь применять, являются следующие:

Рассмотрим каждое из них.

Что такое маркет-дельта?

Дельта выражается в виде разницы между активными покупными и продажными ордерами на определенном таймфрейме. В случае ее положительного значения можно утверждать, что на свече доминирующими были покупные сделки, а если дельта будет отрицательной – это свидетельство преобладания продажных сделок.

Когда количество ордеров на покупку больше, обычно это сопровождается повышением цены, а превосходство ордеров на продажу указывает на дальнейшее ценовое снижение. Если отслеживать все нанесенные на свечу покупные и продажные объемы, можно разницу по количеству операций. Трейдер сможет самостоятельно понимать, с какой стороны было доминирование на интересующей его свече. Полученная разница в виде дельты должна пониматься в общем контексте других баров. Таким образом, напрашивается вывод, что при доминировании длинных позиций цена будет расти, а коротких – снижаться.

На рисунке ниже представлен пример маркет-дельты.

Как сделать кластерный анализ

Что такое маркет-профиль?

Под маркет-профилем подразумеваются торговые объемы по операциям, соответствующие каждой конкретной цене, в рамках одного дня или за весь анализируемый период. Таким образом, это объем «вертикального» типа и он качественно показывает уровни, на которых фиксировался наибольший объем за временной промежуток. Если эту зону пробить в противоположную сторону, это грозит срывом стопов, следовательно, будет появляться импульс.

Маркет-профиль помогает отслеживать ключевые уровни и интерпретировать их как области с максимальными объемами по сделкам. Также через данное понятие можно понять, на каких уровнях какие объемы по ордерам отслеживались (см. рисунок).

Как сделать кластерный анализ

Применение кластерного анализа в торговых сделках

Кластеры могут применять дифференцированно, в зависимости от того, какая методика построения используется трейдером. Самыми эффективными считаются следующие:

Наибольшая эффективность обоих методов наблюдается на таймфреймах не старше 30-ти минут, а на крупных временных интервалах ситуация может быть вообще не предсказуема.

Анализ по методу дельта-профиля

Все значения из ленты сразу попадают на график кластерного анализа. При этом рассматриваются такие паттерны:

Ниже на картинке можно увидеть оба паттерна.

Как сделать кластерный анализ

Важно следить не только за паттерном, а за дельтой в целом, иначе картина будет неоднозначной, что продемонстрировано на изображении ниже.

Как сделать кластерный анализ

Если смотреть только на график свечей, трейдеру ничтожно мало такой информации и график бы просто дошел до уровня. Такая ситуация может рассматриваться и как разворот, и как продолжение тенденции, как видно ниже не рисунке.

Как сделать кластерный анализ

Благодаря дельта-профилю трейдер воздерживается от покупки и находит прекрасный момент для продажи.

Анализ по методу кластер-профиля

Анализируя рынок по данной методике, трейдеру важно найти данные крупного объема. Если уровень сформируется, его будут удерживать быки или медведи в зависимости от силы рынка, а для нас это возможность выставлять ордер с наименьшим риском.

Пример приведен ниже.

Как сделать кластерный анализ

По графику видно, что крупные объемы находятся в пределах 0,7114-154, а также есть три момента в зоне 100-150. Таким образом, продавцами удерживаются позиции, чтобы цена актива не росла.

Здесь важно учитывать несколько спорных моментов:

Особенности кластерного анализа в терминалах МТ4 и МТ5

Наглядное представление кластерного графика в терминале MetaTrader выглядит таким образом.

Как сделать кластерный анализ

Если объем выше среднего значения, он будет выделяться цветом. Это удобно для зрительного восприятия данных трейдером.

Трейдер может определять не только дельту, но и начало сильного движения, его направление в точечном виде.

Как сделать кластерный анализ

Для вычисления уровня разворота необходимы значения таких параметров как:

Используя в комплексе всю информацию, можно создавать свои стратегии торговли и дополнять их вспомогательными инструментами.

Как сделать кластерный анализ

Кластерный анализ позволяет мониторить активность рыночных участников, в частности самых крупных, чтобы отслеживать объемы на ценовых барах. Данный метод можно смело называть самым точным и детальным в работе трейдера.

Ключевая задача трейдера – это вычислить момент перехода дельты от умеренного значения к нормальному, когда рынок из флэта переходит в тренд. Наглядно можно объяснить на таком примере:

Как сделать кластерный анализ

Полезно применять индикатор YuClusters, который помогает формировать графики, используя тиковые данные и выбранную трейдером цену Аск, Бид или среднее их значение.

Точечное вливание в анализе кластеров

Суть такого приема заключается в том, чтобы определить уровни, которым свойственные высокие объемы, которые соответствуют действиям крупных игроков для входа в сделку или при закрытии ордера.

Точечный объем – это зона повышенного вливания ликвидности в рынок. Однако для каждого актива и таймфрейма подбирается свое значение кластера, которое сможет оказаться информативным и эффективным для дальнейшего анализа.
Также важными факторами влияния выступают такие как торговая сессия и общая рыночная активность.

Объемы, которые необходимо учитывать при проведении кластерного анализа, – это показатели, принадлежащие локальным трендам и разворотным точкам:

Как сделать кластерный анализ

На данном примере явно видно применение точечных вливаний объема в виде уровней сопротивления и поддержки. А сама свеча будет подсказывать, как корректно воспринимать объемные уровни:

Рекомендуется сочетать кластерный анализ с другими видами, чтобы выявлять точки для выставления ордера или завершения сделки.

Можно рассмотреть следующий пример:

Как сделать кластерный анализ

Для определения более точных уровней необходимо анализировать самые узкие временные отрезки, в том числе просматривать данные минутного таймфрейма.

Вертикальный торговый объем

Речь идее о гистограмме, которая показывает данные по объему проторгованных позиций и их соответствие каждой свече.
Когда проводится такой анализ, нужно искать моменты возникновения вброса ликвидности и на каком уровне это случилось:

Как сделать кластерный анализ

Рассматривая рисунок, можно отметить, что столбцы гистограммы 1-4 показывают, как на сильном вливании объема случился отскок от уровня поддержки. Зона столбцов 5-6 демонстрирует, что при выбросе объема тормозилось движение вверх, а крупный трейдер входил на продажные сделки.

Горизонтальный торговый объем

Такой подход служит эффективным способом для изучения рынка и определения уровней влияния, а также поиска точек потенциальных разворотов. Он называется также рыночным профилем и изображается как гистограмма, указывающая данные проторгованного объема на каждом рыночном участке.

Когда формируется профиль рынка, вы должны указать конкретный участок для исследования – день, неделя и т.д. Временной интервал задается индивидуально трейдером, так как зависит от его торговой системы.

На рисунке ниже виден горизонтальный объем, который помогает получить сигналы о локальных ключевых уровнях в рамках кластерного анализа.

Как сделать кластерный анализ

Вывод

Кластерный анализ на рынке позволяет определять моменты повышенной торговой активности в виде данных объема, где крупные рыночные игроки набирали свои позиции. Относится к категории современных и высокоточных методик прогнозирования, поскольку в его основу заложена детализация входящих объемов в активе.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *