Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 8

 
Avals:

в данном случае независимость не требуется как я понял, а является как раз предметом оценки.
Требуется. А оценивается энтропия, как вероятностная оценка.
 
HideYourRichess:
Требуется. А оценивается энтропия, как вероятностная оценка.

Где написано, что требуется независимость? Появление букв в русско-язычном тексте независимо от контекста (предыдущих букв)?
 
alexeymosc:
Множество примеров применения ТИ, на русском языке, относятся к анализу буквенного алфавита русского, и других, языков, а также к анализу слов и фраз (последовательностей слов). А ведь все эти символы априори не являются статистически независимыми, и по этим примерам оценивается взаимная информация, величина, которая показывает количество зависимости. Так что априорная независимость изучаемых величин не является необходимым условием корректного применения ТИ.

Очень слабая аргументация, на уровне, что где то читал, что где то там используется, для чего то там, по этому... Именно об этом писал нам академический словарик, - "Для моделирования систем связи такой подход правомерен, поскольку они предназначены для безошибочной передачи по каналу связи информации, представленной любым набором символов. В тех же случаях, когда существен учёт ценности и смысла информации, количеств. подход неприменим. Это обстоятельство налагает существенные ограничения на области возможных приложений ТИ. Неучёт его привёл на ранних этапах развития к переоценке прикладной значимости."


 
Avals:

Где написано, что требуется независимость? Появление букв в русско-язычном тексте независимо от контекста (предыдущих букв)?
А что, из условия задачи это не понятно? Формулировка, кстати, совершенно классическая для тер.вера.
 
alexeymosc:

Это недоработка Статистики. Сам ей пользуюсь, кстати.
Наконец-то можно поставить обоснованный диагноз.
 
faa1947: Открываю в пакете СТАТИСТИКА закладку "добыча данных" - порядка порядка 20 наименований разделов и отдельных процедур. Все это прекрасно согласуется с учебниками и монографиями в этой области, но ничего про ТИ для добычи данных.

Чудесно. Пакет Statistica - единственный источник, к которому нужно обращаться за добычей данных. Поэтому ТИ нужно запретить использовать для этого. И собственный моск - тоже запретить, т.к. вместе со Statistica он уже не нужен.

Roman.: Алексей, Вы не подскажете, реально ли по данной ссылке, все это удовольствие перевести в код в интересующем нас на направлении...

А.Сергеев делал нечто же подобное при переводе в код индикатора Султонова или я ошибаюсь?

Вполне реально. Пределов вроде там не заметил, а вот суммы и логарифмы в MQL4 сделать можно. Что делал sergeev, не знаю. Но, насколько мне известно из других источников, самой сложной частью расчетов было вычисление гамма-функции. Ни о какой ТИ там речи не было.

HideYourRichess: У Вас элементарные события, return, тождественны элементарным событиям из ТИ? [...] Отсюда вопрос, что за "символы" мы имеем на рынке?

По этому поводу уже есть ответ alexeymosc: это [относительные] приращения, которые специально для этого можно дискретизировать. Мой конечный алфавит содержит от 15 до 50 символов.

Предвижу следующий вопрос: "А можно ли делать такую дискретизацию, не выплеснув из ванной мальчика?". А почему бы и нет? У меня, правда, нет процедуры, проверяющей, насколько корректно я это сделал, но несколько проверок крайних и частных случаев показывают, что никакой смертельной ошибки я не совершил. Источник с приемником тоже есть.

Вот что такое канал связи - не так просто ответить. Кажется, это и есть вопрос, которым Вы меня убьете насмерть...

Есть предполагаемый ответ, который может показаться Вам еретическим: это present time, т.е. промежуток времени, когда информация из прошлого передается нулевому бару.

HideYourRichess: Если Вы не привлекаете "экономических и прочих смыслов", то о каких процессах речь идет? Процесс - это "физическое" явление, у него есть причины и есть следствия. Например, процесс падения яблока на голову Ньютону. В приложении к рынкам, процесс купли-продажи. Где это всё в returns?

Мне кажется, Вы чрезмерно механистичны, уважаемый. Процессом вполне законно может быть и информационное явление, заключающееся в генерации returns на основании реальных процессов купли-продажи.

HideYourRichess: Тер.вер., на котором базируется тер.инф., требует независимость рассматриваемых событий, или символов.

Покажите источник, в котором это утверждается. Сомневаюсь, что Вы его найдете.

Где Вы видели, чтобы тервер требовал независимости, - если эта самая независимость является в тервере определяемым понятием? А цепи Маркова, по-Вашему, что такое? А теоремы Байеса? А вообще понятие условной вероятности?

Avals: Алексей, а где рассчеты в результате которых находятся "далекие и практически достоверные зависимости"? И что значит чистые возвраты без волатильности (как получены, ведь просто возвраты содержат волатильность)?

Ну я ж говорил, что невежествен в эконометрике и безнадежно путаюсь в понятии волатильности...

Код расчетов выкладывать тут не хочется, это все же еще и ноу-хау. Но в личке Вам могу рассказать, как я их делал.

 
HideYourRichess:
А что, из условия задачи это не понятно? Формулировка, кстати, совершенно классическая для тер.вера.


мне нет))) если требуется независимость то к примеру зачем такая штука как условная энтропия?

Если следование символов алфавита не независимо (например, во французском языке после буквы «q» почти всегда следует «u», а после слова «передовик» в советских газетах обычно следовало слово «производства» или «труда»), количество информации, которую несёт последовательность таких символов (а, следовательно, и энтропия), очевидно, меньше. Для учёта таких фактов используется условная энтропия. https://ru.wikipedia.org/wiki/Информационная_энтропия

 
faa1947:
Наконец-то можно поставить обоснованный диагноз.


Откройте, же.

Кстати, в Статистике нет такой полезной функции, как генетический алгоритм отбора входных переменных, который есть в NeuroShell. То есть, один продукт не может все в себя вместить. В Matlab тоже нет встроенного функционала расчета взаимной информации, однако соответствующий модуль написан, и, кстати, востребован.

 

Mathemat:

Мне кажется, Вы чрезмерно механистичны, уважаемый. Процессом вполне законно может быть и информационное явление, заключающееся в генерации returns на основании реальных процессов купли-продажи.

Настоящие returns именно так и появляются: купил-продал, купил-продал...

Mathemat:

Покажите источник, в котором это утверждается. Сомневаюсь, что Вы его найдете.

Где Вы видели, чтобы тервер требовал независимости, - если эта самая независимость является в тервере определяемым понятием? А цепи Маркова, по-Вашему, что такое? А теоремы Байеса? А вообще понятие условной вероятности?

Ни Марков, ни Байес не имеют отношения к ТИ. А тер.вер. имеет. И уж поверьте, требование независимости это краеугольный камень тер.вера. о котором даже и писать ленятся.
 

Извините, HideYourRichess, но Вас, кажется, занесло неизвестно куда. Я уже и не знаю, что с Вами обсуждать, раз Вы так настойчивы в откровенной чуши. Ваша логика в рассуждении

Ни Марков, ни Байес не имеют отношения к ТИ. А тер.вер. имеет.

для меня совершенно непостижима.

Верить не буду. Покажите источник, в котором утверждается, что

требование независимости это краеугольный камень тер.вера.

Причина обращения: