нейронная сеть и входы - страница 38

 

Добрый день.

Не только. Я применяю ada, randomForest ( в различных вариантах), С50 и др. Но лучшие результаты конечно у "ada" и rfNear() из COREleаrn. Очень хваленный svm не показал никаких преимуществ ( кроме того, что учится ну очень долго). Не умаляя его значения, может не смог правильно приготовить?

Последовательность работы такая.Проверка входных данных на значимость, определение оптимальных параметров для каждой модели . Расчет по трём различным моделям с калибровкой, решение простым голосованием. При начальной выборке в 1000 баров модели стабильно отрабатывает 250 баров без переобучения. Контроль и оценка по Accuracy.

В последнее время появились пакеты которые кроме оценки входных данных методов главных компонент оценивают влияние методов препроцессинга на результат и выбирают лучший. Еще не совсем освоил, нет времени. Но продолжу изучать.

Удачи.

 
grell:

Какие сигналы, подаваемые на вход, по-вашему, несут полезную информацию?:)

См. PDF в прикреплённом архиве: стр. 17 Редукция незначимых предикторов ...


Там есть простенький пример, где наглядно показано, что метод корректно понижает размерность только для тех входов, которые не являются объясняющими переменными в обучающей выборке.

 
ХМ.. Интересно, скачал по ссылке из книги проект, Но как его запустить не знаю. Может подскажите???
 
Причём когда открывая через яву. Пишет нет Jproject класса.... Как то так....
 

Вот такое окно....

 

 
nikelodeon:
ХМ.. Интересно, скачал по ссылке из книги проект, Но как его запустить не знаю. Может подскажите???

Возможно, что версия Java на компе устаревшая? Я компилировал проект под версией 1.8.0_25

Скачать свежую версию Java2SE (JRE или JDK) можно на сайте: http://java.com/ru/

 

Отлично, всё запустилось, только вот непонятно в каком виде нужно подавать данные....  Понятно что .csv Ну а как они должны быть расположены и т.д.

Еслит есть возможность скинуть файл данных с примером....

 
nikelodeon:

Отлично, всё запустилось, только вот непонятно в каком виде нужно подавать данные....  Понятно что .csv Ну а как они должны быть расположены и т.д.

Еслит есть возможность скинуть файл данных с примером....

см. Прогнозируем банкротства

Там есть прикреплённый файл в формате CSV с примером для классификации.

Если вкратце, то:

Разделитель ячеек - точка с запятой.

Разделитель целой от дробной части для чисел: либо точка, либо запятая (все запятые автоматом заменяются на точки).

Первый столбец - идентификаторы примеров (в текстовом виде)

Последний столбец - значения зависимой переменной: 1 - принадлежность к  заданному классу, 0 - принадлежность к незаданному классу (к какому-то иному классу, кроме заданного)

Первая строка - идентификаторы факторов (в текстовом виде)

Вторая строка - примечания к идентификаторам факторов, например, единицы измерений (в текстовом виде)

Остальные данные, расположенные ниже второй строки, правее первого столбца и левее последнего - числовые значения факторов (нечисловые не обрабатываются).

 
У меня конечно формула попроще стала, да и данных было немного Но как их интерпретировать??? Никак не пойму :-(
 

Понятно. Первое преобразование это нормализация входных данных, После нормализации я подставляю данные в формулу и получаю РЕЗУЛЬТАТ ЧЕГО? Тоесть в формулу я подставляю нормализованные данные. и получаю соотвественно кривую индикатора по формуле??? Зачем тогда знак >0 ставить???

Тут немного не понятно :-( 

Причина обращения: