트레이딩의 머신러닝: 이론, 모델, 실전 및 알고리즘 트레이딩 - 페이지 1934

 
발레리 야스트렘스키 :

그리고 결국 무엇을 얻고 싶습니까? 고조파와 함께 경로는 푸리에로 이동합니다. 또는 직교 다항식에는 많이 있습니다. 모두 분할 가능)

분해할 필요가 없고 생성해야 합니다. 때때로 내 조건을 만족시키는 함수를 만들어야 하는데, 어떤 함수가 어떤 기능인지 몰라서 검색 을 만들어야 합니다.

고조파로 검색 하는 것이 가능하지만 모든 옵션을 고려할 것입니다.

그것들은 본질적으로 동일한 근사치이지만 열거 는 오류를 줄이는 것이 아니라 조건을 충족하기 위해 진행됩니다.


그래서 단순한 조화 근사에서도 이 열거 자체가 어떻게 배열되는지 알고 싶습니다. 함수를 변경하기 위해 무엇을 곱해야 합니까 ??

한 기능을 다른 기능으로 조정하는 메커니즘이 일반적으로 작동하는 방식
 
mytarmailS :

분해할 필요가 없고 생성해야 합니다. 때때로 내 조건을 만족시키는 함수를 만들어야 하는데, 어떤 함수가 어떤 기능인지 몰라서 검색 을 만들어야 합니다.

고조파로 검색 하는 것이 가능하지만 모든 옵션을 고려할 것입니다.

그것들은 본질적으로 동일한 근사치이지만 열거 는 오류를 줄이는 것이 아니라 조건을 충족하기 위해 진행됩니다.


그래서 단순한 조화 근사에서도 이 열거 자체가 어떻게 배열되는지 알고 싶습니다. 함수를 변경하기 위해 무엇을 곱해야 합니까 ??

한 기능을 다른 기능으로 조정하는 메커니즘이 일반적으로 작동하는 방식

나는 공식에서 의미 측면에서 가장 큰 기간에서 가장 작은 기간으로의 확장을 말하지 않을 것입니다. 가장 큰 고조파를 찾아 실제 신호에서 빼서 나머지에서 가장 큰 고조파를 찾아 필요한 정확도로 뺍니다. 그리고 근사(직접 파선 선형 함수에 의한 실제 신호의 대략적인 표현)에서 우리는 직선으로 이산 섹션의 고조파를 나타냅니다. 이산화가 기간의 절반인 경우(더 많은 경우 아무 것도 작동하지 않음) P 또는 극단 사이의 직선, 1/4 이상이면 파선을 얻습니다. 샘플링 단계를 줄이면 정확도가 높아집니다.

긴 섹션에서 가격에 대한 선택을 보면 짧은 섹션으로 나누고 이 섹션에서 선형, 전력, 조화, 로그 함수를 살펴보고 정렬할 수 있습니다. 이상적으로는 고조파와 선형 직교가 문제를 해결해야 합니다. 그것은 몇 번이고 입증되었습니다. 그러나 역사에서만.

시장에는 의미가 없으며 시간이 지남에 따라 기능 / 수학적 모델을 변경하지만 명확한 기준이 없으며 동일한 VR과의 불일치 및 수학적 모델을 결정하는 데 얼마나 많은 데이터가 필요한지 입증되지 않았습니다. 반주기 이산성은 결과를 제공하지 않습니다. 이것은 입증되었습니다. 모두 경험적으로 또는 MO가 있는 NS) 뿐만 아니라 경험적으로도 마찬가지입니다.

조건을 변경하는 기능은 없습니다. 이 섹션에는 하나의 고조파 세트가 있고 다음 섹션에는 다른 고조파 세트가 있습니다. 사운드 샘플링은 우리가 듣는 것의 두 배인 48kHz이므로 고주파수에서 손실됩니다. 그리고 그림 2에서 1/48000초 주기의 신호 레벨.

 
mytarmailS :

분해할 필요가 없고 생성해야 합니다. 때때로 내 조건을 만족시키는 함수를 만들어야 하는데, 어떤 함수가 어떤 기능인지 몰라서 검색 을 만들어야 합니다.

고조파로 검색 하는 것이 가능하지만 모든 옵션을 고려할 것입니다.

그것들은 본질적으로 동일한 근사치이지만 열거 는 오류를 줄이는 것이 아니라 조건을 충족하기 위해 진행됩니다.


그래서 단순한 조화 근사에서도 이 열거 자체가 어떻게 배열되는지 알고 싶습니다. 함수를 변경하기 위해 무엇을 곱해야 합니까 ??

한 기능을 다른 기능으로 조정하는 메커니즘이 일반적으로 작동하는 방식
고조파, 푸리에를 통합니까? 주기와 진폭이 다른 정현파는 A1*cos(2Pi*t/T1+Fi1)+ A2*cos(2Pi*t/T2+Fi2) +... A - 진폭, T - 주기, Fi - 위상을 합산합니다.
 
mytarmailS :

내가 당신에게 이것을 몇 번이나 썼습니까? 삼? 5?

글쎄, 어떤 이유로 그들은 이것을 생각해 냈고,이 기적의 유도를 적용하고 샘플이 훈련에 적합하다는 결론을 내린 사람과 함께 일찍 던진 비디오 ...

 
알렉세이 비아즈미킨 :

글쎄, 어떤 이유로 그들은 이것을 생각해 냈고,이 기적의 유도를 적용하고 샘플이 훈련에 적합하다는 결론을 내린 사람과 함께 일찍 던진 비디오 ...

그는 t-sne (like)를 사용했지만 중요하지 않습니다. 음, 그들은 그것을 생각해 냈고 잘 작동하지만 시장에는 적합하지 않습니다. 다른 모든 것과 마찬가지로 인터넷에서 데이터 세트를 다운로드하면 볼 수 있습니다. 그 일이 잘 작동하지만 ...

그러나 우리는 결론을 내릴 수 있습니다. 클러스터는 안정적으로 생성되고 변경되지 않지만 이익으로 공명하지 않고 대상은 이익으로 공명하지만 클러스터를 돌아 다니며 아마도 각 대상이 개그이지만 클러스터는 객관적인 현실입니다. . 지금 당장은 선생님 없이 훈련할 것입니다. 처음부터 계획한 대로 역사의 유사체로 패턴을 인식하지만 가격이 아니라 umap으로 패턴을 인식하려고 합니다.


로르샤흐 :
고조파, 푸리에를 통합니까? 주기와 진폭이 다른 정현파가 추가됩니다. A1*cos(2Pi*t/T1+Fi1)+ A2*cos(2Pi*t/T2+Fi2) +... A - 진폭, T - 주기, Fi - 위상

젠장, 다 어렵다.... 고조파는 이해했는데 아마 파나르에서 고조파 줄 모아서 어리둥절하게 해보는거겠지, 아마 뭔가에 의존하듯이 다 똑같이 해줘야 하는거겠지, 젠장.. .. 하지만 그렇게 하면 성배

 
mytarmailS :

기능 선택 [ 편집 | 코드 편집 ]

주요 기사:   기능 선택

방법   기능 선택   원래 변수(특성 또는 속성이라고 함)의 하위 집합을 찾으려고 합니다. 세 가지 전략이 있습니다 - 전략   필터   (예를 들어,   기능의 축적 [ko] ), 전략   바디 랩   (예: 정확도에 따른 검색) 및 전략   투자   (모델이 예측 오류를 기반으로 구축됨에 따라 기능이 추가되거나 제거되도록 선택됨). 작업 참조   조합 최적화 .

경우에 따라 회귀 또는 분류 와 같은 데이터 분석 이 원래 공간보다 축소된 공간에서 더 정확하게 수행될 수 있습니다 [3] .

기능 투영 [ 편집 ]   |   코드 편집 ]

피쳐 투영은 다음에서 데이터를 변환합니다.   고차원 공간   저차원 공간으로. 데이터 변환은 다음과 같이 선형일 수 있습니다.   주성분법   (MGK), 그러나 많은 기술이 있습니다   비선형 차원 축소 [ko] [4] [5] . 다차원 데이터의 경우 사용할 수 있습니다.   텐서   차원 축소에 대한 표현   부분 공간의 다중 선형 학습 [ko] [6] .

설명이 있는 텍스트를 놓쳤습니다. 수정했습니다.

나는 즉시 여러 가지 질문이 있습니다.

1. 코드에서 별도의 응용 프로그램에 대한 규칙의 형태로 변형을 사용하여 기능 선택 결과를 얻는 방법은 무엇입니까?

2. 트리나 다른 것을 통해 선택한 기능과 그 변형을 시각화할 수 있는 기회가 있습니까?

3. 이러한 기능 선택 전략을 시도해 보셨습니까?

방법   기능 선택   원래 변수(특성 또는 속성이라고 함)의 하위 집합을 찾으려고 합니다. 세 가지 전략이 있습니다 - 전략   필터   (예를 들어,   기능의 축적 [ko] ), 전략   바디 랩   (예: 정확도에 따른 검색) 및 전략   투자   (모델이 예측 오류를 기반으로 구축됨에 따라 기능이 추가되거나 제거되도록 선택됨). 작업 참조   조합 최적화 .

일부 경우에   다음과 같은 데이터 분석   회귀   또는   분류 는 원래 공간보다 축소된 공간에서 더 정확하게 수행될 수 있습니다 [3] .

mytarmailS :

어제 우리가 한 일

차원 축소 [ 편집 ]   |   코드 편집 ]

고차원 데이터 세트(즉, 10개 이상의 차원 포함) 의 경우 일반적으로 k-최근접 이웃 을 적용하기 전에 차원 축소가 수행됩니다.   ( 영문 k-최근접 이웃 알고리즘 , k-NN) 효과를 피하기 위해   차원의 저주 [16] .


차원 축소의 이점 [ 편집 ]   |   코드 편집 ]

  1. 필요한 시간과 메모리를 줄입니다.
  2. 다중 공선성을 제거하면 기계 학습 모델의 속도가 향상됩니다.
  3. 데이터 를 2D 또는 3D와 같이 매우 낮은 차원으로 축소하면 시각적으로 데이터를 표현하는 것이 더 쉽습니다.

그리고 코드에서 클러스터링이 분리되어 있고 프로젝션이 별도로 구축된 다음 렌더링 중에 컬러 그레이딩을 위해 클러스터링 결과를 제출한 것 같았습니다. 아니요?

 
mytarmailS :

그는 t-sne (like)를 사용했지만 중요하지 않습니다. 음, 그들은 그것을 생각해 냈고 잘 작동하지만 시장에는 적합하지 않습니다. 다른 모든 것과 마찬가지로 인터넷에서 데이터 세트를 다운로드하면 볼 수 있습니다. 그 일이 잘 작동하지만 ...

그러나 우리는 결론을 내릴 수 있습니다. 클러스터는 안정적으로 생성되고 변경되지 않지만 이익으로 공명하지 않고 대상은 이익으로 공명하지만 클러스터를 돌아 다니며 아마도 각 대상이 개그이지만 클러스터는 객관적인 현실입니다. . 지금 당장은 선생님 없이 훈련할 것입니다. 처음부터 계획한 대로 역사의 유사체로 패턴을 인식하지만 가격이 아니라 umap으로 패턴을 인식하려고 합니다.

분류를 위해 기록에 대한 마크업을 어떻게 얻습니까? 그리고 나서, 잘, 인식되었고, 그 다음은 무엇입니까? 다른 날에는 대상 검색을 4개의 클러스터로 나누었습니다... 대상을 클러스터에서 클러스터로 변경하는 것을 제외하고는. 일반적으로 논리가 존재하고 시장과 일치하는 경우 논리를 분석하려면 문자열이 다른 클러스터로 이동한 이유를 이해해야 합니다.

 
알렉세이 비아즈미킨 :

설명이 있는 텍스트를 놓쳤습니다. 수정했습니다.

즉시 여러 가지 질문이 있습니다.

1. 코드에서 별도의 응용 프로그램에 대한 규칙의 형태로 변형을 사용하여 기능 선택 결과를 얻는 방법은 무엇입니까?

2. 트리나 다른 것을 통해 선택한 기능과 그 변형을 시각화할 수 있는 기회가 있습니까?

3. 이러한 기능 선택 전략을 시도해 보셨습니까?

4. 그리고 코드에서 클러스터링이 분리되어 있고 프로젝션이 별도로 구축된 다음 렌더링 중 컬러 그레이딩을 위해 클러스터링 결과를 제출한 것 같았습니다. 아니요?


1. 10만 종가를 별도의 규칙으로 코드에서 기술하고자 하는 것과 같다.

2. 기호는 모든 결과와 함께 기능의 형태로 획득됩니다.

3. 나는 뭔가를 시도했는데, 크기가 줄어들고 품질이 향상되지는 않지만 여전히 멋지다. 예를 들어 품질을 잃지 않고 10k 기호를 500으로 압축할 수 있습니다. 저에게는 매우 좋습니다. 시원하거나 허용 가능한 손실로 최대 50입니다.

4. 그래서 우리는 먼저 차원을 줄인 다음 클러스터링 했습니다. 여기에 쓰여졌습니다 - ------   k-최근접이웃 을 적용 하기 전에

 
mytarmailS :


1. 10만 종가를 별도의 규칙으로 코드에서 기술하고자 하는 것과 같다.

2. 기호는 모든 결과와 함께 기능의 형태로 획득됩니다.

3. 나는 뭔가를 시도했는데, 크기가 줄어들고 품질이 향상되지는 않지만 여전히 멋지다. 예를 들어 품질을 잃지 않고 10k 기호를 500으로 압축할 수 있습니다. 저에게는 매우 좋습니다. 시원하거나 허용 가능한 손실로 최대 50입니다.

4. 그래서 우리는 먼저 차원을 줄인 다음 클러스터링 했습니다. 여기에 쓰여졌습니다 - ------   k-최근접이웃 을 적용 하기 전에

1. 질문을 잘못 이해하신 것 같습니다. 파일에 규칙을 업로드하는 것에 관한 것이지만 2항에서 확인된 규칙이 있습니다.

2. 좋습니다.

3. 변환 후를 포함하여 예측 변수 간에 높은 상관 관계가 있을 가능성이 있습니까? 은퇴한 예측자 목록을 얻거나 탈락하지 않고 단순히 그룹으로 병합합니다. 이해할 수 없습니다.

4. 제가 코드를 잘못 이해했거나 잘못 묶은 것일 수 있습니다. 다시 게시하겠습니다.

 #way <- "F:\\FX\\R\\tree_classification_2019_fS_Eks_29\\Test_Pred_ALL_01.csv"    # ваш путь
way <- "F:\\FX\\R\\2020_04_11_Pred_New_Full\\Pred_New_Full.csv"    # ваш путь

dt <- read.csv(file = way,header = T,sep = ";" ) # читаем файл

target <- dt$Target_100 # целевую в отдельную переменную

dt <- dt[, ! colnames(dt)  %in% 
           #           c( "Target_100_Buy" , "Target_100_Sell" ,
           #             "Time" , "Target_100" )  ] # удаляем не нужные колонки
                      c( "Target_100" )  ] # удаляем не нужные колонки

km <- kmeans(um$layout, centers = 4 )            

# роскоментируем и Устанавливаем нужные пакеты после чего эту строку можно удалить
#install.packages(c( "rgl" , "car" , "umap" ))



# про umap
#https: //cran.r-project.org/web/packages/umap/vignettes/umap.html
#https: //github.com/ropenscilabs/umapr

library (umap)
um <- umap(dt,n_components= 3 )   
# n_components= 3   во сколько измерений уменьшаем данные, можно 100 можно 1
# можно 333 , но нам для 3 д надо трех мерное пространство поетому у нас n_comp= 3
um.res <- um$layout # наши три вектора выход 



#тут все настройки по пакету  car
# http: //www.sthda.com/english/wiki/amazing-interactive-3d-scatter-plots-r-software-and-data-visualization
library (car)   # 3 d

target <- as .factor(target)   #   target нужен для того чтобы окрасить точки в цвет целевой

scatter3d(x = um.res[, 1 ], 
          y = um.res[, 2 ], 
          z = um.res[, 3 ],
          groups = as .factor( km$cluster ),
          grid = FALSE, 
          surface = FALSE,
          ellipsoid = TRUE,
            bg.col = "black" )


write.csv(km$cluster, file = "F:\\FX\\R\\2020_04_11_Pred_New_Full\\Pred.csv" , sep = ";" ,row.names = F,col.names = T)
 
알렉세이 비아즈미킨 :

1. 질문을 잘못 이해하신 것 같습니다. 파일에 규칙을 업로드하는 것에 관한 것이지만 2항에서 확인된 규칙이 있습니다.

2. 좋습니다.

3. 변환 후를 포함하여 예측 변수 간에 높은 상관 관계가 있을 가능성이 있습니까? 은퇴한 예측자 목록을 얻거나 탈락하지 않고 단순히 그룹으로 병합합니다. 이해할 수 없습니다.

4. 제가 코드를 잘못 이해했거나 잘못 묶은 것일 수 있습니다. 다시 게시하겠습니다.

1. 그래도 이해가 안가네요

3. 변환 후 상관된 기능이 있을 수 없습니다. 예, 다른 구조(표지판)로 병합되지만 중복성은 없다고 말할 수 있습니다.

4.

dt <- dt[, ! colnames(dt)  %in% 
           #           c( "Target_100_Buy" , "Target_100_Sell" ,
           #             "Time" , "Target_100" )  ] # удаляем не нужные колонки
                      c( "Target_100" )  ] # удаляем не нужные колонки

모두 하나의 표현이므로 그 안에 주석을 달 수 없습니다.)))