수제라니 무슨 뜻인가요? 이론적 인 정당성, 좋은 기사가 있습니다. RLTv3.2.6이라는 패키지가 있습니다. 꽤 잘 작동합니다. 버전에 주목하세요.
행운을 빕니다.
제 생각에는 특정 예와 함께 다음 조건이 충족되면 수제가 아닌 수제라고 생각합니다.
처음에는 지금은 훨씬 적었지만이 사이트는 부엌에 앉아 무언가를 발명하고 머리에서 용어를 사용하고 "연구"를 시작하고 "연구"뿐만 아니라 기존 및 일반적으로 인식되는 것을 반증하는 자체 제작 "천재"로 가득 차있었습니다.
이 모든 사람들은 자신이 직접 만든 코드가 진지한 학술지에 게재되고 해당 교육을 받은 사람들이 수년 동안 토론한 이론적 근거 가 없기 때문에 한 푼의 가치도 없다는 사실을 깨닫지 못합니다. 그런 다음 많은 사용자가 코드를 작성하고 테스트한 후에야 산업용으로 적합하게 됩니다.
현지의 '천재'에 대해 논의할 필요는 없습니다.
하지만 캣버스트.
비핵심 조직과 전문적이고 매우 유사한 개발의 속내를 이해하기 위해 katbust와 XGBoost에 대한 문서를 비교해 보겠습니다.
레이블을 다시 지정하고 특성에 대한 예측 가능성을 높이는 함수를 작성하면 모델이 더 안정적으로 작동합니다.
데이터 세트가 작은 경우에는 확인을 위해 삭제하고 데이터를 확인할 수 있습니다(또는 좌절할 수 있습니다).
파이썬 사용자를 위해:
c = coreset[coreset.columns[1:-4]] // ваш датасет без меток. Нужно брать только трейн/тест данные, на остальных не делать кластеризацию, иначе подгонка
kmeans = KMeans(init='k-means++', n_clusters=clusters).fit(c) // кол-во кластеров - гиперпараметр
coreset['clusters'] = kmeans.predict(c)
mean_labels = coreset.groupby('clusters')['labels'].apply(lambda x: x.mean()) // считаем среднее по меткам каждого кластера
coreset['labels'] = coreset.apply(lambda row: 0if mean_labels[row['clusters']] < 0.5else1, axis=1) // если среднее больше 0.5, то для всех элементов кластера ставим метку 1 и наоборот
클러스터가 대표성을 갖는다면 모델이 더 안정적입니다. 따라서 무차별 대입 방식으로 클러스터의 수와 클러스터링할 칩을 결정합니다.
제가 알기로는 대화형 세션에서 R로 작업하기 위한 명령은 주석 처리되어 있습니다. 먼저 전체 스크립트를 로드하여 함수를 정의한 다음 명령을 한 줄씩 로드하고 각 명령 뒤에 Enter 키를 누릅니다. 이것은 아마도 과학 출판물의 표준과 같은 것으로, 명령줄에만 의존하고 Rstudio와 같은 환경은 피하는 것이 좋습니다.
간결성을 위해 데이터 수집 및 클래스 템플릿에서 CTree를 호출했는데, 이 역시 피할 수 없는 부분인 것 같습니다.
이상 징후 감지가 목표에 포함되어 있는데, 이는 화재가 비정상적으로 빈번하게 발생하는 곳을 찾는 것입니다.
추신. 얼마 전에 푸아송 분포의 사용에 대해 글을 썼고 여기에서는 작업 코드로 개발되었습니다.
아직 모든 것을 시도하지 않았습니다. 작업 중 하나에 갇혀 있습니다.
제 데이터에서 꼭 실행해 보겠습니다. 이 주제에 대해 다양한 솔루션을 축적하고 있습니다.
파우손 분포와 관련하여 이론적으로는 흥미롭지만 데이터를 보면 시퀀스에서 20 개의 0이 연속적으로있을 수 있고 0과 1이 혼합되어 있고 이러한 건너 뛰기가 중요하다고 가정하면 분포와 일치하지 않는 것 같습니다.
이 숫자를 직접 본 적이 있나요?
0.99 훈련/테스트, 모델이 몇 번의 반복으로 잘린 상태입니다. 클래스를 잘 예측하는 몇 가지 규칙만 남았습니다.
0.99 훈련/테스트, 모델이 몇 번의 반복으로 단축되었습니다. 클래스를 잘 예측하는 몇 가지 규칙만 남았습니다.
TP=10 및 SL=1000 ?)
TP=10 및 SL=1000 ?)
아니요, 많은 거래를하고 싶다면 재미 있습니다.
모든 바에서 새 바를 열 수 있습니다.수제라니 무슨 뜻인가요? 이론적 인 정당성, 좋은 기사가 있습니다. RLTv3.2.6이라는 패키지가 있습니다. 꽤 잘 작동합니다. 버전에 주목하세요.
행운을 빕니다.
제 생각에는 특정 예와 함께 다음 조건이 충족되면 수제가 아닌 수제라고 생각합니다.
처음에는 지금은 훨씬 적었지만이 사이트는 부엌에 앉아 무언가를 발명하고 머리에서 용어를 사용하고 "연구"를 시작하고 "연구"뿐만 아니라 기존 및 일반적으로 인식되는 것을 반증하는 자체 제작 "천재"로 가득 차있었습니다.
이 모든 사람들은 자신이 직접 만든 코드가 진지한 학술지에 게재되고 해당 교육을 받은 사람들이 수년 동안 토론한 이론적 근거 가 없기 때문에 한 푼의 가치도 없다는 사실을 깨닫지 못합니다. 그런 다음 많은 사용자가 코드를 작성하고 테스트한 후에야 산업용으로 적합하게 됩니다.
현지의 '천재'에 대해 논의할 필요는 없습니다.
하지만 캣버스트.
비핵심 조직과 전문적이고 매우 유사한 개발의 속내를 이해하기 위해 katbust와 XGBoost에 대한 문서를 비교해 보겠습니다.
그리고 자수성가하고 자수성가 한 주요 인물은 R로 글을 쓰지 않았기 때문에 Breiman입니다. 그는 그런 콜 코즈 닉입니다.
완전히 무지해 보이지 않도록 R을 배우십시오. 실제로 R의 거의 모든 패키지는 R로 작성되지 않았습니다. 보통은 C++ 또는 Fortran이고 R은 단지 액세스일 뿐입니다. 그렇기 때문에 R의 계산 집약적인 알고리즘이 C++보다 나쁘지 않습니다.
완전히 무식해 보이지 않도록 R을 배우세요: R의 거의 모든 패키지는 R로 작성되지 않았습니다. 보통은 C++ 또는 Fortran이며 R은 단지 액세스에 불과합니다. 그렇기 때문에 R의 계산 집약적인 알고리즘은 C++보다 더 나쁘지 않습니다.
말도 안 돼요, 처음 들어보는 말입니다.
더 깨달을 만한 정보가 있을까요? )
이미 캣버스터에 도달했습니다... )))
그리고 마지막으로 장식적인 터치
이러한 데이터에 대해 MO가 어떻게 훈련될지 궁금합니다.
이것은 테스트 샘플입니다.
이런 숫자를 직접 본 적이 있나요?
절대 가격 값과 연결되어 있기 때문에 재훈련된 것일 가능성이 높습니다.
레이블을 다시 지정하고 특성에 대한 예측 가능성을 높이는 함수를 작성하면 모델이 더 안정적으로 작동합니다.
데이터 세트가 작은 경우에는 확인을 위해 삭제하고 데이터를 확인할 수 있습니다(또는 좌절할 수 있습니다).
파이썬 사용자를 위해:
클러스터가 대표성을 갖는다면 모델이 더 안정적입니다. 따라서 무차별 대입 방식으로 클러스터의 수와 클러스터링할 칩을 결정합니다.제가 알기로는 대화형 세션에서 R로 작업하기 위한 명령은 주석 처리되어 있습니다. 먼저 전체 스크립트를 로드하여 함수를 정의한 다음 명령을 한 줄씩 로드하고 각 명령 뒤에 Enter 키를 누릅니다. 이것은 아마도 과학 출판물의 표준과 같은 것으로, 명령줄에만 의존하고 Rstudio와 같은 환경은 피하는 것이 좋습니다.
간결성을 위해 데이터 수집 및 클래스 템플릿에서 CTree를 호출했는데, 이 역시 피할 수 없는 부분인 것 같습니다.
이상 징후 감지가 목표에 포함되어 있는데, 이는 화재가 비정상적으로 빈번하게 발생하는 곳을 찾는 것입니다.
추신. 얼마 전에 푸아송 분포의 사용에 대해 글을 썼고 여기에서는 작업 코드로 개발되었습니다.
아직 모든 것을 시도하지 않았습니다. 작업 중 하나에 갇혀 있습니다.
제 데이터에서 꼭 실행해 보겠습니다. 이 주제에 대해 다양한 솔루션을 축적하고 있습니다.
파우손 분포와 관련하여 이론적으로는 흥미롭지만 데이터를 보면 시퀀스에서 20 개의 0이 연속적으로있을 수 있고 0과 1이 혼합되어 있고 이러한 건너 뛰기가 중요하다고 가정하면 분포와 일치하지 않는 것 같습니다.
파우손 분포에 관해서는 이론적으로는 흥미롭지만, 데이터를 보면 시퀀스에서 0이 20개 연속으로 있을 수 있고 0과 1이 섞여 있을 수 있으며 이러한 누락이 중요하면 분포와 일치하지 않는 것 같습니다.
이 아이디어는 예시를 서로 다른 그룹으로 나누고 그 안에서 동질성이 있는 그룹으로 나누는 것입니다. 특정 기능으로 이를 수행할 수 있는지는 확실하지 않습니다. 예를 들어, 비고정성 때문에 어떤 것이 가능하다는 것도 사실이 아닙니다.
이 기사는 제가 관심 있는 주제만 다루기 때문에 자세히 공부할 계획이 없습니다. CHAID는 조금 더 가깝지만 완전히 동일하지는 않습니다.