양적 거래 (Quantitative trading) - 페이지 7

 

Martin Scholl(University of Oxford): "에이전트 기반 모델을 사용한 시장 생태학 연구"



Martin Scholl(University of Oxford): "에이전트 기반 모델을 사용한 시장 생태학 연구"

옥스퍼드 대학의 연구원인 Martin Scholl은 행위자 기반 모델을 사용하여 시장 생태학 연구에 몰두했습니다. 효율적 시장 가설과 같은 가정에 의존하는 전통적인 접근 방식과 달리 Scholl은 신고전주의 금융에서 일반적으로 사용되는 합리적 기대 균형 이론에 문제를 제기합니다. 그는 이 이론이 모든 참가자에게 현실 세계에 대한 완벽한 이해를 요구한다고 믿으며, 이는 개인 투자자와 펀드 매니저 모두의 인지적 한계를 고려할 때 비현실적입니다. 대신 그는 실제 금융 데이터를 분석하기 위해 생물학의 도구를 적용하여 금융 시장을 이해하는 새로운 관점을 제공할 것을 옹호합니다.

시장 생태학을 탐구하기 위해 Scholl은 투자 전략을 특정 종의 개체를 대표하는 개인 투자자와 함께 생물학의 종에 비유합니다. 특정 전략을 사용하여 투자된 총 부는 해당 종의 풍부도 또는 총 개체수 크기와 비슷합니다. 투자 게임의 장난감 모델에서 Scholl은 에이전트가 자신의 자산을 머니 마켓 계좌에 남겨두거나 배당금을 지불하는 주식에 투자할 수 있는 단순화된 시나리오를 소개합니다. 이 모델은 완벽한 합리성에 대한 신고전주의적 가정에 대한 다양한 투자 전략 및 반대를 검토할 수 있게 합니다.

Scholl은 시장 생태학을 연구하기 위해 에이전트 기반 모델에 사용되는 다양한 투자 전략을 식별합니다. 첫 번째는 순자산 가치를 주식과 현금으로 나누는 완벽하게 합리적인 전략입니다. 가치 투자자는 미래를 예측하고 주식의 미래 가격을 이해하기 위해 배당금의 성장률을 추정합니다. 두 번째 전략은 최근 가격을 분석하고 추세를 추론하는 추세 추종자를 포함합니다. 세 번째 전략은 유동성 수요를 충족시키기 위해 시장에 진입하지만 단기간에 가격에 민감하지 않은 노이즈 트레이더를 포함합니다. 그러나 그들의 평균 역전 노이즈 프로세스는 오랜 시간 동안 기본 값과 연결됩니다.

시장 메커니즘을 시뮬레이션하고 시장 생태계를 연구하기 위해 Scholl과 그의 팀은 소프트웨어 패키지의 도움으로 에이전트 기반 모델을 활용합니다. 그들은 상대적인 공유를 추적하면서 서로 다른 종의 개인들 사이에서 기부금을 고정하고 초기 기부금을 나누어 모델의 서로 다른 실행 간의 비교 가능성을 보장합니다. 시뮬레이션은 200년 동안 실행되어 각 종의 평균 연간 수익을 관찰할 수 있습니다. 흥미롭게도 그들은 각 전략이 풍부함에 관계없이 가장 수익성이 높은 지역이 적어도 하나는 있다는 것을 발견했습니다.

그의 실험에서 Scholl은 트렌드 추종자의 행동과 이익 재투자의 영향을 조사합니다. 그는 시장이 큰 이상치가 있는 불안정하고 혼돈스러운 지역에서 대부분의 시간을 보내어 얼룩덜룩한 노이즈가 발생한다는 사실을 관찰합니다. 투자자가 이익을 재투자할 때 궤적은 식별된 중심점 주변에서 변동하지만 완전히 수렴하지는 않습니다. 추세 추종자의 집중도를 높이면 수익률의 변동성이 높아집니다. Scholl은 투자자의 합리성과 배당 과정에서 긍정적인 자기 상관 관계가 추세 추종자에서 벗어나는 빠른 움직임 때문이라고 생각합니다.

Scholl은 에이전트 기반 모델을 사용하여 생물학에서 사용되는 포식자-피식자 Volterra 방정식과 유사한 금융 커뮤니티 매트릭스를 구성할 수 있다고 설명합니다. 특정 전략의 수익은 인구 규모와 동일하며 인구 규모의 변화에 대한 수익의 민감도는 커뮤니티 매트릭스를 나타냅니다. 금융 시장에서는 가격이 균형점에서 벗어날 때 서로 다른 전략 간의 경쟁이 발생합니다. Scholl은 금융 시장이 밀도 의존성을 나타내어 생물학적 시스템보다 종 상호 작용을 더 복잡하게 만든다고 강조합니다. 이러한 밀도 의존성은 거품과 같은 가격 인상과 같은 시나리오로 이어지지만 그러한 상황이 비현실적임을 인정합니다.

시장 생태학의 맥락에서 Scholl은 그의 연구 결과의 실질적인 의미에 대해 논의합니다. 그는 풍부한 종을 사용하여 다양한 유형의 포식자 간의 관계를 설명함으로써 시장 결과에 영향을 미치는 선형 모델을 제시합니다. 이 접근 방식은 투자의 다차원적 특성을 강조하고 밀도가 높은 금융 시장에서 손실을 피하거나 먹잇감이 되는 것을 방지하기 위해 적절한 크기 조정 전략의 중요성을 보여줍니다. 그것은 주가가 모든 이용 가능한 기본 정보를 반영하고 금융 시장을 다양한 조건의 영향을 받는 복잡한 시스템으로 제시한다는 전통적인 관점에 도전합니다.

Scholl은 시장 생태학을 연구하기 위해 에이전트 기반 모델 내에서 간단한 선형 모델을 사용하는 방법에 대해 자세히 설명합니다. 보유 자산과 시장 활동의 상대적 풍부함을 분석함으로써 그는 이 접근 방식이 합리성을 가정하고 펀더멘탈을 자동으로 변환하는 부서 파생 모델을 능가한다는 사실을 발견했습니다. 그러나 그는 그의 모델의 한계를 인정하고 현실성을 높이기 위한 추가 연구의 필요성을 강조합니다. 그가 다루는 한 가지 측면은 특히 추세 추종과 관련하여 다양한 레시피와 정의에 대한 모델의 민감도입니다. 배당금은 그의 모델에서 중요한 역할을 하지만 실제 금융 시장에 보다 현실적인 요소를 통합하려면 추가 단계가 필요합니다.

자신의 모델에 대한 대리인의 믿음의 적응성과 관련하여 Scholl은 시장 운영에는 종종 확장된 기간 동안 사업 설명서에 설명된 전략을 따르는 펀드 매니저가 포함된다는 점을 지적합니다. 이는 기계적 자산 할당 프로세스에 대한 경향을 나타냅니다. 결과적으로 Scholl은 덜 적응적인 행동과 덜 지능적인 모델링을 선호합니다. 그러나 그는 옥스퍼드 대학에 있는 그의 그룹의 다른 연구자들이 파라미터를 변경하고 새로운 전략을 혁신하기 위해 진화 알고리즘의 적용을 적극적으로 탐구하고 있다고 강조합니다.

Martin Scholl의 연구는 에이전트 기반 모델을 사용하여 시장 생태학을 연구하는 데 중점을 둡니다. 그는 금융 시장을 더 잘 이해하기 위해 생물학의 개념을 적용함으로써 전통적인 금융 이론과 가정에 도전합니다. 투자 전략을 생물학의 종과 비교하고, 다양한 전략을 분석하고, 시장 메커니즘을 시뮬레이션함으로써 Scholl은 금융 시장의 복잡성과 다양한 전략 간의 상호 작용을 밝혀냅니다. 그의 연구 결과는 금융 시장이 밀도에 매우 의존적이며 이 역동적인 생태계에서 손실을 피하고 먹잇감이 되기 위해서는 투자 전략의 적절한 규모가 중요하다는 것을 시사합니다. Scholl의 작업은 주식 가격이 기본 정보만을 반영한다는 전통적인 견해와 대조되는 복잡한 시스템으로서 시장의 본질에 대한 귀중한 통찰력을 제공합니다.

  • 00:00:00 옥스포드 대학의 Martin Scholl이 에이전트 기반 모델을 사용하여 시장 생태학에 대한 연구에 대해 설명합니다. 그는 효율적 시장 가설과 같은 일반적인 가정에 초점을 맞추는 대신 모든 참가자의 이해가 현실 세계와 일치해야 하기 때문에 신고전주의 금융에서 사용되는 합리적 기대 균형 이론을 문제 삼는다고 설명합니다. 그는 또한 재무 문헌에 300개 이상의 팩터 모델이 있어 사용할 최적의 모델을 결정하기 어렵고 개인 투자자와 펀드 매니저 모두 인지 능력에 물리적 한계가 있음을 밝혔습니다. 또한 그는 금융 시장을 더 잘 이해하기 위해 생물학 도구를 실제 데이터에 적용하는 것의 중요성에 대해 논의합니다.

  • 00:05:00 Martin이 에이전트 기반 모델을 사용하여 시장 생태학을 연구하는 방법에 대해 설명합니다. 그는 투자 전략이 생물학의 종에 비유될 수 있다고 설명합니다. 개인 투자자는 주어진 종의 개체에 해당합니다. 특정 전략을 사용하여 투자된 총 부는 해당 종의 풍부함 또는 총 인구 크기입니다. Scholl은 투자 게임의 장난감 모델을 소개합니다. 여기에서 에이전트는 자산을 머니 마켓 계좌에 남겨두거나 배당금을 지불하는 주식에 투자할 수 있습니다. 이 모델은 대부분의 경우 고유한 청산 가격을 허용하는 단순화된 가정인 하나의 주식으로 작동합니다. Scholl은 또한 완벽하고 합리적인 투자자라는 신고전파 가정을 다루고 이 접근법에 대한 반대를 강조합니다.

  • 00:10:00 Martin Scholl은 생물학의 은유를 사용하여 시장 생태학의 개념을 설명합니다. 그는 참여 이유에 따라 시장의 에이전트를 구분하고 전략을 정의하는 방법으로 초과 수요 기능을 도입합니다. 그는 신호 함수가 투자 과정에서 어떻게 사용되는지, 그리고 다양한 투자 펀드가 획득한 정보 및 분석을 기반으로 다양한 분야에 특화되는 경향이 있는지 설명합니다. 전략의 분할은 특정 틈새 시장을 전문화하여 무언가를 최적화하는 것이 유익한 진화하는 시장에서 매우 중요합니다.

  • 00:15:00 Martin Scholl이 시장 생태학을 연구하기 위해 에이전트 기반 모델에서 사용되는 다양한 전략에 대해 논의합니다. 첫 번째 전략은 순자산 가치를 주식과 현금으로 나누는 완벽하게 합리적인 전략입니다. 가치투자자는 배당금의 성장률을 추정하여 예측을 하여 향후 주가를 이해하는데 도움을 줍니다. 두 번째 전략은 최근 가격을 보고 해당 추세를 추정하는 추세 추종자를 기반으로 합니다. 마지막으로 이 모델에는 유동성 요구를 충족시키기 위해 시장에 들어오지만 가격에 민감하지 않은 노이즈 트레이더가 포함되어 있어 그들의 신호가 짧은 시간 척도에서 무작위로 보입니다. 그러나 그들의 평균 역전 노이즈 프로세스는 오랜 시간 동안 기본 값과 연결되어 있으며 Buscher와 동료들이 추정한 것처럼 천천히 평균으로 되돌아갑니다.

  • 00:20:00 Martin은 시장 생태학을 연구할 수 있는 에이전트 기반 모델을 사용하여 시장 메커니즘을 시뮬레이션하는 방법을 설명합니다. 가능한 솔루션이 많기 때문에 시뮬레이션을 분석적으로 처리하기가 어렵습니다. 따라서 그들은 소프트웨어 패키지를 사용하여 다양한 시장 메커니즘을 시뮬레이션합니다. 모델의 다른 실행 간에 결과를 비교할 수 있도록 기부금을 수정합니다. 그들은 또한 다른 종의 개인에 대한 초기 기부금을 나누고 상대적인 몫을 추적합니다. 그들은 200년 동안 시뮬레이션을 실행하고 각 종의 평균 연간 수익을 봅니다. 그들은 세 가지 전략 모두에 대해 종이 가장 풍부한 지역이 아니더라도 가장 수익성이 높은 지역이 적어도 하나는 있음을 관찰합니다.

  • 00:25:00 옥스포드 대학의 Martin Scholl은 가격이 기본 가치에서 벗어나 배당 프로세스의 무작위 실현과 노이즈 도입으로 인해 막대한 이익과 손실을 초래하는 추세 추종자와 관련된 실험에 대해 논의합니다. 시스템은 얼룩덜룩한 노이즈를 생성하는 큰 이상값이 있는 불안정하고 혼란스러운 영역에서 대부분의 설계를 수행합니다. 두 번째 실험에서 투자자들은 이익을 재투자할 수 있었고 부의 재분배와 함께 단순한 형태로 궤적을 추적했지만 식별된 중심점을 향해 희미하게 수렴하는 대신 좌우로 변동했습니다. 이 시스템은 식별된 매력적인 고정점 주변 지역에서 발견되는 경향이 있으며 시장 청산 가격은 거래일마다 발표되어 거래자의 평가 및 가격에 영향을 미칩니다.

  • 00:30:00 Martin은 트렌드 추종자, 가치 투자자 및 노이즈 트레이더가 있는 시스템의 고정점을 분석할 때 몬테카를로 실험을 통해 얻은 다양한 흐름선을 설명합니다. 선의 굵기는 매년 전략 간에 재분배되는 부의 양을 나타내며, 이는 추세 추종자가 많아지면 시스템에서 막대한 손실을 초래할 수 있음을 보여줍니다. Scholl은 계속해서 크라우딩이 가치 투자자와 추세 추종자에게 다르게 작용하며 추세 추종자의 집중도를 높이면 수익률의 변동성이 높아진다는 점을 강조합니다. 시스템이 추세 추종자에서 빠르게 멀어지는 근본 원인은 투자자의 합리성과 배당 과정에서 양의 자기 상관입니다.

  • 00:35:00 Martin Scholl은 에이전트 기반 모델을 사용하여 시장 생태학을 연구하고 금융 커뮤니티 매트릭스를 구축하는 방법을 설명합니다. Scholl은 생물학의 개체군 역학에서 사용되는 포식자-피식자 Volterra 방정식에 비유합니다. 이 방정식은 다른 개체군의 역학, 즉 개체군 크기에 따라 서로 다른 종이 어떻게 상호 작용하는지 설명하는 데 사용됩니다. 그는 이 개념이 금융 시장에도 적용될 수 있으며 특정 전략의 반환이 개체군 크기로 간주되고 개체군 크기의 변화에 대한 한 종의 반환 민감도가 커뮤니티 매트릭스를 나타낼 것이라고 지적합니다.

  • 00:40:00 옥스퍼드 대학의 Martin은 모든 대각선 항목이 음수이고 모든 양수 항목이 양수이므로 금융 시장 생태학의 종들이 균형점에서 어떻게 경쟁하는지 설명합니다. 모집단의 특정 변화에 대해 강력한 커뮤니티 매트릭스로 고정 포인트가 안정적이므로 시스템이 안정적입니다. 그러나 시장이 균형점에서 상당히 멀어지면 가치 투자자가 적지 않은 상황에서 추세 추종자와 가치 투자자 간의 경쟁이 시작됩니다. 밀도 의존성은 생물학적인 것보다 종 간의 상호 작용을 더 복잡하게 만들고 자연보다 금융에서 훨씬 더 일반적입니다. 가격이 엇갈리는 불안정한 구간에서 추세추종자들은 다른 추세추종자들로부터 이익을 얻고 가격은 거품처럼 계속 오르지만 이 시나리오는 상당히 비현실적이다.

  • 00:45:00 Martin Scholl은 단기간에 추세 추종자의 이점에 대해 논의합니다. 그들은 최고점에서 판매할 수 있거나 적어도 가격이 완전히 폭락하기 전에는 판매할 수 없기 때문에 그들보다 약간 느린 추세 추종자로부터 이익을 얻을 수 있기 때문입니다. 그러나 이 모델에서 추세 추종자는 단순하며 개인의 전략에 관계없이 동일한 시간 척도에서 작동합니다. Scholl은 또한 패시브 펀드 또는 인덱스 트래커가 특정 자산에 부를 할당하는 합의된 펀드로 표현될 수 있는 방법에 대해서도 설명합니다. 인덱서의 비율이 높을수록 시스템이 더 안정되고 전체 시스템이 약화됩니다. 마지막으로 Scholl은 종 간의 이진 관계를 이해하기 위해 이 모든 정보를 계산하여 먹이 그물이라는 결과를 얻었다고 말합니다.

  • 00:50:00 Martin이 에이전트 기반 모델을 사용하여 시장 생태학 연구에 대해 논의합니다. Scholl은 노드가 어떻게 다른 종인지 설명하고 가장자리는 노드 간의 상호 작용입니다. 영양 수준을 사용하여 어떤 종의 수익 수준이 가장 낮은지(다른 종을 잡아먹지 않음), 교통량이 가장 높은 종(다른 모든 종을 잡아먹는 최상위 포식자)을 결정할 수 있습니다. Scholl은 밀도에 따라 트래픽 수준이 어떻게 극적으로 변하고 각 그룹이 배당금 할인을 따르는지 설명합니다. 가치 투자자는 노이즈 트레이더를 잡아먹고 추세 추종자는 상관관계를 이용합니다.

  • 00:55:00 Martin Scholl이 에이전트 기반 모델을 사용하여 시장 생태학을 연구하는 실질적인 의미를 설명합니다. 시장 품질과 잘못된 가격 책정에 기반한 실험은 풍부한 종을 사용하는 간단한 선형 모델이 시장 결과에 영향을 미치는 다양한 유형의 포식자 간의 관계를 설명하는 데 매우 잘 작동한다는 것을 보여줍니다. 개발된 모델은 투자가 어떻게 다차원적인지 관찰할 수 있게 하여 전략이 시장 품질에 다른 영향을 미친다는 것을 강조합니다. Scholl의 연구에 따르면 금융 시장은 밀도 의존도가 매우 높습니다. 즉, 투자자는 손실을 입거나 스스로 희생양이 되지 않도록 전략을 적절하게 조정해야 합니다. 이 접근법은 주식 가격이 이용 가능한 모든 기본 정보를 반영한다고 믿는 전통적인 금융과 달리 다양한 조건의 영향을 받는 복잡한 시스템으로 시장을 설명할 수 있게 합니다.

  • 01:00:00 비디오의 이 섹션에서 Martin Scholl은 에이전트 기반 모델을 사용하여 시장 생태학을 연구하기 위해 간단한 선형 모델을 사용하는 방법에 대해 설명합니다. 보유 자산과 시장 활동의 상대적 풍부함을 살펴봄으로써 그는 합리성을 가정하고 기본 사항을 자동으로 변환하는 부서 파생 모델을 사용하는 것보다 이 접근 방식이 더 나은 예측자를 제공한다는 것을 발견했습니다. 그는 또한 그의 모델의 한계와 모델을 보다 현실적으로 만들기 위한 추가 연구의 필요성에 대해 논의합니다. 그가 다루는 한 가지 질문은 특히 추세 추종과 관련하여 다양한 레시피 및 정의에 대한 모델의 민감도에 관한 것입니다. 그는 주로 그의 모델의 배당금에 의해 주도되지만 실제 금융에 대해 보다 현실적으로 만들기 위해서는 추가 단계가 필요하다고 설명합니다. 시장.

  • 01:05:00 Martin Scholl이 에이전트 기반 모델을 사용하여 시장 생태학을 연구하는 접근 방식에 대해 설명합니다. Scholl은 에이전트가 자신의 모델에 대한 신념을 조정할 수 있다고 가정하지 않습니다. 시장 운영에는 일반적으로 수십 년 동안 사업 설명서에 요약된 전략을 따르는 펀드 매니저가 포함되며, 이는 자산 배분 프로세스가 기계적인 경향이 있음을 나타냅니다. Scholl은 그의 모델링에서 덜 적응적인 행동과 덜 지능적인 쪽으로 기울어지는 경향이 있습니다. 그러나 옥스포드 대학 연구 그룹의 다른 사람들은 진화 알고리즘을 적용하여 전략에 대한 매개 변수를 변경하고 새로운 전략을 혁신하기 위해 노력하고 있습니다.
Martin Scholl (University of Oxford): "Studying Market Ecology Using Agent-Based Models"
Martin Scholl (University of Oxford): "Studying Market Ecology Using Agent-Based Models"
  • 2022.03.23
  • www.youtube.com
Abstract: This talk presents a mathematical analogy between financial trading strategies and biological species and shows how to apply standard concepts fro...
 

Kevin Webster: "가격 영향이 회계 손익을 왜곡하는 방법"



Kevin Webster: "가격 영향이 회계 손익을 왜곡하는 방법"

YouTube 동영상에서 Kevin Webster는 가격 영향이 회계 손익(P&L) 계산서를 왜곡할 수 있는 방법에 대한 주제를 자세히 설명합니다. 그는 위험을 효과적으로 관리하기 위해 가격 영향을 정확하게 모델링하는 것의 중요성을 강조하고 비유동적 위치에 남지 않도록 유동성 위험을 관리하는 것의 중요성을 강조합니다. Webster는 다양한 가격 영향 모델이 있음을 인정하지만 일반적으로 대부분의 데이터에 동의합니다.

특히 금융 위기 이전에는 주요 시장의 유동성이 종종 당연하게 여겨졌다는 점에 주목하면서 가격 영향과 유동성 위험 사이의 교차점을 언급하는 것으로 논의가 시작됩니다. Webster는 가격 영향이 어떻게 이익에 대한 환상을 불러일으키고 가격이 금전적 가치에서 멀어지게 하는지를 설명하는 강력한 인용문을 공유합니다. 대화의 목적은 이 개념을 수학적으로 공식화하여 청산이 시장에 미치는 영향을 추정하여 수익에 대한 착각을 없애는 정량적 프레임워크를 제공하는 것입니다.

Webster는 가격 영향을 거래에 대한 인과 모델로 설명합니다. 여기서 더 공격적인 거래는 가격을 더 밀고 그 반대도 마찬가지입니다. 가격 영향 모델은 거래 비용 분석 및 최적 실행에 널리 사용되며 예상 거래 비용을 추정하고 실행 전략을 최적화하기 위한 사전 거래 도구 역할을 합니다. 그는 주문 미끄러짐을 최소화하고 기계적 움직임과 알파 미끄러짐을 모두 고려하는 데 중점을 두고 트레이더가 알고리즘이 분기별로 어떻게 수행되고 있는지 평가할 수 있는 모의 거래 비용 분석 보고서를 선보입니다.

연사는 시장 스트레스 기간 동안 자산 청산 시뮬레이션을 포함하는 유동성 스트레스 테스트와 관련하여 ESMA(European Securities and Markets Authority)에서 발표한 지침에 대해 논의합니다. 가격 변동과 같은 시장의 반응을 시뮬레이션하고 헤징 전략을 사용하는 것은 위험 노출을 줄이는 데 중요합니다. Webster는 Cascioli, Boucheron, Farmer 및 ESMA 및 Baffled Committee와 같은 규제 위원회의 작업을 포함하여 유동성 스트레스 테스트 및 회계 P&L에 대한 가격 영향에 대한 다양한 문헌을 참조합니다. 그는 회계 손익에 영향을 미치고 높은 청산 비용을 초래할 수 있는 상황을 완화하기 위해 유동성 스트레스 테스트의 필요성을 강조합니다.

가격 영향이 회계 손익에 미치는 왜곡 효과를 측정하고 손익의 다양한 정의를 하나로 묶는 거래 발자국의 개념이 도입되었습니다. Webster는 Casadio-Bouchard-Farmer 논문에서 도출한 회계 손익에 대한 중요한 결론을 설명하기 위해 간단한 판매 모델을 제시합니다. 그는 거래자와 플랫폼 관리자가 매일 관찰하는 숫자가 최종 손익을 과대 평가하여 거래가 완료되면 디플레이션으로 이어지는 방법을 설명합니다. 그러나이 인플레이션 속성은 실시간으로 측정 및 표시되어 거래자에게 실행 가능한 정보를 제공합니다. Webster는 포지션 인플레이션 손실이 종종 일시적이며 위험 허용 범위에 따라 달라진다고 지적합니다.

주식 포지션 평가와 관련된 문제와 회사의 손익에 미치는 영향에 대해 논의합니다. Webster는 주식 포지션을 표시하는 데 사용할 가격과 회계 손익과 거래 알고리즘에서 사용하는 기본 손익 사이의 차이를 결정할 때의 모호성을 강조합니다. 거래 풋프린트는 회계 손익과 기본 손익의 차이로 정의되며 포지션이 청산되면 모호성이 해결됩니다. 화자는 포지션 인플레이션을 탐색하여 이 속성이 유지되는 특정 가정을 만듭니다. Fruehwirth와 Bond가 연구한 충격 모델과 두 가지 사례인 원래 OW 몰과 W 몰도 다룹니다.

Webster는 모델이 의미가 있으려면 자체 자금 조달 방정식 조건과 함께 람다와 베타 사이의 차익 거래가 없는 조건이 충족되어야 한다고 설명합니다. 그는 마감 시 예상 손익을 계산하고 거래 공간이 회계 손익에 편향을 도입하는 방법에 대해 자세히 설명합니다. 포지션 인플레이션 속성으로 인해 포지션 진입 단계에서 포지션이 팽창하고 보유 단계에서 유지되며 결국 증발합니다. 이러한 모든 측면은 거래 화면에서 실시간으로 관찰할 수 있어 거래자에게 귀중한 통찰력을 제공합니다.

Webster는 가격 영향으로 인한 회계 손익 왜곡을 추가로 설명합니다. 그는 트레이더가 알파 없이도 수익성 있는 거래를 할 수 있는 방법에 대해 논의하지만 이러한 수익은 거래 비용으로 인해 수명이 짧다고 경고합니다. 손실을 피하려면 조기에 가격 변동을 모니터링하는 것이 중요합니다. 또한 Webster는 포트폴리오 관리자가 포트폴리오를 전체적으로 보는 것을 선호하며 수학적 금융 세계에서 포트폴리오의 크기와 회전율을 제어하는 정적 포트폴리오의 개념을 도입한다고 지적합니다.

고정된 포트폴리오의 개념은 실행 중인 거래 비용을 추정하는 것과 관련하여 탐구됩니다. 전파자의 시간 척도를 이해함으로써 트레이더는 자신의 포지션이 부풀려진 정도와 포지션을 청산할 때 잃을 수 있는 이익의 환상을 추정할 수 있습니다. Webster는 경험적 데이터를 사용하여 프레임워크를 시연하고 실제 시나리오에 대한 적용 가능성을 보여줍니다. 그는 판매 모델에 프레임워크를 적용하고 회계 손익과 기본 손익의 차이점을 설명하고 거래자의 위험 회피를 기반으로 다양한 목적 함수를 알리는 방법을 강조합니다.

연사는 급매 또는 다른 시장 참여자의 거래 활동이 거래자의 손익과 포지션에 미치는 영향에 대해 자세히 설명합니다. 공격적인 헤징은 크라우딩 효과와 포지션 인플레이션으로 이어져 영구적인 손실을 초래할 수 있습니다. 효과적인 위험 관리를 위해서는 가격 영향을 정확하게 모델링하는 것이 중요하며 유동성 위험 관리는 비유동적 포지션으로 끝나는 것을 방지하기 위해 강조됩니다.

Webster는 사용 가능한 다양한 가격 영향 모델이 있지만 일반적으로 대부분의 데이터에 동의한다는 점을 인정합니다. 그러나 영향이 지속되는 양과 기간에는 차이가 발생할 수 있습니다. 일시적 탈구는 며칠에서 한 달까지 지속될 수 있습니다. 위험 관리 관점에서는 명확한 행동 방침이 있는 반면 트레이더 및 성과 관점에서는 효과적인 커뮤니케이션이 핵심입니다. 손익이 기계적인지 여부를 이해하고 기계적인 부분을 제거하면 트레이더는 거래에서 실제 알파 또는 에지에 집중할 수 있습니다.

연사는 "가격 조작 금지" 원칙을 설명하면서 트레이더가 이익을 얻더라도 결국에는 증발하기 때문에 이를 유지할 수 없다고 강조합니다. 포지션 인플레이션은 시간이 지남에 따라 거래 가치의 디플레이션 또는 즉각적인 청산으로 이어져 손익이 0 또는 마이너스가 될 수도 있습니다. 따라서 트레이더는 지속 가능한 수익을 창출하기 위해 다른 변수에 의존해야 합니다. Webster는 초기 영향 상태, 시장의 나머지 부분에서 발생하는 영향, 거래자의 헤지 및 나머지 시장의 영향 사이의 상관관계를 추가로 탐색합니다.

결론적으로 Kevin Webster는 가격 영향이 어떻게 회계 손익을 왜곡할 수 있는지에 대한 포괄적인 이해를 제공합니다. 그는 변동성이 높은 유동성 체제 동안의 추가 비용과 더 넓은 시장과의 상관 관계를 밝히고 편향에 미치는 영향을 강조합니다. 규제 관점에서 볼 때 회사채와 보험 회사는 이러한 편향의 영향을 더 많이 받을 가능성이 높습니다. Webster는 주식 이외의 시장에 대한 자세한 답변이 부족함을 인정하지만 가격 영향과 손익의 잠재적 왜곡을 이해하기 위한 견고한 수학적 기반을 제공합니다.

  • 00:00:00은 가격 영향이 회계 손익을 어떻게 왜곡하는지에 대한 이 이야기의 기초입니다. 가격 영향과 유동성 위험 간의 교차점과 금융 위기 이전에는 주요 시장의 유동성이 종종 당연하게 여겨졌다는 사실이 이 논의의 동기가 되었습니다. 연사는 가격 영향으로 인한 이익의 환상과 이것이 재정적 가치에서 가격 변동으로 이어지는 방식을 설명하는 두 가지 강력한 인용문을 제공합니다. 이 강연의 목표는 이 아이디어를 수학적으로 공식화하고 청산의 예상 시장 영향을 기반으로 정량적 프레임워크를 제공하여 이러한 이익의 환상을 제거하는 것입니다.

  • 00:05:00 연사는 거래에 대한 인과적 모델로서의 가격 영향과 더 공격적으로 거래될 경우 가격이 더 밀리는 원인과 그 반대의 경우에 대해 논의합니다. 업계에서는 거래 비용 분석 및 최적의 실행을 위해 가격 영향 모델을 사용하고 실무자는 이를 주문의 예상 거래 비용을 추정하고 실행 전략을 최적화하기 위한 사전 거래 도구로 사용합니다. 발표자는 트레이더가 알고가 분기별로 어떻게 작동하는지 평가할 수 있도록 이 유동성 관점을 모방하기 위해 모의 TCA 보고서를 제공합니다. 트레이더는 주문 미끄러짐을 최소화하려고 노력하며 기계적 움직임이나 알파로 인한 주문 미끄러짐 비율에 따라 가격 영향과 알파 미끄러짐이 작용합니다.

  • 00:10:00 Kevin Webster는 시장 스트레스 기간 동안 자산의 청산 시뮬레이션을 포함하는 유동성 스트레스 테스트를 실행하는 방법에 대해 유럽 증권 시장 당국에서 발표한 지침에 대해 논의합니다. 그는 또한 가격 변동과 같은 시장의 반응을 시뮬레이션하는 것의 중요성과 헤지가 어떻게 위험 노출을 줄일 수 있는지 설명합니다. 또한 그는 Cascioli Boucheron Farmer와 Baffled Committee 및 ESMA와 같은 규제 기관의 작업을 포함하여 유동성 스트레스 테스트 및 회계 P&L에 대한 가격 영향에 대한 두 가지 문헌을 검토합니다. 마지막으로 그는 회계 손익에 영향을 미치고 높은 청산 비용을 초래할 수 있는 상황을 피하기 위해 유동성 스트레스 테스트의 필요성을 강조합니다.

  • 00:15:00 연사는 유동성 스트레스 테스트에 대한 다양한 문서에서 얻은 시사점에 대해 논의합니다. 여기에는 의사 결정자가 유동성 스트레스 테스트를 사용해야 할 필요성과 시뮬레이션 기반 구조가 포함됩니다. 그들은 OB 모델에 대한 대체 증거를 제공하고 그 적용 가능성을 크게 높이는 Schweizer 및 Urzua의 한 쌍의 논문과 함께 시장 스트레스 동안 가격 변동을 시뮬레이션하는 Francelli의 특정 논문을 추천합니다. 연사는 또한 P&L의 서로 다른 정의를 함께 묶고 회계 P&L에 대한 가격 영향의 왜곡 효과를 측정하는 거래 발자국의 개념을 소개합니다. 마지막으로, 그들은 Casadio-Bouchard-Farmer 논문에서 만든 회계 손익에 대한 강력한 결론을 설명하기 위해 간단한 급매 모델을 설정했습니다.

  • 00:20:00 Kevin Webster가 가격 영향이 어떻게 회계 손익을 왜곡할 수 있는지 논의합니다. 그는 거래자와 플랫폼 관리자가 매일 보는 숫자가 최종 손익을 과대 평가하여 거래를 마치면 줄어들게 만드는 방법을 설명합니다. 그러나 인플레이션 속성은 실시간으로 측정되고 표시될 수 있으므로 거래자가 실행할 수 있습니다. Webster는 손실의 포지션 인플레이션 부분은 종종 일시적이며 위험 허용 범위에 달려 있다고 지적합니다. 그는 트레이더가 손익을 계산할 때 고려해야 하는 수학적 설정, 변수 및 수량에 대한 소개로 결론을 내립니다.

  • 00:25:00 이 섹션에서 Kevin Webster는 주식 포지션 평가와 관련된 문제와 그것이 회사의 손익(P&L)에 미치는 영향을 설명합니다. 그는 주식 포지션을 표시하는 데 사용할 가격을 결정하는 모호성과 회계 손익과 거래 알고리즘이 사용하는 기본 손익 사이의 차이에 대해 이야기합니다. 그는 거래 공간을 회계 손익과 기본 손익의 차이로 정의하고 포지션이 마감될 때 모호성이 어떻게 해제되는지 설명합니다. 그는 또한 포지션 인플레이션에 대해 논의하고 이 속성이 유지되는 몇 가지 가정을 제공합니다. 마지막으로 그는 Fruehwirth와 Bond가 연구한 충격 모델과 그 두 가지 경우인 원래의 OW 몰과 W 몰을 언급합니다.

  • 00:30:00 Kevin Webster는 모델이 의미를 갖기 위해서는 람다와 베타 사이에 차익 거래 조건이 없어야 하고 자체 자금 조달 방정식 조건이 충족되어야 한다고 설명합니다. 그는 또한 마감 시 예상 손익을 계산하는 방법과 거래 공간이 회계 손익에 편향을 도입하는 방법을 분석합니다. 마지막으로 그는 포지션 인플레이션 속성이 어떻게 포지션 진입 단계에서 포지션을 팽창시키고, 유지 단계 동안 머무르며 결국 증발하게 하는지에 대해 논의합니다. 이 모든 것을 실시간으로 거래 화면에서 관찰할 수 있습니다.

  • 00:35:00 이 섹션에서는 재무 전문가인 Kevin Webster가 회계 손익에서 발생하는 가격 영향 왜곡에 대해 설명합니다. 그는 거래에 알파가 없는 경우에도 거래자가 수익성 있는 거래를 할 수 있는 방법에 대해 논의하는 동시에 이러한 이익이 거래 비용으로 인해 오래 지속되지 않을 것이며 거래자는 손실을 피하기 위해 이러한 가격 위치를 조기에 모니터링해야 한다고 경고합니다. 또한 그는 포트폴리오 관리자가 자신의 포트폴리오를 전체적으로 생각하는 것을 선호하며 수학 금융 세계에서 포트폴리오의 크기와 회전율을 제어하기 위해 고정 포트폴리오를 정의한다고 설명합니다.

  • 00:40:00 Kevin Webster가 고정 포트폴리오의 개념과 실행 중인 거래 비용을 추정하는 데 사용할 수 있는 방법에 대해 설명합니다. 전파자의 시간 척도를 알면 트레이더는 자신의 포지션이 얼마나 부풀려졌는지, 그리고 포지션을 청산하기 시작하면 잃을 수 있는 이익의 환상을 추정할 수 있습니다. 그런 다음 Webster는 경험적 데이터에 대한 프레임워크를 시뮬레이션하고 이러한 공식을 실제 시나리오에 적용할 수 있음을 강조합니다. 마지막으로 그는 이 프레임워크를 불매도 모델에 적용하고 회계 손익과 기본 손익의 차이점과 트레이더의 위험 회피에 따라 서로 다른 목적 함수를 알릴 수 있는 방법을 설명합니다.

  • 00:45:00 Kevin은 급매도 또는 다른 시장 참여자의 거래 활동이 거래자의 손익과 포지션에 어떤 영향을 미칠 수 있는지에 대해 논의합니다. 그는 공격적인 헤징이 크라우딩 효과와 포지션 인플레이션으로 이어져 영구적인 손실을 초래할 수 있음을 보여줍니다. 또한 그는 위험을 효과적으로 관리하기 위해 가격 영향을 정확하게 모델링하는 것의 중요성을 강조하고 비유동적 포지션으로 끝나기 전에 유동성 위험을 관리하는 것의 중요성을 강조합니다. 마지막으로 그는 다양한 가격 영향 모델이 있지만 일반적으로 대부분의 데이터에 동의한다는 점에 주목합니다.

  • 00:50:00 연사는 가격 영향의 양이나 변화뿐만 아니라 영향이 사라지는 기간에 대해 서로 다른 영향 모델이 어떻게 반대할 수 있는지 논의합니다. 그들은 며칠에서 한 달이 될 수 있는 일시적 탈구의 예를 제공합니다. 그러나 트레이더 또는 성과 관리자가 자신의 포지션에 대한 편견을 없애거나 위험 관리를 수행하려는 경우 모든 임팩트 모델로 충분해야 하며 이해관계자와 효과적으로 소통할 수 있는 실행 가능한 세트가 있습니다. 위험 관리 관점에서 명확한 조치 세트가 있습니다. 대조적으로, 트레이더 및 성능 관점에서 볼 때 p/l이 기계적인지 여부를 이해하고 p/l의 기계적인 부분을 제거함으로써 거래에서 실제 알파 또는 실제 우위에 집중할 수 있는 것은 대부분 의사 소통입니다. .

  • 00:55:00 Kevin Webster는 가격 조작 금지 원칙이 트레이더가 이익을 얻더라도 결국 증발하기 때문에 이를 고정시킬 수 없다는 것을 의미한다고 설명합니다. 증명 포지션 인플레이션은 시간이 지남에 따라 거래 가치의 디플레이션 또는 즉각적인 청산으로 이어져 0 또는 마이너스 P&L로 이어집니다. 포지션 인플레이션으로 인해 이익이 영구적이 되는 것을 허용하지 않기 때문에 트레이더는 이익을 내기 위해 다른 변수에 의존해야 합니다. Webster는 초기 영향 상태, 나머지 시장에서 발생하는 초기 영향, 거래자의 헤지 및 나머지 시장의 영향 사이의 상관관계에 대해 더 논의합니다.

  • 01:00:00 Kevin Webster가 가격 영향이 회계 손익을 왜곡하는 방식에 대해 논의합니다. 그는 변동성이 높은 유동성 체제 동안의 추가 비용과 나머지 시장과의 상관관계가 편향에 상당한 기여를 할 수 있다고 설명합니다. 규제 관점에서 볼 때 회사채와 보험 회사는 이러한 편향의 영향을 더 많이 받을 가능성이 높습니다. 그러나 그가 인정하듯이 그는 주식 이외의 특정 질문에 어떻게 답해야 할지 확신이 없기 때문에 매우 상세한 답변을 가지고 있지 않습니다. 전반적으로 그는 가격 영향에 대한 수학적 이해와 그것이 손익을 왜곡할 수 있는 방법을 제공합니다.
Kevin Webster: "How Price Impact Distorts Accounting P&L"
Kevin Webster: "How Price Impact Distorts Accounting P&L"
  • 2022.02.16
  • www.youtube.com
Full Talk Title: "How Price Impact Distorts Accounting P&L - Revisiting Caccioli, Bouchaud and Farmer's Impact-Adjusted Valuation"This presentation revisits ...
 

Laura Leal(Princeton University) - "초단타 금융을 위한 기능 제어 학습"



Laura Leal(Princeton University) - "초단타 금융을 위한 기능 제어 학습"

Princeton University의 연구원인 Laura Leal은 초단타 금융 분야에서 심층 신경망을 적용하는 방법에 대해 유익한 프레젠테이션을 했습니다. 그녀는 기존 솔루션의 한계를 강조하고 이 영역에서 신경망 활용의 이점을 탐구했습니다. Leal은 기존 모델이 어려움을 겪는 자기 상관 및 일중 계절성과 같은 복잡한 요인에 적응하는 능력을 강조했습니다. 신경망을 활용함으로써 트레이더는 시장 영향을 최소화하고 원활하게 거래함으로써 최적의 실행을 달성할 수 있습니다.

신경망의 블랙박스 특성에 대한 우려를 해결하기 위해 Leal은 설명 가능성이라는 개념을 도입했습니다. 그녀는 신경망 제어를 저차원 매니폴드에 투영하는 것에 대해 논의하여 관련 위험과 친숙한 위험 분야와의 편차를 더 잘 이해할 수 있도록 했습니다. 팀은 신경망 제어의 성능을 고전적인 폐쇄형 PDE(편미분 방정식) 솔루션과 비교하여 평가했습니다. 그들은 신경망 접근 방식의 정확성과 효과를 평가하기 위해 가치 함수, 시가 기준 자산, 예측의 상대적 오류를 조사했습니다.

Leal은 실제 데이터와 정확한 역학을 통합하는 것의 중요성을 강조하면서 신경망 훈련의 복잡성을 탐구했습니다. 그녀는 또한 트레이더가 자신의 리스크 선호도를 입력할 수 있는 다중 선호도 컨트롤러를 제안하여 새로운 시장 상황에 더 빠르게 적응할 수 있도록 했습니다. 신경망은 위험 회피 매개변수를 고려하고 거래자의 선호도를 통합함으로써 고주파 금융의 확률적 최적화 문제에 대한 솔루션을 생성할 수 있습니다.

발표자는 위험 제어에 사용되는 신경망의 구조에 대해 논의하면서 반복되는 특성을 강조했습니다. 네트워크가 지나치게 깊지는 않지만 각 시간 단계에서 반복 구조를 사용하여 가중치를 동시에 업데이트합니다. 네트워크에 대한 입력에는 시간과 재고가 포함되며, 출력에는 제어 자체가 포함되어 각 단계에서 거래할 최적의 주식 양을 결정합니다. 제한된 재무 데이터 가용성 문제를 해결하기 위해 Monte Carlo 방법을 사용하여 데이터를 시뮬레이션하는 전이 학습이 사용됩니다.

Leal은 선형 회귀를 사용하여 신경망 제어를 선형 함수 공간에 투영하는 과정을 설명했습니다. 이 프로젝션 기술은 신경망의 비선형 기능과 폐쇄형 제어 솔루션과의 정렬에 대한 이해를 용이하게 합니다. 결과는 시장에 대한 모델의 반응에 대한 계절성 및 위험 회피 매개변수 통합의 영향을 보여주었습니다. 또한 발표자는 문헌에서 일반적으로 2로 설정되지만 2분의 3으로 간주될 때 비선형 솔루션을 나타내는 감마의 중요성을 강조했습니다.

고주파 금융을 위한 거래를 실행할 때 신경망 제어의 성능과 정확성을 철저히 평가했습니다. Leal은 다양한 시나리오와 감마 값에 걸쳐 가치 함수, 시가 기준 자산, 예측의 상대적 오류를 비교했습니다. 신경망은 우수한 성능을 보였지만 기존의 제어 솔루션에서 벗어나 비선형 방식으로 거래를 실행했습니다. 이것은 신경망을 사용하여 거래하기로 한 결정과 확립된 솔루션과의 차이에 따라 적절한 증거금 수준을 결정하는 것에 대한 질문을 제기했습니다.

Leal은 거래자가 위험 전환 매개변수를 입력하고 사전 훈련된 모델로 즉시 거래를 시작할 수 있도록 하는 다중 선호 컨트롤러 접근 방식의 이점을 탐구했습니다. 신경망 솔루션은 PDE 솔루션보다 실행 시간이 더 오래 걸리지만 다양한 위험 기본 설정에 더 큰 유연성과 적응성을 제공했습니다. 설명 가능성을 향상시키기 위해 Leal은 다중 선호 기능을 유지하면서 계산 부담을 줄이는 선형 회귀를 사용하는 프로젝션 아이디어를 제안했습니다. 그녀는 또한 헤징과 같은 다른 재정 문제와의 관련성을 제안하면서 신경망 근사 개념의 광범위한 적용을 강조했습니다.

온라인 강화 학습과 관련된 대기 시간 문제를 피하기 위해 오프라인 교육을 강조하면서 고주파 금융의 신경망 교육 프로세스에 대해 논의했습니다. 네트워크는 시간, 인벤토리 및 잠재적 위험 회피 매개변수를 입력으로 사용하고 비율을 출력으로 생성합니다. Leal은 또한 네트워크가 수렴되면 시뮬레이트된 데이터에서 토론토 증권 거래소에서 얻은 실제 데이터 증분으로 전환하는 전이 학습의 미세 조정 절차를 설명했습니다. 발표자는 훈련 과정에서 실제 데이터와 정확한 역학을 사용하는 것의 중요성을 강조했습니다. 이는 고주파 금융의 복잡성을 포착하는 네트워크의 능력을 향상시키기 때문입니다.

후속 섹션에서 Laura Leal은 고주파 금융을 위해 신경망에 사용되는 입력 및 목적 함수에 대한 통찰력을 제공했습니다. 신경망은 하루 동안 특정 주식의 평균 볼륨 비율로 재고를 통합하여 정규화된 표현을 허용합니다. 목적 함수는 최적의 실행을 위한 제어 역할을 하는 출력과 함께 최대화 문제로 구성됩니다. 신경망의 구조는 기본 관계를 캡처하기 위해 2개의 입력 노드와 4개의 은닉층을 활용하는 함수 근사화를 기반으로 합니다.

두 제어 솔루션 간의 불일치에 대한 질문에 대해 Leal은 이것이 투자자의 변화하는 효용을 반영하는 것으로 해석될 수 있다고 설명했습니다. 감마 매개변수를 조정하면 다양한 유틸리티 기능을 사용할 수 있으므로 제어 솔루션이 다양해집니다. 연구에서 팀은 실제 거래자와의 실증적 테스트를 기반으로 세 반쪽의 감마 값을 선택했으며 결과적으로 만족스러운 성능을 보였습니다.

Leal은 신경망의 출력이 관찰 가능하고 분석 가능하다고 강조했습니다. 그들은 네트워크가 취하는 위치와 거래일 동안 어떻게 변화하는지 모니터링하여 의사 결정 프로세스에 대한 투명성과 통찰력을 제공할 수 있습니다. 이러한 수준의 해석 가능성과 이해를 통해 트레이더는 신경망의 실행 전략에 대한 확신을 얻을 수 있습니다.

고주파 금융을 위한 기능적 통제 개발과 관련된 문제에 대해서도 Leal이 논의했습니다. 평균 제어 프로세스는 거래 실행에 대한 전반적인 통찰력을 제공할 수 있지만 개별 궤적의 동작을 정확하게 나타내지 못할 수 있습니다. 밈 주식의 출현과 같은 시장의 역학은 진화하는 조건을 효과적으로 포착하기 위한 제어 방법의 적응을 필요로 합니다.

결론적으로 Laura Leal의 프레젠테이션은 초단타 금융 영역에서 효과적인 통제를 생성하는 복잡성을 조명했습니다. 연구자와 거래자는 심층 신경망을 활용하여 기존 모델의 한계를 극복하고 이 영역의 복잡한 역학에 적응할 수 있습니다. 위험 선호, 설명 가능성 측정 및 실제 데이터의 통합은 강력하고 적응 가능한 제어 솔루션 개발에 기여합니다. Leal과 그녀의 팀은 작업을 통해 초단타 금융에서 보다 효율적이고 정보에 입각한 의사 결정을 내릴 수 있는 길을 열어주는 귀중한 통찰력과 솔루션을 제공합니다.

  • 00:00:00 Laura Leal은 심층 신경망을 사용하여 고주파 금융에서 최적의 실행 문제를 해결하기 위해 Matthias 및 Charlotte와 공동 작업을 발표합니다. 목표는 큰 시장 영향을 피하고 가능한 한 원활하고 은밀하게 거래하는 것입니다. 팀은 신경망이 블랙박스가 되는 문제를 해결하기 위해 설명 가능성이라는 아이디어를 도입했습니다. 여기에서 신경망 제어를 저차원 매니폴드에 투영하여 위험과 신경망 솔루션이 친숙한 위험에서 얼마나 멀리 떨어져 있는지 더 잘 이해합니다. 부문. 이들은 성과를 평가하고 가치 함수, 부로 표시된 시장, 예측의 상대적 오류를 살펴보고 신경망 솔루션을 고전적인 폐쇄형 PDE 솔루션과 비교합니다.

  • 00:05:00 Princeton University의 Laura Leal이 자동 상관, 무거운 꼬리와 같은 고주파 금융의 복잡성에 적응하기 위해 고군분투하는 PD(편미분) 모델과 같은 기존 솔루션의 한계를 신경망이 개선할 수 있는 방법에 대해 설명합니다. , 일중 계절성. 그러나 신경망은 실행하는 데 시간이 많이 걸릴 수 있으므로 그녀는 거래자의 위험 선호도를 입력하여 새로운 날에 더 빨리 적응하고 확률적 최적화 문제에 대한 솔루션을 생성하는 다중 선호 컨트롤러를 제안합니다. 그런 다음 Leal은 최적의 실행 모델을 포함한 문헌의 개요를 제공하고 신경망이 고주파 금융에서 학습할 수 있는 재고, 제어 및 가격과 같은 상태 변수를 설명합니다.

  • 00:10:00 Laura는 고주파 금융에서 가격 프로세스의 진화와 거래 속도가 어떻게 영향을 받는지에 대해 논의합니다. 그녀는 거래 속도가 빠를수록 더 많은 유동성을 소비하여 가격이 상승하고 영구적인 시장 영향을 생성하는 방법을 설명합니다. 최소화하기 위한 객관적인 기준은 거래의 속도인 제어에 달려 있으며 종단 요소와 운영 비용 요소가 있습니다. 터미널 비용은 세 부분으로 나뉘는데 여기에는 현금의 최종 재산, 재고 보유에 대한 벌금 및 최종 재고를 판매할 수 있는 금액이 포함됩니다. 운영 비용은 하루 종일 재고를 유지하는 데 대한 패널티이며 이 두 매개 변수는 위험 관리에 필수적입니다. Leal은 또한 신경망 솔루션에서 감마가 얼마나 중요한지 논의하며 일반적으로 문헌에서는 2로 간주됩니다.

  • 00:15:00 Princeton University의 연사인 Laura Leal은 가치 함수가 인벤토리에 일부 2차 항을 포함하는 빈도가 높은 금융 문제에서 근사치를 학습하기 위해 신경망을 사용하는 방법을 설명합니다. 신경 메트릭을 사용할 때 등가 솔루션은 신경망의 매개 변수를 선택해야 하므로 제어 mu를 최적화하는 것과 다릅니다. 신경망은 모든 시간 단계에 사용되어 에이전트의 가격, 재고 및 부를 기반으로 반응하는 방법을 학습할 수 있습니다. 이 프로세스는 시간 및 인벤토리 입력과 함께 피드포워드 방식의 완전히 연결된 신경망 구조를 사용합니다. 그러나 설명을 위해 비디오에 사용된 위험 선호 매개변수보다 더 많은 입력을 포함하도록 입력을 여러 가지 방법으로 일반화할 수 있습니다.

  • 00:20:00 Laura Leal이 고주파 금융에서 위험 통제에 사용되는 신경망의 구조를 설명합니다. 신경망은 그다지 깊지는 않지만 반복적이며 각 시간 단계에서 동일한 구조를 재사용하여 가중치를 동시에 업데이트합니다. 네트워크에 대한 입력은 시간과 재고이며, 출력은 신경망 자체인 컨트롤이며, 매 시간 단계마다 거래할 주식의 일정량을 출력합니다. 전이 학습은 비싸거나 희소한 재무 데이터를 사용하는 대신 Monte Carlo를 사용하여 데이터를 시뮬레이션하는 데 사용됩니다. 사용된 데이터는 2008년 1월부터 2009년 12월까지의 토론토 증권 거래소에서 가져온 것이며 신경망은 무거운 꼬리, 자기 상관 및 일중 계절성 문제를 해결하는 데 사용됩니다.

  • 00:25:00 이 섹션에서 Laura Leal은 신경망이 달성한 제어를 선형 회귀를 사용하여 q의 선형 함수 공간에 투영하여 r 제곱을 결정하기 위해 베타1 및 베타2 항을 찾는 과정을 설명합니다. 신경망의 비선형 함수는 폐쇄형 컨트롤의 공간에 투영될 수 있습니다. 결과는 계절성 및 에이전트의 위험 회피 매개변수 학습과 같은 코드에 기능을 추가할 때 시장에 대한 모델의 반응에 상당한 영향이 있었지만 감마가 2에서 3이라는 것을 고려할 때 그렇지 않은 것으로 나타났습니다. -신경망을 위한 선형 솔루션.

  • 00:30:00 Laura는 고주파 금융 거래를 실행할 때 신경망 제어의 성능과 정확성을 조사합니다. 그녀는 다양한 시나리오와 감마 값에 대해 가치 함수와 마크를 시장 부와 비교합니다. 그녀는 또한 투영의 상대적 오류를 평가하고 신경망이 더 나은 성능을 가지고 있지만 알려진 제어와 다른 비선형 방식으로 실행되고 있음을 지적합니다. 이것은 신경망을 사용하여 거래할지 여부와 편안한 알려진 솔루션과의 거리를 기준으로 설정해야 할 마진에 대한 질문을 제기합니다.

  • 00:35:00 이 섹션에서 Laura는 초단타 금융에서 최적의 실행을 위한 다중 선호 컨트롤러에 대한 그녀의 발견에 대해 논의합니다. Leal은 전자가 계절성에 반응하기 때문에 신경망 솔루션이 모든 매개변수 집합에 대해 PDE 솔루션보다 실행하는 데 더 오래 걸린다는 것을 발견했습니다. 그러나이 접근 방식을 사용하면 거래자는 현재 위험 전환 매개 변수를 입력하고 이미 훈련된 것으로 즉시 거래를 시작할 수 있습니다. Leal은 또한 일부 계산 부담을 제거하기 위해 동일한 문제의 선형 회귀 및 다중 선호 버전을 사용하는 프로젝션 아이디어를 통해 설명 가능성을 제안합니다. 또한 Leal은 자신의 논문에서 다른 논문과 이 신경망 근사 아이디어가 헤징을 포함하여 다른 많은 재정 문제에 어떻게 적용될 수 있는지에 대해 논의합니다.

  • 00:40:00 Laura Leal이 고주파 금융에 사용되는 신경망의 교육 프로세스에 대해 설명합니다. 그녀는 대기 시간 문제를 피하기 위해 네트워크가 온라인 강화 학습이 아닌 오프라인에서 훈련된다고 설명합니다. 네트워크가 훈련되면 잠재적으로 위험 회피 매개변수와 함께 시간 및 인벤토리 입력을 받아 속도를 출력합니다. 최종 사용자는 네트워크의 내부 작동을 이해할 필요가 없습니다. Leal은 또한 네트워크가 수렴된 후 Toronto Stock Exchange에서 실제 데이터 증분으로 전환하는 전이 학습에 사용되는 미세 조정 절차를 설명합니다. 마지막으로 그녀는 훈련 과정에서 실제 데이터와 정확한 역학을 사용하는 것의 중요성을 강조하면서 전처리 및 최적화에 대한 질문에 답합니다.

  • 00:45:00 비디오의 이 섹션에서 Laura Leal은 고주파 금융을 위한 신경망에 사용되는 입력 및 목적 함수에 대해 설명합니다. 신경망은 재고를 하루 동안 해당 주식의 평균 거래량의 비율로 가져옵니다. 이 값은 마이너스 1과 1 사이의 값으로 간주됩니다. 목적함수는 출력이 제어가 되는 최대화 문제이며, 신경망의 구조는 함수 근사화를 기반으로 합니다. Leal은 또한 신경망 구조에 2개의 입력 노드와 4개의 숨겨진 계층이 있다고 설명합니다. 마지막으로 그녀는 두 제어 솔루션의 차이점에 대한 질문에 답하고 그것이 투자자의 효용 변화의 결과로 해석될 수 있음을 명확히 합니다.

  • 00:50:00 Laura는 감마 2 모델과 3개 반 모델의 차이점과 효용 함수에 대해 설명합니다. 그녀는 감마 2를 사용하면 솔루션이 더 이상 폐쇄형 솔루션이 아니며 대신 신경망을 통해 근사 솔루션이 생성된다고 설명합니다. 감마3반을 선택한 이유는 회사 내 실제 트레이더들과 테스트를 해보았고 결과적으로 좋은 결과를 얻었기 때문입니다. 또한 Leal은 신경망 출력을 관찰하고 분석할 수 있으며 출력이 어떤 위치에 있고 하루 동안 어떻게 변하는지 알고 있음을 확인합니다.

  • 00:55:00 이 섹션에서 Laura Leal은 고주파 금융을 위한 기능적 제어를 만드는 문제에 대해 설명합니다. 평균 제어 프로세스는 거래 실행이 어떻게 보이는지에 대한 통찰력을 제공할 수 있지만 단일 궤적을 볼 때 완전히 정확하지 않을 수 있습니다. 그녀는 또한 최적화를 위한 2블록 방법의 사용에 대한 질문에 답하고 이 방법이 밈 스톡과 같은 변화하는 역학에 어떻게 적응해야 하는지 설명합니다. 전반적으로 Leal의 프레젠테이션은 초단타 금융을 위한 기능적 컨트롤 생성의 복잡성을 조명합니다.
Laura Leal (Princeton University) - "Learning a Functional Control for High-Frequency Finance"
Laura Leal (Princeton University) - "Learning a Functional Control for High-Frequency Finance"
  • 2021.11.17
  • www.youtube.com
Laura Leal (Princeton University) is our last speaker for the Fall 2021 seminar series. Her topic is called "Learning a Functional Control for High-Frequency...
 

Zihao Zhang (Oxford-Man Institute) - "주문 데이터에 의한 시장을 위한 딥 러닝"



Zihao Zhang (Oxford-Man Institute) - "주문 데이터에 의한 시장을 위한 딥 러닝"

Oxford-Man Institute의 박사 후 연구원이자 기계 학습 연구 그룹의 일원인 Zihao Zhang은 주문 데이터를 통해 시장에 딥 러닝을 적용한 그의 팀의 최근 작업을 발표합니다. 그들의 초점은 시장 미세 구조 데이터, 특히 특정 금융 상품에 대한 전반적인 수요 및 공급 역학에 대한 귀중한 통찰력을 제공하는 지정가 주문서입니다. 주문별 시장과 지정가 주문서 데이터를 결합함으로써 Zhang과 그의 팀은 신호 분산을 줄이고 더 나은 예측 신호를 얻을 수 있음을 발견했습니다. 이러한 모델의 적용은 거래 실행 및 시장 조성 전략을 향상시킬 수 있는 잠재력을 가지고 있습니다.

Zhang은 시장 미시 구조 데이터에 대한 간략한 소개를 제공하면서 특히 시장별 주문 데이터의 중요성을 강조하면서 프레젠테이션을 시작합니다. 이 데이터 소스는 기존 문헌에서 더 많은 주목을 받은 지정가 주문서 데이터에 비해 빈번한 업데이트 및 이벤트를 제공하여 매우 세분화된 정보를 제공합니다. 그는 딥 러닝 모델을 소개하고 주문 데이터별로 시장을 분석하기 위해 설계한 네트워크 아키텍처를 설명합니다. Zhang은 그들의 작업이 고주파 이동을 예측하기 위해 주문별 시장 데이터를 사용하는 최초의 예측 모델을 나타내며 알파 발견의 가능성을 확장하는 대체 정보 소스를 제공한다고 강조합니다.

다음으로 Zhang은 특정 시점에 금융 상품에 대한 모든 미결 지정가 주문의 포괄적인 기록 역할을 하는 지정가 주문서의 개념에 대해 자세히 설명합니다. 그는 차트 데이터가 빈도가 낮은 정보를 제공하지만 실제로 주식 가격은 다변량 시계열인 지정가 주문장으로 표시된다고 강조합니다. Zhang은 지정가 주문서가 제출된 주문을 기반으로 다양한 가격 수준으로 구성되는 방법을 설명합니다. 각 가격 수준은 서로 다른 거래자가 분할한 수많은 소액 주문으로 구성됩니다. 그는 또한 새 메시지가 도착했을 때 주문서가 업데이트되는 방식에 대해 설명합니다. 이를 통해 새 위치를 소개하거나 기존 주문을 취소하거나 현재 주문을 수정할 수 있습니다. Zhang은 지정가 주문서에서 파생된 데이터가 특정 금융 상품에 대한 전반적인 수요와 공급 관계를 드러내며 그의 목표는 주문 배치 및 취소에 대한 정보가 포함된 주문 데이터별 시장을 활용하여 추가 통찰력을 제공할 수 있는지 확인하는 것이라고 지적합니다. 예측을 하기 위해.

앞으로 Zhang은 시장 움직임을 예측하기 위해 딥 러닝에서 주문별 시장 데이터를 활용하는 방법을 탐구합니다. 시장 주문 데이터의 메시지 문자열은 지정가 주문서에 비해 차원이 낮지만 예측에 활용할 수 있는 추가 정보를 제공합니다. Zhang은 과거 사건을 2D 매트릭스로 변환하여 예측을 위해 신경망에 공급할 수 있는 이미지를 형성하는 방법을 설명합니다. 그런 다음 컨볼루션 계층의 결과 기능을 순환 신경 계층에 통합하여 구조를 학습하고 추가 종속성을 캡처할 수 있습니다. 최종 계층은 임계값 반환을 사용하는 분류 설정을 기반으로 예측을 생성합니다.

Zhang은 제한 주문서 데이터를 사용하여 예측을 수행하는 데 사용되는 네트워크 아키텍처에 대해 계속 논의합니다. 이 경우 처음 두 구성 요소는 개별 거래자의 메시지로 대체되고 컨볼루션 계층은 LSTM 계층 또는 주의 계층으로 대체됩니다. Zhang은 단일 지점 예측을 용이하게 하고 인코더-디코더 구조를 포함하는 주의 메커니즘을 간략하게 설명합니다. 인코더는 입력 시간에서 의미 있는 특징을 추출하여 숨겨진 상태로 요약하고 디코더는 예측을 생성합니다. 정규화는 중간 가격을 기준으로 주문이 매수인지 매도인지를 결정하는 데 사용됩니다.

후속 섹션에서 Zhang은 유사한 규모로 정규화되고 단순 선형 모델, 다층 퍼셉트론, LSTM 및 주의 모델과 같은 다양한 모델을 사용하여 테스트된 자산 그룹으로 훈련된 모델의 결과를 제시합니다. 책 데이터와 순수한 주변 데이터. 결과는 앰비언트 데이터의 예측 신호가 제한 주문서의 신호와 상관관계가 낮다는 것을 나타내며, 이는 이 두 소스의 조합이 신호 분산을 줄이고 다양화의 이점을 얻을 수 있으며 우수한 예측 신호를 생성할 수 있음을 시사합니다. 따라서 두 데이터 유형의 예측 신호를 평균화하는 앙상블 모델이 최상의 성능을 나타냅니다.

Zhang은 MBO(market-by-order) 데이터를 예측에 통합할 때 얻을 수 있는 잠재적 이점에 대해 논의하고 이 데이터로 기능 엔지니어링을 수행할 수 있는 능력을 강조합니다. 그는 2~20틱 전방 범위의 예측 범위에 대한 결과를 제시하고 50~100틱 전방에서 관찰된 유사한 행동에 주목합니다. Zhang은 또한 개선된 일반화를 위해 모든 도구를 사용하여 단일 모델을 교육할 수 있는 가능성과 런던 증권 거래소의 MBO 데이터 소스를 포함하여 청중의 질문에 답합니다. PNL 대신 NF1에 초점을 맞추는 것에 대한 청중의 질문에 대해 Zhang은 PNL이 더 적절한 성공 척도라는 데 동의하고 인정합니다.

Zhang은 원시 신호를 사용하거나 소프트맥스 확률을 기반으로 임계값을 설정하는 것과 같이 예측 신호의 사용과 예측 신호를 정의하는 다양한 방법에 대해서도 설명합니다. 그는 지정가 주문서 데이터 대신 MBO(market by order) 데이터 모델링을 제안하고 LSTM 유지 메커니즘을 포함한 딥 러닝 모델을 테스트하는 논문의 핵심 사항을 요약합니다. 결과는 MBO와 지정가 주문서 데이터의 조합이 최상의 결과를 가져온다는 것을 나타냅니다. Zhang은 시장 움직임 간의 자동 상관 관계, 노이즈 거래 필터링, 제한 주문 사진 모델링에 CNN 계층을 사용하는 동기에 관한 청중의 질문에 답합니다.

다음 섹션에서 Zhang은 컨볼루션 신경망(CNN)을 사용하여 효과적으로 탐색할 수 있는 공간 구조로 오더북을 처리하는 방법을 설명합니다. CNN을 사용하여 각 가격 수준에서 정보를 추출하는 것은 예측에 유용한 것으로 입증되었습니다. LSTM(Long Short-Term Memory) 레이어는 데이터의 시간적 흐름을 유지하고 예측을 위해 과거 이벤트를 요약하므로 다중 레이어 퍼셉트론보다 선택됩니다. Zhang은 재무 시계열의 특성으로 인해 어텐션 메커니즘을 사용하는 이점이 제한적이라고 말합니다. 이 논문에는 모델에 사용된 하이퍼파라미터에 대한 자세한 설명이 포함되어 있습니다.

Zhang은 신경망 방법에 사용되는 많은 수의 매개 변수와 주식 시장 예측의 효율성에 대한 우려를 해결합니다. 그는 풍부한 매개변수가 비판의 대상이 될 수 있음을 인정하지만 그의 팀은 모델에 특정한 몇 가지 매개변수만 미세 조정했다고 강조합니다. 그들은 아직 입찰-매도 스프레드를 성공의 기준으로 사용하는 것을 고려하지 않았지만 추가 탐색의 가능성을 인식하고 있습니다. Zhang은 그들의 모델이 거래 실행 및 시장 조성 전략에 실용적인 가치를 지니고 있다고 믿습니다. 그러나 그는 스프레드를 교차하려는 경우 오더북 데이터의 빈번한 업데이트로 인해 거래 실행이 복잡해질 수 있으므로 데이터 다운샘플링이 필요할 수 있다고 언급합니다. 마지막으로 Elo 지정가 주문서를 모델링할 때 개별 주문 크기에 대한 정보를 포함하지 않고 각 가격 수준에서 총 크기를 집계합니다.

결론 섹션에서 Zhang은 주문별 시장과 가격 데이터별 시장의 차이점을 설명합니다. 주문별 시장 데이터는 가격별 시장 데이터로는 불가능한 개별 주문을 추적할 수 있습니다. 적절한 기능 엔지니어링을 통해 주문별 시장 데이터는 추가 정보를 제공하고 알파를 생성할 수 있습니다. Zhang은 또한 자신의 모델이 크기를 변경하지 않고 특정 지정가 주문의 가격 수정을 처리하는 방법에 대해서도 설명합니다. 가격이 업데이트된 각 새 메시지는 새 업데이트로 처리되어 데이터 세트를 보강합니다.

전반적으로 Zihao Zhang의 프레젠테이션은 주문 데이터를 통해 시장에 딥 러닝을 적용하는 방법을 보여주며 시장 미세 구조 데이터에서 가치 있는 통찰력을 추출할 수 있는 잠재력을 강조합니다. 주문별 시장과 지정가 주문서 데이터를 결합하여 Zhang의 팀은 신호 분산 감소와 개선된 예측 신호 생성을 시연했습니다. 그들의 작업은 거래 실행 및 시장 조성 전략을 향상시켜 금융 시장 분석 분야에 귀중한 기여를 할 것을 약속합니다.

  • 00:00:00 Oxford Man Institute의 박사후 연구원이자 기계 학습 연구 그룹의 일원인 Zihao Zhang이 Brian Ling 및 Stefan Loren과 함께 주문 데이터를 기반으로 시장에 딥 러닝 모델을 적용한 최근 작업을 발표합니다. Zhang은 지정가 주문서와 주문별 시장 데이터를 포함하여 시장 미세 구조 데이터에 대한 간략한 소개로 시작합니다. 그는 후자가 틀림없이 가장 세분화된 정보 소스이며 지정가 주문서 데이터에 비해 더 많은 업데이트와 이벤트를 제공하지만 현재 문헌에서는 대체로 무시되고 있다고 강조합니다. Zhang은 딥 러닝 모델을 소개하고 이러한 유형의 데이터를 위해 설계한 네트워크 아키텍처에 대해 설명합니다. 그는 또한 그들의 작업이 높은 빈도의 움직임을 예측하기 위해 주문별 시장 데이터를 사용하는 최초의 예측 모델이며 알파 발견의 영역을 확장하는 직교 정보 소스를 제공한다고 강조합니다.

  • 00:05:00 Zihao는 특정 시점에 금융 상품에 대한 모든 미결 지정가 주문 기록인 지정가 주문서의 개념을 설명합니다. 그는 차트 데이터가 빈도가 낮은 정보를 제공하지만 주식 가격은 실제로 지정가 주문서로 표시되는 다변량 시계열임을 강조합니다. Zhang은 지정가 주문서가 제출된 주문을 기반으로 다양한 가격 수준으로 분류되는 방법과 각 가격 수준은 서로 다른 거래자에 의해 분할된 많은 소액 주문으로 구성되어 있다고 설명합니다. 또한 새 메시지가 수신될 때 주문서가 업데이트되는 방식에 대해 설명합니다. 새 메시지는 새 위치를 추가하거나 기존 주문을 취소하거나 기존 주문을 업데이트할 수 있습니다. Zhang은 지정가 주문서에서 파생된 데이터가 특정 금융 상품에 대한 전반적인 수요와 공급 관계를 보여주며, 그의 초점은 주문 배치 및 취소에 대한 정보가 포함된 주문별 시장 데이터를 사용하는 것이 가능한지 확인하는 것입니다. 예측을 위한 추가 정보를 제공합니다.

  • 00:10:00 Zihao Zhang이 시장 움직임을 예측하기 위해 딥 러닝에 시장 주문 데이터를 사용하는 방법에 대해 설명합니다. 시장 주문 데이터의 메시지 문자열은 지정가 주문서보다 차원이 낮지만 예측에 사용할 수 있는 추가 정보를 제공합니다. Zhang은 과거 사건의 이미지를 2D 매트릭스로 형성하고 예측을 위해 신경망에 입력할 수 있다고 설명합니다. 그런 다음 컨볼루션 계층의 결과 기능을 순환 신경 계층에 넣어 구조와 추가 종속성을 학습할 수 있습니다. 최종 계층은 임계값 반환을 사용하는 분류 설정을 기반으로 예측을 출력합니다.

  • 00:15:00 Oxford-Man Institute의 Zihao Zhang이 지정가 주문서 데이터에서 예측하는 데 사용되는 네트워크 아키텍처에 대해 설명합니다. 처음 두 구성 요소는 개별 거래자의 메시지로 대체되고 컨볼루션 계층은 LSTM 계층 또는 주의로 대체됩니다. 층. Zhang은 또한 이 경우 단일 포인트 예측에 사용되며 인코더와 디코더 구조를 포함하는 어텐션 메커니즘을 간략하게 설명합니다. 인코더는 입력 시간에서 의미 있는 기능을 추출하고 숨겨진 상태로 요약하며 디코더는 예측을 생성합니다. . 정규화는 중간 가격을 기준으로 주문이 매수인지 매도인지를 결정하는 데 사용됩니다.

  • 00:20:00 비디오의 이 섹션에서 Zihao Zhang은 자산 그룹으로 훈련되고 유사한 규모로 정규화되고 단순 선형 모델, 다층 인식, LSTM 및 제한 주문 그룹 데이터와 순수 주변 데이터를 모두 사용하는 어텐션 모델. 결과는 주변 데이터의 예측 신호가 제한 주문서의 신호와 덜 상관관계가 있음을 보여주며, 이 두 신호의 조합이 신호 분산을 줄이고 다양화의 이점을 얻을 수 있으며 더 나은 예측 신호를 생성할 수 있음을 시사합니다. 따라서 두 데이터 유형의 예측 신호를 평균화하는 앙상블 모델이 최상의 성능을 제공합니다.

  • 00:25:00 Zihao Zhang은 MBO(market-by-order) 데이터를 예측에 통합할 때 얻을 수 있는 잠재적 이점에 대해 논의하고 데이터로 기능 엔지니어링을 수행할 수 있는 기능에 대해 언급합니다. 2~20틱 전방의 예측 범위에 대한 결과가 표시되었으며, 50틱 및 100틱 전방에 대해 유사한 동작이 나타났습니다. Zhang은 또한 개선된 일반화를 위해 모든 도구를 사용하여 단일 모델을 교육하는 기능과 런던 증권 거래소의 MBO 데이터 출처를 포함하여 청중 구현 질문에 답변합니다. 한 청중은 PNL 대신 NF1에 초점을 맞춘 질문을 했습니다. Zhang은 이에 동의하고 PNL이 더 관련성 높은 성공 척도임을 인정했습니다.

  • 00:30:00 Zihao Zhang은 원시 신호를 사용하거나 softmax에서 확률에 대한 임계값을 설정하는 것과 같이 예측 신호의 사용과 예측 신호를 정의할 수 있는 다양한 방법에 대해 설명합니다. 그는 제한 주문서 데이터 대신 주문별 시장(MBO) 데이터 모델링을 제안하고 LSTM 유지 메커니즘을 포함한 딥 러닝 모델을 테스트하는 논문을 요약합니다. 결과는 MBO와 지정가 주문서 데이터의 조합이 최상의 결과를 제공한다는 것을 보여줍니다. Zhang은 또한 시장 움직임 간의 자동 상관 관계, 잡음 거래 필터링, 제한 주문 그림 모델링에서 CNN 레이어를 사용하는 동기에 대한 청중의 질문에 답합니다.

  • 00:35:00 비디오의 이 섹션에서 Oxford-Man Institute의 Zihao Zhang은 주문서를 동일한 레이어를 사용하여 탐색할 수 있는 공간 구조로 취급할 수 있는 방법을 설명합니다. CNN(Convolutional Neural Network)을 사용하여 각 가격 수준에서 정보를 추출하는 것이 예측에 도움이 되는 것으로 나타났습니다. LSTM(Long Short-Term Memory) 레이어는 시간 흐름을 왜곡하지 않고 예측을 위해 과거 이벤트를 요약하기 때문에 다중 레이어 인식보다 선택되었습니다. 주의 메커니즘을 사용하는 이점은 재무 시계열의 속성으로 인해 제한적인 것으로 나타났습니다. 이 백서에는 사용된 하이퍼파라미터에 대한 자세한 설명이 포함되어 있습니다.

  • 00:40:00 Zihao Zhang이 신경망 방법에 사용되는 매개변수의 수와 주식 시장 예측의 효율성에 대해 논의합니다. 그는 많은 수의 매개변수가 신경망 방법에 대한 비판이 될 수 있지만 그와 그의 팀은 특정 모델에 대해 몇 가지 매개변수만 조정했다고 지적합니다. 그들은 입찰-매도 스프레드를 성공의 기준으로 사용하는 것을 고려하지 않았지만 더 탐구할 수 있음을 인정합니다. Zhang은 그들의 모델의 적용이 거래 실행 및 시장 조성 전략에 유용하다고 믿지만 스프레드를 교차하려면 장부 데이터가 너무 많은 업데이트를 가질 수 있기 때문에 거래를 하기 위해 데이터를 다운샘플링해야 할 수도 있습니다. 거래를 하십시오. 마지막으로 Elo 지정가 주문서를 모델링할 때 개별 주문 크기에 대한 정보를 포함하는 대신 각 가격 수준에서 총 크기를 집계합니다.

  • 00:45:00 이 섹션에서는 Oxford-Man Institute의 Zihao Zhang이 주문별 시장과 가격 데이터별 시장의 차이점을 설명합니다. Market by order 데이터는 개별 주문을 추적할 수 있게 해주며, 가격 데이터로는 시장이 불가능합니다. 적절한 기능 엔지니어링을 통해 주문별 시장 데이터는 추가 정보를 제공하고 알파를 생성할 수 있습니다. 또한 Zhang은 자신의 모델이 크기를 변경하지 않고 특정 지정가 주문의 가격 수정을 처리하는 방법에 대해 설명합니다. 가격이 업데이트된 각각의 새 메시지는 새 업데이트로 취급된다고 그는 설명합니다.
Zihao Zhang (Oxford-Man Institute) - "Deep Learning for Market by Order Data"
Zihao Zhang (Oxford-Man Institute) - "Deep Learning for Market by Order Data"
  • 2021.10.27
  • www.youtube.com
Next up in the Cornell-Citi webinar series is Dr. Zihao Zhang, who spoke on Tuesday, Oct. 26.Abstract: Market by order (MBO) data - a detailed feed of indiv...
 

Vineel Yellapantula(Cornell MFE '20): "SEC 파일링의 텍스트 정량화"


Vineel Yellapantula(Cornell MFE '20): "SEC 파일링의 텍스트 정량화"

Vineel Yellapantula는 특히 MD&A 섹션에 초점을 맞춘 SEC 파일링에서 발견된 텍스트 정보를 기반으로 주식 거래에 자연어 처리(NLP) 기술을 적용하는 것과 관련된 그의 여름 프로젝트를 발표합니다. 이 프로젝트의 목표는 미국 시장에 존재하는 430개 주식의 각 보고서에 점수를 부여하고 점수를 기반으로 5개의 분위수로 그룹화하여 성과를 분석하는 것입니다. Yellapantula는 코사인 및 Jaccard 유사성과 같은 전통적인 방법을 사용하여 텍스트 간의 유사성 점수를 결정하며 Jaccard 유사성은 시간이 지남에 따라 더 일관성이 있음이 입증됩니다. 또한 텍스트 데이터 세트에서 Keras와 순환 신경망(RNN)을 사용하여 감정 분석 모델을 생성하여 그의 모델에서 87.5%의 인상적인 정확도를 달성하는 방법을 탐구합니다.

프레젠테이션 중에 Yellapantula는 각 특정 문제에 적합한 방법을 선택하고 추가 데이터를 통합하여 결과를 개선하는 것이 중요하다고 강조합니다. 그는 텍스트 데이터, 특히 10-K 파일링 내에서 사용할 수 있는 풍부한 정보를 강조하고 이전 문서를 사용하여 개발된 요소가 현재 문서에만 의존하는 것보다 더 효과적일 수 있다고 언급합니다. Yellapantula는 글러브, word2vec, BERT 및 RNN을 포함하여 텍스트 데이터로 딥 러닝 기술을 활용하기 위한 다양한 대안을 지적합니다. 그는 또한 모델의 예측력을 향상시키기 위해 8-K 파일링 및 뉴스 주기와 같은 더 많은 데이터 소스를 통합할 것을 제안합니다. 그러나 그는 자신의 연구에서 2007년부터 2020년까지 지수에 나타난 실적이 좋은 주식에 초점을 맞추기 때문에 선택 편향이 있음을 인정합니다.

감정 분석 전용 섹션에서 Yellapantula는 Keras와 함께 RNN을 사용하여 모델을 만드는 과정을 설명합니다. 이 단계에는 의미를 이해하기 위해 텍스트를 토큰화하고, 임베딩을 통해 차원을 줄이고, 감정 분류를 위해 시그모이드 기능이 있는 LSTM 레이어와 밀집 레이어를 사용하는 작업이 포함됩니다. 그는 IMDB 리뷰를 사용하여 이 접근 방식의 적용을 시연하고 리뷰 길이를 500단어로 제한하고 짧은 리뷰는 일관성을 유지하기 위해 0으로 채웁니다. 엄격한 평가를 통해 Yellapantula는 감정 분석 모델로 87.5%의 정확도를 달성합니다.

또한 Yellapantula는 요인의 효율성과 시간 경과에 따른 일관성을 결정할 때 정보 상관관계의 중요성을 강조합니다. 그는 안정적인 보고 기능을 갖춘 회사가 실적이 좋은 경향이 있다는 연구 결과를 언급하며 이를 탐색할 유망한 요소로 나타냅니다. 끝으로 Yellapantula는 관객들의 관심에 감사를 표하며 앞으로의 활약을 기대한다.

Vineel Yellapantula의 프로젝트는 NLP 기술을 적용하여 SEC 파일링의 텍스트 정보에서 귀중한 통찰력을 추출하는 방법을 보여줍니다. 보고서에 점수를 매기고 실적을 분석함으로써 그의 작업은 언어가 주식 거래에 미치는 영향을 이해하는 데 기여합니다. 또한 RNN을 사용한 감정 분석에 대한 그의 탐구는 텍스트 데이터에서 감정을 캡처하는 딥 러닝의 잠재력을 보여줍니다. 신중한 방법론 선택과 추가 데이터 소스 통합을 통해 Yellapantula는 이러한 모델의 정확성과 효율성을 향상할 수 있는 기회를 강조합니다.

  • 00:00:00 이 섹션에서 Vineel Yellapantula는 자연어 처리(NLP) 기술을 사용하여 SEC 제출, 특히 MD&A 섹션에 있는 텍스트 정보를 기반으로 주식을 거래하는 여름 프로젝트에 대해 설명합니다. 이 프로젝트는 미국 시장에 존재하는 430개 주식의 각 보고서에 대한 점수를 찾고 점수를 기반으로 5개의 분위수로 그룹화한 후 성과를 분석하는 데 중점을 두었습니다. Vineel은 코사인 및 자카드 유사성과 같은 전통적인 방법을 사용하여 텍스트 간의 유사성에 대한 점수를 찾았으며 자카드 유사성은 시간이 지남에 따라 더 일관성이 있음이 입증되었습니다. Vineel은 또한 RNN과 같은 딥 러닝 기술을 이러한 목적으로 사용할 수 있다고 언급합니다.

  • 00:05:00 이 섹션에서는 Vineel Yellapantula가 텍스트 데이터 세트의 케라와 함께 순환 신경망(RNN)을 사용하여 감정 분석 모델을 만드는 방법을 설명합니다. 이 프로세스에는 텍스트를 토큰화하여 의미를 이해하고 임베딩을 사용하여 차원을 줄인 다음 LSTM 레이어와 시그모이드 기능이 있는 dense 레이어를 사용하여 텍스트의 감정을 분류하는 작업이 포함됩니다. Vineel은 IMDB 리뷰를 사용하여 데이터를 처리하는 방법을 보여줍니다. 리뷰 길이를 500단어로 제한하고 길이의 일관성을 유지하기 위해 짧은 단어는 0으로 채웁니다. 그는 자신의 모델로 87.5%의 정확도를 달성할 수 있었습니다.

  • 00:10:00 비디오의 이 섹션에서 Vineel Yellapantula는 특히 10-K 파일링 내에서 텍스트 데이터를 통해 사용할 수 있는 풍부한 정보에 대해 설명합니다. 그는 이러한 파일링을 통해 많은 요소를 개발할 수 있으며 이전 문서를 사용하는 요소가 현재 문서에만 집중하는 요소보다 더 효과적일 수 있다고 지적합니다. 또한 Yellapantula는 글러브, word2vec, BERT 및 RNN과 같이 텍스트 데이터로 딥 러닝을 사용하기 위한 다양한 대안이 있다고 지적합니다. 그는 특정 문제에 대한 올바른 방법을 선택하는 것이 중요하며 8-K 파일링 및 뉴스 사이클과 같은 더 많은 데이터를 통합하면 더 나은 결과를 얻을 수 있다고 강조합니다. 마지막으로 Yellapantula는 2007년부터 2020년까지 지수에 나타난 실적이 좋은 주식에 초점을 맞추었기 때문에 그의 연구에 약간의 선택 편향이 있음을 인정합니다.

  • 00:15:00 이 섹션에서 Vineel Yellapantula는 시간이 지남에 따라 요인의 일관성뿐만 아니라 요인이 작동하는지 여부를 결정할 때 정보 상관 관계의 중요성에 대해 설명합니다. 그는 또한 안정적인 보고 기능을 갖춘 회사가 실적이 좋다는 연구 결과를 언급하며 이를 탐색할 좋은 요소로 지적합니다. 관객 여러분의 관심에 감사드리며 가을에 뵐 수 있기를 기대합니다.
Vineel Yellapantula (Cornell MFE '20): "Quantifying Text in SEC Filings"
Vineel Yellapantula (Cornell MFE '20): "Quantifying Text in SEC Filings"
  • 2021.05.12
  • www.youtube.com
CFEM alumnus Vineel Yellapantula discusses his summer project at AbleMarkets under Prof. Irene Aldridge, “Quantifying Sentiment in SEC Filings.” By utilizing...
 

Peter Carr (NYU) "Stoptions" 위업. Lorenzo Torricelli(파르마 대학교)



Peter Carr (NYU) "Stoptions" 위업. Lorenzo Torricelli(파르마 대학교)

Peter Carr는 선물 계약과 풋 옵션의 기능을 결합한 "스톱션"이라는 금융 상품을 소개합니다. Stoption을 통해 소유자는 버뮤다 풋 옵션 요소를 통합하여 불리한 가격 변동을 피할 수 있습니다. Carr는 옵션의 개념을 설명하고 이와 관련된 다른 층이 있는 3일 옵션의 예를 제공합니다. 그런 다음 그는 1일 및 2일 중지의 평가를 논의하기 위해 이동합니다. 후자는 2개의 층이 있고 첫째 날 또는 둘째 날에 운동할 수 있는 유연성이 있습니다.

Carr는 역방향 재귀, 결합된 풋의 평가 및 의사 합계 사용을 탐구하여 더 오랜 기간 동안 정지 평가를 탐구합니다. 그는 결합된 풋 옵션의 가격 변동을 나타내기 위해 물류 분포를 활용할 것을 제안합니다. 스톱션의 가치는 "등가격" 옵션에 대한 간단한 공식을 사용하여 얻을 수 있으며 평가 및 헤징은 분석적으로 수행할 수 있습니다.

Carr는 시장에서 그러한 옵션을 채택하는 것과 관련된 문제를 논의하면서 기사를 마무리합니다. 그는 이러한 제품에 대한 구매자와 판매자를 찾는 것의 중요성을 강조하고 잠재적인 구매자 및 판매자와 대화를 나눕니다. 또한 Carr는 중지 모델이 Black-Scholes 및 Bachelier와 같은 기존 모델의 대안이지만 모든 상황에 최적으로 적합하지 않을 수 있음을 인정합니다. 그럼에도 불구하고 그는 그들의 모델이 금융에서 특별한 의미를 지닌 다수의 바이너리 연산을 포착하는 것을 목표로 한다고 강조합니다.

이후 섹션에서 Carr와 Lorenzo Torricelli는 접합 패러다임과 물류 분포를 사용하여 "정지" 모델을 제안합니다. 이 모델은 단일 매개변수를 사용하여 용어 구조에 유연성을 제공하여 한 번에 다양한 용어 구조를 수용할 수 있습니다. 그러나 내재 변동성 그래프가 하향으로 기울기 때문에 시장에 완벽하게 맞지 않을 수 있습니다. 저자는 모델의 한계를 인정하고 모델이 포착하려는 금융 분야의 무수한 바이너리 연산을 인식합니다. 그들은 스트라이크와 단일 옵션 사이의 선택성과 유사 합산을 통한 반복 선택성에 대해 논의합니다. 이 섹션은 상호 감사와 서로의 세미나 참석에 대한 기대로 끝납니다.

  • 00:00:00 Peter Carr가 선물 계약과 풋 옵션을 혼합한 새로운 금융 상품인 "스톱션"을 소개합니다. 중지에는 기본 자산과 고정 기간 및 일일 모니터링이 있으며 소유자는 기본 자산의 각 가격 변동을 발생시킵니다. 스톱션은 풋 옵션 요소 덕분에 소유자가 불리한 가격 변동을 피할 수 있다는 점에서 선물 계약과 다릅니다. 풋은 Bermudan입니다. 즉, 소유자는 하루가 끝날 때 행사할 수 있으며 그날의 가격 변동을 시간의 함수일 수 있는 계약상 지정된 상수로 대체할 수 있습니다.

  • 00:05:00 Peter Carr가 옵션의 개념과 옵션이 금융 계약에서 어떻게 작동하는지 설명합니다. 옵션은 스톱 슈팅 계약이 하루 이상 있는 한 가격 변동에 대한 노출을 언제 멈출지 선택할 수 있는 금융 상품으로 유연성을 제공합니다. 옵션은 한 번만 행사할 수 있으며 해당 시점에 옵션을 행사해야 합니다. 옵션이라는 용어는 행사를 통해 기초자산에 대한 노출을 중단할 시점을 의미합니다. Carr는 3일 옵션의 예를 통해 이 개념을 설명하고 이 옵션과 관련된 세 가지 다른 층을 설명합니다. 그런 다음 옵션을 행사할 때 계약이 만료되며 이는 한 번만 발생해야 합니다. 이러한 계약은 현재 거래되지 않지만 많은 금융 계약에 포함되어 있습니다.

  • 00:10:00 Peter Carr는 "stoptions"라는 버뮤다 운동 스타일과 계약의 예를 논의합니다. 완전히 거래되지는 않지만 스톱션은 버뮤다 스왑션과 가격 수준에 기재된 옵션과의 차이점을 이해하는 데 도움이 될 수 있습니다. iid 가격 변동을 가정함으로써 정지 평가는 기능 반복으로 축소되고 가격 변동에 대한 특정 분배 가정을 부과함으로써 평가는 의사 추가로 축소됩니다. 스탑션에서 얻은 통찰력은 유동적으로 거래되는 버뮤다 옵션에 사용할 수 있으며 Carr는 계속해서 1일 및 2일 스탑션의 평가를 설명합니다. 1일 스탑션은 고정된 층수를 지불하는 반면, 2일 스탑션은 2개의 층을 가지며 첫째 날 또는 둘째 날 행사할 수 있습니다.

  • 00:15:00 이 섹션에서 Peter Carr는 연습이 그 자리에서 완료되면 둘째 날이 끝날 때 보상에 대해 논의합니다. u1이라고 하는 이 값은 첫날이 끝날 때 계산됩니다. Carr는 u1이 첫날의 끝에서 알려진 상수이기 때문에 첫날의 끝에서 가정하는 것이 좋을 수도 있다고 지적합니다. 또한 Carr는 시간 0에서 u1을 제외하고 a1 보수를 a1 - u1로 변경할 것을 제안합니다. 이것은 u1이 풋 보수에 추가된 결합된 풋 또는 u1에 쓰여진 풋과 유사하게 보수를 만듭니다. Carr는 일단 바닐라 옵션을 평가하는 모델이 존재하면 2일 옵션을 포함한 여러 날 옵션은 임베디드 풋을 계산하여 평가할 수 있다고 설명합니다.

  • 00:20:00 이 섹션에서는 NYU의 Peter Carr와 파르마 대학의 Lorenzo Torricelli가 가격 증분이 통계적으로 서로 독립적이고 동일한 분포를 갖는다고 가정하여 2일 및 3일 옵션의 가치를 평가하는 방법에 대해 논의합니다. 일련의 무작위 변수에 대해 iid(독립적이고 동일하게 분포됨)로 알려진 통계의 일반적인 가정을 사용합니다. 2일 옵션에 대한 기혼 풋의 가치를 평가하기 위해 그들은 a1이라고 하는 보수의 알려진 부분과 a2라고 하는 기초 자산의 현재 가격을 포함하는 표기법을 사용합니다. 3일 옵션의 경우 cv로 표시하는 연속 값을 도입하고 동적 프로그래밍을 사용하여 값을 계산합니다.

  • 00:25:00 Peter Carr는 역방향 재귀 과정과 결합된 풋의 평가를 설명합니다. 문제에 필요한 모든 불확실성이 둘째 날이 끝날 때 해결되기 때문에 그는 둘째 날부터 시작합니다. 그는 행사 기회가 한 번 남아 있는 두 번째 날(즉, 세 번째 날)에 지속 가치를 설정한 다음 첫째 날로 돌아가 보수의 가치와 지속 가치를 계산합니다. 그런 다음 가치 평가 날짜의 0시점으로 돌아가 연속 가치와 결합된 풋의 가치인 보수를 계산합니다. 랜덤 보수의 평균은 이전에 계산된 결합된 풋 값이며 가격 변동 분포에 기여하는 매개변수는 시간 0에서 알려져 있습니다.

  • 00:30:00 이 섹션에서 Peter Carr는 기본 행사가 A2가 있는 또 다른 기혼 풋이 있는 행사가 A1이 있는 기혼 풋의 평가에 대해 설명합니다. 그는 이 평가에는 다른 시간에 다를 수 있는 매개변수를 사용하여 함수를 반복하고 함수가 자체적으로 구성되도록 하는 것이 포함된다고 설명합니다. 반복되는 함수는 유럽 스타일의 가치 함수를 적용한 일일 바닐라 결혼이며 Carr는 이 값을 설명하고 닫힌 형식으로 반복하는 함수는 연관 함수 방정식이라는 것을 이용하여 찾을 수 있다고 지적합니다. 결합된 풋 가치 함수를 직접 평가하고 연관성 함수 방정식을 풀도록 요구함으로써 Breeden-Litzenberger 결과를 사용하여 위험 중립 분포를 결정할 수 있습니다. 이 섹션은 하나의 인수와 가역 g의 함수로 결합된 풋 값을 결정할 수 있다는 설명으로 결론을 내립니다.

  • 00:35:00 Peter Carr는 함수에서 두 인수의 조합인 의사 합계의 개념을 설명합니다. 가역 함수를 사용하여 이 수량을 사용하여 바닥의 반복 의사합을 통해 n 기반 옵션의 값을 찾을 수 있습니다. 이 방법을 차익 거래 없이 만들려면 함수를 신중하게 선택하고 보상에 대한 위험 중립적인 기대로 표현해야 합니다. Carr는 이 방법의 생성기가 모든 밑의 로그여야 하고 스칼라 b가 양수여야 함을 밝혔습니다. 결혼한 풋은 또한 자연 로그 g 역을 사용하여 적절하게 평가되어야 하며, 분포 함수를 얻기 위해서는 스트라이크에 대해 두 번 미분해야 합니다. 궁극적으로 이 방법은 표준편차가 아니라 표준편차에 비례하는 비례 계수 b로 뒷받침됩니다.

  • 00:40:00 Peter Carr는 결합된 풋 옵션의 가격 변동을 나타내는 물류 분포의 사용에 대해 논의합니다. 그는 두 가지 기본 구성 요소가 있는 금융 상품의 지수를 사용하여 행사 가격 a1과 기본 평균 a2가 있는 기혼 풋에 대한 공식을 도출합니다. 그는 이것을 의사 합(pseudo-sum)이라고 부르며 실수 집합을 확장하여 마이너스 무한대를 중립 요소로 포함합니다. 그는 이것이 차익 거래가 없는 옵션 평가와 지수 꼬리가 있는 대칭 로지스틱 분포에서만 가능한 가환성 모노이드 구조를 생성한다고 설명합니다. 로지스틱 분포는 명시적 누적 분포 함수를 허용하며 정규 분포보다 친숙한 것으로 간주됩니다. Carr는 물류 분포의 규모가 옵션 만기까지의 시간이 증가하는 함수라고 제안합니다.

  • 00:45:00 Peter는 옵션과 스왑의 기능을 결합한 계약인 "스톱션"에 대해 설명합니다. 정지는 하나의 로지스틱 랜덤 변수를 다른 변수로 교환하는 것을 포함하며 변수는 독립적이고 동일하게 분포됩니다. 경유지를 n일로 평가하려면 로지스틱 분포의 폭을 시간 지평의 길이에 연결하는 함수 b/t를 지정해야 합니다. 바닥이 있는 버뮤다 스톱션의 가치는 간단한 공식으로 제공되며 평가 및 헤징은 분석적으로 수행할 수 있습니다. "등가격" 스톱션의 경우 가치는 시간의 로그에 따라 간단한 방식으로 증가합니다.

  • 00:50:00 Peter Carr는 iid 증분을 가정하고 평가를 반복 함수 평가로 줄이는 "중지" 가격 책정 모델에 대해 논의합니다. 공통 증분에 대한 로지스틱 분포를 가정함으로써 모델은 로그 합계 지수 함수라고 하는 특정 종류의 의사 합계로 더욱 단순화됩니다. 기본 유가 증권 가격은 유한 책임으로 인해 음수가 아닌 실제 가격이 되어야 합니다. 이 모델은 주식으로 확장되어 옵션 계약을 재정의하여 가격 증분을 추가하는 대신 상대적 가격을 곱할 수 있습니다. 양의 무작위 변수를 지원하는 결과 분포를 켤레 검정력 디검이라고 합니다. 이는 음의 왜도가 있는 두꺼운 꼬리 분포이므로 좋은 선택입니다. 이 모델에 대한 향후 연구 기회가 있으며 연준 회의와의 동기화된 계약과 같은 실제 사용에 적용될 수 있습니다.

  • 00:55:00 NYU의 Peter Carr 교수가 시장에서 일종의 옵션 채택과 구매자와 판매자를 찾는 과정에 대해 논의합니다. 그는 옵션 구매에 관심을 보인 Bank of America의 외래 상품 트레이더와 보험 회사 또는 연금 계획과 같은 가능한 판매자와의 대화에 대해 이야기합니다. 입양 과정에는 구매자를 찾는 과정이 포함되며 Peter는 이와 관련하여 보험 회사에서 일하는 친구와 Zoom 통화를 계획하고 있다고 말합니다. 대화는 물류 유통 및 관련 프로세스를 기반으로 하는 재무 모델에 대한 Lorenzo Torricelli의 논의로 끝납니다.

  • 01:00:00 이 섹션에서 Peter Carr는 로그 물류, 왜곡 물류 및 물류 반품 프로세스를 포함하는 포지티브 모델의 로그 반품 및 모델의 반품에 대한 추가 부담금 구조의 기술적 세부사항에 대해 논의합니다. 그는 이러한 프로세스가 순수한 점프이며 무한히 나눌 수 있는 시간군으로 간주될 수 있다고 설명합니다. 정리는 독립적인 증분으로 확률적으로 연속적인 추가 프로세스의 존재를 보장합니다. 또한 이 추가 프로세스는 보안 분배 공식의 내재된 가격 분배를 지원합니다. 그런 다음 Carr는 이 프로세스가 자연스럽게 시장이 되는 방식과 간단한 가격 책정 공식을 지원하는 바람직한 속성을 보유하는 방식을 설명합니다. 마지막으로 그는 물류 가격 모델과 표준 정규 모델의 수치 테스트 및 밀도 비교 결과를 제시합니다.

  • 01:05:00 Peter Carr가 CPDA 모델에서 정규 분포와 로지스틱 분포의 모양 차이에 대해 설명합니다. 그는 CPDA 모델에서 분포의 왜도와 모양이 시간에 따라 변하는 반면 일반 세계에서는 이런 일이 발생하지 않는다는 점에 주목합니다. 정규분포와 로지스틱분포 사이의 비교를 볼 때, 그는 분포가 매우 유사하지만 첨도가 분명히 인정될 수 있다고 말합니다. 그는 또한 누적 시스템 구조의 결과를 보여줍니다. 여기에서 그는 폭발하는 변형 및 단기간의 매우 가파른 왜도 증가와 같은 훨씬 더 유연한 모양을 생성할 수 있음을 관찰합니다. 마지막으로, 그는 cpda 모델의 내재 변동성 표면에 대해 논의하며 여기서 그는 변동성 표면이 몇 가지 매개변수만으로 유연할 수 있다는 점에 주목합니다.

  • 01:10:00 NYU의 Peter Carr와 파르마 대학의 Lorenzo Torricelli가 켤레 패러다임과 로지스틱 분포를 사용하여 단 하나의 매개변수로 완전히 유연한 용어 구조를 생성하는 제안된 "중지" 모델에 대해 논의합니다. 하나의 매개변수는 더 많은 폭과 더 많은 음의 왜도를 동시에 생성하지만 모멘트 평균이 존재하지 않도록 하려면 0과 1 사이여야 합니다. 이 모델은 행사가 한 번에 모든 기간 구조를 수용할 수 있지만 행사가에 대한 내재 변동성의 상향 그래프와 달리 하향 그래프를 생성하기 때문에 항상 시장에 최적으로 적합하지 않을 수 있습니다. Carr와 Torricelli는 그들의 모델이 Black-Scholes 및 Bachelier 모델의 대안임을 인정하지만 그들의 모델이 모든 상황에 적합하지 않을 것이라고 예상합니다. 그들은 금융에 특히 중요한 덧셈과 곱셈과 유사한 속성을 가진 셀 수 없이 많은 이항 연산이 있으며, 그들의 모델이 포착하는 것을 목표로 한다고 주장합니다.

  • 01:15:00 이 섹션에서 Peter Carr와 Lorenzo Torricelli는 유럽 옵션과 같은 파업과 단일 사이의 옵션과 반복 의사 합산으로서의 반복 옵션에 대해 논의합니다. 이는 버뮤다의 remutants 옵션입니다. 그들은 배포판을 선택할 때 바이너리 연산 비율이 2개 이상이라는 점을 염두에 두는 것이 중요하다고 언급하고 서로에게 감사하며 서로의 세미나 참석을 기대하며 토론을 마무리합니다.
Peter Carr (NYU) "Stoptions" feat. Lorenzo Torricelli (University of Parma)
Peter Carr (NYU) "Stoptions" feat. Lorenzo Torricelli (University of Parma)
  • 2021.04.14
  • www.youtube.com
Abstract: We introduce a new derivative security called a stoption. After paying an upfront premium, the owner of a stoption accrues realized price changes ...
 

Lorenzo Torricelli(파르마 대학교) - "옵션 가격 책정의 추가 물류 프로세스"



Lorenzo Torricelli(파르마 대학교) - "옵션 가격 책정의 추가 물류 프로세스"

파르마 대학의 저명한 교수인 로렌조 토리첼리(Lorenzo Torricelli)는 가산 물류 모델과 자기 유사 사양을 탐색하여 옵션 가격 책정의 복잡성을 탐구합니다. 계몽적인 프레젠테이션에서 그는 이러한 혁신적인 모델을 사용하여 바닐라 옵션 가격 책정 공식을 설명하고 물류 가격 책정 모델과 기존 일반 모델 간의 밀도 비교를 보여줌으로써 적용 사례를 보여줍니다.

또한 Torricelli는 동종 모델에 대한 용어 구조의 선형 회전에 대해 로지스틱 모델에 대한 누적 용어 구조의 벤치마크 분석을 수행합니다. 그의 통찰력 있는 관찰은 로지스틱 모델이 용어 구조를 형성하는 데 훨씬 더 많은 유연성을 제공하므로 기존 접근 방식에 비해 주목할만한 이점을 제공한다는 것을 보여줍니다.

포괄적인 이해를 제공하기 위해 Torricelli는 이러한 모델과 관련된 변동성 표면도 조사합니다. 그는 로그 수익의 편향된 분포와 로지스틱 분포의 첨도로 인해 모델에 양의 편향이 있음을 지적합니다. 그러나 그는 대칭성을 나타내기 때문에 물류 분포 자체에 편향이 없음을 강조합니다. Torricelli는 모달 매개변수가 변동성 기간 구조에 미치는 영향에 대해 추가로 논의하여 선택한 매개변수화의 개선 가능성을 인정합니다.

결론적으로 Torricelli는 이러한 모델에서 파생된 옵션 공식이 명시적이고 잘 알려져 있어 실제 구현을 용이하게 한다고 강조합니다. 특히 그는 성능 테스트에서 보여준 놀라운 속도를 칭찬합니다. 투명성과 학문적 협력에 대한 증거로 Torricelli는 이러한 모델과 관련된 코드를 공개적으로 액세스할 수 있도록 하여 연구자와 실무자 모두에게 혜택을 줄 계획입니다.

  • 00:00:00 파르마 대학의 로렌조 토리첼리(Lorenzo Torricelli)는 옵션 기능에 대한 평가 방정식과 메리트 부스 평가를 위한 기능을 시작으로 물류 유통에 기반한 재무 모델을 소개합니다. k에 대한 도함수를 취함으로써 묵시적 보안 가격 분포를 구하고, 물류 기능은 실제 가치 기초와 관련이 있는 것으로 보이며 스큐 물류 분포는 메리트 풋 밸류에이션에서 오는 긍정적인 가격 프로세스와 관련됩니다. . 분포의 무한 분할 구조는 시간군으로 간주되며 추가 프로세스의 존재가 확인되어 내재된 가격 분포를 지원하고 진술의 공식을 결정하는 독립적인 증분을 갖는 확률적으로 연속적인 프로세스가 생성됩니다.

  • 00:05:00 파르마 대학의 교수인 Lorenzo Torricelli가 추가 물류 모델과 옵션 가격 책정의 자체 유사 사양에 대해 논의하고 있습니다. 그는 모델을 사용하여 바닐라 옵션의 가격 책정 공식을 설명하고 용어 함수의 가격 측면에서 이를 인스턴스화합니다. 그는 물류 가격 모델과 일반 모델 간의 밀도 비교를 보여주고 정규 분포의 모양은 시간에 따라 변하지 않는 반면 물류 모델의 분포 모양은 시간에 따라 변하는 것을 관찰합니다. 그는 또한 동종 모델에 대한 용어 구조의 선형 혁명에 대해 로지스틱 모델에 대한 누적 용어 구조를 벤치마킹하고 전자를 사용하여 훨씬 더 유연한 모양을 관찰합니다.

  • 00:10:00 Lorenzo Torricelli가 CPDA 모델의 플롯과 SLA 및 CPDA 모델의 내재 변동성 표면에 대해 설명합니다. 변동성 표면은 로그 수익의 왜곡된 분포와 로지스틱 분포의 첨도로 인해 포지티브 모델에 왜곡이 있음을 보여줍니다. 그러나 물류 분포는 대칭적이므로 왜곡이 없습니다. Torricelli는 모달 매개변수가 변동성 기간 구조에도 유사하게 영향을 미치며 선택한 매개변수화에 개선의 여지가 있다고 언급했습니다. 전반적으로 옵션 공식은 명시적이고 알려져 있으며 속도 테스트는 매우 빠릅니다. 코드도 공개됩니다.
Lorenzo Torricelli (University of Parma) - "Additive Logistic Processes in Option Pricing"
Lorenzo Torricelli (University of Parma) - "Additive Logistic Processes in Option Pricing"
  • 2021.04.12
  • www.youtube.com
On April 13th, 2021, as part of the Cornell-Citi Financial Data Science Seminar Series, Lorenzo Torricelli explains his work on logistic models in conjunctio...
 

Yumeng Ding (Cornell MFE '20) - "기계 학습 모델 해석"



Yumeng Ding (Cornell MFE '20) - "기계 학습 모델 해석"

유능한 연구원인 Yumeng Ding은 주가 예측을 위해 기계 학습 모델을 해석하는 영역을 탐구합니다. 포괄적인 분석에서 그녀는 부분 의존도 플롯, 순열 기능 중요도, 에지 통계 및 LIME을 비롯한 다양한 해석 방법을 탐색하여 이러한 모델의 내부 작동 방식을 밝힙니다. Ding은 이러한 방법을 사용하여 주가 예측에서 개별 요인의 기여도와 상호 작용 효과를 밝히는 것을 목표로 합니다.

Ding의 연구는 분류기 및 회귀와 같은 다양한 기계 학습 모델의 입력으로 활용되는 기술, 품질 및 가치의 세 가지 유형의 요소를 중심으로 진행됩니다. 그녀는 앞서 언급한 해석 가능성 방법을 활용하여 이러한 요인과 주가 예측 사이의 복잡한 관계를 해명합니다. 엄격한 백테스트를 통해 Ding은 비선형 모델이 성능 면에서 선형 모델을 능가한다는 사실을 발견했습니다. 또한 그녀는 다양한 요인의 효과가 시간적 변화를 나타내는 것을 관찰하여 주가 예측의 동적인 특성을 강조합니다. 궁극적으로 Ding은 AdaBoost를 특정 시나리오에 가장 적합한 모델로 식별합니다.

중요한 것은 Ding이 기계 학습 모델을 이해하는 데 있어서 해석 가능성 방법의 중요성을 강조한다는 것입니다. 그녀는 벡터 접근 방식이 가장 예측 가능한 상호 작용에 대한 빠른 통찰력을 제공하지만 이러한 상호 작용의 품질을 밝히는 데는 부족하다고 강조합니다. Ding은 더 간단한 상호작용을 효과적으로 시각화하기 위해 2차원 부분 의존도를 사용하는 것의 가치를 강조합니다. 또한 그녀는 데이터가 노이즈로부터 충분히 명확하다면 개별 상호 작용의 복잡성을 탐구하고 로컬 효과를 시각화하기 위한 선 플롯 방법을 권장합니다.

그녀의 연구 결과를 요약하면서 Ding은 그녀의 프로젝트에서 두 가지 핵심 사항을 강조합니다. 첫째, 그녀는 기계 학습 모델이 복잡한 상호 작용 효과를 포착할 수 있는 능력으로 인해 대부분의 시나리오에서 선형 나이브 회귀를 능가한다는 것을 확인했습니다. 둘째, 그녀는 다양한 해석 방법을 활용하여 기계 학습 모델 해석의 타당성을 강조합니다. 이러한 기술을 통해 연구원은 요인의 개별 기여를 설명하고 예측에 대한 상호 작용 영향을 이해할 수 있습니다.

  • 00:00:00 Yumeng Ding이 주식 가격 예측에 사용되는 기계 학습 모델 해석에 대한 접근 방식에 대해 설명합니다. 그들은 분류기 및 회귀와 같은 다양한 기계 학습 모델을 사용하여 예측하기 위해 기술, 품질 및 가치의 세 가지 유형의 요소를 활용했습니다. 모델을 해석하기 위해 그들은 부분 의존도 플롯, 순열 기능 중요도, 에지 통계 및 LIME과 같은 해석 가능성 방법을 사용하여 개별 기능 효과 및 상호 작용의 분석을 허용했습니다. 백테스트를 통해 그들은 비선형 모델이 선형 모델을 능가하고 요인 효과가 시간이 지남에 따라 변한다는 것을 발견했습니다. 그들은 AdaBoost가 시나리오에 가장 적합한 모델이라고 결론지었습니다.

  • 00:05:00 Yumeng Ding이 기계 학습 모델을 해석하는 다양한 방법에 대해 설명합니다. 그녀는 벡터 접근 방식이 가장 예측 가능한 상호 작용을 찾는 데 빠르고 효율적이지만 상호 작용의 품질 대신 강점만 보여줄 뿐이라고 강조합니다. 그녀는 몇 가지 쉬운 상호 작용을 시각화하기 위해 2차원 부분 의존성이 필요하다고 강조합니다. Ding은 데이터가 너무 시끄럽지 않다면 라인 플롯 방법이 개별 상호 작용의 세부 사항을 살펴보고 로컬 상호 작용을 시각화하는 데 적합하다고 제안합니다. 그녀는 그들의 프로젝트가 두 가지 시사점을 강조하면서 결론을 내립니다. 첫째, 기계 학습 모델은 상호 작용 효과를 캡처하는 능력으로 인해 대부분의 시나리오에서 선형 순진한 회귀를 능가합니다. 둘째, 기계 학습 모델 해석은 사용 가능한 다양한 해석 방법으로 가능하며, 이를 통해 개별 요소가 개별적으로 및 대화식으로 예측에 어떻게 기여하는지 설명할 수 있습니다.
Yumeng Ding (Cornell MFE '20) - "Interpreting Machine Learning Models"
Yumeng Ding (Cornell MFE '20) - "Interpreting Machine Learning Models"
  • 2021.03.12
  • www.youtube.com
March 9, 2021CFEM alumna Yumeng Ding discusses her team capstone project, which was titled, “Interpreting Machine Learning Models.” By utilizing Machine Lear...
 

Silvia Ruiz(Cornell MFE '20): "NLP 기술을 사용하여 주식 움직임을 예측하는 방법"



Silvia Ruiz(Cornell MFE '20): "NLP 기술을 사용하여 주식 움직임을 예측하는 방법"

최근 Cornell MFE 프로그램을 졸업한 Silvia Ruiz는 NLP(자연어 처리) 기술을 사용하여 주가를 예측하는 데 중점을 둔 프로젝트에서 얻은 통찰력을 공유합니다. 그녀의 팀 연구의 목표는 10-K 및 10-Q 보고서와 같은 기업 파일링 간의 관계와 그에 따른 주가에 미치는 영향을 조사하는 것이었습니다. 이를 달성하기 위해 그들은 S&P 500의 5개 부문에 걸쳐 50개 회사를 포함하는 EDGAR 웹사이트에서 1,095개의 보고서로 구성된 실질적인 데이터 세트를 수집했습니다.

처음에 Ruiz와 그녀의 팀은 사전 기반 모델을 실험했지만 그 효과에 한계가 있었습니다. 이 문제를 해결하기 위해 그들은 단어 대 백 모델 및 Finberg와 같은 고급 방법을 통합했으며, 이는 회사 파일링에 포함된 문맥상의 뉘앙스를 이해하는 데 중요한 것으로 입증되었습니다. 또한 그들은 주가 움직임을 예측하기 위해 단어 극성 및 복잡성, xg 부스트 모델을 포함한 다양한 정서 측정을 사용했습니다.

예측의 정확도는 두 가지 다른 시간 프레임에 걸쳐 평가되었습니다. 단기적으로 그들의 모델은 61%의 놀라운 정확도를 달성한 반면 장기적으로는 53%의 상당한 정확도를 보여주었습니다. 이러한 예측을 투자 결정의 신호로 활용하여 동일한 가중치를 적용한 포트폴리오를 능가했습니다. 그러나 Ruiz는 연구 결과의 정확성과 일반화 가능성을 향상시키기 위해 다양한 분야에 걸친 추가 연구가 필요하다고 강조합니다.

Silvia Ruiz는 기꺼이 자신의 연락처 정보를 제공하고 Github에 있는 자신의 프로젝트 저장소에 대한 링크를 제공함으로써 토론을 마무리합니다. 이 제스처는 후속 문의를 장려하고 주가 예측 영역에서 NLP 기술의 이해와 적용을 발전시키는 데 있어 협력을 촉진합니다.

  • 00:00:00 최근 Cornell MFE 졸업생인 Silvia Ruiz가 NLP 기술을 사용하여 주가를 예측할 수 있는지에 대한 그녀의 프로젝트에 대해 이야기합니다. Sylvia와 그녀의 팀은 10k 및 10q와 같은 기업 공시가 회사의 주가에 미치는 영향을 조사하는 것을 목표로 했고 5개 부문의 S&P 500에 속한 50개 회사의 에드거 웹사이트에서 1095개의 보고서 데이터를 수집했습니다. 그들은 사전 기반 모델을 사용하는 것이 효과적이지 않으며 컨텍스트를 이해하기 위해 모델을 뒷받침하는 단어와 Finberg의 방법이 필요하다는 것을 발견했습니다. 마지막으로 단어 극성과 복잡성을 포함한 다양한 정서 척도를 사용하고 주가 예측 변수로 xg 부스트 모델을 실행했습니다.

  • 00:05:00 Silvia Ruiz는 NLP 기술을 사용하여 주식 움직임을 예측하려고 시도한 방법을 설명합니다. 그녀는 그녀의 팀이 보고서 발표 전과 5일 후의 주가를 시장 수익률과 비교하여 시장 수익률을 설명했다고 언급합니다. 장단기 정확도는 61%, 장기 정확도는 53%로 예측을 신호로 삼아 주식 투자를 했다. 그들의 전략은 가중치가 동일한 포트폴리오보다 더 효과적이었지만, 더 정확한 결과를 위해서는 특히 여러 부문에 걸쳐 더 많은 연구가 필요합니다. 그녀는 추가 문의를 위해 연락처 정보와 Github 링크를 공유합니다.
Silvia Ruiz (Cornell MFE '20): "How to Predict Stock Movements Using NLP Techniques"
Silvia Ruiz (Cornell MFE '20): "How to Predict Stock Movements Using NLP Techniques"
  • 2021.05.12
  • www.youtube.com
Silvia Ruiz will discuss her CFEM capstone project, which was titled, “How to Predict Stock Movements Using NLP Techniques.” By utilizing NLP techniques, the...
 

Charles-Albert Lehalle: "자연어 처리를 이해하려는 시도"



Charles-Albert Lehalle: "자연어 처리를 이해하려는 시도"

이 비디오 프리젠테이션에서 Charles-Albert Lehalle과 그의 팀은 금융 영역에서 자연어 처리(NLP)를 적용하는 방법을 탐구합니다. 그들의 논의는 정서 분석, 주가 예측 및 거래 비용 모델링의 세 가지 주요 영역을 중심으로 진행됩니다. 그들은 임베딩의 과적합 및 편향의 위험과 같은 NLP와 관련된 문제를 인정하고 멀티태스킹 학습 및 어휘 확장을 포함한 잠재적 솔루션을 제안합니다. 이 팀은 금융 산업에서 NLP의 잠재력과 한계를 모두 탐구하고 다양한 부문 내에서 맥락과 언어 패턴을 이해하는 것의 중요성을 강조합니다.

Lehalle과 그의 팀은 NLP 기술을 사용한 자체 실험을 발표하여 NLP가 정보를 압축하고 재무 분석가에게 유익한 지표를 제공하는 방법에 대한 귀중한 통찰력을 제공합니다. 그들은 영역별 지식에 대한 요구 사항과 구조화되지 않은 텍스트 데이터에서 의미 있는 정보를 추출하는 어려움을 포함하여 재무에서 NLP를 사용하는 문제를 강조합니다. 거래 목적으로 소셜 미디어 데이터를 활용하는 것과 같이 금융에서 NLP 사용을 둘러싼 윤리적 문제도 논의됩니다.

프레젠테이션 내내 Charles-Albert Lehalle은 다양한 NLP 주제에 대한 전문 지식과 지식을 공유합니다. 그는 금융 분야에서 어휘 기반 및 임베딩 기반 NLP 방법의 사용을 설명하고 텍스트 데이터에서 어휘 및 확률적 기능을 캡처하기 위한 두 가지 접근 방식의 조합을 제안합니다. 임베딩 내에서 동의어와 반의어를 구별하는 문제가 해결되고 Lehalle의 팀은 텍스트의 구조와 정서를 제어하기 위한 생성 모델을 탐색합니다. 공동 단어 분포를 나타내는 행렬과 같은 임베딩 및 참조 모델을 이해하는 것의 중요성이 강조됩니다.

Lehalle은 NLP에서 컨텍스트의 중요성을 탐구하고 임베딩이 컨텍스트를 기반으로 긍정적인 단어와 부정적인 단어에 대해 편향될 수 있는 방법을 논의합니다. 그는 Markov 체인을 사용하여 참조 행렬 모델을 구조화하는 방법을 설명하고 임베딩 내에서 동의어를 식별하는 실험을 제시합니다. 지도 임베딩을 위한 멀티태스킹 학습 제안과 함께 회사 이름 및 관련 극성을 캡처하는 NLP의 한계가 인정됩니다. 연사들은 또한 Loughran-McDonald Lexicon의 긍정적 단어와 부정적 단어의 불균형과 금융 텍스트에서 아이러니를 처리하는 문제를 다룹니다.

프레젠테이션은 최근 Cornell Financial Engineering을 졸업한 Sylvia Ruiz의 프로젝트 개요로 마무리됩니다. 이 프로젝트는 특히 50개 S&P 500 기업의 10-K 및 10-Q 파일링에서 경영 토론 섹션을 스크랩하고 감정을 분석하여 주가에 미치는 영향을 평가하는 NLP 기술을 사용하여 주가를 예측하는 데 중점을 둡니다. Lehalle은 사전 기반 모델의 한계에 대해 논의하고 팀이 사전을 확장하고 FinBERT를 사용하여 컨텍스트를 이해하고 다양한 기능을 활용하여 감정을 측정하는 방법을 설명합니다. 이들은 장단기적으로 동일한 가중치를 적용한 포트폴리오보다 더 나은 성과를 달성했습니다.

요약하자면, Charles-Albert Lehalle과 그의 팀은 금융에서 NLP의 잠재력과 도전에 대해 밝혔습니다. 그들은 NLP 기술을 효과적으로 적용하기 위한 통찰력, 실험 및 전략을 제공하는 동시에 책임 있는 사용의 중요성과 기술 및 금융 영역 모두에 대한 깊은 이해를 강조합니다.

  • 00:00:00 연사는 NLP에 대해 40분간 프레젠테이션을 진행 중인 퀀트 금융 전문가인 Charles-Albert Lehalle를 소개합니다. 연사는 NLP에 대한 여러 주제를 다루는 퀀트 금융에 관한 Lehalle의 과거 간행물을 언급합니다. 연사는 또한 최근에 Cornell을 졸업하고 Rebellion Research와 함께 NLP 프로젝트에 참여했던 Sylvia Ruiz를 소개합니다. 이 강연은 사람들이 데이터 스크래핑 및 패키지 적용의 필요성으로 인해 종종 위협적으로 느껴질 수 있는 NLP를 시작하도록 돕는 것을 목표로 합니다. 발표자는 금융 분야에서 NLP를 사용하는 방법에 대해 간략하게 언급하고 Lehalle의 팀이 현재 1년 이상 NLP를 사용하고 있으며 일부 예측 변수 및 전략을 프로덕션에 사용하고 있다고 언급합니다. 강연은 Mengedar의 진행 중인 작업을 기반으로 하며 연사는 청중이 프레젠테이션에 포함되어야 한다고 생각하는 링크나 문서를 보내도록 권장합니다.

  • 00:05:00 Charles-Albert Lehalle이 금융 거래에서 자연어 처리(NLP)를 사용할 가능성에 대해 논의합니다. 거래자들은 NLP를 활용하여 실적 발표, 소셜 미디어, 금융 뉴스 등 텍스트 형식의 정보에 빠르게 액세스할 수 있습니다. 이 정보는 거래자에게 다른 사람보다 먼저 구매하는 속도 이점을 제공하여 가격을 상승시킬 수 있습니다. 또한 거래자는 NLP를 사용하여 많은 회사에 대한 많은 양의 텍스트를 횡단하고 예상 수익을 기준으로 순위를 매길 수 있습니다. 그러나 Lehalle은 NLP가 가능한 매개변수의 양으로 인해 과잉 공급의 위험이 높다고 지적합니다. 그럼에도 불구하고 받은 정보를 이해함으로써 트레이더는 잠재적 이익을 위해 전략을 조정할 수 있습니다.

  • 00:10:00 Charles-Albert Lehalle이 재무에서 어휘집 기반 및 임베딩 기반 자연어 처리(NLP) 방법의 사용에 대해 논의합니다. 그는 주식에 대한 긍정적 또는 부정적 감정을 식별하기 위해 많은 텍스트에 주석을 추가하는 인간 분석가가 어휘 기반 시스템을 구축하는 반면 임베딩 기반 시스템은 단어의 확률적 맥락을 모델링하는 방법을 설명합니다. Lehalle은 이 두 가지 방법을 결합하여 금융 시장에서 텍스트 데이터의 어휘적 특성과 확률적 특성을 모두 포착해야 한다고 제안합니다. 그는 또한 임베딩이 동의어와 반의어를 포착하는 방법을 탐구하는 접근 방식을 설명합니다. 이는 금융 분야의 예측 분석에 실질적인 영향을 미칠 수 있습니다.

  • 00:15:00 이 섹션에서는 Charles-Albert Lehalle이 자연어 처리(NLP)와 관련된 문제에 대해 설명합니다. 동의어를 캡처하면 텍스트의 복잡성을 줄일 수 있지만 임베딩은 동의어와 반의어를 구별하기 어려울 수 있습니다. 어휘를 구분할 수 없는 시스템에 어휘를 주입하려는 경우 문제가 발생합니다. Lehalle의 팀은 텍스트의 구조와 감정을 제어하고 언어에 입력한 내용을 복구할 수 있는지 확인하기 위해 텍스트의 생성 모델을 개발하려고 시도하고 있습니다. 그들은 이러한 기술을 적용하고 작동 방식을 분석하기 위해 대규모 금융 뉴스 모음을 사용할 계획입니다. 이 프로세스의 이론적 측면에는 단어 2x 키그램 방법과 확률적 행렬의 사용이 포함됩니다.

  • 00:20:00 이 섹션에서는 Charles-Albert Lehalle이 skip-gram word2vec 모델을 사용하여 자연어 처리를 설명합니다. 그는 임베딩을 위한 행렬의 낮은 순위 분해와 소프트 맥스 출력을 사용하여 신경망으로 다시 작성할 수 있는 방법에 대해 설명합니다. 그는 또한 컨텍스트를 다루는 많은 로컬 임베딩을 통해 BERT와 같은 모델의 어텐션 헤드가 어떻게 더 로컬인지 설명합니다. 그는 임베딩과 손실 함수를 최적화하는 데 사용되는 큰 숨겨진 매트릭스인 참조 모델을 이해하는 것의 중요성을 강조합니다.

  • 00:25:00 Charles-Albert Lehalle이 자연어 처리에서 참조 모델의 개념을 설명합니다. 그는 모든 단어의 공동 분포를 나타내는 큰 행렬, 실제 참조 모델의 통계적 추정치, 텍스트를 생성한 숨겨진 참조 모델을 포함하여 다양한 유형의 참조 모델에 대해 설명합니다. 그는 또한 말뭉치에서 같은 위치에 자주 등장하기 때문에 의미론적 관점에서 반의어이지만 임베딩이 같은 단어인 빈도주의 동의어에 대해서도 이야기합니다. 이러한 이해는 자연어 처리의 윤리 논의에서 중요합니다.

  • 00:30:00 이 섹션에서 Lehalle은 자연어 처리에서 컨텍스트의 중요성에 대해 논의하고 임베딩이 컨텍스트에 따라 긍정적인 단어와 부정적인 단어에 대해 어떻게 편향될 수 있는지에 대한 예를 제공합니다. 그는 또한 Markov 체인을 사용하여 코퍼스를 생성하는 것이 단어에 대한 큰 참조 행렬 모델을 구조화하는 데 어떻게 도움이 될 수 있는지와 단어가 올바르게 포함되기 위한 손실 함수가 어떻게 두 분포 사이의 교차 엔트로피인지 설명합니다. 제시된 첫 번째 실험은 동의어로 합성 언어를 설계하고 임베딩의 블록으로 동의어를 복구하는 시도를 포함합니다. 그러나 임베딩은 식별 가능성이 낮아 큰 임베딩에서 저차원 공간을 복구하기가 어렵습니다. 마지막으로 동의어 임베딩 간의 코사인 유사도가 계산됩니다.

  • 00:35:00 Charles-Albert Lehalle이 Lung Hand Micro Lexicon을 사용하여 임베딩을 훈련하여 긍정적인 금융 뉴스 헤드라인과 부정적인 금융 뉴스 헤드라인을 구분하는 방법에 대해 설명합니다. 그는 임베딩이 헤드라인의 단어와 같이 자주 함께 나타나는 동의어를 구별하도록 설계되지 않았기 때문에 헤드라인에 임베딩을 사용하여 긍정적인 단어와 부정적인 단어를 식별하는 것은 어렵다고 지적합니다. 그러나 시간이 지남에 따라 금융 뉴스의 본문을 보면 코사인 유사성 메트릭은 긍정적인 단어와 부정적인 단어가 서로 명확하게 구별된다는 것을 보여줍니다. Lehalle은 또한 금융 위기 동안 은행과 같은 회사 이름이 긍정적인 단어보다 부정적인 단어에 더 가깝다는 것을 보여줍니다. 전반적으로 임베딩 내의 어휘 위치는 금융 뉴스에서 긍정적인 단어와 부정적인 단어를 구별하는 능력에 큰 영향을 미칩니다.

  • 00:40:00 연사 Charles-Albert Lehalle은 회사 이름 및 관련 극성과 임베딩의 비정형성에 관한 자연어 처리(NLP)의 한계에 대해 논의합니다. 그는 임베딩이 이웃 단어의 분포에 우선 순위를 두는 데 초점을 두어 빈도와 동의어를 구별하기 어렵게 한다고 제안합니다. Lehalle은 계속해서 멀티태스킹 학습, 양극화 어휘집에 의해 감독되는 작업과 동시에 임베딩을 교육하는 것이 좋은 생각이 될 수 있다고 제안합니다. 또한 그는 회사 이름이 평판의 유용한 지표가 될 수 있으며 NLP로 생성된 뉴스 기사가 NLP 알고리즘을 속이려는 회사보다 더 큰 관심사라고 지적합니다. 마지막으로 그는 NLP 알고리즘을 잠재적으로 사용하여 정보를 추출하고 새로운 값으로 레이블을 지정하여 가격이 아닌 분석가 추정치를 추론할 수 있다고 설명합니다.

  • 00:45:00 비디오의 이 섹션에서 연사는 인간이 설정하고 금융 텍스트 분석을 위한 자연어 처리(NLP)에 사용되는 Loughran-McDonald Lexicon에서 부정적인 단어와 긍정적인 단어의 불균형에 대해 논의합니다. 그들은 불균형이 보호하려는 경향이 있는 변호사가 작성한 재무 문서의 법적 및 구조적 특성 때문일 수 있다고 제안합니다. 연사는 또한 거래 비용 모델링에서 NLP를 사용하는 방법과 긴 재무 텍스트에서 아이러니를 처리하는 문제에 대해 다룹니다. 그런 다음 코넬 금융 공학 프로그램을 최근 졸업한 Sylvia Ruiz를 소개합니다. 그녀는 NLP 기술을 사용하여 주가를 예측하는 팀 프로젝트를 발표합니다. 이 프로젝트는 S&P 500에 속한 50개 기업의 10K 및 10Q 서류에서 경영 토론 섹션을 스크랩하고 주가에 미치는 영향을 확인하기 위해 감정을 분석하는 데 중점을 두었습니다.

  • 00:50:00 Charles-Albert Lehalle이 자연어 처리(NLP)에 사전 기반 모델을 사용할 때의 문제점과 그와 그의 팀이 NLP 기술을 사용하여 모델을 개선한 방법에 대해 논의합니다. 그는 문맥을 이해하기 위해 skipgram 모델과 FinBERT 모델을 사용하여 보다 균형 잡힌 단어 분류를 위해 사전을 확장한 방법을 설명합니다. 그런 다음 xg 부스트 모델을 실행하여 주가가 상승할지 하락할지 예측하기 전에 다양한 기능을 사용하여 정서와 단어 복잡성을 측정했습니다. 정확도는 상대적으로 낮았지만 장단기적으로 동일 가중치 포트폴리오보다 더 나은 성과를 내는 전략을 만들 수 있었습니다.

  • 00:55:00 Charles-Albert Lehalle이 금융 산업에서 자연어 처리(NLP)의 잠재력에 대해 논의합니다. 그는 더 많은 연구가 필요하며 각 부문마다 언어 패턴이 다르기 때문에 산업을 부문으로 나누는 것이 유리할 수 있다고 제안합니다. 또한 그는 NLP가 정보를 압축하고 유익한 지표를 제공하는 데 더 잘 사용될 수 있으므로 텍스트를 이해하고 기대와 같은 것을 예측하려고 시도하지 말라고 조언합니다. 대신 분석가는 자신의 추론을 사용하여 예측과 기대치를 비교하고 "놀라운 예측자"를 만들 수 있습니다. 전반적으로 Lehalle은 NLP를 재무 분석에 통합하기 전에 NLP의 한계와 강점을 이해할 필요성을 강조합니다.

  • 01:00:00 이 섹션에서 연사는 NLP 모델의 견고성을 높이기 위해 적대적 훈련을 사용하는 방법에 대해 논의합니다. 이 기술은 성 중립성과 같은 언어의 편견을 해결하는 데 적용될 수 있습니다. 연사는 긍정적인 단어와 부정적인 단어 사이의 중립성을 깨기 위해 적대적 훈련을 사용하는 것도 고려하지만 이것이 거래 전략을 구축하는 데 적합하지 않을 수 있음을 주의합니다. 그런 다음 회사에서 섹션에 레이블을 지정하고 형식을 지정하는 방법의 차이로 인해 10K 파일링과 같은 재무 문서에서 섹션을 추출하는 문제로 논의가 이동합니다.

  • 01:00:00 연사는 NLP 모델의 견고성을 높이기 위해 적대적 훈련을 사용하는 방법에 대해 논의합니다. 이 기술은 성 중립성과 같은 언어의 편견을 해결하는 데 적용될 수 있습니다. 연사는 긍정적인 단어와 부정적인 단어 사이의 중립성을 깨기 위해 적대적 훈련을 사용하는 것도 고려하지만 이것이 거래 전략을 구축하는 데 적합하지 않을 수 있음을 주의합니다. 그런 다음 회사에서 섹션에 레이블을 지정하고 형식을 지정하는 방법의 차이로 인해 10K 파일링과 같은 재무 문서에서 섹션을 추출하는 문제로 논의가 이동합니다.

  • 01:05:00 비디오의 이 섹션에서 Charles-Albert Lehalle은 연구의 목적이 아니므로 자신의 임베딩과 Bloomberg의 감정 지수를 비교하지 않았다고 설명합니다. 그는 블룸버그의 예측자가 아마도 벤치마킹하기 어려운 지수가 아닌 예측자를 구축하려고 시도하고 있다고 믿습니다. 그는 NLP를 이용한 실증적 자산 가격 결정 요소 구성에 대한 논문이 있음을 밝히고 NLP를 사용하여 코퍼스에 포함된 정보를 기반으로 10k 요소 또는 위험 섹션 요소와 같은 수많은 요소를 생성할 수 있다고 설명합니다. 따라서 NLP는 기술일 뿐이며 이 경우 말뭉치가 가장 중요한 요소입니다.
Charles-Albert Lehalle: "An Attempt to Understand Natural Language Processing"
Charles-Albert Lehalle: "An Attempt to Understand Natural Language Processing"
  • 2021.02.17
  • www.youtube.com
Full Title: "An Attempt to Understand Natural Language Processing And Illustration On A Financial Dataset"Speaker: Charles-Albert Lehalle (Capital Fund Manag...