標本相関がゼロでも、線形関係がないとは限らない - ページ 46

 

今度は私が写真付きで例を挙げる番です。

区間t = -10 ... 10に2つの過程(ランダムではないが,非ランダムな過程はランダムな過程の退化した場合なので,例としてはこれで良いだろう)の標本があるとする.

x1(t) = cos(2*pi*t)

x2(t) = sint(2*pi*t) + h(t) ただし、h(t)はHeavisideステップである。

で、サンプリングレートがかなり大きい(サインやコサインの周波数そのものよりはるかに大きい) fd >> 1

これらの過程をグラフにしたものがこちらです。


明らかに、サイン/コサインの直交性により、プロセスの不連続性によりQCの判定が一切困難な点0を除き、サンプル全体で瞬間的な相関係数の値はゼロとなる。

それにもかかわらず、与えられた過程を馬鹿正直に線形相関係数の式に代入してしまうと、2番目の過程の時間の算術平均が0ではなく1/2になり、それを式に書かざるを得なくなり、0とは異なる出力値を持って、より短いサンプルが取られる(このようにして計算された係数は、区間[-10;10]では1、例えば[-3]では別のものになります)、ナンセンスなものになってしまうのです。これは、どのパッケージでも、Excelでも、内蔵のQC手順で簡単にチェックすることができます。

ここですでに直感的に矛盾を感じるはずです。あるサンプルを点t=0で2分割し、それぞれの部分について同じようにKKを計算すると、どちらの場合も0になりますが、2つの「0」部分を結合すると、0ではなくなることがわかりますか?どうしてでしょう?

これは過程x2(t)の非定常性が考慮されていないためで、したがってこの場合、平均の推定値として経時的な算術平均をとることはできないのである。さらに、この平均値が時間の経過とともに実際にどのように変化するかは、構造的に分かっている。したがって、計算手順は、プロセスの先験的な知識に基づき、両者を定常性を主張できる形に正確に落とし込む必要がある。

つまり、線形QCの式は、x1(t)とx2(t)を代入するのではなく、x1(t)とx2'(t) = x2(t)-h(t) 、つまり第2過程から定常項を分離する必要があります。そうすれば、数式計算の結果は予想と一致する。

 
Integer:

教科書の名前、定義、引用など、具体的に書いてください。そうはいっても、定義に間違いはないのか、どうしてそう言い切れるのか?相関係数を自分の手で触ってみて(実験して、遊んでみて)、理解し、実感し、感じてみたことはないのか?

よくもまあ、ここまで身をかがめることができるものだ。

ひねりって何だろう(何かのダンスでなければ)、wikipediaで相関の定義を調べてみた。

どこかのフェンスに書かれていることを批判的に評価しようとしているのでしょうか?乱数値とどう関係があるのでしょうか?この定義を書いたのはどこかのアホだけだろう。ヒップホップの 教科書とかでも同じだとしたら、相関関係の意味を理解していないアホが書いた教科書ばかりで、生徒の脳みそをめちゃくちゃにしていることになる。


TViST(確率論と統計学を略して)は私の専攻で、研究所で勉強し、5学期分の試験を受け、優等で合格しました。まあ、正直なところ、ここでスクリーンショットを公証するつもりはないんですけどね。希望する人は誰でも、手元に現れる、私たちの、しかし外国の、そして確信する、相関の定義でそれが問題であるもの、そうでないものを、私は繰り返す、どんな 教科書でも開くことができる。もし、すべての作品がアホによって書かれたものだと考えるなら、まったく読まないほうがいいのでは?いや、むしろこの掲示板を柵のカテゴリーに入れて、まずここに書かれたことを批判的に評価し、次にそこに書かれたことを評価する。

 
alsu:


ここですでに直感的に矛盾を感じるはずです。結局、t=0でサンプルを半分に分け、それぞれの部分のQCを同じように計算すると、どちらの場合も0になりますが、2つの「0」の部分を一緒に縫うことによって、0ではないことが判明しました?どうしてでしょう?

いや、見てない。半分がゼロ、もう半分が非ゼロ。
 
alsu:

TViST(確率論と統計学を略して)は私の専攻科目で、研究所で勉強し、5学期分の試験に優等で合格しました。まあ、正直なところ、ここでスクリーンショットを公証するつもりはないんですけどね。希望する人は誰でも、手元に現れる、私たちの、しかし外国の、そして確信する、相関の定義でそれが問題であるもの、そうでないものを、私は繰り返す、どんな 教科書でも開くことができる。もし、すべての作品がアホによって書かれたものだと考えるなら、まったく読まないほうがいいのでは?いや、むしろこの掲示板を柵のカテゴリーに入れて、まずここに書かれたことを批判的に評価し、次にそこに書かれたことを評価する。

不思議なことに、相関院で教えてくれた先生は、この教科書を読んでいなかったようだ...。門下生に幸あれ)

 
alsu:...明らかに、サイン/コサインの直交性により、サンプル全体の瞬間的な相関係数の値は、プロセスの不連続性によりCCをどのように決定することも困難な点0を除いて、ゼロとなります。
整数:なし見ていない。半分がゼロでも、もう半分がゼロじゃない。

そう、ゼロではない残りの半分のために。視覚的な欺瞞。


続いての質問です。

親愛なる皆さん、価格時系列(FX)のデータで、定常性、分布、エルゴード性、相関など、統計的なものについて結論を出すときに、どのようなデータを使っていますか?屁理屈抜きの質問です。ただ、天文学的な時間によって定量化されたベストバンド測定の一つをしばしば取る?しかし、それは ...なんというかは受け入れられない。実際の取引量を考慮した「リアル」な取引による価格の読み取りのシーケンスを分析することは理にかなっている。分析するためのデータを準備する上で、それがポイントなのかもしれません。

 

興味深い議論ですね。せめてここで真相を解明してくれるかもしれない。

この疑問を解決しようと、頭のいい(と思われる)人たちに何度も相談したのですが、誰もわかってくれず、ただ頬を膨らませるだけだったようです )))

相関の物理的な意味は、ベクトル間の角度の余弦です(ベクトルの座標は両方とも初期サンプルです)。

つまり、QCは曲線の形状を「比較」するだけで、スケーリング(ベクトルの長さの変更)やディスプレースメント(ベクトルの原点の移動)の影響を受けません。

相場は知りませんが、信号処理ではQCはI(1)にしか有効ではありません。特に、信号の周期性の検出はかなり得意です。

I(0)に QC を使う意味は何なのか、理解したいと思います。

そして、これはすべてローカルアプリケーションの場合です。


それとは別に、シリーズ全体のQCや分布などの統計量を一度に計算する意味を理解したいです。これはN年間の平均的な病院の温度ですが、何か意味があるのでしょうか?

市場にはI(1)、I(0)のどちらにも定常性はない。

 
airbas: 市場においては、I(1)、I(0)のいずれにも定常性はない。

市場に対するI(1)とI(0)とは?

I(0)は定義上、定常 過程である。引用元はどこですか?
 
Demi:
はい?そして、コサインとサインの相関係数は-1から+1まで滑らかに変化すると教わったことがあります。0であることが判明......。

1から+1までは相互相関の_function_が変化する。そして、標本相関係数は_数字です。そしてこの数値は、あらかじめ与えられた2つのサンプルに対する定数である。一様な格子上の直交関数の組の値をサンプルとすると、係数は0に等しくなる。これは直交関数の定義から導かれる。和として書かれた定義の積分は、標本共分散の定義と驚くほど似ていることになる。

整数

相関係数はそれ以外のものを示すものではなく、相関の計算は正規性、エルゴード性、定常性とは関係がない。どのような教科書を読んでいるのですか?

数式に数字を代入して数字を得ることがメインであれば、定常性やエルゴード性は重要ではありません。

エルゴード性の性質を利用すれば、一般集団の相関関数をその集団のサンプルに基づいて推定することができます。この性質が満たされない場合、数式で求めた数値は捨てられる。

定常性があれば、例を挙げるのは簡単です。確率微分法の一組の確率過程を考える。

dX(t) = mu_1 * dt + sigma_1 * dW_1;

dY(t) = mu_2 * dt + sigma_2 * dW_2;

dW_1, dW_2 は相関のあるWiener過程(rho相関を持つ)である。

mu_1, mu_2, sigma_1, sigma_2 は正の定数である。

例として、未分化系列のペアの相関係数は、増分間の相関に関係なく、サンプルサイズの増加とともに(任意のmu_1とmu_2に対して - sign(mu_1 * mu_2) に)ユニットになる傾向があることを挙げています。要は、I(1)過程では、標本平均は定数に収束しないのです。

mu_1=0.01; mu_2=0.05; sigma_1=1; sigma_2=1; rho=0.5:

mu <- c(0.01, 0.05)
sigma <- matrix(c(1, 0.5, 0.5, 1), 2, 2)

simulate.random.walks <- function (num.points, integrated = T) {
  ret.val <- matrix(rnorm(num.points * 2), num.points, 2) %*% chol(sigma)
  ret.val <- do.call(cbind, lapply(1 : 2, function (i) { ret.val[, i] + mu[i] } ))
  if (integrated) ret.val <- apply(ret.val, 2, cumsum)
  ret.val
}

num.points.grid <- trunc(exp(seq(log(10 ^ 2), log(10 ^ 6), length.out = 25)))
cor.integrated <- sapply(
  num.points.grid,
  function (num.points) { cor(simulate.random.walks(num.points, T))[1, 2] }
  )
cor.non.integrated <- sapply(
  num.points.grid,
  function (num.points) { cor(simulate.random.walks(num.points, F))[1, 2] }
  )

png(filename='c:/Users/User/Desktop/bgg.png', 800, 600)
par(mfrow = c(2, 1))
plot(num.points.grid, cor.integrated, xlog = T, t = 'o')
abline(h = 1, col = 'red', lty = 'dashed')
plot(num.points.grid, cor.non.integrated, xlog = T, t = 'o')
abline(h = 0.5, col = 'red', lty = 'dashed')
dev.off()

エアバ

相場はどうか知らないが、信号処理ではQCはI(1)に対してのみ有効である。特に、信号の周期性の検出はかなり得意です。

どこの大学を卒業されたのかご存知ですか?面接でもっとしっかり認識適正を確認すべき人がわかる。

Integerさん、私も難しいことでなければ、同じ質問をさせていただきます。

GaryKa です。

拝啓、価格時系列(FX)で、定常性、分布、エルゴード性、相関など統計的なことを結論づけるとき、どのようなデータを使っていますか?屁理屈抜きの質問です。ただ、天文学的な時間によって定量化されたベストバンド測定の一つをしばしば取る?しかし、それは ...なんというかは受け入れられない。実際の取引量を考慮した「リアル」な取引による価格の読み取りのシーケンスを分析することは理にかなっている。分析するためのデータを準備する上で、それがポイントなのかもしれません。


教科書に載っている定義を読めば、だいたいのことはわかる。bid/ask/midpriceのどれを使っても全く変わりません。数値的な特徴は若干異なるかもしれませんが、定常性に関する結論は同じになります。

 

その後、自分で適切かどうかをチェックする。

Свойство эргодичности позволяет оценивать корреляционную функцию для генеральной совокупности на основе выборки из оной. Если это свойство не выполняется - число, полученное по формуле, можно выкинуть.

 
匿名さん、あのね、私はこの掲示板を定期的に、ほとんど全部読んでいますが、あなたの適当な書き込みは一度も見たことがないんですよ。