回帰直線の傾きと相関係数

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


一連の定量的データを統計的に分析する場合、ペア データまたは順序付けられたペアに直面することがよくあります。これらは 2 つの異なる変数のデータに対応しており、通常は同じ個人に由来するため、相互にリンクされています。特定の個人の身長と体重、または車の重量と最高速度など、個別に考慮されるのではなく、常に一緒に考慮されなければならないデータの問題です。

ペアのデータがある場合、統計はこれらの変数間に関係があるかどうかを立証する可能性を提供します。これは、さまざまな科学で特に一般的であり、特に、ある変数の動作が別の変数の動作に影響を与えたり決定したりするように見えることが観察された場合に顕著です。これらの関係を確立するとき、統計は 2 つの異なるタイプのツールを提供します。2 つ以上の変数間の相関研究と、回帰プロセスによる異なる数学的モデルへの対になったデータの調整です。

線形に振る舞うデータの場合、データがどの程度線形に振る舞うかを測定する線形回帰係数rを計算できます。一方、データに最も適合する直線の数式は、線形回帰によっても取得できます。これを行うと、線の切片とその傾きの形で回帰係数が得られます。

線形回帰係数と線形回帰によって得られた直線の傾きの計算の多くの例を見ると、両方の値の間に関係があることがすぐにわかります。特に、勾配が負の場合は常に、回帰係数も負であることに注意してください。正の場合は係数も正であり、勾配がゼロの場合は回帰係数も正です。

回帰直線の傾きと相関係数

以下のセクションでは、なぜこのようなことが起こるのか、そしてほとんどの場合密接に関係しているこれら 2 つの統計値の間の実際の関係について説明します。

統計と科学における相関と回帰

相関研究は、相関係数や決定係数などの一連の統計を提供します。これにより、2 つ以上の変数が互いにどの程度相関しているかを確認できます。言い換えれば、確率変数 (通常は定量的) の変動のどの割合が、それ自体のランダム変動で説明されるのではなく、別の確率変数の変動で説明できるかを確立することができます。これは、1 つまたは複数の変数の変動が別の変数の変動をどの程度うまく説明できるかを確立できることを意味します。

相関研究は、2 つ以上の変数間の相関を確認するだけであり、原因と結果の直接的な証拠を提供しないことに注意してください (つまり、2 つの変数のどちらが他の変数の変動を引き起こすかを確立することはできません)。 )。

一方、2 つの変数が何らかの形で相関していることを (相関研究を通じて) 知っているか、直観的に理解している場合、一般的に、1 つの変数の一般的な挙動を他の変数の関数として表すことを可能にする数学的モデルを確立しようとします。 、したがって、他の値に基づいて変数の1つの値を予測できます。これは、観測されたデータ (順序付けられたペアまたはペアのデータ) とモデルによって予測された値との差を最小限に抑える数学的モデルの係数が計算される回帰プロセスのおかげで達成されます。

線形相関とピアソンの相関係数

相関の最も単純なケースは線形相関です。これは、2 つの量的変数の間に線形関係があり、一方が増加すると、もう一方が常に同じ割合で増加するか、常に同じ割合で減少する場合に発生します。

線形相関研究は、データ系列の線形相関係数の計算に基づいています。計算できる線形相関係数はいくつかありますが、最も一般的なものは次のとおりです。

  • ピアソンの線形相関係数
  • スピアマンの線形相関
  • ケンドールの相関

3 つのうち、最も単純で最も広く使用されているのは、ピアソンの線形相関係数です。ペアリングされたデータが次の条件を満たしている場合に使用できます。

  • 変数間の関係は線形です。
  • どちらの変数も定量的です。
  • 両方の変数は正規分布に従います (ただし、一部の著者は、変数がガウス ベルに完全に適合しなくても、ピアソンの相関を使用できると主張しています)。
  • 従属変数(Y 軸で表す変数) として使用される変数の分散は、独立変数 (X 軸の変数) のさまざまな値に対して一定です。

これらの条件が満たされている場合、ピアソン相関係数を計算して、両方の変数間の線形相関がどの程度良好かを判断できます。

変数 (s 2 x ys 2 y ) と共分散 (Cov x,y os xy ) の両方の分散がわかっている場合、次の式を使用して母集団 (ρ xy ) のピアソン係数を計算できます。

回帰直線の傾きと相関係数

一方、最も一般的なのは、母集団のすべてのデータを知っているわけではなく、サンプルしか持っていないということです。この場合、母集団の推定量であるサンプル ピアソン相関係数を計算できます。次の式で計算されます。

回帰直線の傾きと相関係数

ここで、 rは相関係数、x̅ は変数 x の標本平均、y̅ は変数 y の標本平均、x i とy iは2 つの変数それぞれの個別値です。

最小二乗線形回帰フィット

線形回帰は、ペアのデータ系列を直線に適合させるプロセスです。これは、データ系列に最適な線の数式を取得することを意味し、したがって、両方がデカルト座標系で表される場合、すべての点と線の間の平均距離を最小化します。

線形回帰は、ほとんどの場合、最小二乗法によって実行され、その結果、直線を定義する 2 つのパラメーター、つまり Y 軸のカットと勾配が得られます。

データ系列が線形であるかどうかに関係なく、それに最適な線の方程式を取得することは常に可能です。独立変数X と従属変数 Y として取る別の変数を考えると、直線の方程式は次のように与えられます。

回帰直線の傾きと相関係数

この式で、係数abは線形回帰係数で、それぞれ Y 切片と直線の傾きを表します。モデルの予測誤差 (真の値とモデルによって推定された値の差) の 2 乗を最小化する係数は、次の式で与えられることが簡単にわかります。

回帰直線の傾きと相関係数

線形回帰直線の傾き b と相関係数 r の関係

線形回帰係数abが何であるか、およびピアソン線形相関係数r が何であるかについてより明確になったので、勾配bがrに関連する理由と方法を理解する準備が整いました。

実際、bの前の式とピアソン係数の定義を組み合わせた結果、データのサンプルの場合、これら 2 つの統計量の間の数学的関係が得られます。

回帰直線の傾きと相関係数

図からわかるように、サンプルの標準偏差s xと s yは定義により正であるため (それぞれの分散の正の平方根であるため)、それらの商は必然的に正になります。このため、勾配の符号bは相関係数rの符号によって決定され、逆もまた同様です。

また、傾きはrと前述の2つの標準偏差の商との積で表されるため、2つの変数が相関を示さない場合(つまり、r=0であることが確認された場合)、前に観察したように、線形回帰によってデータに当てはめられた直線の傾きもゼロになります。

従属変数に影響を与える他のすべての要因が成り立つ場合、従属変数と独立変数の間に相関関係がない場合、独立変数 (つまり、x ) は、最初 (つまり、y) に観察可能な変化を生じさせません。したがって、グラフに沿って左から右に移動しても、y 値の増減は観察されず、観察される変動は、その変数のランダムな性質のみによるものです。

人口データの場合のピアソン係数と傾きの関係

サンプルデータに関して今述べたことは、母集団のすべてのデータを持っている場合にも同じように適用されます。唯一の変更点は、統計 ( a、br )の代わりに、母集団の場合、パラメーターが存在することです。

統計ではよくあることですが、パラメータは通常統計と同じ文字で表され、ギリシャ文字のみが使用されます。このため、すべての人口データに当てはめられた直線のカットオフと傾きは文字 α と β ( aとbの代わりに)で表され、ピアソン係数は文字 ρ ( . rの代わりに) で表されます。一方、母標準偏差は文字 s で表されます ( sではなく)。

したがって、傾きと母集団の線形相関係数の関係は次のようになります。

回帰直線の傾きと相関係数

参考文献

Carollo Limeres、MC (2012)。単純線形回帰。サンティアゴ・デ・コンポステーラ大学。http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_50140116_Regr_%20simple_2011_12.pdf

レスカナリス。(nd)。統計におけるペアデータとは何ですか? – ヒント – 2022 . https://us.leskanaris.com/7419-paired-data-in-statistics.html

マルティネス バラ デ レイ、CC (sf)。心理学におけるデータ分析 II – ピアソンの線形相関係数. セビリア大学。https://personal.us.es/vararey/correlacion-lineal-pearson.pdf

ロドリゴ、ジャワ (2016 年 6 月)。線形相関と単純線形回帰。CienciaDeDatos.Net. https://www.cienciadedatos.net/documentos/24_correlacion_y_regression_lineal

Santos Cuervo、L.(2000)。回帰と相関。破棄します。http://recursostic.educacion.es/descartes/web/Descartes1/Bach_CNST_1/Variables_estadisticas_bidimensionales_regresion_correlacion/regresi2.htm

超教授。(2020年5月25日)。回帰直線とは?| | スーパープロフ。教訓的な資料 – Superprof. https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/recta-de-regresion.html

Ucha、AP (2021 年 2 月 19 日)。線形相関係数。エコノミペディア。https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html

-広告-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados

実数は?

円周の計算