Regresyon doğrusunun eğimi ve korelasyon katsayısı

Artículo revisado y aprobado por nuestro equipo editorial, siguiendo los criterios de redacción y edición de YuBrain.


Nicel veri serilerini istatistiksel olarak analiz ederken, genellikle eşleştirilmiş verilerle veya sıralı çiftlerle karşılaşırız. Bunlar, genellikle aynı kişiden gelen ve bu nedenle birbiriyle bağlantılı iki farklı değişkenin verilerine karşılık gelir. Bu durumda, belirli bir bireyin boyu ve ağırlığı veya bir arabanın ağırlığı ve maksimum hızı gibi, ayrı ayrı ele alınmayan, ancak her zaman birlikte değerlendirilmesi gereken bir veri meselesidir.

Eşleştirilmiş verilere sahip olduğumuzda, istatistikler bize bu değişkenler arasında bir ilişki olup olmadığını belirleme imkanı sağlar . Bu özellikle farklı bilimlerde yaygındır, özellikle bir değişkenin davranışının diğerinin davranışını etkilediği veya belirlediği gözlemlendiğinde. Bu ilişkileri kurarken, istatistik bize iki farklı türde araç sağlar: iki veya daha fazla değişken arasındaki korelasyon çalışmaları ve bir regresyon süreci aracılığıyla eşleştirilmiş verilerin farklı matematiksel modellere ayarlanması.

Doğrusal davranan veriler için, verilerin ne kadar doğrusal davrandığını ölçen bir doğrusal regresyon katsayısı, r hesaplanabilir. Öte yandan, doğrunun verilere en uygun matematiksel denklemi doğrusal regresyon yoluyla da elde edilebilir. Bunu yaptığımızda doğrunun kesişme noktası ve eğimi şeklinde regresyon katsayılarını elde ederiz.

Lineer regresyon katsayılarının ve lineer regresyonla elde edilen doğrunun eğiminin hesaplanmasına ilişkin birçok örneğe bakarsak, her iki değer arasında bir ilişki olduğunu hemen fark ederiz. Özellikle, eğim negatif olduğunda regresyon katsayısının da negatif olduğunu not edeceğiz; pozitif olduğunda katsayı da pozitiftir ve eğim sıfır olduğunda regresyon katsayısı da pozitiftir.

Regresyon doğrusunun eğimi ve korelasyon katsayısı

Aşağıdaki bölümlerde bunun neden olduğunu ve neredeyse her zaman el ele giden bu iki istatistiksel değer arasındaki gerçek ilişkinin ne olduğunu keşfedeceğiz.

İstatistik ve bilimde korelasyon ve gerileme

Korelasyon çalışmaları, iki veya daha fazla değişkenin birbiriyle ne kadar ilişkili olduğunu belirlemeyi mümkün kılan korelasyon ve belirleme katsayıları gibi bir dizi istatistik sağlar. Başka bir deyişle, bir rasgele değişkenin (genellikle nicel) değişkenliğinin ne kadarının kendi rasgele varyasyonları ile açıklanmak yerine başka bir rasgele değişkenin değişkenliği ile açıklanabileceğini belirlememize olanak tanırlar. Bu, bir veya daha fazla değişkenin varyasyonunun diğerinin varyasyonunu ne kadar iyi açıkladığını belirlemeye izin verdikleri anlamına gelir.

Korelasyon çalışmalarının sadece iki veya daha fazla değişken arasındaki korelasyonu gördüğü, ancak doğrudan neden ve sonuç kanıtı sağlamadığı (yani, iki değişkenden hangisinin diğerinin varyasyonuna neden olduğunu belirlemeye izin vermediği) belirtilmelidir. ).

Öte yandan, iki değişkenin bir şekilde ilişkili olduğunu bildiğimizde (bir korelasyon çalışması yoluyla) veya sezdiğimizde, genellikle bir değişkenin genel davranışını diğerinin bir fonksiyonu olarak temsil etmemize izin veren bir matematiksel model oluşturmaya çalışırız. , böylece değişkenlerden birinin değerinin diğerinin değerine bağlı olarak tahmin edilmesini sağlar. Bu, gözlemlenen veriler (sıralı çiftler veya eşleştirilmiş veriler) ile model tarafından tahmin edilen değerler arasındaki farkları en aza indiren bir matematiksel modelin katsayılarının hesaplandığı bir regresyon işlemi sayesinde elde edilir.

Lineer Korelasyon ve Pearson Korelasyon Katsayısı

En basit korelasyon durumu doğrusal korelasyondur. Bu, iki nicel değişken arasında, biri arttığında diğeri her zaman aynı oranda artacak veya her zaman aynı oranda azalacak şekilde doğrusal bir ilişki olduğunda ortaya çıkar.

Doğrusal korelasyon çalışmaları, veri serileri için doğrusal korelasyon katsayısının hesaplanmasına dayanır. Hesaplanabilecek birkaç farklı doğrusal korelasyon katsayısı vardır ve bunlardan en yaygın olanları şunlardır:

  • Pearson’ın doğrusal korelasyon katsayısı
  • Spearman’ın doğrusal korelasyonu
  • Kendall’ın Korelasyonu

Üçünden en basiti ve aynı zamanda en yaygın kullanılanı Pearson lineer korelasyon katsayısıdır. Bu, eşleştirilmiş veriler aşağıdaki koşulları karşıladığında kullanılabilir:

  • Değişkenler arasındaki ilişki doğrusaldır.
  • Her iki değişken de niceldir.
  • Her iki değişken de normal bir dağılım izler (ancak bazı yazarlar, değişkenler bir Gauss çanına tam olarak uymasa bile Pearson korelasyonunun kullanılabileceğini iddia etse de).
  • Bağımlı değişken olarak alınan değişkenin (Y ekseninde temsil ettiğimiz) varyansı, bağımsız değişkenin (X ekseninde olan) farklı değerleri için sabittir.

Bu koşullar karşılanırsa, her iki değişken arasındaki doğrusal korelasyonun ne kadar iyi olduğunu belirlemek için Pearson korelasyon katsayısını hesaplayabiliriz.

Her iki değişkenin varyansını (s 2 x ys 2 y ) ve kovaryansı (Cov x,y os xy ) biliyorsak , aşağıdaki formülü kullanarak popülasyon için Pearson katsayısını (ρ xy ) hesaplayabiliriz :

Regresyon doğrusunun eğimi ve korelasyon katsayısı

Öte yandan, en yaygın olanı, popülasyonun tüm verilerini bilmememiz, sadece bir örneklemimiz olması. Bu durumda, popülasyonun bir tahmincisi olan örneklem Pearson korelasyon katsayısını hesaplayabiliriz. Aşağıdaki formül vasıtasıyla hesaplanır:

Regresyon doğrusunun eğimi ve korelasyon katsayısı

r , korelasyon katsayısı olduğunda , x̅, x değişkeninin örnek ortalamasıdır, y̅, y değişkeninin örnek ortalamasıdır ve x i ve y i , iki değişkenin her birinin bireysel değerleridir .

En Küçük Kareler Doğrusal Regresyon Sığdırma

Doğrusal regresyon, eşleştirilmiş bir veri serisini düz bir çizgiye uydurma işlemidir. Veri serisine en iyi uyan çizginin matematiksel denkleminin elde edilmesini içerir ve bu nedenle, her ikisi de bir Kartezyen koordinat sisteminde temsil edildiğinde tüm noktalar ve çizgi arasındaki ortalama mesafeyi en aza indirir.

Doğrusal regresyon neredeyse her zaman en küçük kareler yöntemiyle gerçekleştirilir ve sonuç, bir çizgiyi tanımlayan iki parametrenin, yani Y ekseni ile kesim ve eğimin elde edilmesidir.

Bir veri dizisi doğrusal davransın ya da davranmasın, ona en uygun doğrunun denklemini elde etmek her zaman mümkündür. Bağımsız olarak aldığımız bir değişkeni (X) ve bağımlı değişken olarak aldığımız başka bir değişkeni (Y) ele alırsak , doğrunun denklemi şu şekilde verilir:

Regresyon doğrusunun eğimi ve korelasyon katsayısı

Bu denklemde, a ve b katsayıları doğrusal regresyon katsayılarıdır ve sırasıyla doğrunun Y kesme noktasını ve eğimini temsil eder. Model tahmin hatasının (gerçek değer ile model tarafından tahmin edilen değer arasındaki fark) karesini en aza indiren katsayıların şu şekilde verildiği kolayca gösterilebilir:

Regresyon doğrusunun eğimi ve korelasyon katsayısı

Doğrusal regresyon çizgisinin eğimi, b ve korelasyon katsayısı, r arasındaki ilişki

Artık a ve b doğrusal regresyon katsayılarının ne olduğu ve Pearson doğrusal korelasyon katsayısı r’nin ne olduğu konusunda daha net olduğumuza göre , b eğiminin r ile neden ve nasıl ilişkili olduğunu anlamaya hazırız .

Aslında, b için yukarıdaki denklemin ve Pearson katsayısının tanımının birleşimi , bir veri örneği durumunda, bu iki istatistik arasındaki matematiksel ilişkiyle sonuçlanır:

Regresyon doğrusunun eğimi ve korelasyon katsayısı

Görülebileceği gibi, numune standart sapmaları s x ve s y tanım gereği pozitif olduğundan (ilgili varyansların pozitif karekökü olduklarından), oranları zorunlu olarak pozitif olacaktır. Bu nedenle eğimin işareti b , korelasyon katsayısının işareti r ile belirlenir ve bunun tersi de geçerlidir.

Ayrıca eğim, r ile iki standart sapma arasındaki yukarıda belirtilen bölümün çarpımı olarak ifade edildiğinden , iki değişkenin herhangi bir korelasyon göstermediği durumlarda (yani r = 0 olduğunun doğrulanması durumunda ) , o zaman verilere lineer regresyonla uydurulan doğrunun eğimi de daha önce gözlemlediğimiz gibi sıfır olacaktır.

Bu çok mantıklı, çünkü bağımlı değişkeni etkileyen diğer tüm faktörler geçerliyse, bağımlı değişkenle bağımsız değişken arasında bir korelasyon yoksa, bağımsız değişkende (yani x’te) bir değişikliğin olması beklenecektir. ) birincide (yani y’de) gözlemlenebilir bir değişiklik üretmeyecektir. Sonuç olarak, grafik boyunca soldan sağa doğru hareket ettikçe, y değerlerinde herhangi bir artış veya düşüş gözlemlemeyeceğiz ve gözlemlediğimiz herhangi bir değişiklik, yalnızca o değişkenin rastgele doğasından kaynaklanmaktadır.

Nüfus verileri durumunda Pearson katsayısı ile eğim arasındaki ilişki

Örnek verilerle ilgili olarak az önce söylenenler, bir popülasyonun tüm verilerine sahip olunması durumunda da aynı şekilde geçerlidir. Değişen tek şey, istatistik ( a, b ve r ) yerine , popülasyon durumunda parametrelerin varlığında olmamızdır.

İstatistiklerde yaygın olduğu gibi, parametreler genellikle istatistiklerle aynı harflerle, yalnızca Yunan alfabesinin harfleri kullanılarak temsil edilir. Bu nedenle, doğrunun tüm popülasyon verilerine uydurulan kesim ve eğimi (a ve b yerine ) α ve β harfleriyle , Pearson katsayısı ρ ( r yerine ) harfiyle temsil edilmektedir. popülasyon standart sapmaları ise s harfiyle gösterilir ( s yerine ).

Dolayısıyla, popülasyon için eğim ile doğrusal korelasyon katsayısı arasındaki ilişki şu şekilde verilir:

Regresyon doğrusunun eğimi ve korelasyon katsayısı

Referanslar

Carollo Limeres, Sunucu (2012). BASİT DOĞRUSAL REGRESYON . Santiago de Compostela Üniversitesi. http://eio.usc.es/eipc1/BASE/BASEMASTER/FORMULARIOS-PHP-DPTO/MATERIALES/Mat_50140116_Regr_%20simple_2011_12.pdf

LesKanaris. (son). İstatistiklerde eşleştirilmiş veri nedir? – İpuçları – 2022 . https://us.leskanaris.com/7419-paired-data-in-statistics.html

Martinez Vara De Rey, CC (sf). Psikolojide Veri Analizi II – Pearson’ın Lineer Korelasyon Katsayısı . Sevilla Üniversitesi. https://personal.us.es/vararey/correlacion-lineal-pearson.pdf

Rodrigo, JA (2016, Haziran). Lineer Korelasyon ve Basit Lineer Regresyon . CienciaDeDatos.Net. https://www.cienciadatos.net/documentos/24_correlacion_y_regresion_lineal

Santos Cuervo, L. (2000). Regresyon ve Korelasyon . atar. http://recursostic.educacion.es/descartes/web/Descartes1/Bach_CNST_1/Variables_estadisticas_bi Dimensiones_regresion_correlacion/regresi2.htm

Süper Prof. (2020, 25 Mayıs). Regresyon çizgisi nedir? | Süper Prof. Didaktik Materyal – Superprof. https://www.superprof.es/apuntes/escolar/matematicas/estadistica/disbidimension/recta-de-regresion.html

Ucha, AP (2021, 19 Şubat). Doğrusal korelasyon katsayısı . Economipedia. https://economipedia.com/definiciones/coeficiente-de-correlacion-lineal.html

-Reklamcılık-

mm
Israel Parada (Licentiate,Professor ULA)
(Licenciado en Química) - AUTOR. Profesor universitario de Química. Divulgador científico.

Artículos relacionados