สัมประสิทธิ์สหสัมพันธ์

สัมประสิทธิ์สหสัมพันธ์

 

วิธีการทางสถิติที่ใช้ในการศึกษาความสัมพันธ์ระหว่างตัวแปรเริ่มต้นขึ้นโดย Sir Francis Galton นักพันธุศาสตร์ชาวอังกฤษ ซึ่งมีชีวิตในช่วงปี ค.ศ.1822-1911 เป็นที่ทราบกันดีว่า บุตรมีส่วนละม้ายคล้ายคลึงกับบิดามารดา Galton จึงต้องการทราบว่าความคล้ายคลึงนี้มีมากเพียงใด บุตรจะมีลักษณะแตกต่างไปจากบิดามารดาได้เพียงใด นักสถิติในประเทศอังกฤษต่างสนใจในคำถามนี้ และได้รวบรวมข้อมูลจำนวนมากเพื่อศึกษาหาคำตอบของคำถามนี้

Karl Pearson เป็นผู้หนึ่งที่ศึกษาเรื่องความคล้ายคลึงกันของสมาชิกในครอบครัว ในปี ค.ศ. 1903 เขาวัดความสูงของบิดาจำนวน 1,078 คน และความสูงของบุตรชายคนหนึ่งที่เติบโตเต็มที่ของบุคคลเหล่านี้ นำความสูงของบิดาและบุตรจำนวน 1,078 คู่นี้ มาสร้างแผนภาพการกระจายดังภาพที่ 1 โดยกำหนดแกนนอนหรือแกน x แทนความสูงของบิดา แกนตั้งหรือแกน y แทนความสูงของบุตรชาย และแต่ละจุดแทนคู่บิดาและบุตรชายหนึ่งคู่ 

จากภาพ 1 แสดงให้เห็นความเกี่ยวข้องกันระหว่างสองตัวแปรคือความสูงของบิดาและความสูงของบุตรชาย โดยจะเห็นกลุ่มของจุดที่เอียงสูงขึ้นทางด้านขวามือ กล่าวคือ ค่า y ของจุดส่วนใหญ่จะเพิ่มขึ้นตามค่า x ที่เพิ่มขึ้น หมายความว่า บิดาที่สูงมักจะมีบุตรชายที่สูงด้วย นักสถิติกล่าวถึงลักษณะเช่นนี้ว่า ความสูงของบิดาและบุตรชายมีสหสัมพันธ์กันในทางบวก 

คำว่า สหสัมพันธ์ (correlation) แยกเป็นคำ 2 คำ คือ สห ซึ่งหมายถึง ร่วมกันหรือด้วยกัน และความสัมพันธ์ หมายถึง ความเกี่ยวข้องกัน เมื่อเหตุการณ์ 2 เหตุการณ์ที่โดยปกติมักเกิดขึ้นพร้อมกัน จะบอกว่าสองเหตุการณ์นั้นมีสหสัมพันธ์กัน เช่น คนผมสีดำและตาสีน้ำตาล คนผมสีทองและตาสีฟ้า นอกจากนี้ เมื่อมีการเปลี่ยนแปลงในเหตุการณ์หนึ่ง ก็มักเกิดการเปลี่ยนแปลงในอีกเหตุการณ์หนึ่งควบคู่กัน เช่น เมื่อเด็กสูงขึ้น เขาน่าจะมีน้ำหนักเพิ่มขึ้น

สหสัมพันธ์มี 2 แบบ คือ สหสัมพันธ์ทางบวกและสหสัมพันธ์ทางลบ สหสัมพันธ์ทางบวกหมายถึง เมื่อตัวแปรตัวหนึ่งมีค่าเพิ่มขึ้น อีกตัวแปรมีค่าเพิ่มขึ้นตาม ส่วนสหสัมพันธ์ทางลบ หมายถึง เมื่อตัวแปรตัวหนึ่งมีค่าเพิ่มขึ้น อีกตัวแปรจะมีค่าลดลง ภาพ 2 แสดงตัวอย่างของสหสัมพันธ์ทางบวกและลบของความสูงและน้ำหนักตัวของคน 

เมื่อทราบจากแผนภาพการกระจายว่าตัวแปรมีสหสัมพันธ์กัน สิ่งที่ควรทราบเพิ่มเติมคือ ความเกี่ยวข้องสัมพันธ์นั้นมีมากหรือน้อยเพียงใด ในเรื่องนี้แผนภาพการกระจายจะสามารถบอกได้ในระดับหนึ่ง เมื่อกล่าวถึงบิดาที่สูง 72 นิ้ว อาจคาดได้ว่าบุตรชายจะสูง 72 นิ้วด้วย ในทำนองเดียวกัน ถ้าบิดาสูง 68 นิ้ว คาดว่าบุตรชายควรสูง 68 นิ้ว หรือถ้าบิดาสูง 70 นิ้ว บุตรชายก็น่าจะสูง 70 นิ้ว นั่นคือ หากนำความสูงของบิดาและบุตรชายคู่ต่าง ๆ เหล่านี้มาลงจุดในแผนภาพ จุดจะตกบนเส้นตรงที่ทำมุม 45o กับแกนนอน เส้นตรงนี้เป็นเส้นที่แสดงว่าความสูงของบุตรชายเท่ากับความสูงของบิดา โดยมีสมการเป็น y = x ดังแสดงไว้ในภาพที่ 1ฉะนั้นถ้าคิดว่าความสูงของบุตรชายควรใกล้เคียงกับความสูงของบิดา หมายความว่า จุดต่าง ๆ บนแผนภาพการกระจายควรตกใกล้กับเส้นตรงเส้นนี้ ซึ่งจากภาพที่ 1 จะเห็นครอบครัวส่วนใหญ่มีจุดตกกระจายรอบ ๆเส้น บ้างก็ห่างจากเส้นตรงมาก บ้างก็อยู่ใกล้เคียง แสดงว่าความสูงของบุตรชายต่างจากความสูงของบิดาไม่มากก็น้อย 

การกระจายของจุดในแผนภาพการกระจายแสดงถึงความมากหรือน้อยของความสัมพันธ์ระหว่างความสูงของบิดาและบุตรชาย การทราบความสูงของบิดาช่วยให้คาดเดาความสูงของบุตรชายได้ เพราะความสูงของบิดาและบุตรชายมีความสัมพันธ์กันแต่การคาดคะเนก็ไม่ถูกต้องแน่นอน ยังมีความผิดพลาดเกิดขึ้นได้ เพราะบุตรชายที่มีบิดาสูงเท่ากันหลายคนก็มีความสูงแตกต่างกัน ลองพิจารณาบิดาที่สูงประมาณ 72 นิ้ว ในภาพที่ 1 จุดต่าง ๆ ที่มีค่า x ใกล้ ๆ 72 นิ้วล้วนเป็นจุดจากคู่บิดาและบุตรชายที่มีบิดาสูง 72 นิ้ว จะเห็นว่าความสูงของบุตรชายเหล่านี้ (ค่า y) มีการกระจายหรือความผันแปรอยู่มาก นั่นคือ การทำนายความสูงของบุตรชายมีความคลาดเคลื่อนได้พอสมควรถึงแม้ว่าจะทราบความสูงของบิดาของเขา อันเนื่องมาจากความสัมพันธ์ระหว่างตัวแปรทั้งสองยังไม่สมบูรณ์ ดังนั้นจะสามารถสรุปความสัมพันธ์ของตัวแปร x และ y ออกมาเป็นตัวเลขให้เห็นว่ามีระดับมากหรือน้อยได้อย่างไรค่าเฉลี่ยของ x และ y รวมทั้งส่วนเบี่ยงเบนมาตรฐานของ x และ y ไม่อาจอธิบายเกี่ยวกับความสัมพันธ์ระหว่าง x และ y ได้ ค่าเฉลี่ยของ x และ y จะแสดงให้ทราบว่าจุดศูนย์กลางของกลุ่มข้อมูลอยู่ที่ใด และส่วนเบี่ยงเบนมาตรฐานของ x และ y จะอธิบายเรื่องการกระจายของจุดบนแต่ละแกน จากด้านหนึ่งของกลุ่มไปยังอีกด้านหนึ่งพิจารณาแผนภาพการกระจายของข้อมูล 2 ชุดในภาพที่ 3 เห็นได้ว่าทั้งสองชุดต่างมีจุดศูนย์กลางและการกระจายด้านแกนนอนและแกนตั้งเหมือนกัน แต่ในชุดแรก จุดกระจัดกระจายไม่เกาะกลุ่มกัน ส่วนในชุดที่สองจุดเกาะกลุ่มแนบแน่นเป็นแนวเส้นตรงมาก หรือสองตัวแปรมีความสัมพันธ์เชิงเส้นตรงสูงมาก นั่นคือ ระดับความสัมพันธ์ในแผนภาพทั้งสองนี้ต่างกัน การจะวัดระดับความสัมพันธ์ จึงต้องใช้ค่าทางสถิติอีกค่าหนึ่งที่เรียกว่า สัมประสิทธิ์สหสัมพันธ์ (correlation coefficient)

By naunjutaearn

ความสัมพันธ์ในข้อมูลเชิงปริมาณ

ความสัมพันธ์ในข้อมูลเชิงปริมาณ

 

เมื่อมีข้อมูลของตัวแปรสองตัวที่วัดค่าเป็นตัวเลข ซึ่งเรียกว่า ข้อมูลเชิงปริมาณ สิ่งที่น่าสนใจจากข้อมูลนี้ ได้แก่ 

 ตัวแปรทั้งสองเกี่ยวข้องกันหรือไม่ ระดับความสัมพันธ์ของตัวแปรมีมากน้อยเพียงใด ความสัมพันธ์ของตัวแปรอยู่ในรูปแบบใด จะคาดคะเนค่าตัวแปรหนึ่งจากอีกตัวแปรได้หรือไม่ 

เพื่อความสะดวกในการตอบคำถามต่าง ๆ ข้างต้น จะกำหนดให้ตัวแปรหนึ่งเป็น x และอีกตัวแปรเป็น y ตัวอย่างเช่น การสมัครเข้าศึกษาต่อระดับปริญญาโทสาขาวิชาบริหารธุรกิจในหลาย ๆ สถาบัน มักมีข้อกำหนดว่า ผู้สมัครต้องมีคะแนนจากผลการสอบ GMAT (Graduate Management Attitude Test) ประกอบการสมัครด้วย คะแนน GMAT เป็นตัวที่ใช้วัดความรู้ความสามารถของผู้สมัครอย่างหนึ่ง จึงต้องการทราบว่า ผลการเรียนของผู้สมัคร (GPA) ในระดับปริญญาตรีมีความสัมพันธ์กับคะแนน GMAT หรือไม่ หรือจะคาดคะเนคะแนน GMAT จาก GPA ของผู้สมัครได้หรือไม่ฉะนั้นอาจกำหนดตัวแปร x คือ GPA และตัวแปร y คือ GMAT สมมติเราสังเกตค่าข้อมูลของ x และ y จากผู้สมัครเรียนจำนวน 36 คน ดังนั้นจึงมีคู่ลำดับของค่าสังเกต (x, y) จากผู้สมัครแต่ละคน นั่นคือจะมีค่าสังเกต (x1, y1), (x2, y2), … , (x36, y36) เช่น ผู้สมัครคนหนึ่งมี GPA เป็น 2.68 และได้คะแนน GMAT 414 คะแนน ค่าสังเกตของผู้สมัครก็จะเป็น (2.68, 414) เป็นต้น ข้อมูลของผู้สมัครทั้ง 36 คนแสดงในตาราง

 

ตารางแสดงข้อมูล GPA และคะแนน GMAT ของผู้สมัครเรียน 36 คน

GPA GMAT GPA GMAT GPA GMAT
3.44 632 2.36 399 2.80 444
3.59 588 2.36 482 3.13 426
3.30 563 2.66 420 3.01 471
3.40 553 2.68 414 2.79 490
3.50 572 2.48 533 2.89 431
3.78 591 2.46 509 2.91 446
3.00 509 2.63 504 2.75 546
3.48 528 2.44 336 2.73 467
3.22 541 2.36 464 3.22 506
3.47 552 2.13 408 3.12 473
3.35 520 2.41 469 3.08 440
3.39 543 2.55 529 3.03 419

 

 

การพิจารณาค่าสังเกตุที่เป็นตัวเลขไม่สามารถช่วยให้เห็นความสัมพันธ์ระหว่าง x และ y ได้มากนัก วิธีที่ดีกว่าและเป็นขั้นตอนเริ่มแรกที่สำคัญในการศึกษาความสัมพันธ์ในข้อมูลของสองตัวแปรก็คือ การสร้างกราฟแสดงการกระจายของข้อมูล โดยให้ตัวแปร x อยู่ทางแกนนอน ส่วนตัวแปร y อยู่ทางแกนตั้ง และลงค่าสังเกตุ (x , y) แต่ละคู่ลำดับเป็นจุดบนกราฟนั้น แผนภาพที่ได้จะเรียกว่า แผนภาพการกระจาย (scatter diagram) แผนภาพการกระจายมีประโยชน์มากในการช่วยนำเสนอข้อมูลของสองตัวแปรที่เป็นเชิงปริมาณ ซึ่งจากการพิจารณาแผนภาพการกระจาย จะช่วยให้มองเห็นภาพของรูปแบบความสัมพันธ์ระหว่างตัวแปรได้ดี 

 

ตัวอย่างเช่น จะสังเกตุเห็นได้ว่า จุดต่าง ๆ มีลักษณะการกระจายเป็นแนวเส้นตรง เส้นโค้ง หรือเห็นเป็นเพียงกลุ่มของข้อมูลที่ไม่มีรูปแบบความสัมพันธ์ใด ๆ สำหรับในตัวอย่างเรื่อง GPA และ GMAT ข้างต้น จะสร้างแผนภาพการกระจายของข้อมูลในตาราง ได้ดังภาพ จุดแต่ละจุดแสดงค่า GPA และคะแนน GMAT ของผู้สมัครแต่ละคน จะเห็นว่าจุดกระจายเป็นแนวจากมุมล่างซ้าย สูงขึ้นไปยังมุมบนขวา ซึ่งแสดงว่า ผู้สมัครที่มี GPA ต่ำ ส่วนใหญ่จะได้คะแนน GMAT ต่ำ ในขณะที่ผู้สมัครที่มี GPA สูงส่วนใหญ่จะได้คะแนน GMAT สูง

By naunjutaearn

ความสัมพันธ์ในข้อมูลเชิงคุณภาพ

ความสัมพันธ์ในข้อมูลเชิงคุณภาพ

 

เมื่อตัวแปรทั้งสองตัวมีการวัดค่าเป็นค่าที่บอกประเภทของหน่วยตัวอย่าง ดังนั้น การที่จะศึกษาความสัมพันธ์โดยการนำข้อมูลจำแนกประเภทนั้นมาแจกแจงความถี่และจัดเรียงสรุปในรูปตารางแจกแจงความถี่แบบสองทาง หรืออีกชื่อหนึ่งที่นิยมเรียกในทางสถิติ คือตารางการณ์จร (Contingency table) โดยมีรูปแบบของตาราง คือ ประเภทหรือกลุ่มของตัวแปรหนึ่งจะอยู่ด้านแถวนอน และอีกตัวแปรหนึ่งอยู่ด้านแถวตั้ง จำนวนความถี่ของหน่วยตัวอย่างแต่ละประเภทที่นับได้จะบันทึกในแต่ละช่องของตารางตัวอย่าง

 

การสอบถามความเห็นของนิสิตต่อผลการสอนเป็นกิจกรรมหนึ่ง เพื่อไปสู่การปรับปรุงคุณภาพการเรียนการสอน จุดที่สนใจจุดหนึ่ง คือ ความพอใจของนิสิตในการเรียนวิชาหนึ่ง ขึ้นกับวิชานั้นว่าเป็นวิชาบังคับหรือวิชาเลือกหรือไม่ ดังนั้น ในแบบสอบถามจึงให้นิสิตระบุว่าวิชาที่เรียนเป็นวิชาบังคับหรือวิชาเลือก นอกเหนือจากการให้นิสิตเสนอความเห็นเกี่ยวกับวิชานั้น โดยมี 3 ระดับให้เลือกคือ ดี พอใช้ และควรปรับปรุง ทั้งนี้ เมื่อสอบถามนิสิตที่เรียนวิชาหนึ่งจำนวน 200 คน ได้ข้อมูลที่นำมาจำแนกนิสิตเป็นกลุ่ม ตามค่าของตัวแปรสองตัว คือลักษณะวิชา และความคิดเห็น ความถี่หรือจำนวนนิสิตในแต่ละกลุ่มแสดงในตารางการณ์จรขนาด 2×3 ได้ดังนี้

 

ตารางแสดงจำนวนนิสิตจำแนกตามลักษณะวิชาและความเห็นต่อวิชา
ดี พอใช้ ควรปรับปรุง รวม
วิชาเลือก 35 20 5 60
วิชาบังคับ 37 76 27 140
รวม 72 96 32 200

 

นั่นคือ จากนิสิต 200 คนที่สอบถาม มี 140 คนที่เรียนวิชานี้เป็นวิชาบังคับ และในกลุ่มนี้ 37 คนมีความเห็นว่าวิชานี้ดี 76 คนคิดว่าพอใช้ 27 คนคิดว่าควรปรับปรุงเพื่อให้เข้าใจได้ดีขึ้นว่านิสิตมีความคิดเห็นแตกต่างกันอย่างไรบ้าง จะคำนวณความถี่สัมพัทธ์หรือร้อยละของแต่ละช่อง โดยหารความถี่แต่ละช่องด้วยขนาดตัวอย่าง 200 แล้วคูณด้วย 100 เช่น 37 เปลี่ยนเป็นร้อยละ 18.5 ( [37/200] x 100 = 18.5) ค่าร้อยละของนิสิตแสดงในตารางข้างล่างนี้

 

ตารางแสดงร้อยละของนิสิตจำแนกตามลักษณะวิชาและความเห็นต่อวิชา
ดี พอใช้ ควรปรับปรุง รวม
วิชาเลือก 17.5 10.0 2.5 30.0
วิชาบังคับ 18.5 38.0 13.5 70.0
รวม 36.0 48.0 16.0 100.0

 

จะเห็นได้ว่า นิสิตส่วนใหญ่ (ร้อยละ 70) เรียนวิชานี้เป็นวิชาบังคับ และเกือบครึ่งหนึ่ง (ร้อยละ 48) เห็นว่า การสอนวิชานี้อยู่ในระดับพอใช้ และประมาณหนึ่งในสาม (ร้อยละ 36) เห็นว่า การสอนอยู่ในระดับดีนอกจากจะหาความถี่สัมพัทธ์หรือร้อยละของแต่ละช่องเทียบกับยอดรวมทั้งหมดแล้ว อาจหาความถี่สัมพัทธ์หรือร้อยละเทียบกับยอดรวมแถวนอนหรือแถวตั้งก็ได้ ขึ้นกับความสนใจ เช่น ต้องการเปรียบเทียบการแจกแจงของความคิดเห็นของนิสิตกลุ่มที่เรียนวิชานี้เป็นวิชาบังคับ และกลุ่มที่เรียนเป็นวิชาเลือก หรือกล่าวอีกอย่างหนึ่งว่า ความคิดเห็นสัมพันธ์กับลักษณะวิชาอย่างไร ดังนั้น จะคำนวณร้อยละของนิสิตที่มีความคิดเห็นต่าง ๆ แยกสำหรับแต่ละกลุ่ม โดยเอา 140 เป็นตัวหาร เช่น 37 เปลี่ยนเป็นร้อยละ 26.4 ( [37/140] x 100 = 26.4 ) ดังตารางข้างล่าง

 

ตารางแสดงร้อยละของนิสิตที่มีความเห็นต่าง ๆ ต่อวิชาที่เรียน
แยกตามกลุ่มลักษณะวิชา
ดี พอใช้ ควรปรับปรุง รวม
วิชาเลือก 58.4 33.3 8.3 100.0
วิชาบังคับ 26.4 54.3 19.3 100.0
รวม 36.0 48.0 16.0 100.0

 

จากตารางแสดงความเห็นระหว่างนิสิตสองกลุ่มต่างกัน นิสิตที่เรียนวิชานี้เป็นวิชาเลือกเห็นว่า การสอนอยู่ในระดับดี มากกว่านิสิตที่เรียนวิชานี้เป็นวิชาบังคับ ความเห็นที่แตกต่างนี้เป็นเพียงความบังเอิญในกลุ่มนิสิตที่เป็นตัวอย่าง หรือเป็นความแตกต่างในความคิดเห็นจริง ๆ ของนิสิตทั่วไป จำเป็นที่จะต้องใช้สถิติอนุมานในการศึกษาต่อไป ซึ่งจะไม่กล่าวถึงในที่นี้ แทนการนำเสนอในรูปของตารางอาจใช้แผนภูมิแท่งที่ช่วยให้เห็นการเปรียบเทียบง่ายขึ้นดังภาพข้างล่าง ที่แสดงผลการวิเคราะห์เหมือนตาราง

 

 

ความเห็นของนิสิตต่อวิชาที่เรียนแยกตามกลุ่มลักษณะวิชา

By naunjutaearn

ความสัมพันธ์ในข้อมูลสองตัวแปร

ป ข้อมูลที่พบเห็นมักมีตัวแปรที่มากกว่าหนึ่งตัว ซึ่งตัวแปรเหล่านั้น อาจมีความเกี่ยวข้องสัมพันธ์กัน ตัวอย่างเช่น รถยนต์เมื่อมีอายุการใช้งานนานขึ้น ก็จะเสียค่าใช้จ่ายในการบำรุงรักษามากขึ้น นั่นคือ อายุการใช้งานและค่าใช้จ่ายในการบำรุงรักษามีความสัมพันธ์กัน หรือผลการเรียนของนิสิตสัมพันธ์หรือขึ้นอยู่กับสติปัญญาของนิสิต และเวลาที่นิสิตใช้ในการทบทวนบทเรียน ความรู้เรื่องความสัมพันธ์ในข้อมูลจะทำให้เข้าใจสิ่งต่าง ๆ ที่อยู่รอบตัวได้ดีขึ้น เช่น ทราบเหตุผลว่าทำไมนิสิตแต่ละคนมีผลการเรียนแปรผันแตกต่างกันหรือทราบว่าค่าใช้จ่ายในการบำรุงรักษารถยนต์แปรผันตามอายุการใช้งานของรถคันนั้นอย่างไร 

ดังนั้น จากหน่วยตัวอย่างแต่ละหน่วยที่สุ่มมา หากมีการสังเกตและจดบันทึกค่าของตัวแปรมาตั้งแต่ 2 ตัวแปรขึ้นไป ก็สามารถนำข้อมูลที่ได้มาศึกษาว่า ตัวแปรเหล่านั้นมีความเกี่ยวข้องสัมพันธ์กันหรือไม่ ถ้ามีระดับความสัมพันธ์ มีมากน้อยเพียงใด และลักษณะความสัมพันธ์เป็นแบบใด การที่ตัวแปรมีความสัมพันธ์กันหมายความว่า ความรู้เกี่ยวกับตัวแปรหนึ่งจะช่วยให้ทราบเรื่องราวเกี่ยวกับตัวแปรอื่นที่สัมพันธ์กันได้ 

ฉะนั้น ประโยชน์หนึ่งที่ได้จากการทราบความสัมพันธ์ระหว่างตัวแปร คือ จะสามารถทำนายค่าของตัวแปรหนึ่งที่สนใจ จากข้อมูลของตัวแปรอื่น ๆ เช่น สามารถคาดคะเนได้ว่า ค่าใช้จ่ายในการบำรุงรักษารถยนต์คันหนึ่งที่ใช้งานมาแล้ว 10 ปีเป็นเท่าใด ต่อไปจะกล่าวถึงความสัมพันธ์ เฉพาะกรณีที่มีตัวแปรเพียง 2 ตัว โดยพิจารณาแต่กรณีที่ทั้งสองตัวแปรมีค่าที่บอกถึงประเภทหรือกลุ่มนั้น คือ ข้อมูลเชิงคุณภาพ หรือข้อมูลจำแนกประเภท เช่น ความสัมพันธ์ระหว่างการสูบบุหรี่และการเป็นมะเร็งปอด และกรณีที่ตัวแปรทั้งคู่วัดค่าเป็นตัวเลข หรือข้อมูลเชิงปริมาณ เช่น ความสัมพันธ์ระหว่างผลผลิตและปริมาณปุ๋ยที่ใช้ ส่วนกรณีที่ตัวแปรหนึ่งเป็นตัวแปรที่บอกถึงการจำแนกประเภท และอีกตัวแปรวัดค่าเป็นตัวเลขจะไม่กล่าวถึง 

สำหรับข้อมูลที่เป็นเชิงปริมาณล้วน ๆ ซึ่งอาจหาสมการแสดงความสัมพันธ์ระหว่างตัวแปร เพื่อใช้ประโยชน์ในการคาดคะเนค่าได้ เช่น สมการแสดงความสัมพันธ์ระหว่างน้ำหนักและความสูง ช่วยให้ทราบน้ำหนักตัวที่เหมาะสมสำหรับคนที่มีความสูงระดับต่าง ๆเทคนิคการสร้างสมการนี้เรียกว่า การถดถอย 

ความสัมพันธ์หนึ่งที่สำคัญมากคือเมื่อตัวแปรตัวหนึ่งเป็นเวลา และสนใจการเปลี่ยนแปลงของค่าตัวแปรอีกตัวเมื่อเวลาเปลี่ยนไป เรียกการเปลี่ยนแปลงตามเวลานี้ว่า แนวโน้ม ตัวอย่างที่พบมาก ได้แก่ แนวโน้มของข้อมูลทางเศรษฐกิจต่าง ๆ เช่น การขึ้นลงของดัชนีราคาตลาดหลักทรัพย์ อัตราดอกเบี้ย ปริมาณการส่งออกสินค้า เป็นต้น 

ดังนั้น จะกล่าวถึงความสัมพันธ์ในข้อมูลของสองตัวแปร การสร้างสมการแสดงความสัมพันธ์และแนวโน้มอย่างง่าย ๆ เพื่อให้เกิดความเข้าใจและสามารถนำความรู้ไปประยุกต์ใช้ในชีวิตประจำวันต่อไป

 

ความสัมพันธ์ในข้อมูลสองตัวแปร

 

เมื่อสังเกตลักษณะสองลักษณะหรือสองตัวแปรจากแต่ละหน่วยตัวอย่าง การศึกษาข้อมูลของตัวแปรแต่ละตัวแยกกันจะไม่สามารถให้คำตอบเกี่ยวกับความสัมพันธ์ได้ แต่จำเป็นต้องนำข้อมูลของทั้งสองตัวแปรมาศึกษาพร้อมกันโดยการจัดระเบียบข้อมูล เพื่อให้เห็นความสัมพันธ์ได้ง่ายขึ้น ซึ่งอาจจัดระเบียบตารางหรือกราฟ ทั้งนี้ ขึ้นกับว่าข้อมูลนั้นเป็นข้อมูลเชิงคุณภาพหรือข้อมูลเชิงปริมาณ
By naunjutaearn