Giải chuyên đề học tập Tin 12 CTST hay, chi tiết Chuyên đề 3: Thực hành phân tích dữ liệu với phần mềm b..

Bài 3.6: Phân tích tương quan - Chuyên đề Tin học 12 Chân trời sáng tạo


Quan sát dữ liệu Bảng 1, có mối tương quan giữa điểm Ngữ văn và điểm Ngoại ngữ không

Tổng hợp đề thi học kì 2 lớp 12 tất cả các môn - Chân trời sáng tạo

Toán - Văn - Anh - Hoá - Sinh - Sử - Địa

Lựa chọn câu để xem lời giải nhanh hơn

Câu 1

Trả lời câu hỏi Khởi động trang 95 Chuyên đề Tin học 12 Chân trời sáng tạo

Quan sát dữ liệu Bảng 1, có mối tương quan giữa điểm Ngữ văn và điểm Ngoại ngữ không

Lời giải chi tiết:

Dựa trên dữ liệu từ Bảng 1, để xác định mối tương quan giữa điểm Ngữ văn và điểm Ngoại ngữ, ta làm như sau:

Nhập điểm Ngữ văn và Ngoại ngữ của từng học sinh vào hai cột riêng biệt trong Excel.

Sử dụng công thức =CORREL(array1, array2) trong Excel, với array1 là cột điểm Ngữ văn và array2 là cột điểm Ngoại ngữ.

Nên: Nếu hệ số tương quan gần 1 hoặc -1, có mối tương quan mạnh giữa hai môn học. Nếu hệ số tương quan gần 0, không có mối tương quan rõ ràng.

Câu 2

Trả lời câu hỏi trang 97 Chuyên đề Tin học 12 Chân trời sáng tạo

Tại sao phải tổ chức lại những dữ liệu dưới dạng tần số trên bảng tính trước khi phân tích tương quan?

Lời giải chi tiết:

Cần phải tổ chức lại những dữ liệu dưới dạng tần số trên bảng tính trước khi phân tích tương quan vì:

Tổ chức dữ liệu dưới dạng tần số giúp tránh nhầm lẫn giữa các giá trị dữ liệu và số lần xuất hiện của chúng. Điều này rất quan trọng khi tính toán các hệ số tương quan, vì cần phải biết chính xác mỗi giá trị xuất hiện bao nhiêu lần.

Tổ chức dữ liệu dưới dạng tần số giúp dữ liệu trở nên rõ ràng và có hệ thống hơn. Bạn có thể dễ dàng nhận diện được số lần xuất hiện của các giá trị trong tập dữ liệu.

Nhiều phương pháp thống kê yêu cầu dữ liệu đầu vào đã được tổng hợp thành các tần số. Việc tổ chức lại dữ liệu theo tần số giúp đảm bảo rằng các tính toán sẽ được thực hiện chính xác.

Một số phép kiểm định thống kê, như kiểm định chi bình phương (chi-square test), yêu cầu dữ liệu được tổ chức dưới dạng bảng tần số.

Khi dữ liệu được tổ chức rõ ràng, việc tính toán và nhập liệu sẽ ít gặp phải sai sót hơn, giúp đảm bảo độ tin cậy của các kết quả phân tích tương quan.

Khi dữ liệu được tổ chức dưới dạng tần số, việc tạo các biểu đồ và đồ thị (như biểu đồ cột, biểu đồ hình tròn) để trực quan hóa dữ liệu sẽ dễ dàng hơn. Điều này giúp người dùng dễ dàng nắm bắt được thông tin từ dữ liệu.

Nhiều công cụ phân tích dữ liệu và phần mềm thống kê yêu cầu dữ liệu đầu vào được tổ chức dưới dạng tần số. Điều này giúp quá trình phân tích tự động hóa và sử dụng các công cụ phân tích trở nên hiệu quả hơn.

Dữ liệu được sắp xếp dưới dạng tần số có thể giúp phát hiện các mẫu hoặc xu hướng trong dữ liệu một cách dễ dàng hơn.

Với dữ liệu được tổ chức dưới dạng tần số, các thao tác xử lý và phân tích dữ liệu trở nên dễ dàng hơn, đặc biệt là khi làm việc với các tập dữ liệu lớn.

Luyện tập Câu 1

Trả lời câu hỏi Luyện tập 1 trang 97 Chuyên đề Tin học 12 Chân trời sáng tạo

Thực hiện bố trí lại dữ liệu Bảng 3 về dạng dữ liệu có tần số bằng 1.

Lời giải chi tiết:

Thực hiện bố trí lại dũ liệu Bảng 3 về dạng dữ liệu có tần số bằng 1 như sau:

- Nhập dữ liệu từ Bảng 3 vào Excel.

- Tạo một bảng mới bên cạnh bảng gốc.

- Dùng hàm =REPT(text, number_times) để sao chép mỗi hàng theo tần số tương ứng. Trong đó text là nội dung cần sao chép, và number_times là số lần sao chép (tần số).

- Sử dụng công cụ “Text to Columns” để chia nhỏ dữ liệu đã sao chép thành từng hàng riêng biệt.

- Xóa cột tần số cũ, vì tất cả dữ liệu giờ đều có tần số là 1.

Lưu ý: Bạn cần lặp lại quá trình cho đến khi tất cả dữ liệu có tần số bằng 1

Luyện tập Câu 2

Trả lời câu hỏi Luyện tập 2 trang 97 Chuyên đề Tin học 12 Chân trời sáng tạo

Nhận định sau đúng hay sai "Hệ số tương quan tuyến tính là một đại lượng không nằm khoảng từ -1 đến +1"?

Lời giải chi tiết:

Nhận định sau đúng hay sai "Hệ số tương quan tuyến tính là một đại lượng không nằm khoảng từ -1 đến +1"?

Hệ số tương quan tuyến tính (thường được gọi là hệ số tương quan Pearson) luôn nằm trong khoảng từ -1 đến +1. Đây là một đại lượng đo lường mức độ và hướng của mối quan hệ tuyến tính giữa hai biến.

- Hệ số tương quan bằng 1 (+1): Cho biết mối tương quan tuyến tính hoàn hảo thuận. Khi một biến tăng, biến kia cũng tăng với một tỉ lệ cố định.

- Hệ số tương quan bằng -1 (-1): Cho biết mối tương quan tuyến tính hoàn hảo nghịch. Khi một biến tăng, biến kia giảm với một tỉ lệ cố định.

- Hệ số tương quan bằng 0: Cho biết không có mối tương quan tuyến tính giữa hai biến. Tuy nhiên, không có nghĩa là hai biến không có mối quan hệ nào mà chỉ là không có mối quan hệ tuyến tính.

Vì vậy, hệ số tương quan tuyến tính luôn nằm trong khoảng từ -1 đến +1.

Nên nhận định sau là sai "Hệ số tương quan tuyến tính là một đại lượng không nằm khoảng từ -1 đến +1".

Nhiệm vụ

Trả lời câu hỏi Nhiệm vụ trang 97 Chuyên đề Tin học 12 Chân trời sáng tạo

Phân tích tương quan tuyến tính

Yêu cầu: Sử dụng dữ liệu Bảng 1, hãy phân tích xem có mối tương quan giữa điểm Ngữ văn và điểm Ngoại ngữ hay không.

Lời giải chi tiết:

Sử dụng dữ liệu Bảng 1, muốn phân tích xem có mối tương quan giữa điểm Ngữ văn và điểm Ngoại ngữ hay không ta dùng công cụ phân tích Correlation trong bộ công cụ Analysis Toolpak để phân tích xem liệu có mối tương quan giữa điểm Ngữ văn hay không. Ta thực hiện như sau:

1. Chọn Data, chọn Data Analysis, chọn Correlation, Ok.

2. Trong hộp thoại Correlation, thiết lập các tuỳ chọn như sau (Hình 4):

Input:

Input Range: $T$2:$G542 (vùng chứa dữ liệu điểm Ngữ văn và Ngoại ngữ). Grouped By: Chọn Columns (do dữ liệu hiển thị dạng cột).

Labels in first row: Chọn mục này, cho khi chọn vùng dữ liệu SF$2:$G$42 có chọn tiêu đề. Ouput Range: 51$2 (vùng chứa kết quả).

3. Quan sát Ilĩnh 5, em nhận thấy kết quả ở ở tỉnh J4 = 0.172013139, chứng tỏ giữa điểm Ngữ văn và diễm Ngoại ngữ có mối lương quan yếu.

Vận dụng Câu 1

Trả lời câu hỏi Vận dụng 1 trang 100 Chuyên đề Tin học 12 Chân trời sáng tạo

Giả sử có tài liệu về tuổi nghề (năm) và năng suất lao động (sản phẩm) của 10 công nhân tại một xí nghiệp như Bảng 4. Em hãy xác định xem giữa tuổi nghề của công nhân và năng suất lao động của họ có mối liên hệ với nhau không.

Lời giải chi tiết:

Giả sử có tài liệu về tuổi nghề (năm) và năng suất lao động (sản phẩm) của 10 công nhân tại một xí nghiệp như Bảng 4. Để xác định mối liên hệ giữa tuổi nghề và năng suất lao động của công nhân, bạn có thể sử dụng phân tích tương quan trong Excel. Dưới đây là các bước cơ bản:

- Nhập dữ liệu tuổi nghề và năng suất lao động vào hai cột trong Excel.

- Sử dụng công thức =CORREL(array1, array2) để tính hệ số tương quan Pearson, với array1 là cột tuổi nghề và array2 là cột năng suất lao động.

- Nếu hệ số tương quan gần 1 hoặc -1, có mối liên hệ mạnh giữa tuổi nghề và năng suất lao động.

- Nếu hệ số tương quan gần 0, không có mối liên hệ rõ ràng.

Vận dụng Câu 2

Trả lời câu hỏi Vận dụng 2 trang 100 Chuyên đề Tin học 12 Chân trời sáng tạo

Khảo sát mối quan hệ giữa nhiệt độ trung bình với doanh số bán kem có số liệu được biểu diễn theo Bảng 5:

Lời giải chi tiết:

Khảo sát mối quan hệ giữa nhiệt độ trung bình với doanh số bán kem có số liệu được biểu diễn theo Bảng 5 như sau:

- Nhập dữ liệu nhiệt độ trung bình và doanh số bán kem từ Bảng 5 vào hai cột trong một bảng tính Excel.

- Sử dụng công thức =CORREL(array1, array2) để tính hệ số tương quan Pearson, với array1 là cột nhiệt độ trung bình và array2 là cột doanh số bán kem.

Kết quả: Nếu hệ số tương quan gần 1, có mối quan hệ tuyến tính dương mạnh giữa nhiệt độ và doanh số. Nếu hệ số tương quan gần -1, có mối quan hệ tuyến tính âm mạnh. Nếu hệ số tương quan gần 0, không có mối quan hệ tuyến tính rõ ràng.


Bình chọn:
4.9 trên 7 phiếu

>> Xem thêm

Group 2K8 ôn Thi ĐGNL & ĐGTD Miễn Phí