Mục lục
Trong hướng dẫn này, bạn sẽ tìm hiểu cách vẽ biểu đồ phân tán trong Excel để tạo biểu diễn đồ họa của hai tập dữ liệu tương quan.
Khi xem hai cột dữ liệu định lượng trong bảng tính Excel của bạn, bạn thấy gì? Chỉ cần hai bộ số. Bạn có muốn xem hai bộ này có liên quan với nhau như thế nào không? Biểu đồ phân tán là lựa chọn đồ thị lý tưởng cho việc này.
Biểu đồ phân tán trong Excel
A biểu đồ phân tán (còn được gọi là XY graph hoặc sơ đồ phân tán ) là biểu đồ hai chiều thể hiện mối quan hệ giữa hai biến.
Trong biểu đồ phân tán, cả trục ngang và trục dọc đều là trục giá trị biểu thị dữ liệu số. Thông thường, biến độc lập nằm trên trục x và biến phụ thuộc trên trục y. Biểu đồ hiển thị các giá trị tại giao điểm của trục x và y, được kết hợp thành các điểm dữ liệu đơn lẻ.
Mục đích chính của biểu đồ phân tán là cho biết mức độ mạnh mẽ của mối quan hệ hoặc mối tương quan giữa hai biến. Các điểm dữ liệu nằm dọc theo một đường thẳng càng chặt chẽ thì mối tương quan càng cao.
Cách sắp xếp dữ liệu cho biểu đồ phân tán
Với nhiều mẫu biểu đồ có sẵn do Excel cung cấp, việc tạo biểu đồ phân tán trở thành công việc chỉ với vài cú nhấp chuột. Nhưng trước tiên, bạn cần sắp xếp dữ liệu nguồn của mình đúng cách.
Như đã đề cập, biểu đồ phân tán hiển thị hai định lượng có liên quan với nhaubiến. Vì vậy, bạn nhập hai tập hợp dữ liệu số vào hai cột riêng biệt.
Để dễ sử dụng, biến độc lập nên nằm trong cột trái vì cột này là sẽ được vẽ trên trục x. Biến phụ thuộc (biến bị ảnh hưởng bởi biến độc lập) phải nằm trong cột phải và sẽ được vẽ trên trục y.
Mẹo. Nếu cột phụ thuộc của bạn đứng trước cột độc lập và bạn không thể thay đổi cột này trong trang tính, thì bạn có thể hoán đổi trục x và trục y trực tiếp trên biểu đồ.
Trong ví dụ của chúng tôi, chúng tôi sẽ trực quan hóa mối quan hệ giữa ngân sách quảng cáo trong một tháng nhất định (biến độc lập) và số lượng hàng bán ra (biến phụ thuộc) nên ta sắp xếp dữ liệu cho phù hợp:
Cách tạo biểu đồ phân tán trong Excel
Với dữ liệu nguồn được tổ chức chính xác, việc tạo biểu đồ phân tán trong Excel sẽ thực hiện hai bước nhanh chóng sau:
- Chọn hai cột có dữ liệu số, bao gồm cả tiêu đề cột. Trong trường hợp của chúng tôi, đó là phạm vi C1:D13. Không chọn bất kỳ cột nào khác để tránh nhầm lẫn với Excel.
- Chuyển đến nhóm Inset > Trò chuyện , nhấp vào biểu tượng biểu đồ Scatter , và chọn mẫu mong muốn. Để chèn biểu đồ phân tán cổ điển, hãy nhấp vào hình thu nhỏ đầu tiên:
Sơ đồ phân tán sẽ được chèn ngay vào trang tính của bạn:
Về cơ bản, bạn có thểxem xét công việc được thực hiện. Hoặc, bạn có thể tùy chỉnh một số thành phần của biểu đồ để làm cho biểu đồ trông đẹp hơn và thể hiện mối tương quan giữa hai biến rõ ràng hơn.
Các loại biểu đồ phân tán
Bên cạnh biểu đồ phân tán cổ điển được hiển thị trong ví dụ trên, có sẵn một vài mẫu khác:
- Phân tán bằng các đường thẳng và điểm đánh dấu
- Phân tán bằng các đường trơn tru
- Phân tán bằng các đường thẳng và điểm đánh dấu
- Phân tán theo đường thẳng
Phân tán theo đường thẳng được sử dụng tốt nhất khi bạn có ít điểm dữ liệu. Ví dụ: đây là cách bạn có thể biểu thị dữ liệu trong bốn tháng đầu tiên bằng cách sử dụng biểu đồ phân tán với các đường và điểm đánh dấu mượt mà:
Các mẫu biểu đồ Excel XY cũng có thể vẽ từng biến riêng biệt , trình bày các mối quan hệ giống nhau theo một cách khác. Đối với điều này, bạn nên chọn 3 cột có dữ liệu - cột ngoài cùng bên trái có giá trị văn bản (nhãn) và hai cột có số.
Trong ví dụ của chúng tôi, các chấm màu xanh biểu thị chi phí quảng cáo và các chấm màu cam biểu thị chi phí quảng cáo các mặt hàng đã bán:
Để xem tất cả các loại phân tán có sẵn ở một nơi, hãy chọn dữ liệu của bạn, nhấp vào biểu tượng Phân tán (X, Y) trên ruy-băng rồi nhấp vào Thêm phân tán Biểu đồ… Thao tác này sẽ mở hộp thoại Inset Chart với loại XY (Scatter) được chọn và bạn chuyển đổi giữa các mẫu khác nhau ở trên cùng để xem mẫu nào cung cấp tốt nhấtbiểu diễn đồ họa dữ liệu của bạn:
Biểu đồ phân tán 3D
Không giống như biểu đồ phân tán XY cổ điển, Biểu đồ phân tán 3D hiển thị các điểm dữ liệu trên ba trục (x, y và z) để thể hiện mối quan hệ giữa ba biến. Do đó, nó thường được gọi là biểu đồ XYZ .
Rất tiếc, không có cách nào để tạo biểu đồ phân tán 3D trong Excel, ngay cả trong phiên bản Excel 2019 mới. Nếu bạn thực sự cần loại biểu đồ này để phân tích dữ liệu của bạn, hãy cân nhắc sử dụng một số công cụ của bên thứ ba, chẳng hạn như plot.ly. Ảnh chụp màn hình bên dưới cho biết loại biểu đồ phân tán 3D mà công cụ này có thể vẽ:
Biểu đồ phân tán và mối tương quan
Để diễn giải chính xác biểu đồ phân tán, bạn cần hiểu cách các biến có thể liên quan đến từng biểu đồ khác. Nhìn chung, tồn tại ba loại tương quan:
Tương quan dương - khi biến x tăng, biến y cũng tăng. Một ví dụ về mối tương quan thuận mạnh là lượng thời gian học sinh dành cho việc học và điểm số của họ.
Mối tương quan nghịch - khi biến x tăng, biến y giảm. Bỏ lớp và điểm có mối tương quan nghịch - khi số lần vắng mặt tăng lên, điểm thi giảm xuống.
Không có mối tương quan - không có mối quan hệ rõ ràng giữa hai biến; các dấu chấm nằm rải rác xung quanh toàn bộ khu vực biểu đồ. Ví dụ, chiều cao và điểm số của học sinh dường như không có mối tương quanvì cái trước không ảnh hưởng đến cái sau theo bất kỳ cách nào.
Tùy chỉnh biểu đồ phân tán XY trong Excel
Cũng như các loại biểu đồ khác, gần như mọi thành phần của biểu đồ phân tán trong Excel đều có thể tùy chỉnh. Bạn có thể dễ dàng thay đổi tiêu đề biểu đồ, thêm tiêu đề trục, ẩn đường lưới, chọn màu biểu đồ của riêng bạn, v.v.
Dưới đây, chúng tôi sẽ tập trung vào một số tùy chỉnh dành riêng cho biểu đồ phân tán.
Điều chỉnh tỷ lệ trục (giảm khoảng trắng)
Trong trường hợp các điểm dữ liệu của bạn được nhóm lại ở trên cùng, dưới cùng, bên phải hoặc bên trái của biểu đồ, bạn có thể muốn dọn sạch khoảng trắng thừa.
Để giảm khoảng cách giữa điểm dữ liệu đầu tiên và trục tung và/hoặc giữa điểm dữ liệu cuối cùng và cạnh phải của biểu đồ, hãy thực hiện các bước sau:
- Nhấp chuột phải trục x và nhấp vào Định dạng trục…
- Trên ngăn Trục định dạng , đặt Tối thiểu và Tối đa<2 mong muốn> giới hạn cho phù hợp.
- Ngoài ra, bạn có thể thay đổi các đơn vị Chính kiểm soát khoảng cách giữa các đường lưới.
Ảnh chụp màn hình bên dưới hiển thị cài đặt của tôi:
Để xóa khoảng cách giữa các điểm dữ liệu và các cạnh trên/dưới của vùng biểu đồ, hãy định dạng trục y dọc i theo cách tương tự.
Thêm nhãn để phân tán các điểm dữ liệu trong biểu đồ
Khi tạo biểu đồ phân tán với số lượng điểm dữ liệu tương đối nhỏ, bạn có thể muốn gắn nhãn các điểm theo tên để tạotrực quan dễ hiểu hơn. Đây là cách bạn có thể thực hiện việc này:
- Chọn biểu đồ và nhấp vào nút Thành phần biểu đồ .
- Đánh dấu vào ô Nhãn dữ liệu , nhấp vào mũi tên nhỏ màu đen bên cạnh, rồi nhấp vào Tùy chọn khác…
- Trên ngăn Định dạng nhãn dữ liệu , chuyển sang Tùy chọn nhãn (cái cuối cùng) và định cấu hình nhãn dữ liệu của bạn theo cách này:
- Chọn hộp Giá trị từ ô rồi chọn hộp phạm vi mà bạn muốn lấy nhãn dữ liệu từ đó (trong trường hợp của chúng tôi là B2:B6).
- Nếu bạn chỉ muốn hiển thị tên, hãy xóa Giá trị X và/hoặc Y Value để xóa các giá trị số khỏi nhãn.
- Chỉ định vị trí nhãn, các điểm dữ liệu Trên trong ví dụ của chúng tôi.
Vậy đó! Tất cả các điểm dữ liệu trong biểu đồ phân tán Excel của chúng tôi hiện được gắn nhãn theo tên:
Mẹo: Cách khắc phục các nhãn chồng lấp
Khi hai hoặc nhiều điểm dữ liệu ở rất gần nhau, nhãn của chúng có thể chồng lên nhau , giống như trường hợp của các nhãn Jan và Mar trong sơ đồ phân tán của chúng tôi. Để khắc phục điều này, hãy bấm vào các nhãn, sau đó bấm vào nhãn chồng chéo để chỉ nhãn đó được chọn. Trỏ con trỏ chuột của bạn vào nhãn đã chọn cho đến khi con trỏ chuyển thành mũi tên bốn cạnh, sau đó kéo nhãn đến vị trí mong muốn.
Kết quả là bạn sẽ có một biểu đồ phân tán Excel đẹp mắt và hoàn toàn dễ đọcnhãn:
Thêm đường xu hướng và phương trình
Để hình dung rõ hơn mối quan hệ giữa hai biến, bạn có thể vẽ một đường xu hướng trong biểu đồ phân tán Excel của mình, còn được gọi là đường phù hợp nhất .
Để hoàn thành, hãy nhấp chuột phải vào bất kỳ điểm dữ liệu nào và chọn Thêm Đường xu hướng… từ menu ngữ cảnh.
Excel sẽ vẽ một đường càng gần tất cả các điểm dữ liệu càng tốt để có nhiều điểm phía trên đường như bên dưới.
Ngoài ra, bạn có thể hiển thị phương trình cho đường xu hướng mô tả một cách toán học mối quan hệ giữa hai biến. Đối với điều này, hãy chọn hộp Hiển thị Phương trình trên Biểu đồ trên ngăn Định dạng Đường xu hướng sẽ xuất hiện ở phần bên phải của cửa sổ Excel ngay sau khi bạn thêm đường xu hướng. Kết quả của những thao tác này sẽ giống như sau:
Những gì bạn thấy trong ảnh chụp màn hình ở trên thường được gọi là biểu đồ hồi quy tuyến tính và bạn có thể tìm thấy hướng dẫn chi tiết về cách tạo biểu đồ này tại đây: Cách tạo biểu đồ hồi quy tuyến tính trong Excel.
Cách chuyển đổi trục X và Y trong biểu đồ phân tán
Như đã đề cập, biểu đồ phân tán thường hiển thị biến độc lập trên đường chân trời trục và biến phụ thuộc trên trục tung. Nếu biểu đồ của bạn được vẽ theo cách khác, thì cách khắc phục đơn giản nhất là hoán đổi các cột nguồn trong trang tính của bạn rồi vẽ lại biểu đồ.
Nếuvì lý do nào đó không thể sắp xếp lại các cột, bạn có thể chuyển trực tiếp chuỗi dữ liệu X và Y trên biểu đồ. Đây là cách thực hiện:
- Nhấp chuột phải vào bất kỳ trục nào và nhấp vào Chọn dữ liệu… trong menu ngữ cảnh.
- Trong cửa sổ hộp thoại Chọn nguồn dữ liệu , hãy nhấp vào nút Chỉnh sửa .
- Sao chép Các giá trị của chuỗi X vào hộp Các giá trị của chuỗi Y và ngược lại.
Mẹo. Để chỉnh sửa nội dung của hộp Sê-ri một cách an toàn, hãy đặt con trỏ chuột vào hộp và nhấn F2 .
- Nhấp OK hai lần để đóng cả hai cửa sổ.
Kết quả là biểu đồ phân tán Excel của bạn sẽ trải qua quá trình chuyển đổi này:
Mẹo. Nếu bạn cần tìm một điểm dữ liệu cụ thể trong biểu đồ, hướng dẫn này sẽ hướng dẫn bạn cách tìm, đánh dấu và gắn nhãn một điểm dữ liệu trong biểu đồ phân tán.
Đó là cách bạn tạo biểu đồ phân tán trong Excel. Trong hướng dẫn tiếp theo của chúng tôi, chúng tôi sẽ tiếp tục với chủ đề này và chỉ ra cách nhanh chóng tìm và đánh dấu một điểm dữ liệu nhất định trong biểu đồ phân tán. Hãy chú ý theo dõi!