Đặc điểm cấu trúc của chuỗi phân phối biến thiên.

Đặc điểm cấu trúc của chuỗi phân phối biến thiên.

Giả sử bạn muốn xác định giá trị trung bình trong phân bố điểm số của học sinh hoặc trong một mẫu dữ liệu đảm bảo chất lượng. Để làm điều này, bạn sẽ cần tính trung vị của một tập hợp số bằng hàm MEDIAN.

Hàm này là một cách để đo xu hướng trung tâm, tức là vị trí tâm của một tập hợp số trong một phân bố thống kê. Có ba cách phổ biến nhất để xác định xu hướng trung tâm.

    Giá trị trung bình- đây là một giá trị là trung bình số học, nghĩa là nó được tính bằng cách cộng một tập hợp số rồi chia tổng kết quả cho số của chúng. Ví dụ: trung bình cộng của các số 2, 3, 3, 5, 7 và 10 là 5 (kết quả của việc chia tổng của các số này là 30 cho số của chúng là 6).

    Trung bình- số nằm ở giữa một tập hợp số: một nửa số có giá trị lớn hơn số trung vị và một nửa số có giá trị nhỏ hơn. Ví dụ: trung vị của các số 2, 3, 3, 5, 7 và 10 sẽ là 4.

    Thời trang- số thường thấy nhất trong một bộ số nhất định. Ví dụ: chế độ cho các số 2, 3, 3, 5, 7 và 10 sẽ là 3.

Với sự phân bố đối xứng của một tập hợp số, cả ba giá trị của xu hướng trung tâm sẽ trùng nhau. Khi phân phối nhiều số bị sai lệch, các giá trị có thể khác nhau.

Ảnh chụp màn hình trong bài viết này được chụp bằng Excel 2016. Nếu bạn đang sử dụng phiên bản khác, giao diện có thể hơi khác một chút nhưng các tính năng sẽ giống nhau.

Ví dụ

Để làm cho ví dụ này dễ hiểu hơn, hãy sao chép nó lên một tờ giấy trắng.

Khuyên bảo:Để chuyển giữa xem kết quả và xem công thức trả về những kết quả đó, hãy nhấn CTRL+` (dấu nháy đơn) hoặc trên tab Công thức trong nhóm Sự phụ thuộc của công thức nhấn vào nút Hiển thị công thức.

trung bình tôi họ gọi giá trị của thuộc tính nằm ở giữa chuỗi xếp hạng và chia nó thành hai phần bằng nhau về số đơn vị. Như vậy, trong hàng xếp hạng của phân bố, một nửa hàng có giá trị thuộc tính vượt quá trung vị, nửa còn lại nhỏ hơn trung vị.

Trung vị được sử dụng thay cho giá trị trung bình số học khi các tùy chọn cực trị của chuỗi được xếp hạng (nhỏ nhất và lớn nhất) so với phần còn lại hóa ra là quá lớn hoặc quá nhỏ.

TRONG rời rạc trong một chuỗi biến thể chứa số đơn vị lẻ, trung vị bằng biến thể của đặc tính có số đó:
,
trong đó N là số đơn vị dân số.
Trong một chuỗi rời rạc bao gồm một số chẵn các đơn vị tổng thể, trung vị được định nghĩa là giá trị trung bình của các tùy chọn có các số và:
.
Trong phân bổ người lao động theo thâm niên công tác, trung vị bằng trung bình cộng của các phương án có số 10 trong dãy xếp hạng: 2 = 5 và 10: 2 + 1 = 6. Các phương án về đặc điểm thứ năm và thứ sáu là như nhau đến 4 năm, do đó
của năm
Khi tính số trung vị ở khoảng thời gian hàng được tìm thấy đầu tiên khoảng trung vị, (tức là chứa trung vị), trong đó tần số hoặc tần số tích lũy được sử dụng. Trung vị là khoảng có tần số tích lũy bằng hoặc lớn hơn một nửa tổng thể tích của quần thể. Giá trị trung bình sau đó được tính bằng công thức:
,
đâu là giới hạn dưới của khoảng trung vị;
- chiều rộng của khoảng trung vị;
- tần số tích lũy của khoảng trước trung vị;
- tần số của khoảng trung vị.
Hãy tính số trung vị của chuỗi phân bổ lao động theo tiền lương (xem bài “Tóm tắt và phân nhóm số liệu thống kê”).
Trung vị là mức lương từ 800-900 UAH, vì tần số tích lũy của nó là 17, vượt quá một nửa tổng của tất cả các tần số (). Sau đó
Tôi=800+100 UAH.
Giá trị thu được cho thấy một nửa số công nhân có mức lương dưới 875 UAH, nhưng mức này cao hơn mức trung bình.
Để xác định trung vị, bạn có thể sử dụng tần số tích lũy thay vì tần số tích lũy.
Trung vị, giống như mode, không phụ thuộc vào các giá trị cực trị của biến thể, do đó nó cũng được sử dụng để mô tả tâm trong chuỗi phân phối có ranh giới không chắc chắn.
Thuộc tính trung vị : tổng các giá trị tuyệt đối của độ lệch so với trung vị nhỏ hơn bất kỳ giá trị nào khác (bao gồm cả giá trị trung bình số học):

Đặc tính này của dải phân cách được sử dụng trong giao thông khi thiết kế vị trí các điểm dừng xe điện và xe điện, trạm xăng, điểm tập trung, v.v.
Ví dụ. Có 10 gara dọc theo đường cao tốc dài 100 km. Để thiết kế xây dựng một trạm xăng, dữ liệu đã được thu thập về số chuyến đi dự kiến ​​đến trạm xăng của mỗi gara.
Bảng 2 - Số liệu về số lượt đi đến trạm xăng của từng gara.

Cần lắp đặt trạm xăng sao cho tổng quãng đường xe đi đổ xăng là tối thiểu.
Lựa chọn 1. Nếu một trạm xăng được đặt ở giữa đường cao tốc, tức là ở km thứ 50 (trung tâm của phạm vi thay đổi thuộc tính), thì quãng đường đi được, có tính đến số chuyến đi, sẽ là:
a) theo một hướng:
;
b) ngược lại:
;
c) tổng số km đi được cả hai chiều: .

Lựa chọn 2. Trường hợp trạm xăng đặt ở giữa đường, được xác định bằng công thức tính trung bình số học có tính đến số chuyến đi:

Giá trị trung vị có thể được xác định bằng đồ họa, sử dụng phép tính tích lũy (xem bài giảng “Tóm tắt và phân nhóm dữ liệu thống kê”). Để làm điều này, thứ tự cuối cùng, bằng tổng của tất cả các tần số hoặc tần số, được chia làm đôi. Từ điểm kết quả, đường vuông góc được khôi phục cho đến khi nó giao với điểm tích lũy. Trục hoành của điểm giao nhau cho giá trị trung vị.

Để tính trung vị trong MS EXCEL, có một hàm đặc biệt MEDIAN(). Trong bài viết này, chúng ta sẽ xác định trung vị và tìm hiểu cách tính nó cho một mẫu và cho một luật phân phối nhất định của một biến ngẫu nhiên.

Hãy bắt đầu với trung vịmẫu(tức là đối với một tập hợp các giá trị cố định).

Trung vị mẫu

Trung bình(trung vị) là số nằm giữa một tập hợp số: một nửa số trong tập hợp đó lớn hơn Trung bình, và một nửa số đó nhỏ hơn Trung bình.

Tính toán trung vị cần thiết trước tiên (giá trị trong vật mẫu). Ví dụ, Trung bìnhđối với mẫu (2; 3; 3; 4 ; 5; 7; 10) sẽ là 4. Bởi vì chỉ trong vật mẫu 7 giá trị, ba trong số đó nhỏ hơn 4 (tức là 2; 3; 3) và ba giá trị lớn hơn (tức là 5; 7; 10).

Nếu tập hợp chứa một số chẵn thì nó được tính cho hai số ở giữa tập hợp. Ví dụ, Trung bìnhđối với mẫu (2; 3; 3 ; 6 ; 7; 10) sẽ là 4,5, vì (3+6)/2=4,5.

Để xác định trung vị trong MS EXCEL có một hàm cùng tên MEDIAN(), phiên bản tiếng Anh của MEDIAN().

Trung bình không nhất thiết trùng với . Sự trùng khớp chỉ xảy ra nếu các giá trị trong mẫu được phân bổ đối xứng đối với trung bình. Ví dụ, đối với mẫu (1; 2; 3 ; 4 ; 5; 6) Trung bìnhtrung bình bằng 3,5.

Nêu biêt được Chức năng phân phối F(x) hoặc hàm mật độ xác suất P(X), Cái đó Trung bình có thể được tìm thấy từ phương trình:

Ví dụ, khi giải phương trình này bằng phương pháp giải tích cho phân bố Log chuẩn lnN(μ; σ 2), chúng ta thu được rằng Trung bìnhđược tính bằng công thức =EXP(μ). Khi μ=0, trung vị là 1.

Hãy chú ý đến điểm Hàm phân phối, mà F(x)=0,5(xem hình trên) . Trục hoành của điểm này bằng 1. Đây là giá trị trung bình, trùng khớp một cách tự nhiên với giá trị được tính toán trước đó bằng công thức em.

Trong MS EXCEL Trung bìnhPhân phối lognormal LnN(0;1) có thể được tính bằng công thức =LOGNORM.REV(0,5,0,1).

Ghi chú: Nhắc lại rằng tích phân của trên toàn bộ miền xác định biến ngẫu nhiên bằng một.

Do đó, đường trung tuyến (x=Trung tuyến) chia diện tích bên dưới đồ thị hàm mật độ xác suất thành hai phần bằng nhau.

Hàm MEDIAN trong Excel dùng để phân tích một dãy giá trị số và trả về một số nằm giữa tập hợp đang được kiểm tra (trung vị). Nghĩa là, hàm này chia một tập hợp số thành hai tập hợp con có điều kiện, tập đầu tiên chứa các số nhỏ hơn trung vị và tập thứ hai - nhiều hơn. Trung vị là một trong nhiều phương pháp để xác định xu hướng trung tâm của một phạm vi quan tâm.

Ví dụ sử dụng hàm MEDIAN trong Excel

Khi nghiên cứu các nhóm tuổi của sinh viên, dữ liệu từ một nhóm sinh viên được chọn ngẫu nhiên tại một trường đại học đã được sử dụng. Nhiệm vụ là xác định tuổi trung bình của học sinh.

Dữ liệu ban đầu:

Công thức tính toán:


Mô tả đối số:

  • B3:B15 – độ tuổi nghiên cứu.

Kết quả:

Tức là trong nhóm có những học sinh có độ tuổi nhỏ hơn 21 tuổi và lớn hơn giá trị này.



So sánh hàm MEDIAN và AVERAGE để tính giá trị trung bình

Trong các buổi tối ở bệnh viện, nhiệt độ cơ thể của từng bệnh nhân đều được đo. Chứng minh tính hữu ích của việc sử dụng tham số trung vị thay vì giá trị trung bình để kiểm tra một loạt các giá trị thu được.

Dữ liệu ban đầu:

Công thức tìm số trung bình:

Công thức tìm số trung vị:

Có thể thấy từ giá trị trung bình, nhiệt độ trung bình của bệnh nhân cao hơn bình thường, nhưng điều này không đúng. Giá trị trung vị cho thấy ít nhất một nửa số bệnh nhân có nhiệt độ cơ thể bình thường, không vượt quá 36,6.

Chú ý! Một phương pháp khác để xác định xu hướng trung tâm là mode (giá trị xuất hiện thường xuyên nhất trong phạm vi đang nghiên cứu). Để xác định xu hướng trung tâm trong Excel, bạn nên sử dụng hàm MODE. Xin lưu ý rằng trong ví dụ này, các giá trị của trung vị và mốt là như nhau:

Nghĩa là, giá trị trung bình chia một tập hợp thành các tập con có giá trị nhỏ hơn và lớn hơn cũng là giá trị xuất hiện thường xuyên nhất trong tập hợp đó. Như bạn có thể thấy, hầu hết bệnh nhân đều có nhiệt độ 36,6.

Ví dụ tính trung vị trong phân tích thống kê trên Excel

Ví dụ 3. Có 3 nhân viên bán hàng đang làm việc tại một cửa hàng. Dựa vào kết quả 10 ngày gần nhất cần xác định nhân viên nào sẽ được thưởng. Khi chọn nhân viên giỏi nhất, mức độ hiệu quả công việc của anh ta được tính đến chứ không phải số lượng hàng bán được.

Bảng dữ liệu gốc:


Để mô tả hiệu quả, chúng tôi sẽ sử dụng ba chỉ số cùng một lúc: giá trị trung bình, trung vị và chế độ. Hãy xác định chúng cho từng nhân viên bằng cách sử dụng các công thức AVERAGE, MEDIAN và MODE tương ứng:


Để xác định mức độ phân tán dữ liệu, chúng tôi sử dụng một giá trị tương ứng là tổng giá trị của mô đun chênh lệch giữa giá trị trung bình và chế độ, giá trị trung bình và trung vị. Nghĩa là, hệ số x=|av-med|+|av-mod|, trong đó:

  • av – giá trị trung bình;
  • med – trung vị;
  • mod - thời trang.

Hãy tính giá trị của hệ số x cho người bán đầu tiên:

Chúng tôi sẽ thực hiện tính toán tương tự cho những người bán khác. Kết quả:


Hãy xác định người bán sẽ nhận được tiền thưởng:

Lưu ý: Hàm SMALL trả về giá trị tối thiểu đầu tiên từ phạm vi giá trị hệ số x được xem xét.


Hệ số x là một đặc tính định lượng nhất định về tính ổn định trong công việc của nhân viên bán hàng được nhà kinh tế cửa hàng đưa ra. Với sự trợ giúp của nó, có thể xác định phạm vi có độ lệch giá trị nhỏ nhất. Phương pháp này chứng tỏ ba phương pháp xác định xu hướng trung tâm có thể được sử dụng cùng lúc như thế nào để thu được kết quả đáng tin cậy nhất.

Đặc điểm sử dụng hàm MEDIAN trong Excel

Hàm này có cú pháp sau:

TRUNG BÌNH(số1; [số2];...)

Mô tả các đối số:

  • số1 – đối số bắt buộc mô tả giá trị số đầu tiên có trong phạm vi đang nghiên cứu;
  • [number2] – tùy chọn thứ hai (và các đối số tiếp theo, tổng cộng lên tới 255 đối số), mô tả các giá trị thứ hai và tiếp theo của phạm vi đang nghiên cứu.

Lưu ý 1:

  1. Khi thực hiện phép tính, sẽ thuận tiện hơn khi chuyển toàn bộ phạm vi giá trị đang được nghiên cứu thay vì nhập các đối số tuần tự.
  2. Các đối số được chấp nhận là dữ liệu số, tên chứa số, dữ liệu loại tham chiếu và mảng (ví dụ: =MEDIAN((1,2,3,5,7,10))).
  3. Khi tính trung vị, các ô chứa giá trị trống hoặc logic TRUE, FALSE được tính đến, các ô này sẽ được hiểu tương ứng là giá trị số 1 và 0. Ví dụ: kết quả thực thi một hàm có các giá trị logic trong các đối số (TRUE; FALSE) tương đương với kết quả thực thi hàm đó với các đối số (1;0) và bằng 0,5.
  4. Nếu một hoặc nhiều đối số hàm chấp nhận giá trị văn bản không thể chuyển đổi thành giá trị số hoặc chứa mã lỗi thì hàm sẽ trả về mã lỗi #VALUE!
  5. Các hàm Excel khác có thể được sử dụng để xác định giá trị trung bình của mẫu: PERCENTILE.IN, QUARTILE.IN, MAX Ví dụ sử dụng:
  • =PERCENTILE.IN(A1:A10,0.5), vì theo định nghĩa, trung vị là phân vị thứ 50.
  • =QUARTILE.ON(A1:A10;2), vì trung vị là tứ phân vị thứ 2.
  • =HIGH(A1:A9,COUNT(A1:A9)/2), nhưng chỉ khi số lượng số trong phạm vi là số lẻ.

Lưu ý 2:

  1. Nếu trong phạm vi nghiên cứu, tất cả các số được phân bố đối xứng xung quanh giá trị trung bình thì giá trị trung bình số học và trung vị của phạm vi này sẽ tương đương.
  2. Với độ lệch lớn của dữ liệu trong phạm vi (“phân tán” các giá trị), trung vị phản ánh tốt hơn xu hướng phân bổ các giá trị so với giá trị trung bình số học. Một ví dụ điển hình là việc sử dụng giá trị trung vị để xác định mức lương thực tế của người dân ở một bang nơi các quan chức có thu nhập cao hơn công dân bình thường.
  3. Phạm vi giá trị được nghiên cứu có thể chứa:
  • Một số lẻ. Trong trường hợp này, trung vị sẽ là một số duy nhất chia phạm vi thành hai tập hợp con có giá trị lớn hơn và nhỏ hơn tương ứng;
  • Số chẵn. Sau đó, trung vị được tính là trung bình số học của hai giá trị số chia tập hợp thành hai tập con được chỉ ra ở trên.

Cùng với các giá trị trung bình, các giá trị trung bình cấu trúc được tính toán dưới dạng các đặc tính thống kê của chuỗi phân bố biến thiên - thời trangTrung bình.
Thời trang(Mo) biểu thị giá trị của đặc tính đang được nghiên cứu, được lặp lại với tần số lớn nhất, tức là mode – giá trị của một đặc tính xảy ra thường xuyên nhất.
Trung bình(Tôi) là giá trị của thuộc tính nằm ở giữa quần thể được xếp hạng (có thứ tự), tức là trung vị là giá trị trung tâm của chuỗi biến thể.
Thuộc tính chính của trung vị là tổng độ lệch tuyệt đối của các giá trị thuộc tính so với trung vị nhỏ hơn bất kỳ giá trị nào khác ∑|x i - Me|=min.

Xác định chế độ và trung vị từ dữ liệu chưa được nhóm

Hãy xem xét xác định chế độ và trung vị từ dữ liệu chưa được nhóm. Giả sử một nhóm làm việc gồm 9 người có các loại biểu thuế sau: 4 3 4 5 3 3 6 2 6. Vì lữ đoàn này có nhiều công nhân thuộc loại thứ 3 nhất nên loại thuế này sẽ mang tính phương thức. Mơ = 3.
Để xác định số trung vị cần thực hiện xếp hạng: 2 3 3 3 4 4 5 6 6 . Công nhân trung tâm trong chuỗi này là công nhân thuộc loại thứ 4, do đó, loại này sẽ là trung vị. Nếu chuỗi xếp hạng bao gồm số đơn vị chẵn thì trung vị được xác định là trung bình của hai giá trị trung tâm.
Nếu chế độ phản ánh biến thể phổ biến nhất của giá trị thuộc tính, thì trung vị thực tế thực hiện các chức năng trung bình cho một quần thể không đồng nhất không tuân theo quy luật phân phối chuẩn. Chúng ta hãy minh họa ý nghĩa nhận thức của nó bằng ví dụ sau.
Giả sử chúng ta cần mô tả thu nhập trung bình của một nhóm người gồm 100 người, 99 người trong số họ có thu nhập trong khoảng từ 100 đến 200 đô la mỗi tháng và thu nhập hàng tháng của nhóm sau là 50.000 đô la (Bảng 1).
Bảng 1 - Thu nhập hàng tháng của nhóm người nghiên cứu. Nếu sử dụng mức trung bình số học, chúng ta sẽ có thu nhập trung bình khoảng 600 - 700 đô la, con số này không có nhiều điểm chung với thu nhập của phần chính trong nhóm. Giá trị trung bình, trong trường hợp này bằng với Tôi = 163 đô la, sẽ cho phép chúng tôi đưa ra mô tả khách quan về mức thu nhập của 99% nhóm người này.
Hãy xem xét việc xác định chế độ và trung vị bằng cách sử dụng dữ liệu được nhóm (chuỗi phân phối).
Giả sử rằng sự phân bổ lao động của toàn bộ doanh nghiệp theo danh mục thuế quan có dạng sau (Bảng 2).
Bảng 2 - Phân bổ lao động doanh nghiệp theo nhóm thuế

Tính toán mode và trung vị cho chuỗi rời rạc

Tính toán mode và trung vị cho chuỗi khoảng

Tính toán mode và trung vị cho chuỗi biến thiên

Xác định chế độ từ chuỗi biến thể rời rạc

Một chuỗi các giá trị thuộc tính được xây dựng trước đó, được sắp xếp theo giá trị, sẽ được sử dụng. Nếu cỡ mẫu là số lẻ thì lấy giá trị trung tâm; nếu cỡ mẫu là chẵn, chúng ta lấy giá trị trung bình số học của hai giá trị trung tâm.
Xác định chế độ từ chuỗi biến thể rời rạc: Loại cước số 5 có tần suất sử dụng cao nhất (60 người) nên mang tính phương thức. Mơ = 5.
Để xác định giá trị trung bình của một đặc tính, số đơn vị trung vị của chuỗi (N Me) được tìm bằng công thức sau: , trong đó n là thể tích của tổng thể.
Trong trường hợp của chúng ta: .
Giá trị phân số thu được, luôn xảy ra khi số lượng đơn vị trong dân số là số chẵn, cho biết điểm giữa chính xác nằm trong khoảng từ 95 đến 96 công nhân. Cần xác định xem những người lao động có số sê-ri này thuộc nhóm nào. Điều này có thể được thực hiện bằng cách tính toán tần số tích lũy. Không có công nhân nào có số lượng này ở nhóm thứ nhất, nhóm chỉ có 12 người và không có ai ở nhóm thứ hai (12+48=60). Công nhân thứ 95 và 96 thuộc nhóm thứ ba (12+48+56=116) nên trung vị là loại thuế thứ 4.

Tính toán mode và trung vị trong chuỗi khoảng

Không giống như chuỗi biến thiên rời rạc, việc xác định mode và trung vị từ chuỗi khoảng đòi hỏi phải tính toán nhất định dựa trên các công thức sau:
, (5.6)
Ở đâu x 0- giới hạn dưới của khoảng thời gian (khoảng có tần số cao nhất được gọi là khoảng thời gian);
Tôi- giá trị của khoảng thời gian;
f Mo- tần số của khoảng thời gian;
f Mo -1- tần số của khoảng trước nhịp điệu;
f Mo +1– tần số của khoảng theo sau phương thức.
(5.7)
Ở đâu x 0- giới hạn dưới của khoảng trung vị (trung vị là khoảng đầu tiên có tần số tích lũy vượt quá một nửa tổng tần số);
Tôi- giá trị của khoảng trung vị;
S Me -1- khoảng tích lũy trước trung vị;
tôi- tần số của khoảng trung vị.
Hãy để chúng tôi minh họa việc áp dụng các công thức này bằng cách sử dụng dữ liệu trong Bảng. 3.
Khoảng có ranh giới 60 – 80 trong phân phối này sẽ mang tính phương thức, bởi vì nó có tần số cao nhất. Sử dụng công thức (5.6), chúng tôi xác định chế độ:

Để thiết lập khoảng trung vị, cần xác định tần số tích lũy của từng khoảng tiếp theo cho đến khi nó vượt quá một nửa tổng tần số tích lũy (trong trường hợp của chúng tôi là 50%) (Bảng 5.11).
Người ta xác định rằng trung vị là khoảng có ranh giới 100 - 120 nghìn rúp. Bây giờ chúng ta xác định số trung vị:

Bảng 3 - Phân bổ dân số Liên bang Nga theo mức thu nhập danh nghĩa bình quân đầu người vào tháng 3 năm 1994.
Nhóm theo mức thu nhập bình quân đầu người hàng tháng, nghìn rúp.Tỷ trọng dân số, %
Lên đến 201,4
20 – 40 7,5
40 – 60 11,9
60 – 80 12,7
80 – 100 11,7
100 – 120 10,0
120 – 140 8,3
140 –160 6,8
160 – 180 5,5
180 – 200 4,4
200 – 220 3,5
220 – 240 2,9
240 – 260 2,3
260 – 280 1,9
280 – 300 1,5
Hơn 3007,7
Tổng cộng100,0

Bảng 4 - Xác định khoảng trung vị
Do đó, giá trị trung bình số học, mốt và trung vị có thể được sử dụng như một đặc tính tổng quát của các giá trị của một thuộc tính nhất định đối với các đơn vị của một quần thể được xếp hạng.
Đặc điểm chính của trung tâm phân phối là giá trị trung bình số học, được đặc trưng bởi thực tế là tất cả các sai lệch so với nó (dương và âm) cộng lại bằng 0. Trung vị được đặc trưng bởi thực tế là tổng độ lệch so với nó trong mô đun là tối thiểu và chế độ là giá trị của thuộc tính xảy ra thường xuyên nhất.
Tỷ lệ của mode, trung bình và trung bình số học cho biết bản chất của sự phân bố đặc tính trong tổng hợp và cho phép chúng ta đánh giá tính bất đối xứng của nó. Trong phân bố đối xứng, cả ba đặc điểm đều trùng khớp. Sự khác biệt giữa mode và giá trị trung bình số học càng lớn thì chuỗi càng bất đối xứng. Đối với chuỗi không đối xứng vừa phải, chênh lệch giữa mốt và trung bình số học lớn hơn khoảng ba lần so với chênh lệch giữa trung vị và trung bình, nghĩa là:
|Mo –`x| = 3 |Tôi –`x|.

Xác định mode và trung vị bằng phương pháp đồ thị

Mốt và trung vị trong một chuỗi khoảng có thể được xác định bằng đồ thị. Chế độ được xác định bởi biểu đồ phân phối. Để làm điều này, hãy chọn hình chữ nhật cao nhất, trong trường hợp này là hình chữ nhật. Sau đó, chúng ta nối đỉnh bên phải của hình chữ nhật phương thức với góc trên bên phải của hình chữ nhật trước đó. Và đỉnh bên trái của hình chữ nhật phương thức - với góc trên bên trái của hình chữ nhật tiếp theo. Từ điểm giao nhau của chúng, chúng ta hạ thấp đường vuông góc với trục hoành. Trục hoành giao điểm của các đường này sẽ là phương thức phân phối (Hình 5.3).


Cơm. 5.3. Xác định đồ họa của chế độ bằng cách sử dụng biểu đồ.


Cơm. 5.4. Xác định đồ họa của trung vị bằng cách tích lũy
Để xác định trung vị từ một điểm trên thang tần số tích lũy (tần số) tương ứng 50%, một đường thẳng được vẽ song song với trục hoành cho đến khi giao với điểm tích lũy. Sau đó, từ điểm giao nhau, đường vuông góc được hạ xuống trục x. Trục hoành của giao điểm là đường trung tuyến.

Phần tư, phần thập phân, phần trăm

Tương tự, với việc tìm trung vị trong chuỗi biến thể của phân phối, bạn có thể tìm thấy giá trị của thuộc tính cho bất kỳ đơn vị nào của chuỗi được xếp hạng. Vì vậy, ví dụ: bạn có thể tìm thấy giá trị của thuộc tính cho các đơn vị chia một chuỗi thành bốn phần bằng nhau, thành 10 hoặc 100 phần. Các giá trị này được gọi là “tứ phân vị”, “thập phân vị”, “phần trăm”.
Các phần tư biểu thị giá trị của đặc điểm chia quần thể được xếp hạng thành 4 phần bằng nhau.
Có một phần tư dưới (Q 1), tách ¼ dân số có giá trị thấp nhất của thuộc tính và một phần tư trên (Q 3), tách ¼ phần có giá trị cao nhất của thuộc tính. Điều này có nghĩa là 25% số đơn vị trong dân số sẽ có giá trị Q 1 nhỏ hơn; 25% số đơn vị sẽ nằm giữa Q 1 và Q 2 ; 25% nằm giữa Q 2 và Q 3 và 25% còn lại vượt quá Q 3. Tứ phân vị giữa của Q2 là trung vị.
Để tính toán các phần tư sử dụng chuỗi biến thiên theo khoảng, các công thức sau được sử dụng:
, ,
Ở đâu x Q 1- giới hạn dưới của khoảng chứa tứ phân vị dưới (khoảng được xác định bởi tần số tích lũy, tần số đầu tiên vượt quá 25%);
x Q 3- giới hạn dưới của khoảng chứa tứ phân vị trên (khoảng được xác định bởi tần số tích lũy, tần số đầu tiên vượt quá 75%);
Tôi- kích thước khoảng;
Câu hỏi 1-1– tần số tích lũy của khoảng trước khoảng chứa tứ phân vị dưới;
Câu hỏi 3-1– tần số tích lũy của khoảng trước khoảng chứa tứ phân vị trên;
f Câu 1– tần số của khoảng chứa tứ phân vị dưới;
f Câu 3– tần số của khoảng chứa tứ phân vị trên.
Hãy xem xét việc tính toán các phần tư dưới và trên theo dữ liệu trong Bảng. 5.10. Tứ phân vị dưới nằm trong khoảng 60 – 80, tần số tích lũy của nó là 33,5%. Tứ phân vị trên nằm trong khoảng 160 – 180 với tần suất tích lũy là 75,8%. Khi tính đến điều này, chúng tôi nhận được:
,
.
Ngoài các phần tư, các phần thập phân có thể được xác định trong phạm vi biến thể của phân bố - các tùy chọn chia chuỗi biến thể được xếp hạng thành mười phần bằng nhau. Thập phân vị thứ nhất (d 1) chia dân số theo tỷ lệ 1/10 đến 9/10, thập phân vị thứ hai (d 1) - theo tỷ lệ 2/10 đến 8/10, v.v.
Chúng được tính bằng các công thức:
, .
Các giá trị đặc trưng chia chuỗi thành một trăm phần được gọi là phần trăm. Các tỷ lệ của trung vị, tứ phân vị, thập phân vị và phân vị được trình bày trong Hình 2. 5.5.

lượt xem