SMS

Chào mừng bạn đến với blog của bomxuan868! chúc bạn có một ngày vui vẻ!
Lòng tin làm nên sức mạnh

Fish

Thứ Ba, ngày 13 tháng 11 năm 2012

Độ lệch chuẩn SD và độ lệch tương đối RSD

 Trả lời câu hỏi bài tập quản lý chất lượng khi nào dùng độ lệch chuẩn và độ lệch tương đối: độ lệch biểu diễn độ biến thiên của giá trị đo mẫu so với giá trị trung bình. Độ lệch tương đối có thể đánh giá được độ biến thiên của các giá trị không cùng đơn vị mà độ lệch chuẩn không làm được.

Trả lời sau khi đọc bài viết:

Độ lệch chuẩn hay sai số chuẩn?

Trong vài năm qua, tôi nhận khá nhiều email hỏi về những vấn đề căn bản trong thống kê sinh học và phương pháp dịch tễ học.  Tôi có ý định mở mục Lâm sàng thống kê (Statistical Clinic) để trao đổi với bạn đọc về các vấn đề mà tôi thấy quan trọng này.  Tôi hân hoan chào đón các câu hỏi của bạn đọc để có cảm hứng trả lời.
Trong hàng trăm thư hỏi và tham vấn trong thời gian 3 năm qua, tôi đếm có đến 5 thư hỏi về vấn đề mà tôi lấy làm tựa đề cho bài viết này.  Chẳng hạn như một bạn đọc ở Hà Nội viết email đến tôi hỏi: “Thưa thầy!  Em đọc thấy trong các tập san y học người ta thường hay trình bày số trung bình kèm theo SEM, nhưng cũng có bài báo trình bày số trung bình kèm theo SD. Xin hỏi Thầy cách trình bày nào đúng?”
Đây là một câu hỏi đơn giản nhưng tôi thấy có ý nghĩa ứng dụng khá rộng, nên muốn nhân cột báo Lâm sàng thống kê để trả lời bạn đọc.
Trong các tập san y học, chúng ta thường thấy những cột số dưới hình thức x ± y, trong đó x là số trung bình, còn y thì có khi là độ lệch chuẩn (standard deviation – SD) hay sai số chuẩn (standard error – SE).  Cũng có tác giả viết SEM (viết tắt từ cụm từ standard error of the mean).  Cách trình bày như thế thông dụng đến nỗi một số chuyên gia và các ban biên tập tập san y học phải lên tiếng khuyến cáo.  Theo khuyến cáo chung và cũng là qui ước nghiên cứu y học: để mô tả một biến số lâm sàng tuân theo luật phân phối chuẩn, các nhà nghiên cứu nên cách trình bày số trung bình và kèm độ lệch chuẩn (không phải sai số chuẩn; để mô tả một biến số lâm sàng không tuân theo luật phân phối chuẩn, nên trình bày số trung vị và số ở vị trí 25% và 75% (tức là interquartile range).
Để hiểu qui ước này, chúng ta cần phải tìm hiểu ý nghĩa của độ lệch chuẩn và sai số chuẩn.  Tôi thấy điều này cần thiết, bởi vì hầu hết sách giáo khoa thống kê (ngay cả sách giáo khoa do người Tây phương viết) đều không giải rõ những khác biệt về ý nghĩa của hai chỉ số thống kê này.
Mô tả một biến số theo luật phân phối chuẩn
Xin nhắc lại thuật ngữ: cụm từ “phân phối chuẩn” ở đây chính là “Normal distribution” (hay có sách còn gọi là “Gaussian distribution”, lấy từ tên của nhà toán học vĩ đại người Đức Frederick Gauss).  Một biến số tuân theo luật phân phối chuẩn, khi vẽ bằng biểu đồ, giống như hình một cái chuông cân đối (Biểu đồ 1).  Phân phối này được xác định bằng hai thông số: số trung bình và độ lệch chuẩn.  Để tiết kiệm chữ nghĩa, tôi sẽ lấy kí hiệu m thể hiện số trung bình, và s thể hiện độ lệch chuẩn.
Tại sao chúng ta cần độ lệch chuẩn?  Để trả lời câu hỏi này, chúng ta thử xem qua ví dụ sau đây:
Ví dụ 1.  Một biến số phản ảnh tình trạng của một bệnh trong hai nhóm bệnh nhân (nhóm A gồm 6 bệnh nhân, và nhóm B gồm 4 bệnh nhân) như sau:
Nhóm A: 6, 7, 8, 4, 5, 6
Nhóm B: 10, 2, 3, 9
Có thể dễ dàng thấy rằng số trung bình của nhóm A là 6, bằng với số trung bình của nhóm B.  Tuy có cùng số trung bình, chúng ta khó có thể kết luận hai nhóm này tương đương nhau, bởi vì độ khác biệt trong nhóm B cao hơn trong nhóm A.  Thật vậy, độ khác biệt giữa số lớn nhất và số nhỏ nhất trong nhóm B là 8 (tức 10 trừ cho 2) gấp hai lần so với nhóm A với độ khác biệt là 4 (lấy 8 trừ cho 4).
Chúng ta cần một chỉ số để phản ảnh sự khác biệt giữa các bệnh nhân (hay nói theo thuật ngữ là biến thiên).  Cách làm hiển nhiên nhất là lấy kết quả của từng bệnh nhân trừ cho số trung bình và cộng chung lại.  Gọi chỉ số này là D, và để phân biệt hai nhóm A và B, chúng ta dùng kí hiệu dưới dòng (subscript):
Nhóm A:    «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msub»«mi»D«/mi»«mi»A«/mi»«/msub»«/math» = (6-6) + (7-6) + (8-6) + (4-6) + (5-6) + (6-6) = 0
Nhóm B:    «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msub»«mi»D«/mi»«mi»B«/mi»«/msub»«/math» = (10-6) + (2-6) + (3-6) + (9-6) = 0
Như thấy trên, vấn đề ở đây là tổng số khác biệt D là 0.  Như vậy D vẫn chưa phản ảnh được độ biến thiên mà chúng ta muốn.  Một cách làm cho D có “hồn” hơn là chúng ta lấy bình phương của từng cá nhân và cộng số bình phương lại với nhau.  Gọi chỉ số mới này là «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msup»«mi»D«/mi»«mn»2«/mn»«/msup»«/math» , chúng ta có:
Nhóm A:    «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msubsup»«mi»D«/mi»«mi»A«/mi»«mn»2«/mn»«/msubsup»«/math» = (6-6)2 + (7-6)2 + (8-6)2 + (4-6)2 + (5-6)2 + (6-6)2 = 10
Nhóm B:      «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msubsup»«mi»D«/mi»«mi»B«/mi»«mn»2«/mn»«/msubsup»«/math» = (10-6)2 + (2-6)2 + (3-6)2 + (9-6)2 = 50
Bây giờ thì «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msup»«mi»D«/mi»«mn»2«/mn»«/msup»«/math» rõ ràng cho thấy nhóm B có độ biến thiên cao hơn nhóm A.  Nhưng còn một vấn đề, vì «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msup»«mi»D«/mi»«mn»2«/mn»«/msup»«/math» là tổng số, tức là chịu ảnh hưởng cỡ mẫu trong từng nhóm.  Một cách điều chỉnh hợp lí nhất là chia «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msup»«mi»D«/mi»«mn»2«/mn»«/msup»«/math» cho số cỡ mẫu.  Gọi chỉ số mới này là S2, chúng ta có:
Nhóm A:       «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msubsup»«mi»S«/mi»«mi»A«/mi»«mn»2«/mn»«/msubsup»«/math» = 10 / 6 = 1.67
Nhóm B:       «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msubsup»«mi»S«/mi»«mi»B«/mi»«mn»2«/mn»«/msubsup»«/math» = 50 / 4 = 12.5
Nhưng để khách quan hơn nữa, chúng ta còn phải điều chỉnh cho số thông số sử dụng trong tính toán.  Chú ý rằng khi tính «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msup»«mi»D«/mi»«mn»2«/mn»«/msup»«/math» hay S2 , chúng ta trừ kết quả mỗi bệnh nhân cho số trung bình (tức là tốn một thông số).  Vì thế, thay vì chia  cho số cỡ mẫu, chúng ta phải chia cho số cỡ mẫu trừ 1.  Gọi chỉ số mới nhất là s2, chúng ta có:
«math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msubsup»«mi»s«/mi»«mi»A«/mi»«mn»2«/mn»«/msubsup»«mo»=«/mo»«mfrac»«mn»10«/mn»«mrow»«mn»6«/mn»«mo»-«/mo»«mn»1«/mn»«/mrow»«/mfrac»«mo»=«/mo»«mn»2«/mn»«/math»
«math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msubsup»«mi»s«/mi»«mi»B«/mi»«mn»2«/mn»«/msubsup»«mo»=«/mo»«mfrac»«mn»50«/mn»«mrow»«mn»4«/mn»«mo»-«/mo»«mn»1«/mn»«/mrow»«/mfrac»«mo»=«/mo»«mn»16«/mn»«mo».«/mo»«mn»7«/mn»«/math»
Chỉ số s2 ở đây chính là phương sai.
Nhưng còn một vấn đề nhỏ nữa: bởi vì đơn vị phương sai là bình phương, khác với đơn vị của số trung bình.  Vì thế, cách hoán chuyển tốt nhất là chuyển giá trị của phương sai sao cho có cùng đơn vị với số trung bình bằng cách lấy căn số bậc hai, và đây chính là độ lệch chuẩn (kí hiệu s).
«math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mtable columnalign=¨left¨ rowspacing=¨0¨»«mtr»«mtd»«msub»«mi»s«/mi»«mi»A«/mi»«/msub»«mo»=«/mo»«msqrt»«mn»2«/mn»«/msqrt»«mo»=«/mo»«mn»1«/mn»«mo».«/mo»«mn»41«/mn»«/mtd»«/mtr»«mtr»«mtd»«msub»«mi»s«/mi»«mi»B«/mi»«/msub»«mo»=«/mo»«msqrt»«mrow»«mn»16«/mn»«mo».«/mo»«mn»7«/mn»«/mrow»«/msqrt»«mo»=«/mo»«mn»4«/mn»«mo».«/mo»«mn»08«/mn»«/mtd»«/mtr»«/mtable»«/math»
Đến đây, chúng ta có thể thấy nhóm B có độ biến thiên cao hơn nhóm A.  Một cách để định lượng hóa độ lệch chuẩn tương quan với số trung bình là lấy độ lệch chuẩn chia cho số trung bình (và nếu cần, nhân cho 100).  Kết quả của tính toán này có tên là hệ số biến thiên (coefficient of variation – CV):
Nhóm A:       CVA = 1.41 / 6 × 100 = 23.5%
Nhóm B:       CVB = 4.08 / 6 × 100 = 68.3%
Lợi thế của hệ số biến thiên là nó cho chúng ta một phép so sánh các biến số không có cùng đơn vị.  Chẳng hạn như chúng ta có thể so sánh độ biến thiên của áp suất máu và độ cholesterol trong một quần thể, vì hệ số biến thiên có cùng đơn vị phần trăm.
Đến đây, chúng ta có thể tóm lược sự phân phối của hai nhóm bệnh nhân bằng bẳng sau đây:
Nhóm
Số đối tượng (N)
Trung bình
Độ lệch chuẩn
Hệ số biến thiên
A
6
6.0
1.41
23.5%
B
4
6.0
4.08
68.3%
Mô tả sự biến thiên của số trung bình: sai số chuẩn
Các sách giáo khoa thống kê thường mô tả cách tính sai số chuẩn trong phần mở đầu, nhưng không giải thích nó có nghĩa là gì và tại sao phải cần đến chỉ số thống kê này.  Công thức tính sai số chuẩn (kí hiệu bằng SE – viết tắt từ standard error) rất đơn giản: lấy độ lệch chuẩn chia cho căn số bậc hai của số cỡ mẫu (n):
«math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mi»S«/mi»«mi»E«/mi»«mo»=«/mo»«mi»s«/mi»«mo»/«/mo»«msqrt»«mi»n«/mi»«/msqrt»«/math»
Áp dụng công thức trên cho ví dụ, SE của nhóm A và B lần lượt là:
Nhóm A: «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mtable columnalign=¨left¨ rowspacing=¨0¨»«mtr»«mtd»«mi»S«/mi»«msub»«mi»E«/mi»«mi»A«/mi»«/msub»«mo»=«/mo»«mn»1«/mn»«mo».«/mo»«mn»41«/mn»«mo»/«/mo»«msqrt»«mn»6«/mn»«/msqrt»«mo»=«/mo»«mn»0«/mn»«mo».«/mo»«mn»58«/mn»«/mtd»«/mtr»«mtr»«mtd»«mi»S«/mi»«msub»«mi»E«/mi»«mi»B«/mi»«/msub»«mo»=«/mo»«mn»4«/mn»«mo».«/mo»«mn»08«/mn»«mo»/«/mo»«msqrt»«mn»4«/mn»«/msqrt»«mo»=«/mo»«mn»2«/mn»«mo».«/mo»«mn»04«/mn»«/mtd»«/mtr»«/mtable»«/math»
Tại sao chúng ta cần tính SE ?  Xin nhắc lại nguyên lí và mục đích đằng sau của thống kê học là ước tính những thông số của một quần thể (population).  Trong thực tế chúng ta không biết các thông số này, mà chỉ dựa vào những ước tính từ một hay nhiều mẫu để suy luận cho giá trị của quần thể mà các mẫu được chọn.  Chẳng hạn như chúng ta không biết chiều cao của người Việt là bao nhiêu (bởi vì đâu có ai đo lường chiều cao của 82 triệu dân); chúng ta phải chọn một mẫu gồm n đối tượng để tính trị số trung bình của mẫu này, và dùng trị số trung bình của mẫu để suy luận cho toàn dân số.
Nhưng chọn mẫu phải ngẫu nhiên thì mới mang tính đại diện cao.  Cứ mỗi lần chọn mẫu, chúng ta có một nhóm đối tượng khác.  Và, cứ mỗi mẫu, chúng ta có một số trung bình mới.  Câu hỏi đặt ra là: nếu chọn mẫu nhiều lần (“nhiều” ở đây có nghĩa là hàng triệu hay tỉ lần) thì các số trung bình này dao động cỡ nào.
Ví dụ 2. Hãy lấy một ví dụ cụ thể (nhưng đơn giản) để minh họa cho ý tưởng vừa trình bày.  Giả sử chúng ta có một quần thể chỉ 10 người, và chiều cao tính bằng cm của 10 người này là:
Quần thể: 130, 189, 200, 156, 154, 160, 162, 170, 145, 140
Như vậy chiều cao trung bình của quần thể (chúng ta biết) là 160.6 cm.  Gọi chỉ số này là μ = 160.6 cm.
Bây giờ, giả sử chúng ta không có điều kiện và tài lực để đo chiều cao của toàn bộ quần thể, mà chỉ có khả năng lấy mẫu 5 người từ quần thể này để ước tính chiều cao.  Chúng ta có thể lấy nhiều mẫu ngẫu nhiên, mỗi lần 5 người:
Lần thứ 1: 140, 160, 200, 140, 145                     x1 = 157.0
Lần thứ 2: 154, 170, 162, 160, 162                     x2 = 161.6
Lần thứ 3: 145, 140, 156, 140, 156                     x3 = 147.4
Lần thứ 4: 140, 170, 162, 170, 145                     x4 = 157.4
Lần thứ 5: 156, 156, 170, 189, 170                     x5 = 168.2
Lần thứ 6: 130, 170, 170, 170, 170                     x6 = 162.0
Lần thứ 7: 156, 154, 145, 154, 189                     x7 = 159.6
Lần thứ 8: 200, 154, 140, 170, 170                     x8 = 166.8
Lần thứ 9: 140, 170, 145, 162, 160                     x9 = 155.4
Lần thứ 10: 200, 200, 162, 170, 162                   x10 = 178.8
….
Chú ý trong dãy trên, các số x1, x2, x3, … là số trung bình cho mỗi mẫu được chọn.  Chúng ta thấy cứ mỗi lần chọn mẫu, số trung bình chiều cao ước tính khác nhau, và biến thiên từ 147.4 cm đến 178.8 cm.  Các số trung bình này dao động chung quanh số trung bình của quần thể (tức là 160.6 cm).
Nếu chúng ta chọn mẫu N lần (mỗi lần với n đối tượng), thì chúng ta sẽ có N số trung bình.  Độ lệch chuẩn của N số trung bình này chính là sai số chuẩn.  (Nên nhớ N ở đây là hàng triệu hay tỉ lần).  Do đó, sai số chuẩn phản ảnh độ dao động hay biến thiên của các số trung bình mẫu (sample averages).
Một số sách giáo khoa thống kê dùng danh từ “Standard error of the mean” (SEM), nhưng đây là một cách dùng từ sai.  Như tôi vừa trình bày trên, không có cái gọi là “standard error of the mean”, mà chỉ là standard deviation of the means (chú ý chữ “means” số nhiều vì tính từ nhiều số trung bình).  Thay vì gọi standard deviation of the means (quá dài dòng), người ta gọi ngắn gọn bằng một thuật ngữ mới: standard error.
Ý nghĩa của độ lệch chuẩn và sai số chuẩn
Gọi thông số trung bình của một quần thể là μ (nên nhớ rằng chúng ta không biết giá trị củaμ).  Gọi ước số trung bình tính từ mẫu là  và độ lệch chuẩn là s.  Theo lí thuyết xác suất của phân phối chuẩn, chúng ta có thể phát biểu rằng:
  • 68% cá nhân trong quần thể đó có giá trị «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mi»t«/mi»«mi»§#7915;«/mi»«mo»§nbsp;«/mo»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«mo»-«/mo»«mi»s«/mi»«mo»§nbsp;«/mo»«mi»§#273;«/mi»«mi»§#7871;«/mi»«mi»n«/mi»«mo»§nbsp;«/mo»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«mo»+«/mo»«mi»s«/mi»«/math»
  • 95% cá nhân trong quần thể đó có giá trị «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mi»t«/mi»«mi»§#7915;«/mi»«mo»§nbsp;«/mo»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«mo»-«/mo»«mn»1«/mn»«mo».«/mo»«mn»96«/mn»«mo»§#215;«/mo»«mi»s«/mi»«mo»§nbsp;«/mo»«mi»§#273;«/mi»«mi»§#7871;«/mi»«mi»n«/mi»«mo»§nbsp;«/mo»«mo»§nbsp;«/mo»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«mo»+«/mo»«mn»1«/mn»«mo».«/mo»«mn»96«/mn»«mo»§#215;«/mo»«mi»s«/mi»«/math»;
  • 99% cá nhân trong quần thể đó có giá trị «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mi»t«/mi»«mi»§#7915;«/mi»«mo»§nbsp;«/mo»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«mo»-«/mo»«mn»3«/mn»«mo»§#215;«/mo»«mi»s«/mi»«mo»§nbsp;«/mo»«mi»§#273;«/mi»«mi»§#7871;«/mi»«mi»n«/mi»«mo»§nbsp;«/mo»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«mo»+«/mo»«mn»3«/mn»«mo»§#215;«/mo»«mi»s«/mi»«/math»
Qua trình bày trên, chúng ta thấy rõ ràng độ lệch chuẩn phản ảnh độ biến thiên của một số cá nhân trong một quần thể.  Còn sai số chuẩn phản ảnh độ dao động của các số trung bình chọn từ quần thể.
Ví dụ 3.  Chẳng hạn như khi nói trọng lượng trung bình của một nhóm bệnh nhân là 55 kg với độ lệch chuẩn 8.2 kg, thì câu nói này có nghĩa rằng nếu ta chọn [một cách ngẫu nhiên] một bệnh nhân từ quần thể, thì xác suất 95% là bệnh nhân này sẽ có trọng lượng từ 55─1.96×8.2 = 39 kg đến 55+1.96×8.2 = 71 kg.  Giá trị 39 kg đến 71 kg được gọi là khoảng tin cậy 95% (95% confidence interval).
Trong trường hợp khoảng tin cậy 95% hàm chứa giá trị âm thì sao?  Chúng ta biết rằng chiều cao không thể có giá trị âm!  Vì thế, nếu khoảng tin cậy 95% hàm chứa giá trị âm thì điều này cho chúng ta biết rằng hoặc là (a) phân phối của biến số không tuân theo luật phân phối chuẩn, và các số trung bình, độ lệch chuẩn, hay phương sai không còn ý nghĩa thực tế nữa, hoặc (b) cách chọn mẫu có vấn đề.  Đây là một đề tài thú vị mà tôi sẽ trở lại trong một bài khác.
Về ý nghĩa của sai số chuẩn, chúng ta quay lại với Ví dụ 2.  Giả sử chúng ta không biết giá trị thật của số trung bình cho toàn quần thể, mà chỉ dựa vào mẫu thứ nhất để ước tính.  Lần chọn mẫu thứ nhất là: 140, 160, 200, 140, 145, và:
Số trung bình của mẫu: «math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«mover»«mi»x«/mi»«mo»§#175;«/mo»«/mover»«/math» = 157.0 cm
Độ lệch chuẩn: s = 25.4 cm
Sai số chuẩn: SE = 25.4/«math xmlns=¨http://www.w3.org/1998/Math/MathML¨»«msqrt»«mn»5«/mn»«/msqrt»«/math» = 11.36 cm
Như vậy, theo lí thuyết xác suất, chúng ta có thể nói rằng xác suất 95% là số trung bình của toàn quần thể dao động từ 157─1.96×11.36 = 139 cm đến 157+1.96×11.36 = 179 cm.  (Trong thực tế, chúng ta biết rằng số trung bình của toàn quần thể là 160.6 cm).
Tóm tắt
Cần phải nói ngay rằng không một biến số lâm sàng nào có thể được mô tả chỉ bằng một ước số.  Để có một “bức tranh” chung về một biến số lâm sàng, chúng ta nên sử dụng ba ước số chính: cỡ mẫu, số trung bình, và độ lệch chuẩn.  Sai số chuẩn không cung cấp thông tin về độ biến thiên của một quần thể, cho nên ước số này không nên sử dụng cho việc mô tả một chỉ số lâm sàng.
Nhưng trong thực tế, vì hiểu sai hay nhập nhằng về độ lệch chuẩn và sai số chuẩn nên các bài báo y học được trình bày thiếu thống nhất.  Lúc thì các tác giả trình bày độ lệch chuẩn, lại có khi cung cấp sai số chuẩn.  Đây không phải là vấn đề gian lận khoa học, mà chỉ đơn giản là thiếu hiểu biết.  Chính vì thế mà ban biên tập các tập san y học quốc tế ra chỉ dẫn khuyến cáo tác giả chỉ nên trình bày độ lệch chuẩn kèm theo số trung bình và cỡ mẫu.
Bởi vì mẫu số của sai số chuẩn là số cỡ mẫu, cho nên sai số chuẩn thường thấp hơn độ lệch chuẩn.  Chính vì thế mà có khi tác giả có lẽ ngại trình bày độ lệch chuẩn quá cao (ngại người bình duyệt chất vấn và có thể bài báo bị từ chối) nên họ cố tình trình bày bằng sai số chuẩn mà không ghi chú thích!  Tình trạng nhập nhằng này mới là gian lận khoa học – nhưng là một gian lận ở trình độ thấp.
Hi vọng rằng những giải thích trên đây của tôi đã cung cấp cho bạn đọc một cách hiểu sâu hơn và rõ ràng hơn về khác biệt giữa độ lệch chuẩn và sai số chuẩn.
Nguyễn Văn Tuấn
nguồn: http://statistics.vn/index.php?option=com_content&view=article&id=21:do-lech-chuan-hay-sai-so-chuan&catid=52:sai-s-chun&Itemid=23

THIẾT BỊ VÀ HÓA CHẤT MÔI TRƯỜNG NGÀNH NƯỚC VÀ NƯỚC THẢI

Ngày 19 tháng 4 năm 2011

Kiểm soát và đánh giá việc phân tích-so sánh SD và SRD

Độ chính xác của phép đo

Độ chính xác (precision) cho biết kết quả phân tích có độ lặp lại cao hay không. Các kết quả đo lường trên cùng một mẫu với cùng một thông số được so sánh với giá trị trung bình của các kết quả thu được. Trong đo lường, một thiết bị có thể cho kết quả phân tích có độ chính xác cao nhưng độ chuẩn xác (accuracy) lại thấp.


Chỉ số thống kê được sử dụng thông thường nhất để ước lượng độ chính xác chính là độ lệch chuẩn (standard deviation-SD) và độ lệch chuẩn tương đối (relative standard deviation-RSD) .RSD cũng được biết đến như là hệ số biến thiên (coefficient of variation – CV):

Tính toán độ lệch chuẩn
Các máy tính điện tử, như Casio Fx-570es chẳng hạn, đều có chương trình thống kê để tính giá trị SD một cách đơn giản, chỉ cần nhập giá trị và nhấn các phím tương thích theo hướng dẫn. Công thức để tính SD được biểu diễn như sau:

Trong đó:

SD = độ lệch chuẩn

ΣXi2 = tổng bình phương của các giá trị đo được

ΣXi = tổng các giá trị đo được

n = số lượng các lần đo


Ví dụ 1: các kết quả thu được khi lặp lại phân tích đối với dòng ra nước thải có giá trị tổng chất rắn lơ lửng-TSS lần lượt như sau 10.5, 11.7, 12.6, 9.8 và 11.4 mg/L TSS











Tổng của Xi = 56

Tổng của Xi2= 631.90

n = 5









SD = 1.08 mg/L

Độ lệch chuẩn của phép đo có cỡ hoặc độ lớn phụ thuộc vào cỡ hoặc độ lớn của dữ liệu. Ví dụ, kết quả phân tích TSS của nước thải đầu vào phải cao hơn kết quả phân tích của nước thải đầu ra. Do đó, giá trị SD của các kết quả cho đầu vào sẽ lớn hơn so với SD của đầu ra.

Ví dụ 2: Các phân tích lặp lại để xác định TSS của đầu vào nước thải như sau: 245, 230, 255, 247 và 253 mg/L TSS









Tổng của Xi = 1230

Tổng của Xi2= 302968

n = 5









SD = 9.85 mg/L

Sự khác biệt giữa các giá trị đo được tùy thuộc vào độ lớn và cỡ của giá trị cần xác định, thông qua 2 ví dụ trên cho thấy SD của đầu ra và đầu vào không thể so sánh để đánh giá độ chính xác với nhau (1.08 mg/L với 9.85 mg/L). Tính giá trị RSD (hoặc CV) sẽ giải quyết được vấn đề này do RSD hoặc CV sẽ cho ta biết tính biến thiên của mẫu đó theo phần trăm đối với giá trị trung bình.

Tính độ lệch chuẩn tương đối

Công thức của RSD (hoặc CV) là





Trong đó:

RSD= độ lệch chuẩn tương đối

SD= độ lệch chuẩn

= giá trị trung bình của các kết quả đo được



Sử dụng các giá trị từ ví dụ 1 ta có
= (56mg/L) /5 = 11.2 mg/L


RSD = (1.08 mg/L x 100% )/11.2 mg/L = 9.6%

Tương tự sử dụng các giá trị từ ví dụ 2 ta có

= (1230mg/L) /5 = 246 mg/L


RSD = (9.85 mg/L x 100% )/246 mg/L = 4.0 %

So sánh độ chính xác của phép đo
RSD cho giá trị theo % không có đơn vị đo (mg/L đã bị loại trừ trong công thức tính). Giá trị RSD càng nhỏ thì độ chính xác của phép đo càng cao. Các giá trị của SD được biểu diễn dưới dạng liên quan đến cỡ trung bình của các giá trị TSS đo được. Khi độ chính xác của việc phân tích TSS đầu ra (9.6%) được so sánh với độ chính xác của việc phân tích TSS đầu vào (4.0%), có thể thấy rằng độ chính xác của việc đo TSS đầu ra thấp hơn gần 2 lần so với đầu vào.




1 nhận xét:

  1. Cảm ơn bạn về bài viết, cho mình hỏi thêm 1 chút, nếu có thể bạn giúp mình nhé. Đọc trong 1 tài liệu về thống kê có viết " ( t(0,9;n-1) độ lệch chuẩn tối đo của phép thử không được vượt quá các giá trị trong bảng sau ......" .Mình muốn hỏi là căn cứ vào đâu để đưa ra các giá trị cho độ lệch chuẩn tối đa có thể chấp nhận này ?

    Trả lờiXóa