Suy luận thống kê

Suy luận thống kê là quá trình suy luận suy ra các đặc điểm của một phân phối cơ bản bằng việc phân tích dữ liệu. Phân tích thống kê suy luận suy ra tính chất của tổng thể: điều này bao gồm các giả thuyết thử nghiệm và các ước tính phát sinh. Tổng thể được giả định là lớn hơn so với tạo ra các dữ liệu quan sát, nói cách khác, các dữ liệu quan sát được giả định là lấy mẫu từ một tổng thể lớn hơn.

Thống kê suy luận có thể được so sánh với số liệu thống kê mô tả. Thống kê mô tả chỉ quan tâm tới tính chất của dữ liệu quan sát, và không giả sử các dữ liệu đến từ dữ liệu lớn hơn.

Giới thiệu

Suy luận thống kê giải thích rõ ràng về một tổng thể, sử dụng dữ liệu rút ra từ tổng thẻ thông qua hình thức lấy mẫu. Cho một giả thuyết về tổng thể chúng ta muốn suy ra, suy luận thống kê bao gồm (đầu tiên) mô hình thống kê của một tiến trình tạo ra dữ liệu (thứ hai) mệnh đề suy luận từ mô hình trên.

Konishi & Kitagawa nói rõ “phần lớn các vấn đề trong suy luận tống kê có thể được coi là vấn đề liên quan đến mô hình thống kê”^[1]. Sir David Cox đã nói “làm thế nào để chuyển từ vấn đề chính để mô hình thống kê được thực hiện thường xuyên là một phần quan trọng nhất của một phân tích”.^[2]

Kết luận của một suy luận thống kê là một vấn đề cần giải quyết bằng thống kê. Một số hình thức phổ biến nhất của thống kê:

Một ước lượng điểm, tức là một giá trị đặc biệt xấp xỉ một thông số có tầm quan trọng.
Ước lượng khoảng thời gian, ví dụ như một khoảng tin cậy (hoặc khoảng ước lượng) là một khoảng thời gian được xây dựng dựa trên một tập hợp dữ liệu rút ra từ một tổng thể, chịu tác động của mẫu lặp lại của một bộ dữ liệu này, như vậy khoảng thời gian đó sẽ chứa các giá trị tham số đúng với xác suất tại mức độ tin cậy nhất định.
Một khoảng thời gian đáng tin cậy, tức là một tập hợp các giá trị có giới hạn, ví dụ 95% của độ tin cậy.
Bác bỏ giả thuyết^[3]
Phân nhóm hoặc phân tầng các điểm dữ liệu thành các nhóm.

Các mô hình và các giả thuyết

Bất kỳ kết luận thống kê nào đều phụ thuộc vào giả thuyết. Một mô hình thống kê là một tập hợp các giả thuyết liên quan đến việc tạo ra các dữ liệu quan sát và dữ liệu đồng dạng. Việc mô tả các mô hình thống kê thường nhấn mạnh vào vai trò của số lượng mẫu, điều quan trọng mà ta muốn kiểm tra độ chính xác của suy luận.^[4] Thống kê mô tả thường được sử dụng như một bước chuẩn bị trước nhiều kết luận chính thức được đưa ra.^[5]

Chấp nhận các mô hình/ giả thuyết

Thống kê phân biệt giữa ba cấp độ của các mô hình giả thuyết

Đầy đủ tham số: các phân phối xác suất mô tả quá trình dữ liệu tổng thể được mô tả một cách đầy đủ bởi một tập hợp của các phân phối xác suất liên quan đến số hạng hữu hạn các tham số chưa biết.^[4] Ví dụ, người ta có thể giả định rằng sự phân phối của các giá trị mẫu là đúng tiêu chuẩn. Và bộ dữ liệu được tạo ra bởi các mẫu ngẫu nhiên cơ bản. Tập hợp của các mô hình tuyến tính tổng quát là một lớp được sử dụng rộng rãi và linh hoạt của các mô hình tham số.
Phi tham số: các giả thuyết về quá trình tạo ra các dữ liệu ít hơn so với số liệu thống kê thông số và có thể là rất nhỏ.^[6] Ví dụ, các phân phối xác suất liên tục có giá trị trung bình, trong đó có thể được ước tính bằng trung bình mẫu hay các ước lượng Hodges-Lehmann-Sen, trong đó có đặc tính tốt khi dữ liệu phát sinh từ mẫu ngẫu nhiên không có nhiều yếu tố.
Bán tham số: thuật ngữ này thường ngụ ý giả định “ở giữa” hoàn toàn và phương pháp tiếp cận phi tham số. Ví dụ, người ta có thể giả định rằng một phân phối tổng thể có ý nghĩa hữu hạn. Hơn nữa, người ta có thể giả định rằng mức độ phản ứng trung bình trong tổng thể phụ thuộc tuyến tính trên một số tham số đồng biến (giả định một tham số) nhưng không thực hiện bất kỳ giả định tham số mô tả các biến có nghĩa theo nhiều hướng (như sự xuất hiện của mẫu hoặc có thể chấp nhận mẫu của bất kỳ biến ngẫy nhiên nào). Tổng quát hơn, các mô hình bán tham số thường có thể chia thành các “cấu trúc” và véc –tơ “biến thiên ngẫu nhiên”. Một vec – tơ được nghiên cứu dưới dạng tham số và không phải là tham số. Các mô hình Cox nổi tiếng là một tập hợp các giả định bán tham số.

Tầm quan trọng của mô hình/ giả thuyết hợp lý

Dù mức độ giả định được thực hiện, suy luận của việc đo độ chính xác của kết luận nói chung đòi hỏi các giả định này là chính xác, tức là các cơ chế tạo ra dữ liệu thực sự đã được quy định một cách phù hợp.

Giả định không chính xác của lấy mẫu ngẫu nhiên “không có nhiều yếu tố” có thể làm mất giá trị suy luận thống kê.^[7] Giả thuyết bán tham số và tham số đầy đủ phức tạp cũng đang gây lo ngại. Ví dụ, giả sử mô hình Cox là sai, có thể trong một số trường hợp dẫn đến kết luận sai lầm.^[8] Giả định không đúng quy tắc trong tổng thể cũng mất giá trị một số hình thức của suy luận hồi quy.^[9] Việc sử dụng bất kỳ một mô hình tham số nào cũng được xem là một cách nghi ngờ bởi hầu hết các chuyên gia trong việc lấy mẫu tổng thể loài người: “hầu hết các nhà thống kê lấy mẫu khi họ xử lý các khoảng tin cậy, hạn chế khoảng tin cậy để báo cáo (người đánh giá) dựa trên các mẫu rất lớn, nơi mà các định lý giới hạn chính đảm bảo rằng (những người đánh giá) sẽ có các phân phối gần như là bình thường”^[10]. Đặc biệt một phân phối bình thường: “sẽ là một giả định hoàn toàn không thực tế và việc chấp nhận giả thuyết một cách không thận trọng để thực hiện nếu chúng ta đang giải quyết với bất kỳ kiểu tổng thể của kinh tế”^[10]. Ở đây, các định lý giới hạn trung tâm chỉ ra rằng các phân phối mẫu có nghĩa là: “cho mẫu rất lớn” được ước lượng phân phối thông thường, nếu phân phối là không nhiều đuôi.

Phân phối xấp xỉ

Với sự khó khăn trong việc xác định sự phân bố chính xác của số liệu thống kê mẫu, nhiều phương pháp đã được phát triển cho xấp xỉ này.

Với mẫu hữu hạn, kết quả xấp xỉ đo khoảng cách giữa một phân phối hạn chế tiếp cận với phân phối mẫu của thống kê. Ví dụ, với 10.000 mẫu độc lập xấp xỉ phân phối chuẩn (hai chữ số chính xác) phân phối của mẫu có ý nghĩa cho nhiều bản phân phối tổng thể bởi thuyết Bery – Esseen.^[11] Tuy nhiên, đối với kết quả có ý nghĩa thực tế, xấp xỉ tiêu chuẩn cung cấp một xấp xỉ tốt để phân phối các mẫu trung bình khi có 10 (hoặc nhiều hơn) mẫu độc lập, theo nghiên cứu mô phỏng và kinh nghiệm thống kê^[11]. Sau công việc của Kolmogorov vào những năm 1950, số liệu thống kê tiên tiến sử dụng lý thuyết xấp xỉ và phân tích chức năng để xác định số lượng các lỗi của xấp xỉ. Trong phương pháp này, các thuyết hình học metric của phân phối xác suất được nghiên cứu, cách tiếp cận này xác định số lượng lỗi xấp xỉ, ví dụ, sự phân kỳ Kullback – Leibler, Bregman phân kỳ và khoảng cách Hellinger.^[12]^[13]^[14]

Với mẫu lớn vô hạn, hạn chế các kết quả nghiên cứu khoa học như các định lý giới hạn trung tâm mô tả giới hạn phân phối các mẫu thống kê, nếu nó tồn tại. Kết quả hạn chế là không báo cáo về các mẫu hữu hạn, và thực sự không liên quan đến xác mẫu hữu hạn.^[15]^[16]^[17] Tuy nhiên, lý thuyết tiệm cận của các bản phân phối hạn chế thường được đưa ra dẫn chứng để chứng minh với các mẫu hữu hạn. Ví dụ, kết quả hạn chế thường được đưa ra dẫn chứng để biện minh cho phương pháp tổng quát của tầm quan trọng và việc sử dụng các phương trình ước tính tổng quát, được phổ biến trong kinh tế lượng và thống kê sinh học. Độ lớn của sự khác biệt giữa phân phối hạn chế và phân phối chuẩn (các lỗi của xấp xỉ) có thể được đánh giá bằng mô phỏng^[18]. Các ứng dụng tự khám phá của giới hạn kết quả với các mẫu giới hạn là thực tế phổ biến trong nhiều ứng dụng, đặc biệt là với mô hình kích thước nhỏ của hàm log – concave likelihood (chẳng hạn như một tham số quan hệ theo cấp số nhân).

Các mô hình ngẫu nhiên

Đối với một bộ dữ liệu được cung cấp bởi một thiết kế ngẫu nhiên, phân phối ngẫu nhiên của một thống kê (theo giả thuyết null) được xác định bằng cách đánh giá kiểm định thống kê cho tất cả các dự định có thể được tạo ra bởi các thiết kế ngẫu nhiên. Trong suy luận thường hay xảy ra, chọn ngẫu nhiên cho phép suy luận dựa trên sự phân phối ngẫu nhiên chứ không phải là một mô hình chủ quan, và điều này là quan trọng đặc biệt trong mẫu khảo sát và thiết kế các thử nghiệm.^[19]^[20] Suy luận thống kê từ các nghiên cứu ngẫu nhiên cũng đơn giản hơn nhiều hoàn cảnh khác.^[21]^[22]^[23] Trong suy luận Bayesian, chọn ngẫu nhiên cũng có tầm quan trọng: trong mẫu khảo sát, sử dụng các mẫu mà không cần thay thế đảm bảo tính thay đổi của mẫu với tổng thể, tỏng thí nghiệm ngẫu nhiên, chọn ngẫu nhiên đảm bảo một chỗ trống tại giả định ngẫu nhiên cho thông tin cùng tham số.^[24]

Mục tiêu ngẫu nhiên cho phép các thủ tục quy nạp đúng^[25]^[26]^[27]^[28]. Nhiều thống kê phân tích buộc phân tích thống kê ngẫu nhiên dựa trên cơ sở các dữ liệu đã được tạo ra bởi các thủ tục ngẫu nhiên và được xác định rõ^[29]. (tuy nhiên, sự thật là trong các linh vực của khoa học với kiến thức lý thuyết phát triển và kiểm soát thực nghiệm, thử nghiệm ngẫu nhiên có thể làm tăng chi phí của các thử nghiệm mà không cải thiện chất lượng của các kết quả^[30]^[31]). Tương tự như vậy, kết quả từ các thí nghiệm ngẫu nhiên được đề nghị của cơ quan thống kê hàng đầu như cho phép suy luận với độ tin cậy cao hơn làm nghiên cứu quan sát các hiện tượng tương tự.^[32] Tuy nhiên một nghiên cứu quan sát tốt có thể tốt hơn so với một thử nghiệm ngẫu nhiên xấu.

Phân tích thống kê của một thử nghiệm ngẫu nhiên có thể dựa trên các phối hợp ngẫu nhiên trong giao thức thử nghiệm mà không cần một mô hình chính.^[33]^[34]

Tuy nhiên, bất cứ lúc nào, một số giả thuyết có thể không được kiểm tra bằng cách sử dụng mô hình thống kê khách quan, trong đó mô tả chính xác thí nghiệm ngẫu nhiên hay mẫu ngẫu nhiên. Trong một số trường hơp, các nghiên cứu ngẫu nhiên này là không kinh tế hoặc không đúng với nguyên tắc.

Phân tích dựa trên mô hình thí nghiệm ngẫu nhiên

Đó là tiêu chuẩn tiến hành để tham khảo một mô hình thống kê, thường là một mô hình tuyến tính, khi phân tích các dữ liệu từ các thử nghiệm ngẫu nhiên. Tuy nhiên, các kết hợp tác động đến việc lựa chọn mô hình thống kê. Nó không thể chọn một mô hình thích hợp mà không biết các kết hợp ngẫu nhiên.^[20] Các kết quả sai lệch trầm trọng có thể thu được từ thí nghiệm phân tích dữ liệu ngẫu nhiên trong khi bỏ qua các giao thức thử nghiệm. Sai lầm phổ biến bao gồm bỏ lỡ việc ngăn chặn sử dụng thử nghiệm và đo lường lặp đi lặp lại gây nhầm lẫn về các đơn vị thử nghiệm tương tự với việc lặp lại độc lập của việc xử lý áp dụng cho các đơn vị thí nghiệm khác.^[35]

Phương pháp luận cho thống kê suy luận

Các trường phái khác nhau của suy luận thống kê đã được thành lập. Những trường phái này hay “mô hình” là không loại trừ lẫn nhau, và phương pháp làm việc tốt dưới một mô hình thường có những cách giải thích hấp dẫn dưới các mô hình khác nhau.

Bandyopadhyay & Forster^[36] mô tả bốn mô hình: “(i) thống kê cổ điển hoặc thống kê lỗi, (ii) thống kê Bayes, (iii) thống kê dựa trên cơ sở likelihood and (iv) thống kê dựa trên thông tin của Akaikean và cơ sở thống kê Criterion”. Các mô hình cổ điển (hoặc thường xuyên), mô hình Bayes, va các mô hình dựa trên AIC được tóm tắt dưới đây. Các mô hình likelihood về cơ bản là một mô hình đại diện của mô hình AIC.

Suy luận phương pháp mẫu lặp (Frequentist)

Mô hình này hiệu chỉnh việc sản xuất của các mệnh đề (cần làm rõ thuật ngữ phức tạp) bằng cách xem xét (danh nghĩa) lặp lại việc lấy mẫu của bộ dữ liệu tương tự như một phương thức. Bằng cách xem xét các đặc điểm của mẫu theo mẫu lặp lại, các tính chất của bất kì đặc tính của mô hình suy luận thống kê có thể được mô tả - mặc dù trong thực tế định lượng này mang tính thách thức lớn.

Ví dụ về suy luận của mô hình

Giá trị p-value
Khoảng tin cậy

Suy luận mô hình, khách quan, và lý thuyết quyết định

Một cách giải thích mô hình suy luận (hoặc suy luận cổ điển) là nó chỉ được áp dụng trong các dạng của tần số xác suất, có nghĩa là các dạng lấy mẫu lặp lại từ một tổng thể. Tuy nhiên, cách tiếp cận của Neyman^[37] phát triển một thủ tục dưới dạng xác suất thử nghiệm trước. Đó là trước khi thực hiện một thử nghiệm, một quyết định về một quy tắc cho đến một kết luận như vậy là xác suất đúng được kiểm soát một cách thích hợp: một xác suất như vậy không cần phải có mô hình hoặc giải thích mẫu lặp lại. Ngược lại, suy luận Bayesian hoạt động dưới dạng xác suất có điều kiện (tức là xác suất có điều kiện dưa trên dữ liệu quan sát), so với các xác suất cận biên (nhưng với điều kiện dựa trên tham số chưa biết) được sử dụng trong các mô hình tiếp cận.

Các mô hình thủ tục thử nghiệm ý nghĩa và khoảng tin cậy có thể được xây dựng mà không liên quan đến chức năng tiện ích. Tuy nhiên, một số yếu tố mô hình thống kê, hư lý thuyết quyết định thống kê, để kết hợp các hàm hữu ích^{[cần dẫn nguồn]}. Trong đó, mô hình phát triển của suy luận tốt nhất (ví dụ như tối thiểu sai số ước lượng không chệch, hoặc đồng nhất việc kiểm tra tác động sử dụng các hàm dự kiến, trong đó vai trò của hàm (tiêu cực) là hàm hữu ích. Hàm dự kiến cần phải được nêu rõ trong lý thuyết thống kê để chứng minh rằng một thủ tục thống kê có một thuộc tính tối ưu^[38]. Tuy nhiên, hàm dự kiến thường phổ biến cho việc thống kê thuộc tính tối ưu: ví dụ, ước lượng trung bình không chệch là tối ưu dưới giá trị các dạng hàm dự kiến, trong đó họ giảm thiểu tổn thất dự kiến, và bình phương nhỏ nhất là ước lượng bình phương tối ưu dưới các hàm dự kiến sai số bình phương, trong đó giảm thiểu tổn thất dự kiến.

Trong khi đó các nhà thống kê sử dụng mô hình suy luận được chọn cho mình những tham số quan trọng, và các số liệu thống kê ước lượng/ kiểm tra sẽ được sử dụng, sự vắng mặt của các tiện ích rõ ràng hiển nhiên và phân phối trước đã hỗ trợ các thủ tục mô hình để trở nên rọng rãi được xem như “mục đích”^{[cần dẫn nguồn]}.

Suy luận Bayes

Các tính toán Bayesian mô tả mức độ tin cậy bằng cách sử dụng “ngôn ngữ” của xác suất, độ tin cậy này là có thể chấp nhận được, lấy tích phân của một, và tuân theo tiên đề xác suất. Suy luận của Bayes sử dụng khoảng tin cậy ở phía sau có sẵn như là cơ sở cho việc thực hiện các mệnh đề thống kê. Có luận cứ khác nhau để sử dụng cho phương pháp Bayesian.

Ví dụ về suy luận Bayesian

Khoảng thời gian đáng tin cậy cho khoảng thời gian ước lượng
Các yếu tố Bayes để so sánh mô hình

Suy luận Bayesian, tính chủ quan và thuyết quyết định

Nhiều kết luận Bayesian không đồng nhất được dựa trên bản tóm tắt “bằng trực giác có cơ sở” của hậu nghiệm. Ví dụ, hậu nghiệm có nghĩa là trung bình và phương thức, khoảng mật độ hậu nghiệm cao nhất, và tất cả các yếu tố Bayes có thể được phát triển theo cách này. Trong khi chức năng tiện ích của người sử dụng không cần phải chỉ ra cho các loại suy luận này, các bản tóm tắt làm tất cả phụ thuộc (với một mức độ nào) về niềm tin trước khi công bố và thường được xem như là kết quả chủ quan. (Phương pháp xây dựng trước đó không yêu càu dữ liệu đầu vào bên ngoài đã được đề xuất nhưng chưa được phát triển đầy đủ).

Thông thường, suy luận Bayes được hiệu chỉnh với tham chiếu đến một tiện ích được nêu một cách rõ ràng, hoặc hàm dự kiến, các “quy tắc Bayes” là một trong những tối đa hóa mong đợi dự kiến, trung bình thông qua hàm dự kiến không chắc chắn. Hình thức suy luận Bayesian tự động cung cấp các quyết định tối ưu trong một ý nghĩa lý thuyết quyết định. Giả định được đưa ra, dữ liệu và tiện ích, suy luận Bayesian có thể được thực hiện cho bất kỳ vấn đề cơ bản, mặc dù không phải tất cả thống kê cần có một giải thích Bayessian. Các phân tích không phải là Bayesian chính thức có thể (logic) không liên tục, một tính năng của thủ tục Bayessian mà sử dụng phân tích phù hợp (ví dụ, có thể lấy tích phân từ một) là họ được đảm bảo để được chặt chẽ. Một số những người ủng hộ suy luận Bayes khẳng định suy luận phải trong phạm vi lý thuyết quyết định, và rằng suy luận Bayesian không nên kết luận với việc đánh giá, tổng hợp của độ tin cậy hậu nghiệm.

Suy luận dựa theo AIC

Các mô hình khác để suy luận

Chiều dài mô tả tối thiểu

Nguyên tắc chiều dài mô tả tối thiểu (MDL-Minimum description length) đã được phát triển từ ý tưởng trong lý thuyết thông tin^[39] và lý thuyết mức độ phức tạp của Kolmogorov^[40]. Nguyên tắc lựa chọn mô hình thống kê là nén dữ liệu một cách tối đa. Tiến trình suy luận không cần giả thuyết trái vơi quy luật hoặc không có căn cứ “cơ chế tổng hợp dữ liệu” hay các mô hình xác suất cho các dữ liệu, như có thể được thực hiện trong các mô hình phương pháp hoặc Bayesian.

Thuy nhiên, nếu một “cơ chế tạo ra dữ liệu” không tồn tại trong thực tế, sau đó nguồn của Shannon ở điểm bắt đầu theo thuyết mã hóa cung cấp các nguyên tắc mô tả chiều dài tối thiểu của dữ liệu, trung bình và tiệm cận^[41]. Trong giảm thiểu chiều dài mô tả (mô tả phức tạp), MDL ước tính là đồng dạng để ước lượng Likelihood lớn nhất và ước lượng hậu nghiệm (sử dụng tối đa mức độ đo trong một hệ thống ưu tiên Bayessian). Tuy nhiên, MDL tránh các giả định rằng mô hình xác suất cơ bản được biết đến; nguyên tắc MDL cũng có thể được áp dụng mà không cần giả định, ví dụ như các dữ liệu phát sinh từ mẫu độc lập.^[41]^[42]

Các nguyên tắc MDL đã được áp dụng trong lý thuyết mã hóa thông tin liên lạc trong lý thuyết dữ liệu, trong hồi quy tuyến tính^[42] và trong khai thác dữ liệu.^[40]

Việc đánh giá các tiến trình suy luận MDL thường dựa trên việc sử dụng kỹ thuật hoặc tiêu chuẩn từ lý thuyết tính toán phức hợp.^[43]

Suy luận cơ sở so sánh

Cơ sở so sánh suy luận là một phương pháp tiếp cận các kết luận thống kê dựa trên xác suất chuẩn, còn gọi là “phân phối cơ sở so sành”. Trong việc tiếp theo, phương pháp này được gọi gọi là xác định các tính chất yếu, rất hạn chế trong các ứng dụng, và thậm chí là sai lầm^[44]^[45]. Tuy nhiên lập luận này cũng giống như các cơ sở so sánh chỉ ra rằng^[46] một phân phối tin cậy không phải là một phân phối xác suất hợp lệ, và vì điều này đã không có hiệu lực áp dụng cho các khoảng tin cậy, nó không nhất thiết phải làm mất hiệu lực của các kết luận rút ra từ luận điểm cơ sở so sánh.

Suy luận cấu trúc

Phát triển ý tưởng của Fissher và Pitman 1938 – 1939^[47], George A. Barnard phát triển “suy luận cấu trúc” hoặc “suy luận then chốt”^[48], một cách tiếp cận việc sử dụng xác suất cố định về nhóm có mối quan hệ. Barnard đã trình bày lại lý lẽ sau suy luận chuẩn trên một lớp hạn chế của mô hình mà những thủ tục “cơ sở so sánh” sẽ được xác định rõ ràng và hữu ích.

Tham khảo

^ Konishi & Kitagawa (2008), p.75
^ Cox (2006), p.197
^ According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable
^ ^a ^b Cox (2006) page 2
^ Evans, Michael (2004). Probability and Statistics: The Science of Uncertainty. Freeman and Company. tr. 267.
^ van der Vaart, A.W. (1998) Asymptotic Statistics Cambridge University Press. ISBN 0-521-78450-6 (page 341)
^ Kruskal 1988
^ Freedman, D.A. (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Bản in lại Chapter 11 (pages 169–192) of Freedman (2010)).
^ Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5
^ ^a ^b Brewer, Ken (2002). Combined Survey Sampling Inference: Weighing of Basu's Elephants. Hodder Arnold. tr. 6. ISBN 978-0340692295.
^ ^a ^b Jörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399 ^{[cần chú thích đầy đủ]}
^ Le Cam (1986) ^{[cần số trang]}
^ Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press. ^{[cần chú thích đầy đủ]}
^ Liese, Friedrich and Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer. ISBN 0-387-73193-8.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)
^ Kolmogorov (1963, p.369): "The frequency concept, based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".
^ "Indeed, limit theorems 'as $n$ tends to infinity' are logically devoid of content about what happens at any particular $n$ . All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)
^ Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately.... What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)
^ Pfanzagl (1994): "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [...] Realistic information about the remaining errors may be obtained by simulations." (page ix)
^ Neyman, J.(1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", Journal of the Royal Statistical Society, 97 (4), 557–625 JSTOR 2342192
^ ^a ^b Hinkelmann and Kempthorne(2008) ^{[cần số trang]}
^ ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website)
^ David A. Freedmana's Statistics.
^ David S. Moore and George McCabe. Introduction to the Practice of Statistics.
^ Gelman A. (2013). Bayesian Data Analysis (Chapman & Hall).
^ Peirce (1877-1878)
^ Peirce (1883)
^ David Freedmana Statistics and David A. Freedman Statistical Models.
^ Rao, C.R. (1997) Statistics and Truth: Putting Chance to Work, World Scientific. ISBN 981-02-3111-3
^ Peirce, Freedman, Moore and McCabe.^{[cần dẫn nguồn]}
^ Box, G.E.P. and Friends (2006) Improving Almost Anything: Ideas and Essays, Revised Edition, Wiley. ISBN 978-0-471-72755-2
^ Cox (2006), page 196
^
ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website)
- David A. Freedmana's Statistics.
- David S. Moore and George McCabe. Introduction to the Practice of Statistics.
^ Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.
^ Hinkelmann & Kempthorne (2008) ^{[cần số trang]}
^ Hinkelmann and Kempthorne (2008) Chapter 6.
^ Bandyopadhyay & Forster (2011). The quote is taken from the book's Introduction (p.3). See also "Section III: Four Paradigms of Statistics".
^ Neyman, J. (1937) "Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability", Philosophical Transactions of the Royal Society of London A, 236, 333–380.
^ Preface to Pfanzagl.
^ Soofi (2000)
^ ^a ^b Hansen & Yu (2001)
^ ^a ^b Hansen and Yu (2001), page 747.
^ ^a ^b Rissanen (1989), page 84
^ Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) ^{[cần số trang]}
^ Neyman (1956)
^ Zabell (1992)
^ Cox (2006) page 66
^ Davison, page 12. ^{[cần chú thích đầy đủ]}
^ Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR 1403482

Sách tham khảo

Bandyopadhyay, P. S.; Forster, M. R. biên tập (2011), Philosophy of Statistics, Elsevier.
Bickel, Peter J.; Doksum, Kjell A. (2001). Mathematical statistics: Basic and selected topics. 1 . Prentice Hall. ISBN 0-13-850363-X. MR 0443141.
Cox, D. R. (2006). Principles of Statistical Inference, Cambridge University Press. ISBN 0-521-68567-2.
Fisher, R. A. (1955), "Statistical methods and scientific induction", Journal of the Royal Statistical Society, Series B, 17, 69—78. (criticism of statistical theories of Jerzy Neyman và Abraham Wald)
Freedman, D. A. (2009). Statistical models: Theory and practice . Cambridge University Press. tr. xiv+442 pp. ISBN 978-0-521-74385-3. MR 2489600.
Freedman, D. A. (2010). Statistical Models and Causal Inferences: A Dialogue with the Social Sciences (Edited by David Collier, Jasjeet S. Sekhon, and Philip B. Stark), Cambridge University Press.
Hansen, Mark H.; Yu, Bin (tháng 6 năm 2001). “Model Selection and the Principle of Minimum Description Length: Review paper”. Journal of the American Statistical Association. 96 (454): 746–774. doi:10.1198/016214501753168398. JSTOR 2670311. MR 1939352.
Hinkelmann, Klaus; Kempthorne, Oscar (2008). Introduction to Experimental Design . Wiley. ISBN 978-0-471-72756-9.
Kolmogorov, Andrei N. (1963). “On tables of random numbers”. Sankhyā Ser. A. 25: 369–375. MR 0178484. Bản in lại Kolmogorov, Andrei N. (1998). “On tables of random numbers”. Theoretical Computer Science. 207 (2): 387–395. doi:10.1016/S0304-3975(98)00075-9. MR 1643414.
Konishi S., Kitagawa G. (2008), Information Criteria and Statistical Modeling, Springer.
Kruskal, William (tháng 12 năm 1988). “Miracles and Statistics: the casual assumption of independence (ASA Presidential Address)”. Journal of the American Statistical Association. 83 (404): 929–940. JSTOR 2290117.
Le Cam, Lucian. (1986) Asymptotic Methods of Statistical Decision Theory, Springer. ISBN 0-387-96307-3
Neyman, Jerzy (1956). “Note on an Article by Sir Ronald Fisher”. Journal of the Royal Statistical Society, Series B. 18 (2): 288–294. JSTOR 2983716. (reply to Fisher 1955)
Peirce, C. S. (1877–1878), "Illustrations of the Logic of Science" (series), Popular Science Monthly, vols. 12-13. Relevant individual papers:
- (1878 March), "The Doctrine of Chances", Popular Science Monthly, v. 12, March issue, pp. 604–615. Internet Archive Eprint.
- (1878 April), "The Probability of Induction", Popular Science Monthly, v. 12, pp. 705–718. Internet Archive Eprint.
- (1878 June), "The Order of Nature", Popular Science Monthly, v. 13, pp. 203–217.Internet Archive Eprint.
- (1878 August), "Deduction, Induction, and Hypothesis", Popular Science Monthly, v. 13, pp. 470–482. Internet Archive Eprint.
Peirce, C. S. (1883), "A Theory of Probable Inference", Studies in Logic, pp. 126-181, Little, Brown, and Company. (Reprinted 1983, John Benjamins Publishing Company, ISBN 90-272-3271-7)
Pfanzagl, Johann; with the assistance of R. Hamböker (1994). Parametric Statistical Theory. Berlin: Walter de Gruyter. ISBN 3-11-013863-8. MR 1291393.
Rissanen, Jorma (1989). Stochastic Complexity in Statistical Inquiry. Series in computer science. 15. Singapore: World Scientific. ISBN 9971-5-0859-1. MR 1082556.
Soofi, Ehsan S. (tháng 12 năm 2000). “Principal Information-Theoretic Approaches (Vignettes for the Year 2000: Theory and Methods, ed. by George Casella)”. Journal of the American Statistical Association. 95 (452): 1349–1353. doi:10.1080/01621459.2000.10474346. JSTOR 2669786. MR 1825292.
Traub, Joseph F.; Wasilkowski, G. W.; Wozniakowski, H. (1988). Information-Based Complexity. Academic Press. ISBN 0-12-697545-0.
Zabell, S. L. (tháng 8 năm 1992). “R. A. Fisher and Fiducial Argument”. Statistical Science. 7 (3): 369–387. doi:10.1214/ss/1177011233. JSTOR 2246073.

Đọc thêm

Casella, G., Berger, R.L. (2001). Statistical Inference. Duxbury Press. ISBN 0-534-24312-6
Freedman D.A. (1991). "Statistical models and shoe leather", Sociological Methodology, 21: 291–313.
Held L., Bové D.S. (2014). Applied Statistical Inference—Likelihood and Bayes (Springer).
Lenhard, Johannes (2006). "Models and Statistical Inference: the controversy between Fisher and Neyman–Pearson", British Journal for the Philosophy of Science, 57: 69–91.
Lindley, D. (1958). "Fiducial distribution and Bayes' theorem", Journal of the Royal Statistical Society, Series B, 20: 102–7.
Rahlf, Thomas (2014). "Statistical Inference", in Claude Diebolt, and Michael Haupert (eds.), "Handbook of Cliometrics (Springer Reference Series)", Berlin/Heidelberg: Springer. http://www.springerreference.com/docs/html/chapterdbid/372458.html
doi:10.1111/insr.12067
Hoàn thành chú thích này
Young, G.A., Smith, R.L. (2005). Essentials of Statistical Inference, CUP. ISBN 0-521-83971-8

Liên kết ngoài

MIT OpenCourseWare: Statistical Inference
Statistical induction and prediction

[1] Konishi & Kitagawa (2008), p.75

[2] Cox (2006), p.197

[3] According to Peirce, acceptance means that inquiry on this question ceases for the time being. In science, all scientific theories are revisable

[Cox2006-4] Cox (2006) page 2

[5] Evans, Michael (2004). Probability and Statistics: The Science of Uncertainty. Freeman and Company. tr. 267.

[6] van der Vaart, A.W. (1998) Asymptotic Statistics Cambridge University Press. ISBN 0-521-78450-6 (page 341)

[7] Kruskal 1988

[8] Freedman, D.A. (2008) "Survival analysis: An Epidemiological hazard?". The American Statistician (2008) 62: 110-119. (Bản in lại Chapter 11 (pages 169–192) of Freedman (2010)).

[9] Berk, R. (2003) Regression Analysis: A Constructive Critique (Advanced Quantitative Techniques in the Social Sciences) (v. 11) Sage Publications. ISBN 0-7619-2904-5

[Brewer-10] Brewer, Ken (2002). Combined Survey Sampling Inference: Weighing of Basu's Elephants. Hodder Arnold. tr. 6. ISBN 978-0340692295.

[JHJ-11] Jörgen Hoffman-Jörgensen's Probability With a View Towards Statistics, Volume I. Page 399 ^{[cần chú thích đầy đủ]}

[12] Le Cam (1986) ^{[cần số trang]}

[13] Erik Torgerson (1991) Comparison of Statistical Experiments, volume 36 of Encyclopedia of Mathematics. Cambridge University Press. ^{[cần chú thích đầy đủ]}

[14] Liese, Friedrich and Miescke, Klaus-J. (2008). Statistical Decision Theory: Estimation, Testing, and Selection. Springer. ISBN 0-387-73193-8.Quản lý CS1: nhiều tên: danh sách tác giả (liên kết)

[15] Kolmogorov (1963, p.369): "The frequency concept, based on the notion of limiting frequency as the number of trials increases to infinity, does not contribute anything to substantiate the applicability of the results of probability theory to real practical problems where we have always to deal with a finite number of trials".

[16] "Indeed, limit theorems 'as $n$ tends to infinity' are logically devoid of content about what happens at any particular $n$ . All they can do is suggest certain approaches whose performance must then be checked on the case at hand." — Le Cam (1986) (page xiv)

[17] Pfanzagl (1994): "The crucial drawback of asymptotic theory: What we expect from asymptotic theory are results which hold approximately.... What asymptotic theory has to offer are limit theorems."(page ix) "What counts for applications are approximations, not limits." (page 188)

[18] Pfanzagl (1994): "By taking a limit theorem as being approximately true for large sample sizes, we commit an error the size of which is unknown. [...] Realistic information about the remaining errors may be obtained by simulations." (page ix)

[19] Neyman, J.(1934) "On the two different aspects of the representative method: The method of stratified sampling and the method of purposive selection", Journal of the Royal Statistical Society, 97 (4), 557–625 JSTOR 2342192

[Hinkelmann_and_Kempthorne-20] Hinkelmann and Kempthorne(2008) ^{[cần số trang]}

[21] ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website)

[22] David A. Freedmana's Statistics.

[23] David S. Moore and George McCabe. Introduction to the Practice of Statistics.

[24] Gelman A. (2013). Bayesian Data Analysis (Chapman & Hall).

[25] Peirce (1877-1878)

[26] Peirce (1883)

[27] David Freedmana Statistics and David A. Freedman Statistical Models.

[28] Rao, C.R. (1997) Statistics and Truth: Putting Chance to Work, World Scientific. ISBN 981-02-3111-3

[29] Peirce, Freedman, Moore and McCabe.^{[cần dẫn nguồn]}

[30] Box, G.E.P. and Friends (2006) Improving Almost Anything: Ideas and Essays, Revised Edition, Wiley. ISBN 978-0-471-72755-2

[31] Cox (2006), page 196

[32] ASA Guidelines for a first course in statistics for non-statisticians. (available at the ASA website)
David A. Freedmana's Statistics.

David S. Moore and George McCabe. Introduction to the Practice of Statistics.

[33] David A. Freedmana's Statistics.

[34] David S. Moore and George McCabe. Introduction to the Practice of Statistics.

[33] Neyman, Jerzy. 1923 [1990]. "On the Application of Probability Theory to AgriculturalExperiments. Essay on Principles. Section 9." Statistical Science 5 (4): 465–472. Trans. Dorota M. Dabrowska and Terence P. Speed.

[34] Hinkelmann & Kempthorne (2008) ^{[cần số trang]}

[35] Hinkelmann and Kempthorne (2008) Chapter 6.

[36] Bandyopadhyay & Forster (2011). The quote is taken from the book's Introduction (p.3). See also "Section III: Four Paradigms of Statistics".

[37] Neyman, J. (1937) "Outline of a Theory of Statistical Estimation Based on the Classical Theory of Probability", Philosophical Transactions of the Royal Society of London A, 236, 333–380.

[38] Preface to Pfanzagl.

[Soofi_2000_1349–1353-39] Soofi (2000)

[HY-40] Hansen & Yu (2001)

[HY747-41] Hansen and Yu (2001), page 747.

[JR-42] Rissanen (1989), page 84

[43] Joseph F. Traub, G. W. Wasilkowski, and H. Wozniakowski. (1988) ^{[cần số trang]}

[44] Neyman (1956)

[45] Zabell (1992)

[46] Cox (2006) page 66

[47] Davison, page 12. ^{[cần chú thích đầy đủ]}

[48] Barnard, G.A. (1995) "Pivotal Models and the Fiducial Argument", International Statistical Review, 63 (3), 309–323. JSTOR 1403482

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]

[29]

[30]

[31]

[32]

[33]

[34]

[35]

[36]

[37]

[38]

[39]

[40]

[41]

[42]

[43]

[44]

[45]

[46]

[47]

[48]