Saturday, December 17, 2011

Lý thuyết xác suất được hình thành như thế nào?

Xác suất và xác suất thống kê là một ngành khoa hoc (toán học) hiện đại, nó gần như xuất phát từ các hiện tượng trong đời sống thực tiễn, hình thành và phát triễn rất nhanh nhằm phục vụ các nhu cầu của thực tiễn. Hiện nay một phần nhỏ của lý thuyết xác suất đã được đưa vào chương trình phổ thông, nằm ở học kì I của lớp 1

1. Vậy lý thuyết xác suất được hình thành như thế nào?


Có thể nói sự bắt nguồn cho câu chuyện về xác suất và thống kê là từ một vài bài viết được đề cập từ những sự nỗ lực độc lập của Cardano (Liber de Ludo Aleae (1565), xuất hiện lần đầu tiên vào năm 1663) và Galilei (Sopra le Scoperte dei Dadi (vào khoảng 1620), xuất hiện lần đầu tiên vào năm 1718), nhưng vào thời điểm đó đã có một sự đồng quan điểm được nhận định từ một số câu hỏi về trò chơi cờ bạc được Antoine Gombaud, Chevalier de Méré và Damien Mitton gởi cho Pascal vào năm 1654.

Thời gian này chưa có báo chí khoa học như ngày nay, do đó cần có những phương thức khác thật sự cần thiết để nắm bắt và công bố những công trình nghiên cứu về môn khoa học mới. Thư từ là một trong những con đường giải quyết hiệu quả trở ngại này. Thật vậy, Martin Marsenne đã như là người trung gian giữ vai trò kết nối sự liên lạc giữa các nhà khoa học và triết học trên toàn châu Âu bằng cách viết và nhận những lá thư, sau đó chuyển chúng cho những người khác. Trong số những người bạn thư của ông có nhiều nhà khoa học và triết học như Descartes, Pascal, Fermat, Galilei và Huygens.

Thế kỷ 17
Năm 1654:
Giữa tháng 7 và tháng 10 của năm đó đã có 7 lá thư được trao đổi giữa Blaise Pascal và Pierre de Fermat có thể được xem chính là nguồn gốc đích thực của lý thuyết xác suất. Một trong các chủ đề chính của những lá thư này là thảo luận câu hỏi được đề cập trước đây của Méré về problème des partis (vấn đề chia điểm) giữa hai người chơi P1 và P2 khi họ chơi một chuỗi những ván chơi công bằng, và cuộc chơi sẽ kết thúc khi một trong 2 người chơi thắng được N ván chơi (N là số đã biết trước). Nhưng đột nhiên cuộc chơi bị gián đoạn. P1 đã thắng N1 ván chơi, P2 thắng N2 ván chơi. Làm thế nào để chia tiền thưởng?

Pascal dường như có ý định viết một cuốn sách ngắn về bài toán problème des partis (cách chia điểm) được gọi là Aleae Geometria nhưng dự định này chưa được thực hiện.

Năm 1656:

Đầu năm, Christiaan Huygens đã viết một bản thảo về Van Rekeningh in Spelen van Geluck và gửi cho Frans van Schooten, giáo sư toán học của trường đại học Leyden. Huygens là một trong những sinh viên cũ của ông. Van Schooten thật sự thích thú quan tâm tới bản thảo của Christiaan Huygens và muốn đưa nó vào thành phần cuối của cuốn sách toán mà ông đang viết.

Van Rekeningh in Spelen van Geluck là một chuyên luận ngắn khoảng 15 trang mà có lẽ Huygens có được dựa trên những gì ông ta nhận thấy về những vấn đề thảo luận qua thư từ giữa Pascal và Fermat trong suốt những năm đầu tiên ông ở Paris.

Trong bản thảo cuối cùng có chứa 14 vấn đề (Voorstellen) cùng với lời giải của chúng và 5 vấn đề dành cho người đọc giải quyết. Năm vấn đề cuối này là một phần nội dung thảo luận của Fermat và Pascal.

Vấn đề thứ 2 và thứ 4 trong 5 vấn đề cuối cùng này liên quan đến việc nhặt những mảnh vỡ đen và trắng trong khi bịt mắt (tiền thân của mô hình bình kín - the urn model). Vấn đề cuối cùng trong 5 vấn đề trên được biết đến như là vấn đề Gambler's Ruin, xuất phát từ thảo luận thư từ giữa Pascal và Fermat được tiếp tục vào năm 1656. Huygens đã nghe thấy những vấn đề của Pascal và Fermat này từ Pierre Carcavy. Năm vấn đề cuối cùng là nền tảng cho các nhà toán học sau này (như là Jacob và Nicholas Bernoulli, de Moivre và Montmort) nghiên cứu hay cải tiến dựa trên những lời giải mà Huygens sẽ công bố.

Năm năm tiếp theo Jacob Bernoulli phát triển ý tưởng của ông trên nền tảng xác suất như đã mô tả trong tập Maditationes (sự suy ngẫm) của ông. Những điều này là nền tảng cho tập Ars Conjectandi (1713) của ông ta.

Năm 1693:

Công việc của Edmond Halley trên biểu đồ sinh được công bố trong An estimate of the Degrees of Mortality of Mankind (Một ước lượng về mức độ tỷ lệ tử vong của nhân loại), rút ra từ biểu đồ tìm hiểu về tỷ lệ sinh và tử tại thành phố thuộc Breslaw, với một nỗ lực muốn xác minh giá tiền trợ cấp sống và một vài sự xem xét khác.

Thế kỷ 18

Tiểu luận của Huggens vẫn có giá trị trong lĩnh vực xác suất trong vòng 50 năm. Những năm đầu của thế kỷ 18 đã chứng kiến một loạt các công trình về xác suất của Montmort, Nicolaus Bernoulli, De Moivre và Jacob Bernoulli (sau khi ông mất). Có lẽ điều này xảy ra từ sự khích lệ của những "lời nói thì thầm", những bài viết rất khó hiểu trong Ars Conjectandi, mà ngay tác giả của nó là Jacob Bernoulli cũng trăn trở suy nghĩ trong 20 năm và trước khi ông mất vẫn chưa giải quyết xong.

Sau khi Montmort mất, chính De Moivre đã tiếp nối Doctrine Of Chance (Học thuyết sự ngẫu nhiên) của ông ta. Từ giữa thế kỷ 18 , vấn đề kết hợp những kết quả quan sát đã trở thành một đề tài quan trọng được nghiên cứu bởi Boscovich, Laplace và những nhà khoa học khác.

Năm 1705:

Jacob Bernoulli mất. Một bản trường ca của Fontenelle viết tóm tắt công trình Ars Conjectandi của Jacob Bernoulli đã được xuất bản trong những năm tiếp theo. Do sự tranh chấp của gia đình, phải mất 8 năm trước khi Ars Cọnjectandi được xuất bản. Đây là điều đáng buồn vì nội dung chính của văn bản đã được hoàn thành vào năm 1690.

Năm 1708:

Pierre Remond de Montmort xuất bản công trình Essai d'Analyse sur les Jeux de Hazards.

Năm 1709:

Luận văn của Nicolaus Bernoulli, De Usu Artis Conjectandis in Jure, được xuất bản vào năm 1709. Phần lớn của luận văn được sao chép trực tiếp từ những công trình của Jacob Bernoulli như là Meditationes và Ars Cọnjectandi.


Chúng ta phải đợi 77 năm trước khi phân phối chuẩn được nhận biết bởi Gauss và Laplace trong việc đưa ra miêu tả chung những sai số quan sát được sẽ có phân phối như thế nào.

Năm 1738:

Abraham de Moivre công bố cuốn sách mở rộng thứ 2 của Doctrine of Chances (Học thuyết sự ngẫu nhiên), với một bản mở rộng tổng quan của Approximatio (Anh ngữ).

Theo Stigler (1986) vào khoảng năm 1750, sự thuận lợi của việc tổ hợp những quan sát đã từ từ trở nên rõ ràng. Mãi đến khi một khái niệm được chấp nhận đó là khi tổ hợp những quan sát, sai số sẽ tăng lên thay vì bù đắp cho nhau. Một ngoại lệ là vào thế kỷ 16, nhà du hành vũ trụ Đan Mạch, Tycho Brahe, như đã được mô tả bởi Hald (1990).

Năm 1749, Leonard Euler trong khi đang cố gắng giải quyết vấn đề bất đẳng thức trong chuyển động của Sao Mộc và Sao Thổ, đã không có chiều hướng kết hợp những quan sát. Tobias Mayer trong khi khắc phục vấn đề tương tự đã đưa ra khái niệm hàng rào và giải quyết vấn đề.

Năm 1757:

The Dalmatian jesuit Roger Boscovich công bố ý tưởng của ông ta về việc tổ hợp những quan sát trong một bản đề cương của công trình năm 1755 với tham khảo Anh ngữ Christopher Maire của ông trong việc đo cung kinh tuyến nằm gần Rome. Một bản mô tả đầy đủ phương pháp của ông được công bố vào năm 1760, về sau xuất hiện trong một công trình khác đó là Voyage astronomique et geographique dans Pétat de Péglise (1770).

Năm 1763:

Định lý của Thomas Bayes được giới thiệu sau khi ông mất, nhưng hầu như nó không gây chú ý trong làng toán học cho tới tận năm 1780.

Năm 1774:

Pierre Simon Laplace công bố công trình Mémoire sur la probabilité des causes par les évènements, trong đó ông cố gắng Xác định giá trị trung bình có được sau ba lần quan sát trên cùng một hiện tượng. Có thể nói nội dung của công trình này dựa trên một hồi ký năm 1772 chưa được công bố và một công trình khác được mở rộng thúc đẩy từ kiến thức của những nhà khoa học khác cùng thời (Joseph-Louis Lagrange và Johan III Bernoulli) cũng nghiên cứu cùng một vấn đề. Tuy nhiên, một bước ngoặt sai lầm trong xấp xỉ đã làm Laphace kẹt ở phương trình bậc 15 trong lời giải của vấn đề.

Năm 1787:

Pierre Simon Laplace xuất bản tập Théorie de Jupiter et Saturne (Lý thuyết về sao Mộc và sao Thổ), trong đó ông giải quyết vấn đề bất đẳng thức trong chuyển động của sao Mộc và sao Thổ và chứng minh trạng thái ổn định của hệ mặt trời. Ông cải tiến dựa trên phương pháp sử dụng kết hợp những quan sát Tobias Mayer.

Thế kỷ 19

Năm 1805:

Adrien Marie Legendre công bố phương pháp bình phương cực tiểu trong cuốn sách Nouvelles méthodes pour la détermination des orbites des comètes. Theo Stigler (1986, trang145-146), Gauss nhắc đến phương pháp này như một nguyên tắc đơn giản vào năm 1809 và đã đề cập đến việc chính ông phát triển phương pháp bình phương cực tiểu vào năm 1775, nhưng không công bố. Đây chính là nguyên nhân Legendre tố cáo Gaus về tội ăn cắp ý tưởng. (Xem trong Eric W.Weissteins Biography of Gauss. Tuy nhiên, chú ý rằng Weissteins dường như xác minh khám phá của Legendres vào năm 1811.)

Năm 1809:

Carl Friedrich Gauss đã chỉ ra được phân phối chuẩn là sự mô tả phân phối của những lỗi quan sát trong công trình Theoria Motus Corporum Coclestium in Sectionibus Conicis Solum Ambientum. Tuy nhiên, lý lẽ lập luận của ông hơi vòng vo.

Năm 1810:

Pierre Simon Laplace người nhận ra yếu điểm trong công việc của Gauss năm 1809, đã đưa ra bản chặt chẽ và cải tiến hơn trong phần bổ sung của cuốn sách Mémoire sur les approximations des formules qui sont fonctions de très grant nombres et sur leur application aux probabilités của ông.

Năm 1812:

Pierre Simon Laplace công bố công trình Théorie analytique des probabilités (Lý thuyết giải tích xác xuất).

Năm 1815:

Bessel đưa ra thuật ngữ probable error (sai số có thể) (wahrscheinliche Fehler) để chỉ ra khoảng cách giữa giá trị trung bình và phân vị trong phân phối chuẩn (chính bằng 0,6745 độ lệch chuẩn). Nó là thước đo cho tính hay thay đổi mãi cho đến khi được thay thế bởi độ lệch chuẩn.

Năm 1835:

Adolphe Quatelet giới thiệu trong Sur l'homme et le developpement de ses facultés, essai d'une physique sociale ý tưởng của ông về l'homme moyen (người đàn ông trung bình); ý tưởng này xuất phát từ những ai trong chúng ta chệch đi nhiều hay ít so với phân phối chuẩn. Quatelet chú trọng đến phương pháp dùng thông kê và ý tưởng này thật sự hữu ích trong thiên văn học và toán học nhằm nghiên cứu các thuộc tính của con người và trong con đường ông cải tiến xấp xỉ của mình.

Năm 1837:

Một vài điều chưa rõ trong Recherchés sur la probabilité des jugements... của Simeon Denis Poisson, ông ta đã giới thiệu phân phối, mà vào năm 1914 phân phối này được H.E. Spoer đặt tên là phân phối Poisson. Poisson đưa ra "Luật số lớn".

Phân phối Poisson đạt được vị trí quan trọng vào năm 1973 khi Thomas Pynchon miêu tả phân phối tác động của tên lửa V2 trong Gravity's Rainbow.

Năm 1867:

Pafnuti Chebyshev đã đưa ra và chứng minh bất đẳng thức Chebyshev.

Năm 1875:

Francis Galton giới thiệu cách sử dụng đường bậc bốn và đặt tên ogive cho hàm phân phối tích lũy chuẩn ngược.

Năm 1885:

Francis Galton đã sử dụng hồi quy.

Năm 1893:

Karl Pearson đặt tên độ lệch chuẩn cho độ đo phân tán, được biết đến như "Sai số bình phương trung bình so với gốc", "Sai số của bình phương trung bình" hay "Trung bình sai số".

Năm 1897:

Karl Pearson giới thiệu hệ số tương quan (Pearson). Vào năm 1888 Galton cũng đã có cùng ý tưởng nhưng ông không theo đuổi dòng suy nghĩ này (Stigler, 1986, p. 297-299).

Cái tên Auguste Bravais(1846) cũng gắn liền với khái niệm hệ số tương quan (Mối tương quan Bravais-Pearson). Nhưng theo Stigler (1986, p. 353) sự gắn liền này không xác thực.

Thế kỷ 20

Thế kỷ XX được đặc trưng bởi một số tranh luận về phương pháp luận. Đầu tiên, có một sự bất đồng trong nhìn nhận đến sở thích nghiên cứu với mức ý nghĩa tương quan lớn (Karl Pearson) hay nghiên cứu trên những thực nghiệm có mức ý nghĩa nhỏ (Ronald Fisher). Lĩnh vực nghiên cứu thực nghiệm với mức thang nhỏ đã chứng kiến sự nổi lên của một cuộc tranh luận thứ 2: H testing (Ronald Fisher) đối lập với bao gồm H và khái niệm Power (Jerzy Neyman & Egon Pearson).

Niềm tin của Spearman vào một nhân tố thông minh chung (g) mà được cho là sức mạnh ý định bên cạnh sự phát triển của nhân tố phân tích, đã dẫn đến cuộc tranh cãi kéo dài đến vài thập kỷ, với Thurstone và những nhà khoa học khác, những người dần dần đề cao nhân tố phân tích như là một cách duy nhất đơn giản hóa số liệu.

Sau chiến tranh thế giới lần thứ 2, bùng nổ các bài toán không-tham số và sự phát minh máy tính đã tạo ra khối luợng lớn khả năng thực hiện những ý tưởng mới và cũ như là mức thang đa chiều, bootstrapping và phân tích đa biến ngẫu nhiên.

Năm 1900:

Karl Pearson đưa ra ý tưởng phân phối Chi bình phương.

Năm 1904:

Charles Spearman dựa trên nền tảng về phân tích thừa số và hoàn thành nó trong 8 năm.

Spearman biểu diễn hệ số tương quan cho vấn đề sắp xếp số liệu.

Năm 1908:

William Gosset giới thiệu công trình về phân phối t và ứng dụng của phép thử t.

Sự xuất hiện đầu tiên của phép thử t trong tâm lý học và những lĩnh vực liên quan đã xảy ra trước thập niên 30 của thế kỷ, nhưng Shen (1940) vẫn nhắc đến phép thử t như chưa phải là cách ứng dụng chung trong lĩnh vực giáo dục.

Năm 1925:

Ronald Alymer Fisher công bố công trình Statistical methods for research workers. Đây là cuốn sách giáo khoa giới thiệu phân tích biến ngẫu nhiên.

Năm 1933:

Andrei Kolmogorov đưa ra những tiên đề cơ bản của lý thuyết xác suất trong cuốn sách của ông

Grundbegriffe der Wahrscheinlichkeitsrechnung (Foundations of the Calculus of Probabilities).

Ông cũng giới thiệu phép thử thống kê

Năm 1933:

Harold Hotelling công bố công trình nghiên cứu về phân tích thành phần chính.

Năm 1939:

Vadimir Smirnov dùng thống kê được phát triển bởi Kolmogorov để xây dựng phép thử Kolmogorov-Smirnov.

Năm 1976:

Gene Glass công bố báo cáo của ông về việc kết hợp những kết quả trong của nghiên cứu đa cấp và đặt tên cho phương pháp này là meta-analysis. Mặc dù có nhiều ý tưởng đã tồn tại từ trước đó (Lush 1931, Fisher 1932, Pearson 1933, Snedecor 1946) nhưng chính Gass là người đã mang lại cho phương pháp này sự thúc đẩy để đạt được vị trí xứng đáng.

Năm 1977:

John Tukey giới thiệu phân tích dữ liệu giải thích (EDA) như là thuốc giải độc cho giả thiết kiểm định tuần tự thay vì quan sát đầu tiên về số liệu.
Nguồn: diendantoanhoc.net

1 comment:

  1. Bài viết rất ý nghĩa, cám ơn bạn đã chia sẻ
    click xem thêm trung tâm gia sư bình dương

    ReplyDelete