Banner trang chi tiết
MathX Cùng em học toán > NÓ CÓ PHẢI LÀ ĐỒ GIẢ ??? (Phần cuối)

NÓ CÓ PHẢI LÀ ĐỒ GIẢ ??? (Phần cuối)


Phải chăng Shakespeare là kẻ giả mạo?

Nghiệp vụ điều tra cũng phát huy tác dụng của mình trong lĩnh vực văn học. Có phải Shakespeare đã thực sự viết nên tất cả những vở kịch mà nay mang tên ông? Các học giả vẫn còn tranh cãi về vấn đề này, và những người giỏi toán nhất trong số họ đã sử dụng các phương pháp thống kê để điều tra nguồn gốc tác giả của một số tác phẩm cụ thể.

  Ta sẽ phân tích một tác phẩm được cho là của Shakespeare trên phương diện thống kê như thế nào?

  Cách tiếp cận đơn giản nhất là đếm số lượng của một số từ nhất định mà Shakespeare thường sử dụng trong các tác phẩm do ông viết nên. Một số từ nhất định xuất hiện thường xuyên, ví dụ như "thế giới", "không hẻ" và “dịu dàng". Một số từ không bao giờ xuất hiện, vi dụ như “kinh thánh". Nếu tác phẩm được điều tra có từ “kinh thánh" thì ta lập tức có thể đưa ra nghi ngờ rằng đây không phải tác phẩm của Shakespeare, và trên thực tế tần số xuất hiện tương đối của các từ khác nhau có thể được so sánh trực tiếp để kiếm tra xem chúng có tuân theo một mô thức quen thuộc nào hay không.

  Tuy vậy, quá trình điều tra nguồn gốc tác giả thực sự phức tạp hon mô tả trên rất nhiều. Năm 1985, một bài thơ có tên “Tôi sẽ chết?" ('Shall I die?”) được phát hiện tại thư viện Bodleian thuộc đại học Oxford. Trên bản thảo có ký tắt hai chữ cái WS. Đây có thể là một tác phẩm bị lãng quên của Shakespeare hay không?
  Những cuộc điều tra đã được tiến hành. Mot phân tích ban đầu được đưa ra dựa trên kiểu mẫu dùng từ trong suốt sự nghiệp của Shakespeare. Người ta phát hiện ra rằng, trong mỗi tác phẩm mới, Shakespeare luôn thêm vào một số từ mà ông chưa từng dùng kỳ tác phẩm nào truớc đó. (Khá may mắn là máy tinh có thể thực hiện tất cả các công đoạn đếm từ để chứng minh điều này. Ta có thể dễ dàng tưởng tượng được mức độ mệt mỏi của công việc phân tích này trước kỷ nguyên điện tử.) Nhờ vậy ta có thể dự đoán số lượng từ mới có thể xuất hiện trong một tác phẩm mới. Nếu con số này là quá lớn thi tác giả này rất nhiều khả năng không thể là Shakespeare. Nếu không có một từ mới nào thì đó có thể là một người đang gắng sức bắt chước phong cách của Shakespeare.

  Theo dự đoán về mặt toán học thì "Tôi sẽ chết?" sẽ có khoảng 7 từ mới. Trên thực tế nó có 9 từ mới, một kết quả khá gần với dự đoán. Kết quả này được dùng làm bằng chứng khẳng định Shakespeare là tác giả của bai tho.

  Nhưng những người theo chủ nghĩa hoài nghi không bị thuyết phục, nhất là khi bài thơ này đọc lên không giống như của Shakespeare. Nhiều phân tich về câu chữ của bài thơ đã được đưa ra. Một vị giáo sư tận tụy đã nghiên cứu không chỉ từng con chữ riêng biệt mà còn cả mối liên hệ giữa chúng. Có một vi dụ đế minh họa cho tác dụng của phương pháp này như sau, hai tác giá có thể cùng sử dụng "thiên đàng" và "trần thể" với tần suất ngang nhau, nhưng một người có thể luôn sử dụng hai từ này cùng nhau, trong khi người còn lại luôn sử dụng hai từ này riêng biệt. Mỗi kiểu mẫu này là một phong cách riêng biệt của từng tác giả. Có thể nói câu chữ cũng giống như mẫu ADN hoặc dấu vân tay mặc dù mối tương quan này còn phải cân nhắc kỹ càng vì ADN của người không bao giờ thay đổi còn cách viết của mỗi người có thể khác biệt đáng kể giữa các văn bản khác nhau.

  Bài kiểm tra mối liên hệ giữa tử ngủ có vẻ đã loại trừ khả năng tác giả là Shakespeare, mặc dù vậy nó cũng đồng thời loại trừ luôn cả những ứng viên tiêm năng khác, ví dụ như Marlowe và Bacon. Bài kiếm tra này cũng không thuyết phục được tất cả và trên thực tế, người ta vẫn tiếp tục tranh cãi xem ai là tác giả của bài thơ này. Luồng ý kiến hiện nay có vẻ nghiêng về kết luận Shakespeare là tác giả, nhưng điều này còn tùy thuộc vào việc ta tin ở bài kiểm tra nào.

  Trên thực tế có rất nhiều bài kiểm tra thống kê khác nhau mà ta có thể thực hiện trên văn bản, bao gồm độ dài trung bình của câu và độ dài trung bình của từ ngữ. Thậm chí các thành phần từ ngữ cũng có thể được đem ra so sánh, ví dụ như chia nhỏ văn bản thành những khúc năm-chữ và tiến hành một loạt các phân tích toán học liên quan đến tần suất và sự phân bố của các mô thức.

  Điều này có giúp gì trong việc phá án không? Ít nhất thì nó cũng cung cấp những bằng chứng phụ. Trong một vài trường hợp, nổi tiếng nhất là vụ Unabomber xảy ra ở Mỹ, những bức thư do nghi phạm gửi đi đã được đem ra so sánh với những văn bản khác mà anh ta từng viết để kiểm tra xem chúng có sự tương đồng hay không. Tuy nhiên, để có thể thực sự tự tin xác định tác giả của một tác phẩm hoàn toàn dựa trên câu chữ, chứ không phải chữ viết tay hay lỗi đánh vần, ta có thể phải kiểm tra hàng nghìn thay vì hàng trăm từ để có được bằng chứng thuyết phục. Nói cách khác, thẩm phán cần rất nhiều câu chữ để có thể đưa ra một câu phán quyết...

 

Còn có bao nhiêu trò lừa đảo nữa ?

Không một hệ thống phát hiện lừa đảo nào là hoàn hảo, và một vài trò lừa đảo vẫn luôn thoát đưoc lưới kiểm duyệt. Mặc dù chúng có thể không bị phát hiện, nhmg ta vẫn có thể ước lượng được số kẻ lửa đáo thoát tội, dưa vdo số những kẻ lừa đảo đã bị bắt

  Kỹ thuật được dùng để xác định số kẻ lửa đảo sẽ giống như kỹ thuật mà những người đọc morat sử dụng để kiếm tra văn bản. Ta đều biết ràng lỗi đánh máy (hay con gọi là lối typo) thường rất khó nhận ra, do đó chủ nhà in có thể yêu cầu hai người đọc mo rát kiểm tra lối độc lập với nhau.

  Giả sử người đâu tiên tim đc E, lỗi và người thứ hai tìm được E, lỗi. Hai người so sánh với nhau và thấy có S lối chung. Vậy có thế có bao nhiêu lỗi tất cả?

Ta có thể sử dụng Chi số Lincoln để đưa ra một ưỚC lượng khá sát. Tổng số lỗi trong bản in se xấp xi:

                     Số lỗi typo =  (E1xE2)/S

  Vi dụ, người thứ nhất tìm được 15 lỗi, người thứ hai tìm được 12 lỗi và số lỗi chung là 10. Chỉ số Lincoln dự đoán có (12x15)/10 = 18 lỗi. Trong 18 lỗi này mới có 17 lỗi được phát hiện, 10 lỗi chung, 5 lỗi do riêng người thứ nhất tìm được và 2 lỗi do riêng người thứ hai tìm được.

  Kỹ thuật tuong tự cũng được áp dụng, chẳng hạn, trong ước lượng số vụ gian lận thuế chưa bị phát giác. Hai điều tra viên sẽ kiểm tra các hồ sơ một cách độc lập, và xác định các hồ sơ tình nghi. Nếu điều tra viên đầu tiên tìm được 20 hồ sơ và người thứ hai tìm được 24 ho so, với 12 hồ sơ chung, thì tổng cộng họ đã xác định được 32 hỗ sơ khác nhau. Chỉ số Lincoln gọi ý có thể có đến (20 x 24)/12 = 40 hồ sơ tinh nghi. Điều này có nghĩa là đã có khoảng tám trưong hợp gian lận thuế thoát tội.

  Cho đến lúc này, kỹ thuật trên không được dúng để phát hiện lứa đáo, mà nó chỉ là một cách thú vị 4 kiếm tra các yếu tố liên quan đến lửa đảo, Trên thực tế, kỹ thuật này củng với các phương pháp đã nêu trước đó đủ để biến mỗi chúng ta trở thành một thám tử nghiệp dư.

 

Nó có phải là đồ giả ???_Khả năng gặp được một nửa hoàn hảo của mình là bao nhiêu ?_
MathX.vn – THÍCH HỌC TOÁN - 120.000 phụ huynh và học sinh đặc biệt yêu thích


Bài viết liên quan