Tội phạm có thể vô tình để lại những manh mối liên quan đến tội ác của mình, ví dụ như vân tay, sợi vải hoặc vũ khí. Tuy nhiên còn có một loại manh mối ít rõ ràng hon nhung khả năng buộc tội cao không kém. Trong rất nhiều hoạt động từ kinh doanh cho đến nghiên cứu trong phòng thí nghiệm, những kẻ gian lận da bị phát hiện vì những con số mà chúng để lại. Không phải số điện thoại hay số tài khoản ngân hàng mà là những con số thống kê hằng ngày với bề ngoài không có gì khác thường.
Những bài kiểm tra số liệu có thể phát hiện kẻ gian lận
Một trong nhưng bằng chứng có thế lật tấy màn lừa đảo có liên quan đến con số 1. Để hiểu được nguyên lý của nó, ta sẽ cùng phân tích nội dung trang nhất của một tờ báo mới. Chắc chắn sẽ có sự xuất hiện của rất nhiều con số trong tất cả các mục của tờ báo. Ví dụ: "thêm 50.000 quân. " giảm 2,5%", ". xảy ra lần cuối vào năm 1962. "ông đưa ra 18 chỉ thị rð ràng", "... người cha 65 tuổi ...", hoặc tiếp theo ở trang 3".
Những con số này hoàn toàn không liên quan đến tuổi.", hoặc "tiếp theo ở trang 3". nhau, nhưng chúng có biểu thị một mô thức nào không? Bạn có thể đoán xem những số có chứ số đầu tiên là 1 xuất hiện trong một tờ báo chiếm bao nhiều phần trăm không? Còn những số bắt đầu với chữ số 5 hoặc 8 chiếm bao nhiêu?
Có thể bạn chưa từng để ý đến vấn đề này, nhưng cũng dễ hiểu nếu ta đưa ra giả thiết rằng những chứ số đầu tiên của các số xuất hiện trong một tờ báo đuợc phân bố với mật độ xấp xỉ bằng nhau. Nói cách khác, nếu chọn một số ngẫu nhiên xuất hiện trên báo thì xác suất để số đó bắt đầu với các chữ số 1 và chữ số 9 là như nhau Điều đáng ngạc nhiên là kết quả không phải như vậy. Trên thực tế, với một số được chọn ngẫu nhiên tử trang nhất thì chữ số đầu tiên của nó có khả năng là 1 cao hơn hẳn các chữ số còn lại. Gần một nửa các con số sẽ bắt đầu với chữ số 1 hoặc 2, và chữ số càng lớn thì xác suất đứng đầu một số của nó càng thấp. Các số bắt đầu với chữ số 9 là khá hiếm. Nếu thu thập được lượng các số đủ lớn, ta sẽ có được những kết quả xấp xỉ như sau:
Tại sao những con số này lại có thể được dự đoán chính xác đến vậy khi mà các số rút ra từ một tờ báo là ngẫu nhiên? Sự phân bố các chữ số khá kỳ lạ này được xác định bởi định luật Benford. Năm 1939, Frank Benford, một kỹ sư tại GEC(1), đã đưa ra một nhận định khá thú vị. Khi xem xét số liệu thống kê dân số của các thành phố, ông nhận thấy số lượng số bắt đầu với chứ số 1 nhiều hơn so với số lượng số bắt đầu với các chữ số còn Hai. Ông tiến hành nghiên cứu sâu hơn và phát hiện ra rằng điều này cũng đúng với giá cổ phiếu, độ dài các dòng sông, các thông số thống kê trong thể thao - chính xác là nó đúng với hầu hết các tập hợp số thường gặp.
Định luật Benford hóa ra đùng ở hầu hết các trường hợp, miễn là mẫu thứ của ta đủ lớn, và các con số dx vét đến không bị ràng buộc bởi một quy luật hay những giới hạn chặt chẽ náo đó, Ví dụ, số điện thoại không tuân theo định luật Benford vi chủng bị ràng buộc bởi nguyên tác phải có bảy hoặc tám chữ số. Chiều cao của nam giới cũng không đúng với định luật Benford vi con số này hầu như luôn nàm trong khoảng từ 150 đến 180cm. Tuy nhiên chỉ cần các điều kiện nêu trên được thỏa mãn thì định luật Benford có phạm vi ứng dụng rất rộng.
1. General Electric Company: một tập đoàn công nghiệp lớn và lâu đời của Anh. (Khác với tập đoàn General Electric của Mỹ) Tập đoàn này đã phần chia, chuyển đối nhiều lân idi bị thầu tóm hầu hết vào năm 2005. (BT)
Định luận Benfort và phương pháp phát hiện gian lận
Đầu những năm 1990, định luật Benford bắt đầu nổi tiếng trong lĩnh vực phát hiện gian lận. Mark Nigrini, một giảng viên môn kế toán, yêu cầu sinh viên kiểm tra sổ sách của những doanh nghiệp mà họ biết để minh họa cho sự phân phối có thể dự đoán trước của các chủ số đầu tiên. Một sinh viên quyết định kiếm tra sổ sách của anh vợ mình, người đang làm chủ một cửa hiệu bản đồ gia dụng. Anh ta thật sự bất ngờ vì số liệu hoàn toàn không tuân theo định luật Benford. Cụ thể là có 93% con số bất đầu với chữ số 1, thay vì 30% như dự đoán. Phần còn lại bắt đầu với chữ số 8 hoặc 9.
Sự khác biệt là quá lớn, đến mức tạo ra cảm giác có gì đó không đúng với các số liệu ở đây. Trên thực tế, sinh viên này đã vô tình phát hiện ra hành vi gian lận số sách của anh vợ mình.
Bắt đầu khiêm tốn như vậy, định luật Benford đã thành một trong những công cụ chính thống mà rất nhiều kế toán sử dụng để phát hiện hành vi gian lận. Điểm thú vị của phương pháp này là nó rất đơn giản. Đôi khi phương pháp này cũng đạt được những thành công ngoài mong đợi, như trong một vụ việc ở Arizona, khi må nghi phạm bị phát hiện đã lập quá nhiều séc chỉ có chữ số đầu tiên là 8 và 9. Những con số này ban đầu có vẻ khá vô hại, nhưng thật sự thì chủng lại cực kỳ mâu thuẫn với đường cong đi xuống mà Benford đã dự đoán. Đây là kiểu mẫu điển hình cho những người cố tạo ra số liệu giả. Thường thì họ sẽ bịa ra những số tiền thấp hơn một mức quan trọng nào đó, như 100 bảng chẳng hạn, mức bị yêu cầu phải có những chứng thực cấp cao hơn. Với cách làm này họ sẽ làm biến dạng kiểu mẫu tự nhiên của các con số, và từ đó để lại manh mối về việc làm trái pháp luật này cho các điều tra viên.
(Còn tiếp)
Nó có phải là đồ giả ???_Khả năng gặp được một nửa hoàn hảo của mình là bao nhiêu ?_