Kỳ 1: Phát minh thẻ đục lỗ
Trong thời đại của Dữ liệu lớn, ít có ai gây tranh cãi như các tin tặc. Một mặt, tin tặc độc hại hay còn gọi là tin tặc mũ đen gây ra thiệt hại hàng tỷ USD mỗi năm khi đột nhập vào các mạng riêng tư và công cộng để lấy cắp tiền hoặc dữ liệu cá nhân hoặc đơn giản là để gây hỗn loạn. Mặt khác, những tin tặc được gọi là có đạo đức (tin tặc mũ trắng) sử dụng các kỹ năng để phục vụ lợi ích công cộng thông qua thăm dò các hệ thống máy tính để tìm các điểm yếu về bảo mật hoặc làm rò rỉ thông tin về tham nhũng của chính phủ và các tội phạm khác. Mặc dù chủ yếu gắn liền với thời đại kỹ thuật số hiện đại, nhưng nghệ thuật tin tặc đã có từ gần 100 năm trước. Một trong những tin tặc đầu tiên cũng là một trong những người có đạo đức nhất là René Carmille – người đã cứu hàng triệu công dân Pháp khỏi Đức Quốc xã trong Chiến tranh Thế giới thứ hai.
Kỷ nguyên của Dữ liệu lớn thực ra đã tồn tại từ rất lâu, từ những năm 1880 và là đây là một vấn đề khó khăn mà Chính phủ Mỹ phải đối mặt. Hiến pháp Mỹ quy định rằng cứ 10 năm phải thực hiện điều tra dân số một lần để có thể cập nhật thuế và đại diện chính trị theo thay đổi dân số. Cuộc điều tra dân số đầu tiên của Mỹ diễn ra vào năm 1790 và trong 90 năm sau đó, người ta thu thập và xử lý dữ liệu điều tra dân số hoàn toàn bằng tay.
Tuy nhiên, vào năm 1880, Cục Điều tra Dân số phải đối mặt với một cuộc khủng hoảng lớn: dân số Mỹ đã tăng lên quá lớn đến mức cuộc điều tra dân số năm 1880 phải mất 9 năm mới hoàn thành. Vào thời điểm hoàn thành dữ liệu năm 1880 thì đã sắp đến lúc phải thực hiện cuộc điều tra dân số tiếp theo. Với tốc độ này, Cục Điều tra Dân số lo ngại các cuộc tổng điều tra trong tương lai sẽ không bao giờ có thể bắt kịp, khiến toàn bộ hoạt động này trở nên vô nghĩa.
Khi đó, Herman Hollerith, một kỹ sư người Mỹ từng tham gia cuộc điều tra dân số năm 1880, xuất hiện. Năm 1889, Hollerith được cấp bằng sáng chế cho một hệ thống tăng tốc độ lập bảng dữ liệu điều tra dân số, dựa trên công nghệ thẻ bấm lỗ. Trong khi thẻ bấm lỗ trước đây đã được sử dụng để tự động hóa quá trình dệt các mẫu dệt phức tạp, hệ thống của Hollerith là hệ thống đầu tiên áp dụng trong lĩnh vực xử lý dữ liệu một cách thực tế.
Hệ thống của Hollerith lấy cảm hứng từ một hệ thống mà ngành đường sắt lập ra để xác định và bắt những tên cướp tàu hỏa cũng như các loại tội phạm khác. Vì thời đó, việc chụp ảnh rất chậm chạp và rườm rà, nên thay vào đó, vé tàu được in kèm một loạt chi tiết mô tả ngoại hình như chiều cao, màu mắt và râu trên khuôn mặt mà người soát vé có thể điền vào bằng cách bấm lỗ vé tiêu chuẩn. Theo cách này, có thể ghi lại mô tả sơ bộ về từng hành khách. Hollerith nhận ra rằng hệ thống này có thể dễ dàng điều chỉnh cho phù hợp với cuộc điều tra dân số và đã thiết kế thẻ bấm lỗ riêng để ghi lại dữ liệu điều tra dân số. Một chiếc máy to như đàn piano có tên là Tabulator có nhiệm vụ đọc và xử lý thẻ.
Hệ thống Hollerith hoạt động như sau: Những người tham gia điều tra dân số sẽ đi khắp đất nước và ghi lại dữ liệu như số lượng, tuổi và giới tính của những người trong mỗi hộ gia đình bằng cách bấm lỗ trong các vị trí tương ứng trên thẻ Hollerith. Những thẻ này sau đó sẽ được gửi lại cho văn phòng điều tra dân số để xử lý. Một người điều hành sẽ đưa từng thẻ vào máy Tabulator thông qua một cửa sập có bản lề, khá giống máy quét hoặc máy photocopy phẳng hiện đại. Khi cửa sập đóng lại, lưới các chốt kim loại có lò xo được ép vào thẻ. Nơi một lỗ đã được bấm lỗ ghim đi qua và tiếp xúc với một vũng thủy ngân, hoàn thành một mạch điện.
Dữ liệu này được đếm và hiển thị trên một loạt các mặt đồng hồ trên mặt của Tabulator, để người vận hành đọc và ghi lại thủ công. Tuy nhiên, điều thiên tài của Tabulator nằm ở khả năng tua lại hoặc “lập trình” để đếm các dữ liệu được kết hợp khác nhau. Ví dụ: nam giới chưa lập gia đình dưới 30 tuổi. Hollerith cũng đã phát minh ra một thiết bị gọi là Sorter bao gồm 13 thùng kim loại thẳng đứng, có các nắp có lò xo, mỗi nắp có thể được lập trình để thu thập một tổ hợp dữ liệu khác nhau. Vì vậy, ví dụ, nếu người điều hành đưa một thẻ về một nam giới chưa kết hôn dưới 30 tuổi, thì nắp thùng được lập trình bằng thông tin kết hợp đó sẽ mở ra để người điều hành có thể thả thẻ vào.
Hệ thống Hollerith đã được Cục Điều tra Dân số thông qua đúng thời điểm cuộc điều tra dân số năm 1890 và tác động của nó là rất lớn. Việc sử dụng thẻ bấm lỗ và bảng thống kê đã cắt giảm thời gian cần thiết để xử lý dữ liệu điều tra dân số từ 9 xuống còn 2 năm. Cải thiện đáng kể về hiệu suất này biến máy Hollerith trở thành thiết bị tiêu chuẩn tại Cục Điều tra Dân số.
Vào năm 1896, Hollerith thành lập Công ty Máy lập bảng Hollerith để bán hàng. Trong số những khách hàng đầu tiên của ông là Công ty Bảo hiểm Nhân thọ Prudential và Công ty Đường sắt Trung tâm New York. Đây là công ty sau này đã xử lý gần 4 triệu vận đơn hàng hóa mỗi năm và là một lựa chọn lý tưởng cho hệ thống Hollerith.
Trong thập kỷ tiếp theo, Hollerith đã giới thiệu một số cải tiến quan trọng giúp hệ thống ngày càng hiệu quả và mạnh mẽ hơn, trong đó các thẻ bấm lỗ được thiết kế lại, các phím bấm được cải tiến, máy in để tự động lập bảng dữ liệu… Những sáng tạo này tạo ra cả một ngành hoàn toàn mới và nhiều ngành sử dụng để xử lý lượng dữ liệu khổng lồ như lập hóa đơn hay trả lương. Thời đại Thông tin đã chính thức đến.
Nhưng đối với Herman Hollerith, thành công không kéo dài. Năm 1903, Giám đốc mới của Cục Điều tra Dân số, Simon North, cho rằng Hollerith có quá nhiều độc quyền trong xử lý dữ liệu và cấm sử dụng các máy của công ty này trong Cục Điều tra Dân số. Sau đó, vào năm 1911, thông qua việc mua lại cổ phiếu, Công ty Máy lập bảng Hollerith được hợp nhất với bốn công ty khác để thành lập Công ty Máy tính – Lập bảng. Cuối cùng, vào năm 1923, công ty hợp nhất này đổi tên thành International Business Machines – được gọi tắt là IBM.
Dưới thời của Giám đốc điều hành Thomas Watson, IBM sau này thống trị ngành máy tính kỹ thuật số, kiểm soát hơn 90% tất cả các thiết bị thẻ bấm lỗ ở Mỹ vào năm 1950. Một trong những chìa khóa thành công của IBM là không bao giờ bán máy cho khách hàng mà chỉ cho thuê. Có lúc IBM thậm chí đã tính đến việc tính phí với khách hàng cho mỗi thẻ bấm lỗ cá nhân mà họ sử dụng - một phương pháp sẽ mang lại cho họ những khoản lợi nhuận thậm chí còn lớn hơn. Tuy nhiên, đối với Chính phủ Mỹ thì đây là một bước đi quá xa.
Vào năm 1932, IBM đã bị đưa ra tòa vì vi phạm Đạo luật Chống độc quyền Clayton năm 1914. Mặc dù IBM lập luận rằng các thẻ mà họ nắm giữ bằng sáng chế về mặt kỹ thuật là một thành phần của máy móc mà họ đã cho khách hàng thuê, nhưng vào năm 1936, Chính phủ Mỹ cuối cùng đã ra phán quyết chống lại lập luận này.
Sau này, IBM còn bị chỉ trích vì một hành vi phi đạo đức hơn.
Đón đọc kỳ 2: Hỗ trợ Đức Quốc xã