1.THÔNG TIN VÀ XỬ LÝ THÔNG TIN

    Khái niệm thông tin (information) được sử dụng thường ngày. Con người có nhu cầu đọc báo, nghe đài, xem phim, video, đi tham quan, du lịch, tham khảo ý kiến người khác, ... để nhận được thêm thông tin mới. Thông tin mang lại cho con người sự hiểu biết, nhận thức tốt hơn về những đối tượng trong đời sống xã hội, trong thiên nhiên, ... giúp cho họ thực hiện hợp lý công việc cần làm để đạt tới mục đích một cách tốt nhất.

Figure_B2_009.gif (4672 bytes)

Những đám mây đen đu`n lên ở chân trời phía Ðông chứa đựng thông tin báo hiệu về trận mưa lớn sắp xảy ra. Màu đen của mây, tốc độ vận chuyển của mây chứa các thông tin về khí tượng.

Biểu đồ thống kê sản phẩm hàng tháng của từng phân xưởng bánh kẹo chứa đựng các thông tin về năng suất lao động, về mức độ thực hiện kế hoạch sản xuất của phân xưởng đó. Nốt nhạc trong bản sô-nát ánh trăng của Beethoven làm cho người nghe cảm thấy được sự tươi mát, êm dịu của đêm trăng. Những thông tin về cảm xúc của tác giả đã được truyền đạt lại.

    Khi tiếp nhận được thông tin, con người thường phải xử lý nó để tạo ra những thông tin mới, có ích hơn, từ đó có những phản ứng nhất định. Người tài xế chăm chú quan sát người, xe cộ đi lại trên đường, độ tốt xấu mặt đường, tính năng kỹ thuật cũng như vị trí của chiếc xe để quyết định, cần tăng tốc độ hay hãm phanh, cần bẻ lái sang trái hay sang phải... nhằm đảm bảo an toàn tối đa cho chuyến xe đi.

    Thông tin có thể được phát sinh, được lưu trữ, được truyền, được tìm kiếm, được sao chép, được xử lý, nhân bản. Thông tin cũng có thể biến dạng, sai lệch hoặc bị phá hủy.

    Mỗi tế bào sinh dục của những cá thể sinh vật mang thông tin di truyền quyết định những đặc trưng phát triển của cá thể đó. Gặp môi trường không thuận lợi, các thông tin di truyền đó có thể bị biến dạng, sai lệch dẫn đến sự hình thành những cá thể dị dạng. Ngược lại, bằng những tác động tốt của di truyền học chọn giống, ta có thể cấy hoặc làm thay đổi các thông tin di truyền theo hướng có lợi cho con người. Thông tin được thể hiện dưới nhiều dạng thức khác nhau như sóng ánh sáng, sóng âm, điện từ, các ký hiệu viết trên giấy hoặc khắc trên gỗ, trên đá, trên các tấm kim loại ... Về nguyên tắc, bất kỳ cấu trúc vật chất nào hoặc bất kỳ dòng năng lượng nào cũng có thể mang thông tin. Chúng được gọi là những vật (giá) mang tin. Dữ liệu (data) là biểu diễn của thông tin và được thể hiện bằng các tín hiệu (signal) vật lý.

    Thông tin chứa đựng ý nghĩa, còn dữ liệu là các dữ kiện không có cấu trúc và không có ý nghĩa rõ ràng nếu nó không được tổ chức và xử lý. Cùng một thông tin, có thể được biểu diễn bằng những dữ liệu khác nhau. Cùng biểu diễn một đơn vị, nhưng trong chữ số thập phân ta cùng ký hiệu 1, còn trong hệ đếm La Mã lại dùng ký hiệu I. Mỗi dữ liệu lại có thể được thể hiện bằng những ký hiệu vật lý khác nhau. Cũng là gật đầu, đối với nhiều dân tộc trên thế giới thì đó là tín hiệu thể hiện sự đồng tình; nhưng ngược lại, đối với người Hy Lạp, gật đầu để biểu lộ sự bất đồng. Cùng là ký hiệu I nhưng trong tiếng Anh có nghĩa là đại từ nhân xưng ngôi thứ nhất (tôi) còn trong toán học lại là chữ số La Mã có giá trị là 1. Mỗi tín hiệu có thể dùng để thể hiện các thông tin khác nhau. Uống một chén rượu để mừng ngày gặp mặt, cũng có thể uống chén rượu để giải sầu, để tiễn đưa người thân lên đường đi xa.

    Thông tin là một khái niệm trừu tượng, tồn tại khách quan, có thể nhớ trong đối tượng, biến đổi trong đối tượng và áp dụng để điều khiển đối tượng. Thông tin làm tăng thêm hiểu biết của con người, là nguồn gốc của nhận thức. Thông tin về một đối tượng chính là một dữ kiện về đối tượng đó, chúng giúp ta nhận biết và hiểu được đối tượng. Thông tin có liên quan chặt chẽ đến khái niệm về độ bất định. Mỗi đối tượng chưa xác định hoàn toàn đều có một độ bất định nào đó. Tính bất định này chưa cho biết một cách chính xác và đầy đủ về đối tượng đó.

    Ðộ bất định sẽ giảm đi khi nhận thêm thông tin. Cơ quan Công An được thông báo: đối tượng bị truy nã A đang trú ngụ tại Hà Nội. Thông tin này mới chỉ giúp Công An xác định được đối tượng A có thể trú ngụ đâu đó trong nội hoặc ngoại thành Hà Nội. Nếu Công An cả bốn quận nội thành đều khẳng định là trong địa bàn của họ hiện không có đối tượng A thì Sở Công an chỉ cần triển khai truy tìm đối tượng A trong năm huyện ngoại thành. Thông tin bổ sung do công an bốn huyện nội thành cung cấp làm độ bất định về nơi trú ngụ của đối tượng A giảm xuống.

    Ðộ bất định có liên quan chặt chẽ đến khái niệm xác suất - độ đo khả năng có thể xảy ra của sự kiện (biến cố). Nếu một biến cố không bao giờ xảy ra, xác suất của nó có giá trị bằng 0. Nếu có một biến cố chắc chắn xảy ra, xác suất của nó bằng 1. Ðại lượng xác suất có giátrị trong đoạn [0,1]. Xác suất đối tượng A trú ngụ ở đâu trong 9 địa bàn (4 quận và 5 huyện) của Hà Nội trước khi có thông tin bổ sung là 1/9, còn sau đó là 1/5. Xác suất càng nhỏ thì độ bất định càng lớn. Thông tin có thể đo được. Giả sử sự kiện có thể tồn tại ở một trong số n trạng thái được đánh số 1,2,...,n trong đó trạng thái i xuất hiện với xác suất là Pi (0<Pi<1). C.Shannon vào năm 1948 đã đưa ra công thức sau nhằm xác định độ bất định của sự kiện

Shannon.jpg (11047 bytes)

    Khi được cung cấp thêm thông tin, số trạng thái và xác suất xảy ra của mỗi trạng thái sẽ khác đi và ta sẽ nhận được một độ bất định mới l2 nào đó (bé hơn l1). Như vậy, thông tin bổ sung đã làm giảm độ bất định và hiệu số (l1-l2) được xem là lượng tin của thông tin mới bổ sung.

    Thực ra, trước đó vào năm 1928 R.Hartley đã xét trường hợp riêng khi p1=p2=...=pn = 1/n. Khi đó độ bất định sẽ là log2n. Có thể ứng dụng công thức Hartly để tính lượng tin trong trường hợp đơn giản khi khả năng tồn tại ở một trong hai trạng thái của sự kiện là như nhau (đồng xác suất : p1=p2=1/2). Ðộ bất định trong trường hợp này sẽ là log22-1.

    Trong máy tính, các thông tin được biểu diễn bằng hệ đếm nhị phân. Tuy chỉ dùng 2 ký số là 0 và 1 mà ta gọi là bit nhưng hệ nhị phân đã giúp máy tính biểu diễn - xử lý được trên hầu hết các loại thông tin mà con người hiện đang sử dụng như văn bản, hình ảnh, âm thanh, video, ...