Em hay cho biết dữ liệu là gì

Khái niệm thông tin và dữ liệu

Dữ liệu là gì?

Dữ liệu là một khái niệm rất trừu tượng, chính là thông tin đã được đưa vào máy tính. Dữ liệu sau khi tập hợp và xử lý sẽ cho ta thông tin. Nói một cách khác, dữ liệu là thông tin đã được mã hóa trong máy tính. Ví dụ như con số điểm thi là một dữ liệu hoặc con số về nhiệt độ trong ngày là một dữ liệu, hình ảnh về con người hay phong cảnh cũng là những dữ liệu,…

Dữ liệu là gì?

Theo wikipedia, khái niệm dữ liệu là gì còn được định nghĩa là chuỗi bất kỳ của một hoặc nhiều ký tự có ý nghĩa thông qua việc giải thích một hành động cụ thể nào. Dữ liệu phải được thông dịch để trở thành thông tin. Để dữ liệu trở thành thông tin, cần xem xét một số nhân tố bao gồm người hoặc vật tạo ra dữ liệu.

Dữ liệu biểu diễn số lượng, tính chất hoặc ký hiệu hoạt động được máy tính lưu trữ trên ổ cứng từ, đĩa quang và được truyền đi dưới dạng tín hiệu điện.

Thông tin là gì?

Thông tin chính là sự thông báo, trao đổi, giải thích về một đối tượng nào đó và thường được thể hiện dưới dạng các tín hiệu như chữ viết, âm thanh, dòng điện,…Nói một cách khái quát, thông tin chính là sự hiểu biết của con người về một thực thể nào đó, có thể thu nhập, lưu trữ và xử lý được.

Thông tin sẽ được liên kết với dữ liệu vì dữ liệu đại diện cho các giá trị dược quy cho các tham số và thông tin là dữ liệu theo ngữ cạnh và có ý nghĩa kèm theo. Thông tin cũng liên quan đến kiến thức bởi kiến thức biểu thị sự hiểu biết về một khái niệm trừu tượng hoặc cụ thể.

Thông tin có thể được mã hóa thành nhiều dạng khác nhau để truyền vài giải thích, nó cũng có thể được mã hóa để lưu trữ và liên lạc an toàn.

Thông tin được chia ra làm 2 loại chính đó là số [ số nguyên, số thực] và phi số [ là các văn bản, hình ảnh, âm thanh,…]

Lý thuyết: Thông tin và dữ liệu

1. Khái niệm thông tin và dữ liệu

- Thông tin là một khái niệm rất trừu tượng. Thông tin được hiểu như là sự thông báo, trao đổi, giải thích về một đối tượng nào đó và thường được thể hiện dưới dạng các tín hiệu như chữ số, chữ viết, âm thanh, dòng điện... Chẳng hạn thông tin về kết quả học tập của học sinh được giáo viên chủ nhiệm ghi trong sổ liên lạc giúp cho các bậc phụ huynh biết về tình hình học tập của con em mình.

Nói một cách tổng quát, thông tin là sự hiểu biết của con người về một thực thể nào đó, có thể thu thập, lưu trữ, xử lí được.

- Dữ liệu cũng là một khái niệm rất trừu tượng, là thông tin đã được đưa vào máy tính. Dữ liệu sau khi tập hợp lại và xử lí sẽ cho ta thông tin. Hay nói cách khác, dữ liệu là thông tin đã được mã hoá trong máy tính. Chẳng hạn, con số điểm thi là một dữ liệu hoặc con số về nhiệt độ trong ngày là một dữ liệu, hình ảnh về con người, phong cảnh cũng là những dữ liệu,...

2. Đơn vị đo thông tin

Đơn vị cơ bản đo thông tin là bit [Binary digit]. Bit là dung lượng nhỏ nhất tại mỗi thời điểm có thể ghi được hoặc là kí hiệu 0 hoặc là kí hiệu 1. Hai kí hiệu này dùng để biểu diễn thông tin trong máy tính.

Ngoài đơn vị bit nói trên, đơn vị đo thông tin thường dùng là byte và 1 byte bằng 8 bit. Ta có các đơn vị đo thông tin như sau:

1 byte

= 8 bit.

1 kilôbai [kB]

= 1024 byte

= 210byte.

1 mêgabai [MB]

= 1024 kB

= 210kB.

1 gigabai [GB]

= 1024 MB

= 210MB.

1 têrabai [TB]

= 1024 GB

= 210GB.

1 pêtabai [PB]

= 1024 TB

= 210TB.

3. Các dạng thông tin

Chúng ta, có thể phân loại thông tin thành hai loại: số [số nguyên, số thực...] và phi số [văn bản, âm thanh, hình ảnh...]

4. Mã hoá thông tin trong máy tính

Muốn máy tính xử lí được, thông tin phải được biến đổi thành một dãy bit. Cách biến đổi như vậy được gọi là mã hoá thông tin.

Để mã hoá thông tin dạng văn bản người ta dùng bộ mã ASCII sử dụng tám bit để mã hoá kí tự. Trong bộ mã ASCII, các kí tự được đánh số từ 0 đến 255 và các kí hiệu này được gọi là mã ASCII thập phân của kí tự.

Người ta đã xây dựng bộ mã Unicode sử dụng 16 bit để mã hoá vì bộ mã ASCII chỉ mã hoá được 256 kí tự, chưa đủ để mã hoá đồng thời các bảng chữ cái của các ngôn ngữ trên thế giới. Bộ mã Unicode có thể mã hoá được 65536 kí tự khác nhau. Nó cho phép thể hiện trong máy tính văn bản của hầu hết các ngôn ngữ trên thế giới bằng một bộ mã. Đây là bộ mã chung để thể hiện các văn bản hành chính.

Thông tin tuy có nhiều dạng khác nhau nhưng đều được lưu trữ và xử lí trong máy tính chỉ ở một dạng chung đó là mã nhị phân.

5. Biểu diễn thông tin trong máy tính

a] Biểu diễn thông tin loại số

Hệ đếm: Hệ đếm được hiểu như tập các kí hiệu và qui tắc sử dụng tập kí hiệu đó để biểu diễn và xác định giá trị các số. Có hệ đếm phụ thuộc vị trí và hệ đếm không phụ thuộc vị trí.

Hệ đếm La Mã là hệ đếm không phụ thuộc vị trí, đó là các chữ cái: I=1; V=5; X=10; L=50; C=100; D=500; M=1000; Hệ này thường ít dùng, chỉ dùng để đánh số chương, mục, đánh số thứ tự...

Các hệ đếm thường dùng là các hệ đếm phụ thuộc vị trí. Bất kì một số tự nhiên b nào lớn hơn 1 đều có thể chọn làm cơ số cho một hệ đếm. Trong các hệ đếm này, số lượng các kí hiệu được sử dụng bằng cơ số của hệ đếm đó. Các kí hiệu được dùng cho hệ đếm đó có các giá trị tương ứng: 0, 1,..., b-1.

i] Hệ thập phân [hệ cơ số 10] sử dụng tập kí hiệu gồm 10 chữ số: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Giá trị của mỗi chữ số phụ thuộc vào vị trí của nó trong biểu diễn.

ii] Các hệ đếm thường dùng trong Tin học

- Hệ nhị phân [hệ cợ số 2] chỉ dùng 2 kí hiệu là chữ số 0 và chữ số 1.

Ví dụ: 1012 = Ix22 + 0x21 + 1x2°= 510.

- Hệ cơ số mười sáu [Hệ Hexa], sử dụng các kí hiệu: 0, 1,2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F, trong đó A, B, C, D, E, F có giá trị tương ứng là 10, 11, 12, 13, 14, 15 trong hệ thập phân.

iii] Biểu diễn số nguyên

Một byte biểu diễn được số nguyên trong phạm vi -127 đến 127.

iv] Biểu diễn số thực

Dùng dấu chấm[.] để ngăn cách giữa phần nguyên và phần thập phân. Mọi số thực đều có thể biểu diễn dưới dạng ±M X 10+K[dạng dấu phẩy động].

b] Biểu diễn thông tin loại phi số

Biểu diễn văn bản: Dùng một dãy bit để biểu diễn một kí tự [mã ASCII của kí tự đó]

Các dạng khác: xử lí âm thanh, hình ảnh... thành dãy các bit

Nguyên lí mã hoá nhị phân

Thông tin có nhiều dạng khác nhau như số, văn bản, hình ảnh, âm thanh... Khi dựa vào máy tính, chúng đều biến đổi thành dạng chung - dãy bit. Dãy bit là mã nhị phân của thông tin mà nó biểu diễn.

Loigiaihay.com

  • Thực hành 7: Định dạng đoạn văn bản trang 112 SGK Tin học 10

    Hãy áp dụng những thuộc tính định dạng đã biết để trình bày lại đơn xin học dựa trên mẫu sau đây:

  • Bài tập và thực hành 6: Làm quen với Word trang 106 SGK Tin học 10

    Tập di chuyển, xoá, sao chép phần văn bản, dùng cả ba cách: lệnh chọn, nút lệnh trên thanh công cụ và tổ hợp phím tắt.

Trong bài viết này

  • Tổng quan

  • Thời điểm sử dụng những kiểu dữ liệu

  • Thuộc tính kích cỡ trường

  • Kiểu dữ liệu trong các mối quan hệ và liên kết

  • Tham chiếu kiểu dữ liệu

Trong bài viết này

  • Tóm tắt kiểu dữ liệu

    • Loại Dữ liệu Bảng

  • Chuyển đổi loại dữ liệu ẩn và rõ ràng trong công thức DAX

    • Bảng Chuyển đổi Dữ liệu Ẩn

      • Cộng [+]

      • Trừ [-]

      • Nhân [*]

      • Chia [/]

      • Toán tử so sánh

  • Xử lý các giá trị trống, chuỗi trống và các giá trị bằng không

Dữ liệu là gì?

Dữ liệu [data] là chuỗi bất kỳ của một hoặc nhiều ký hiệu có ý nghĩa thông qua việc giải thích một hành động cụ thể nào đó. Dữ liệu cần phải được thông dịch để trở thành thông tin. Để dữ liệu thành thông tin, cần xem xét một số nhân tố bao gồm người tạo ra dữ liệu và thông tin được mong muốn từ dữ liệu đó. [Nguồn Wikipedia]

Bây giờ, nếu chúng ta nói về dữ liệu chủ yếu trong lĩnh vực khoa học, thì câu trả lời cho “dữ liệu là gì” sẽ là dữ liệu là các loại thông tin khác nhau thường được định dạng theo một cách cụ thể.

Dữ liệu máy tính là gì?

Dữ liệu máy tính là thông tin xử lý hoặc lưu trữ bởi một máy tính. Thông tin này có thể ở dạng tài liệu văn bản, hình ảnh, đoạn âm thanh, chương trình phần mềm hoặc các dạng dữ liệu khác. … Điều này cho phép truyền dữ liệu từ máy tính này sang máy tính khác bằng kết nối mạng hoặc các thiết bị đa phương tiện khác nhau.

Các kiểu dữ liệu phổ biến bao gồm:

  • Số nguyên
  • Số dấu phẩy động
  • Ký tự
  • Chuỗi
  • Boolean
  • Âm thanh
  • Hình ảnh

Để đạt được hiệu quả cao khi xử lý, lưu trữ và truyền thông tin điều cần thiết là phải tìm cách tổ chức và biểu diễn [thể hiện] thông tin trong MTĐT một cách hợp lý. Như đã biết, dữ liệu là hình thức biểu diễn thông tin. Vậy đối với máy tính dữ liệu chính là các thông tin đã được mã hoá dưới dạng số nhị phân. Dữ liệu – thông tin được máy tính xử lý có thể có các dạng khác nhau.

Máy tính có thể tính toán trên các số, có thể xử lý thông tin chữ hay thông tin logic, có thể xử lý những thông tin đa phương tiện [multimedia] như âm thanh và hình ảnh. Máy tính còn có thể xử lý tri thức [knowledge].

Thông tin về một đối tượng có thể rất phức tạp và có thể được thể hiện bằng nhiều dữ liệu có kiểu khác nhau. Ví dụ thông tin về một cán bộ có thể có tên, nơi sinh là văn bản; ngày sinh, lương là số; ảnh chân dung là ảnh…

Để lưu trữ trong MTĐT cả dữ liệu số, phi số và tri thức đều được mã hóa bằng các mã nhị phân. Theo nghĩa đó mọi dữ liệu dù là bản chất có khác nhau nhưng đều được số hoá.

Dữ liệu kiểu số

Biểu diễn số dấu phảy tĩnh

Với kiểu biểu diễn số dấu phảy tĩnh, người ta chọn một độ rộng n bít nào đó cho một số. Trong n bit này, bít đầu tiên dùng để mã dấu của số theo cách bít 0 dùng để mã dấu dương, bít 1 dùng để mã dấu âm. Trong n-1 bít còn lại, lấy một số bít cho phần nguyên và phần còn lại cho phần lẻ. Ví dụ trong dãy 16 bít sau nếu ta dùng 7 bít cho phần nguyên và 8 bít cho phần lẻ và một bít cho dấu thì biểu diễn sau thể hiện số 1100101,11011011

Biểu diễn số dấu phảy tĩnh fixed point number

Do với mỗi kiểu biểu diễn đã chọn, vị trí dấu phảy mang tính quy ước nằm ở một vị trí cố định nên kiểu biểu diễn này gọi là kiểu dấu phảy tĩnh.

Trên thực tế đa số các môi trường xử lý quy ước dấu phảy đứng sau ô cuối cùng có nghĩa là chỉ áp dụng chế độ dấu phảy tĩnh cho số nguyên. Độ dài của biểu diễn tuỳ thuộc vào nhu cầu. Các số nguyên thường dùng chủ yếu có các loại độ dài 8 bit, 16 bít và 32 bit.

Mã số nguyên trình bày trên đây được gọi là mã thuận. Thực ra để tiện cho việc thực hiện các phép tính đại số, người ta còn sử dụng nhiều loại mã số nguyên khác như mã ngược, mã bù…mà ta sẽ không trình bày ở đây.

Biểu diễn số dấu phảy động

Biểu diễn số dấu phảy động – floating point number

Biểu diễn dấu phảy tĩnh không đáp ứng được một số nhu cầu, đặc biệt trong tính toán gần đúng. Đối với các bài toán tính gần đúng người ta có thể chấp nhận những sai số là lớn về tuyệt đối nhưng tỉ số của sai số trên giá trị thực của số là nhỏ [sai số tương đối].

Mặt khác cách biểu diễn số trong dấu phảy tĩnh không đủ mềm dẻo để thể hiện các số quá lớn hoặc quá bé. Đã từ lâu, khi có nhu cầu tính toán gần đúng trên máy tính người ta thường dùng một loại biểu diễn số khác là biểu dấu phảy động.

Video liên quan

Chủ Đề