Chương 2 Flashcards
(41 cards)
Máy tính là gì
thiết bị đa phương tiện (multimedia device)
Mt lưu trữ, xử lý, hiển thị các dạng dữ liệu
- Giá trị số (numbers)
- Văn bản (text)
- Hình ảnh (Imagé, graphics)
- Âm thanh (audio)
- Hình ảnh động (video)
Nén dữ liệu (Data Compression)
- Goals: Giảm kích thước lưu trữ dữ liệu
+ Tỉ số nén (Compression ratio)
Hai kỹ thuật chính của nén dữ liệu
- Nén không mất dữ liệu (lossless): dữ liệu có thể được phục hồi nguyên vẹn từ dữ liệu nén
- Nén có mất dữ liệu (lossly): có một phần dữ liệu bị mất khi nén
Máy tính sử dụng dữ liệu dạng nhị phân vì:
- Giá thành thấp
- Độ tin cậy cao
Chữ số nhị phân là:
BIT (Binary digiT)
Hệ đếm theo vị trí
Hệ đếm là tập các ký hiệu và quy tắc nhầm biểu diễn các giá trị số
Đổi hệ đếm 12 sang hệ đếm 10. Ta có 642 trong hệ đếm 12
612^2 + 412^1+2
= 864 + 48 + 2 = 914 trong hệ đếm 10
Các hệ đếm thông dụng
- Hệ thập phân (Decimal) dùng 10 chữ số: 0,1,2,3,4,5,6,7,8,9
- Hệ nhị phân (Binary) dùng 2 chữ số: 0,1
- Hệ bát phân (octal) dùng 8 chữ số: 0,1,2,3,4,5,6,7
- Hệ thập lục phân (Hexadecimal) dùng 16 chữ số:
0,2,3,4,5,6,7,8,9,A,B,C,D,E,F
Các phép toán
- Phép toán số học: cộng, trừ, nhân, chia, chia nguyên, lũy thừa, đồng dư (mod).
- Phép toán so sánh: >, >=, <, <=, =, <>
- Phép toán logic: AND, OR, NOT
Thứ tự ưu tiên thực hiện các phép toán:
- Ưu tiên cao nhất: phép toán trong cặp dấu ngoặc
- Ưu tiên 2: lũy thừa, đồng dư
- Ưu tiên 3: Nhân, chia, chia nguyên
- Ưu tiên sau cùng: Cộng, trừ
Các khái niệm:
- Giá trị X được biểu diễn trên n bit
- X: giá trị cần biểu diễn
- n: kích thước biểu diễn
- Với n bit chỉ biểu diễn được các giá trị X
trong một khoảng biểu diễn - Số nguyên không dấu (unsigned integer)
- Số nguyên có dấu (signed integer)
Mã quá N
Còn gọi là phương pháp di chuyển (biased)
Sử dụng một số nguyên N cho trước làm giá trị dịch.
Một giá trị thập phân (tức giá trị cần biểu
diễn) sẽ được biểu diễn bằng dạng nhị phân của một số dương nào đó sao cho, giá trị
của số dương này lớn hơn giá trị cần biểu diễn N đơn vị
Ứng dụng số dấu chấm tĩnh
Dùng trong các chương trình tính toán thương mại (các ứng dụng spreadsheet),
và được hỗ trợ trên một số ngôn ngữ lập trình
Số dấu chấm động
X là số bất kỳ, có thể phân tích dưới dạng:
X = m*ae (1)
trong đó:
- a gọi là cơ số (radix)
- m gọi là phần định trị (mantissa)
- e gọi là phần bậc (exponent)
Tiêu chuẩn số dấu chấm động IEEE 754
- Do tổ chức IEEE (Institute of Electrical and Electronic Engineers)
- Mở rộng thành tiêu chuẩn IEEE 854
- Được sử dụng phổ biến trên các đơn vị số dấu chấm động (FPU, Floating-Point Unit) trong các bộ xử lý, và trên các ngôn ngữ lập trình
Tiêu chuẩn IEEE 754 gồm các dạng số chấm động tiêu chuẩn (normalized):
- Số chính xác đơn – Single-precision 32 bit
(Số single) - Số chính xác kép – Double-precision 64 bit
(Số double) - Số chính xác kép mở rộng –
Double-Extended precision 80 bit (Số extended) - Số extended dùng để giảm các lỗi khi làm tròn
số và chỉ dùng bên trong các FPU
Các số dấu chấm động IEEE 754 có dạng:
X = S*2^e
trong đó:
-S là phần định trị (significand)
e là phần bậc (exponent)
Với 1.0 ≤ | S | < 2
S có thể viết thành S = 1.f
trong đó f là phần phân số (fraction)
X = ± 1.f * 2e
Các dạng số đặc biệt
- Số dạng denormalized dùng để biểu diễn số rất nhỏ
- Số nhỏ nhất là 2-23 * 2-127 = 2-150
- Có thể biểu diễn 2 số 0 (+0, -0)
- Số vô cực có thể dùng làm toán hạng tuân theo các quy tắc toán học cho số vô cực
Khi kết quả phép toán không xác định, ví dụ ∞/∞ thì dùng dạng NaN (Not a
Number)
Làm tròn số (rounding)
Tiêu chuẩn IEEE 754 có các dạng làm
tròn số:
* Unbiased: round to nearest
Làm tròn về số gần nhất
Nếu số cần làm tròn ở giữa 2 giá trị thì làm tròn về số có bit cuối bên phải là 0
* Toward zero: làm tròn về zero
* Toward positive infinity: làm tròn về +∞
* Toward negative infinity: làm tròn về -∞
Bộ mã ASCII (American Standard Code For Information Interchange )
- Do ANSI (American National Standards Institude) công bố năm 1967, cập nhật năm 1986
- Bảng mã ASCII dùng biểu diễn ký tự trên máy tính và các thiết bị truyền thông
Mã ASCII chuẩn
Dùng 7 bit, biểu diễn được 128 ký tự, bao gồm:
* Các ký tự điều khiển (control characters) có giá trị (mã) từ 0 đến 1Fh
* Các ký tự in được (printable characters) có giá trị (mã) từ 20h đến 7Fh
Mã ASCII mở rộng
dùng 8 bit, bao gồm:
* Phần ASCII chuẩn
* Các ký tự đặc biệt có giá trị (mã) từ 80h đến FFh
Unicode là gì:
tiêu chuẩn mã hóa ký tự của
Hiệp hội Unicode (Unicode Consortium) bao gồm các nhà sản xuất IBM, Apple, HP, MicroSoft, Adobe, …
- Unicode là một hiện thực của chuẩn ISO 10646 UCS 2 (Universal Character Set)