Giáo trình Kiến trúc máy tính - Chương 2: Lịch sử phát triển của máy tính
Máy tính thế hệ thứ nhất
Ống chân không
Máy tính thế hệ thứ hai
Transistor
Máy tính thế hệ thứ ba
Mạch tích hợp
Thiết kế hiệu suất
Tốc độ vi xử lý
Cân bằng hiệu năng
Kiến trúc và tổ chức chip
Đa lõi
MICs
GPGPUs
Sự phát triển của Intel x86
Hệ thống nhúng
Sự phát triển của ARM
Đánh giá hiệu suất máy
Tốc độ đồng hồ và số lệnh trên
giây
Tiêu chuẩn đánh giá
Luật Amdahl
Luật Little
62 trang |
Chia sẻ: thucuc2301 | Lượt xem: 905 | Lượt tải: 0
Bạn đang xem trước 20 trang tài liệu Giáo trình Kiến trúc máy tính - Chương 2: Lịch sử phát triển của máy tính, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
+ Chương 2
Lịch sử phát triển của máy tính
+
NỘI DUNG
1. Lịch sử phát triển của Máy tính
Thế hệ đầu tiên: ống chân không
Thế hệ thứ hai: Transitor
Thế hệ thứ ba: mạch tích hợp
Các thế hệ tiếp theo
2. Thiết kế hiệu suất
Tốc độ vi xử lý
Cân bằng Hiệu suất
Cải tiến trong Tổ chức và Kiến trúc Chip
3. Đa lõi, MICs và GPGPUs
4. Sự phát triển của kiến trúc Intel x86
5. Hệ thống nhúng và ARM
6. Đánh giá hiệu suất
Tốc độ đồng hồ và số lệnh trên giây
Tiêu chuẩn
Luật Amdahl
Luật Little
+
1.1 Thế hệ đầu tiên: Ống chân không
a, ENIAC - Electronic Numerical Integrator And Computer
Được thiết kế và xây dựng tại trường ĐH Pennsylvania
Bắt đầu từ 1943 – hoàn thành năm 1946
Bởi giáo sư John Mauchly và học trò John Eckert
Là máy tính điện tử số đầu tiên trên thế giới
Phòng thí nghiệm đạn đạo quân đội (BRL) cần thiết bị có thể cung cấp
bảng quỹ đạo chính xác cho một loại vũ khí mới trong khoảng thời gian cho
phép
Đã không kịp hoàn thành phục vụ chiến tranh. Được tháo rời vào năm 1955
Nhiệm vụ đầu tiên của nó là thực hiện một loạt các tính toán giúp xác
định tính khả thi của bomb hydrogen.
ENIAC
Nặng 30 tấn
Chiếm 1500 m2 diện tích sàn
Gồm 18000 đèn điện tử, 1500 công tắc điện tử
Tiêu thụ 140 kWh
Có khả năng thực hiện 5000 phép tính trên 1s
Tính toán trên số thập phân
Bộ nhớ gồm 20 thanh ghi, mỗi cái có thể giữ 1 số 10 chữ số
Lập trình bằng tay bằng cách đấu nối các đầu cắm điện và dùng
các ngắt điện
+
John von Neumann
Ý tưởng thiết kế được đưa ra vào năm 1945
Khái niệm chương trình lưu trữ
Do các nhà thiết kế ENIAC, đặc biệt là nhà toán học John von
Neumann
Chương trình được lưu vào trong bộ nhớ cùng với dữ liệu
ALU điều khiển để tính toán trên dữ liệu nhị phân
Bộ điều khiển dịch các tập lệnh trong bộ nhớ và thi hành, điều khiển
hoạt động của các thiết bị vào ra
Máy tính IAS
Hoàn thiện vào năm 1952 bởi viện nghiên cứu cao cấp Princeton
Là nền tảng cho các máy tính hiện đại ngày nay.
b. EDVAC (Electronic Discrete Variable Computer)
Cấu trúc của Máy von Neumann
Main
Memory
(M)
Central Processing Unit (CPU)
Arithmetic-
Logic
Unit (CA)
Program
Control
Unit (CC)
Figure 2.1 Structure of the IAS Computer
I/O
Equip-
ment
(I, O)
+
Format bộ nhớ của máy IAS
lưu trữ cả dữ liệu và lệnh
Chữ số được biểu diễn dưới
dạng số nhị phân. Mỗi lệnh là
một mã nhị phân
Bộ nhớ của IAS gồm 1000
cell nhớ (gọi là 1 từ) x 40 bit.
2x20 bit tập lệnh
(a) Number wordsign bit
0 39
(b) Instruction word
Figure 2.2 IAS Memory Formats
opcode address
left instruction
0 8 20 28 39
1
right instruction
opcode address
+
Cấu trúc
của
máy tính
IAS
AC
IBR PC
IR
Control
circuits
Addresses
Control
signals
Instructions
and data
MAR
MBR
MQ
Arithmetic-logic
circuits
Arithmetic-logic unit (ALU)
Program control unit
Figure 2.3 Expanded Structure of IAS Computer
Input-
output
equipment
Main
memory
M
+ Các loại thanh ghi
• Chứa word sắp lưu vào bộ nhớ hoặc sắp được gửi ra cổng
I/O
• Có thể nhận một word từ bộ nhớ hoặc từ các cổng I/O
Thanh ghi đệm dữ liệu
(MDR)
• Chứa địa chỉ bộ nhớ của từ chuẩn bị được đọc
hoặc ghi vào MDR.
Thanh ghi địa chỉ bộ
nhớ (MAR)
• Chứa mã lệnh của lệnh sắp được thực thi. Thanh ghi tập lệnh (IR)
• Được sử dụng để tạm thời lưu trữ lệnh nằm bên tay
phải của 1 từ trong bộ nhớ.
Thanh ghi đệm chứa
tập lệnh (IBR)
• Chứa địa chỉ của cặp lệnh tiếp theo cần lấy từ bộ
nhớ
Bộ đếm chương trình
(PC)
• Được sử dụng để tạm thời giữ các toán hạng và kết
quả của các phép tính trong ALU.
Bộ cộng tích luỹ (AC)
và bộ nhân chia (MQ)
+
Tập lệnh
trong
IAS
+
Máy tính thương mại
1947 – Thành lập Công ty máy tính Eckert-Mauchly để
sản xuất máy tính thương mại
UNIVAC I
Là máy tính thương mại thành công đầu tiên
Được dùng cho cả các ứng dụng khoa học và thương mại
Uỷ quyền bởi Cục điều tra dân số Mỹ để tính toán vào năm 1950
UNIVAC II – hoàn thành vào cuối những năm 1950
Có dung lượng bộ nhớ lớn hơn, nhanh hơn, hiệu suất cao hơn
Tương thích ngược
c. UNIVAC - Universal Automatic Computer
+
d. IBM
Từng là hãng sản xuất thiết bị
đục lỗ thẻ.
1953 - Máy tính điện tử
chương trình lưu trữ đầu tiên
- 701
Dùng cho tính toán khoa học
1955 - Dòng sản phẩm 702
Tính năng phần cứng làm
nó phù hợp với các ứng
dụng kinh doanh
Dòng máy tính thế hệ
700/7000 đã giúp IBM là nhà
sản xuất máy tính hàng đầu
+
1. Lịch sử phát triển máy tính
Nhỏ gọn hơn
Giá thành rẻ
Toả nhiệt ít hơn ống chân không
Là một thiết bị bán dẫn làm từ silicon
Được phát minh bởi Bell Labs vào năm 1947
Mãi đến cuối những năm 1950, máy tính bán dẫn hoàn
toàn mới chính thức đưa vào thị trường thương mại
1.2 Thế hệ thứ hai: Transistor
+
Máy tính thế hệ thứ hai
Đặc điểm:
Bộ điều khiển và bộ số học
logic phức tạp hơn
Sử dụng các ngôn ngữ lập
trình bậc cao
Có các phần mềm hệ thống
cung cấp khả năng:
Tải chương trình
Di chuyển dữ liệu tới thiết
bị ngoại vi và thư viện
Thực hiện các tính toán
thông thường
1957 - Sự xuất hiện của
Tập đoàn thiết bị số
(Digital Equipment
Corporation -DEC)
PDP-1 là máy tính đầu tiên
của DEC
Bắt đầu sự xuất hiện của
máy tính mini – dòng máy
thống trị ở thế hệ máy tính
thứ ba.
IBM 700/7000 Series
Example Members of the IBM 700/7000 Series
CPU
Memory
Figure 2.5 An IBM 7094 Configuration
Data
channel
Mag tape
units
Card
punch
Line
printer
Card
reader
Drum
Disk
Disk
Hyper-
tapes
Teleprocessing
equipment
Data
channel
Data
channel
Data
channel
Multi-
plexor
Cấu hình
IBM
7094
1.3 Thế hệ thứ ba: Mạch tích hợp
Lịch sử phát triển máy tính
1958 –mạch tích hợp ra đời
Linh kiện rời
Các transistor đơn lẻ, đóng gói khép kín.
Được chế tạo rời, đóng gói trong riêng và được hàn hoặc
nối với nhau lên trên bảng mạch.
Quá trình sản xuất tốn kém và cồng kềnh.
Hai thành viên quan trọng nhất của thế hệ máy tính thứ ba
là IBM System/360 và DEC PDP-8
+
Vi điện tử
Boolean
logic
function
Input
Activate
signal
(a) Gate
Figure 2.6 Fundamental Computer Elements
Output
Binary
storage
cell
Input
Read
Write
(b) Memory cell
Output
+
Mạch tích hợp
Máy tính bao gồm các cổng,
các cell nhớ và đường kết
nối giữa các bộ phận.
Cổng và các cell nhớ được
xây dựng bằng những linh
kiện điện tử kỹ thuật số đơn
giản.
Lưu trữ dữ liệu – trên các
cell nhớ
Xử lý dữ liệu –qua các cổng
Di chuyển dữ liệu – Dữ liệu
được di chuyển trên các
đường dẫn giữa các bộ
phận của máy tính đi vào/ra
bộ nhớ và từ bộ nhớ qua
cổng tới bộ nhớ.
Điều khiển – tín hiệu điều
khiển được truyền trên các
đường dẫn giữa các bộ
phận.
Các linh kiện như điện trở,
transistor và dây dẫn có thể chế
tạo từ chất bán dẫn như silicon.
Nhiều transistor có thể được sản
xuất cùng lúc trên một tấm khuôn
silicon
+
Mối quan hệ
giữa
Tấm khuôn,
Chip,
và
Cổng
Wafer
Chip
Gate
Figure 2.7 Relationship Among Wafer, Chip, and Gate
Packaged
chip
Computer Generations
Các thế hệ máy tính
+ Sự phát triển của Chip
Figure 2.8 Growth in Transistor Count on Integrated Circuits
(DRAM memory)
1
1947
Fi
rs
t
w
or
ki
ng
tr
an
si
st
or
M
oo
re
’s
la
w
pr
om
ul
ga
te
d
In
ve
nt
io
n
of
in
te
gr
at
ed
c
ir
cu
it
50 55 60 65 70 75 80 85 90 95 2000 05 11
10
100
1,000
10.000
100,000
10 m
100 m
1 bn
10 bn
100 bn
Moore’s Law
1965; Gordon Moore – đồng sáng lập Intel
Số lượng transistor trên mỗi chip tăng gấp đôi
sau mỗi năm với giá thành không đổi
Tốc độ sau
đó chậm lại
còn gấp đôi
sau mỗi 18
tháng vào
những năm
1970 và duy
trì cho đến
ngày nay
Hệ quả của quy luật Moore:
Giá
mạch
nhớ và
mạch
logic
máy
tính
giảm rất
mạnh
Rút
ngắn
chiều
dài
đường
dẫn
điện,
tăng tốc
độ hoạt
động
Máy
tính nhỏ
gọn
hơn và
thuận
tiện cho
sử
dụng ở
nhiều
môi
trường
Giảm
yêu cầu
về điện
năng
tiêu thụ
và bộ
làm mát
Kết nối
giữa
các
chip ít
hơn
+
Đặc tính của họ System/360
+
DEC PDP-8
1964
Minicomputer – máy tính mini đầu tiên
Không cần phòng máy lạnh
Nhỏ đủ để đặt trên 1 chiếc ghế phòng thí nghiệm
$ 16.000
$ 100k+ cho IBM 360
Ứng dụng nhúng và OEM
CẤU TRÚC BUS
Sự phát triển của PDP-8
+
Cấu trúc bus DEC - PDP-8
Figure 2.9 PDP-8 Bus Structure
Console
controller
CPU
Omnibus
Main
memory
I/O
module
I/O
module
+
4. Máy tính
thế hệ tiếp
theo
LSI
Large
Scale
Integration
VLSI
Very Large
Scale
Integration
ULSI
Ultra Large
Scale
Integration
Bộ nhớ bán dẫn
Bộ vi xử lý
+ Bộ nhớ bán dẫn
Kể từ năm 1970 bộ nhớ bán dẫn đã trả qua 13 thế hệ phát triển
Mỗi thế hệ sau lại tăng mật độ bộ nhớ lên gấp 4 lần so với thế hệ trước cùng với giảm giá
thành và thời gian truy câp.
1974, giá 1 bit của bộ nhớ bán dẫn thấp hơn giá của bộ nhớ lõi
Giá bộ nhớ tiếp tục giảm mạnh khi mật độ bộ
nhớ vật lý tăng nhanh
Sự phát triển công nghệ bộ nhớ và xử lý làm
thay đổi bản chất của máy tính gần 1 thập kỉ
1970, Fairchild ra mắt bộ nhớ bán dẫn dung lượng tương đối lớn đầu tiên
Kích thước chip
bằng đơn lõi
Có thể chứa 256 bits
nhớ
Không xoá được Tốc độ nhanh hơn lõi
+
Vi xử lý
Mật độ các thành phần trên chip xử lý tiếp tục tăng
Ngày càng nhiều thành phần đặt trên chip dẫn đến càng ít chip cần
thiết để xây dựng một bộ xử lý máy tính
1971 Intel phát triển dòng 4004
Chip đầu tiên chứa được tất cả thành phần của CPU trên 1 chip đơn
Sự ra đời của bộ vi xử lý 4 bit
1972 Intel phát triển dòng 8008
Vi xử lý 8 bit đầu tiên
1974 Intel phát triển dòng 8080
Vi xử lý đa năng đầu tiên
Nhanh hơn, tập lệnh phong phú hơn, khả năng định địa chỉ rộng hơn
Quá trình phát triển của vi xử lý Intel
a. 1970s Processors
b. 1980s Processors
c. 1990s Processors
d. Recent Processors
Quá trình phát triển của vi xử lý Intel
+
2. CÁC ĐẶC TÍNH THIẾT KẾ MÁY TÍNH
+
2.1 Tốc độ vi xử lý
• Bộ xử lý thi hành cùng một lúc nhiều lệnh
Kỹ thuật ống dẫn (Pipelining)
• Bộ xử lý tra mã lệnh tìm được từ bộ nhớ và dự đoán nhánh nào
hoặc nhóm lệnh nào được xử lý tiếp theo.
Dự đoán nhánh
• Bộ xử lý phân tích lệnh nào phụ thuộc vào kết quả của lệnh khác,
hoặc dữ liệu, để đưa ra lịch trình xử lý lệnh tối ưu nhất
Phân tích dòng dữ liệu
• Sử dụng dự đoán nhánh và phân tích dòng dữ liệu, một số bộ xử lý
thi hành lệnh trước khi nó xuất hiện, giữ kết quả trong một vùng
tạm thời, giữ cho bộ máy luôn hoạt động bận rộn.
Thi hành lệnh theo suy đoán
Kĩ thuật xây dựng bộ vi xử lý hiện đại bao gồm:
+
2.2 Cân bằng Hiệu suất
Điều chỉnh kiến trúc và tổ chức để bù đắp cho sự chênh lệch giữa
khả năng khác nhau của các thành phần.
Ví dụ về kiến trúc bao gồm:
Tăng số lượng bit được lấy ra tại 1 thời điểm bằng cách làm cho
DRAMs “rộng hơn” thay vì “sâu hơn” và bằng cách sử dụng đường bus
dữ liệu rộng.
Thay đổi giao diện DRAM để nó hiệu quả hơn bằng cách thêm vào 1 bộ
nhớ cache hoặc 1 cơ chế đệm khác trên chip DRAM
Giảm tần suất truy cập bộ nhớ bằng cách kết hợp các cấu trúc bộ nhớ
cache phức tạp và hiệu quả hơn giữa bộ xử lý và bộ nhớ chính
Tăng băng thông kết nối giữa bộ xử lý và bộ nhớ bằng cách sử dụng
các bus tốc độ cao và phân cấp bus để đệm và cơ cấu dòng dữ liệu
Tốc độ dữ liệu của các thiết bị I/O điển hình
Keyboard
101 102 103 104 105
Data Rate (bps)
106 107 108 109
Mouse
Modem
Ethernet
Hard disk
Graphics display
Gigabit Ethernet
Floppy disk
Laser printer
Scanner
Optical disk
Figure 2.10 Typical I/O Device Data Rates
+
2.3 Cải tiến kiến trúc và tổ chức Chip
Tăng tốc độ phần cứng của bộ vi xử lý
Cơ bản là do thu hẹp kích thước cổng logic
Nhiều cổng hơn, đóng gói chặt chẽ hơn, tăng tốc độ đồng hồ
Thời gian truyền tín hiệu giảm
Tăng kích thước và tốc độ cache
Dành một phần của chip vi xử lý
Thời gian truy cập cache giảm đáng kể
Thay đổi cấu trúc và tổ chức bộ vi xử lý
Tốc độ thực hiện lệnh tăng mạnh
Xử lý song song
+
Tốc độ đồng hồ và mật độ Logic
Tiêu thụ điện năng
Tăng khi mật độ cổng logic và tốc độ đồng hồ tăng
Toả nhiệt
Trễ RC (Resistance – điện trở & Capacitance – điện dung)
Tốc độ dòng electrons chạy trên chip giới hạn bởi điện dung và điện
trở (RC) của đường dây kim loại kết nối chúng
Trễ tăng khi tích RC tăng
Dây kết nối mảnh hơn, điện trở tăng
Dây đặt gần nhau hơn, điện dung tăng
Trễ bộ nhớ
Tốc độ bộ nhớ thường chậm hơn tốc độ bộ xử lý
Giải pháp
Chú trọng hơn vào phương pháp tổ chức và kiến trúc
+
Xu hướng phát triển bộ xử lý
Figure 2.11 Processor Trends
0.1
1
10
1970 1975 1980 1985 1990 1995 2000 2005 2010
Transistors (Thousands)
Frequency (MHz)
Power (W)
Cores
102
103
104
105
106
107
3. Chip đa lõi
Việc sử dụng nhiều bộ xử lý trên một chip cung cấp
tiềm năng tăng hiệu suất cho máy mà không làm tăng
tốc độ đồng hồ
Tăng gấp đôi số lượng bộ vi xử lý, tăng gấp đôi hiệu
suất
Chiến lược: sử dụng hai bộ xử lý đơn giản trên 1 chip
thay vì một bộ xử lý phức tạp
Với 2 bộ xử lý thì sẽ có bộ nhớ cache lớn hơn
Bộ nhớ cache lớn hơn sẽ cần phải chia làm hai hoặc
ba cấp cache trên một chip
+
Đa lõi tích hợp (MIC)
Đơn vị xử lý đồ hoạ (GPU)
Sự nhảy vọt về hiệu suất
đặt ra thách thức trong
phát triển phần mềm để
khai thác hết tính năng
của xử lý đa lõi.
Chiến lược MIC và đa lõi
yêu cầu các bộ xử lý đa
năng phải gộp đồng nhất
trên một chip đơn
Lõi được thiết kế để thi hành
song song các thao tác trên
dữ liệu đồ hoạ
GPU thường nằm trên card
đồ hoạ rời, nó được sử dụng
để mã hoá và giải mã đồ hoạ
2D và 3D cũng như xử lý
video
Được sử dụng như bộ xử lý
vector cho những ứng dụng
yêu cầu tính toán lặp
Đa lõi tích hợp (MIC) Đơn vị xử lý đồ hoạ (GPU)
Là kết quả sau nhiều thập kỉ nghiên cứu máy tính tập lệnh
phức tạp (Complex instruction set computers - CISCs)
Kết hợp các nguyên tắc thiết kế phức tạp chỉ có ở các siêu
máy tính hoặc hệ thống lớn
Một cách thiết kê bộ xử lý khác là máy tính tập lệnh rút gọn
(Reduced instruction set computer - RISC)
Kiến trúc ARM được sử dụng rộng rãi trong các hệ thống
nhúng và là một trong những hệ thống RISC mạnh nhất, thiết
kết tối ưu nhất trên thị trường
Trên thị trường, Intel là nhà sản xuất số một về các vi xử lý cho
các hệ thống không phải hệ nhúng.
4. Kiến trúc x86
Khái quát
+
Sự phát triển
của x86
8080
Vi xử lý đa năng đầu tiên
máy 8-bit với đường dữ liệu tới bộ nhớ 8-bit
Được dùng trên máy tính cá nhân đầu tiên
(Altair)
8086
Máy 16-bit
Sử dụng cache cho lệnh, hoặc hàng đợi
Hiện diện đầu tiên của kiến trúc x86
8088
Sử dụng cho máy tính cá nhân IBM đầu tiên
80286
16 Mb bộ nhớ thay vì chỉ 1Mb
80386
Máy 32 bit đầu tiên của Intel
Bộ xử lý Intel đầu tiên hỗ trợ thao tác đa nhiệm
80486
Kĩ thuật cache và ống dẫn lệnh (pipeline)
phức tạp hơn
Tích hợp sẵn bộ xử lý toán học
Sự phát triển của x86 - Pentium
Pentium
• Super-
scalar
• Thực hiện
nhiều lệnh
song song
Pentium
Pro
• Tăng tính
super-
scalar
• Đổi tên
thanh ghi
tích cực
• Dự đoán
nhánh
• Phân tích
dòng dữ
liệu
• Thi hành
lệnh theo
suy đoán
Pentium II
• Kĩ thuật
MMX
• Thiết kế
đặc biết
để xử lý
video,
audio và
dữ liệu đồ
hoạ
Pentium III
• Thêm vào
các lệnh
dấu phẩy
động để
hỗ trỡ các
phần
mềm đồ
hoạ 3D
Pentium 4
• Thêm các
lệnh dấu
phẩy động
và những
cải tiến
khác cho
đa
phương
tiện
Sự phát triển của x86 (2)
Core
Vi xử lý Intel x86 đầu tiên
có dual core – tức là thực
hiện hai bộ xử lý trên một
chip đơn.
Core 2
Mở rộng kiến trúc lên 64 bit
Gần đây có thể có tới 10 bộ
xử lý trên 1 chip
x86 thống lĩnh thị trường vi xử lý (trừ
hệ thống nhúng)
Kiến trúc tập lệnh tương thích với
các phiên bản trước
Tổ chức và kỹ thuật thay đổi
nhanh
Khoảng 1 lệnh thêm mới mỗi
tháng
500 lệnh có sẵn
+
Khái niệm:
“Sự kết hợp của phần cứng và phần
mềm máy tính, có thể cùng với các
thành phần khác, được thiết kế để thi
hành một chức năng cụ thể. Trong
nhiều trường hợp, hệ thống nhúng là
một phần của một hệ thống/sản phẩm
lớn hơn, ví dụ như một hệ thống
chống bó cứng phanh trong ôtô.”
5.
Hệ thống
Nhúng
Ví dụ về các hệ thống nhúng
Market Embedded Device
Automotive
Ignition system
Engine control
Brake system
Consumer electronics
Digital and analog televisions
Set-top boxes (DVDs, VCRs, Cable boxes)
Personal digital assistants (PDAs)
Kitchen appliances (refrigerators, toasters, microwave ovens)
Automobiles
Toys/games
Telephones/cell phones/pagers
Cameras
Global positioning systems
Industrial control
Robotics and controls systems for manufacturing
Sensors
Medical
Infusion pumps
Dialysis machines
Prosthetic devices
Cardiac monitors
Office automation
Fax machine
Photocopier
Printers
Monitors
Scanners
+ Hệ thống nhúng
Hệ thống từ nhỏ đến
lớn, kéo theo nhiểu
ràng buộc về giá thành
và nhiều yêu cầu để
tối ưu hoá và tái sử
dụng khác nhau
Độ bền ngắn hoặc dài
Không quá nghiêm
ngặt với các yêu cầu và
sự kết hợp các yêu cầu
chất lượng khác nhau
như độ an toàn, tin cậy,
thời gian thực và độ
linh hoạt.
Điều kiện môi trường
khác nhau về bức xạ,
độ rung và độ ẩm.
Đặc tính ứng dụng khác
nhau dẫn đến tải tĩnh
hay động, tốc độ nhanh
hay chậm, tác vụ về
tính toán hay giao diện,
tổ hợp and hay or
Các mô hình tính toán
khác nhau từ hệ thống
sự kiện rời rạc đến hệ
thống kết hợp hybrid
Yêu cầu và ràng buộc
+ Tổ chức của hệ thống nhúng
Auxiliary
Systems
(power,
cooling)
MemoryFPGA/
ASIC
Human
interface
Diagnostic
port
D/A
Conversion
A/D
conversion
Electromechanical
backup and safety
Sensors Actuators
Processor
Software
External
environment
Figure 2.12 Possible Organization of an Embedded System
+
Acorn RISC Machine (ARM)
Họ vi xử lý và vi điều khiển
RISC.
Thiết kế vi xử lý và kiến
trúc đa lõi, cấp phép cho
các nhà sản xuất.
Chip tốc độ cao, nhỏ gọn
và tiết kiệm điện.
Chủ yếu dùng trong hệ
thống nhúng
Được sử dụng rộng rãi trong
PDA, các thiết bị cầm tay
iPod, iPhone
Kiến trúc bộ xử lý được sử dụng
rộng rãi nhất
Acorn đã sản xuất ARM1 & ARM2
năm 1985 và ARM3 năm 1989
Acorn, VLSI và Apple Computer
thành lập ARM Ltd.
+
Family Notable Features Cache Typical MIPS @
MHz
ARM1 32-bit RISC None
ARM2 Multiply and swap
instructions;
Integrated memory
management unit,
graphics and I/O
processor
None 7 MIPS @ 12 MHz
ARM3 First use of processor
cache
4 KB unified 12 MIPS @ 25 MHz
ARM6 First to support 32-bit
addresses; floating-
point unit
4 KB unified 28 MIPS @ 33 MHz
ARM7 Integrated SoC 8 KB unified 60 MIPS @ 60 MHz
ARM8 5-stage pipeline; static
branch prediction
8 KB unified 84 MIPS @ 72 MHz
ARM9 16 KB/16 KB 300 MIPS @ 300
MHz
ARM9E Enhanced DSP
instructions
16 KB/16 KB 220 MIPS @ 200
MHz
ARM10E 6-stage pipeline 32 KB/32 KB
ARM11 9-stage pipeline Variable 740 MIPS @ 665
MHz
Cortex 13-stage superscalar
pipeline
Variable 2000 MIPS @ 1 GHz
XScale Applications
processor; 7-stage
pipeline
32 KB/32 KB L1
512 KB L2
1000 MIPS @ 1.25
GHz
DSP = digital signal processor SoC = system on a chip
Thông
số
ARM
Các hạng mục thiết kế ARM
Thiết kế bộ xử lý ARM cần phải đáp ứng ba hạng mục sau:
Platforms ứng dụng
Thiết bị chạy trên hệ điều
hành mở bao gồm Linux, Palm
OS, Symbian OS, và Windows
CE trong các ứng dụng không
dây và ảnh số.
Nhúng thời gian thực
Các hệ thống lưu trữ, bộ
phận tự động và các ứng
dụng mạng, công nghiệp...
Bảo mật ứng dụng
Cards thông minh, SIM cards
và các thiết bị thanh toán
+
6. ĐÁNH GIÁ HIỆU SUẤT MÁY
+
6.1 Đồng hồ hệ thống
6.2 Chuẩn so sánh (Benchmark)
Ví dụ: xét 1 câu lệnh ngôn ngữ lập trình bậc cao như sau:
A = B + C /* giả sử tất cả giá trị nằm trong bộ nhớ chính*/
Với kiến trúc tập lệnh truyền thống, theo kiến trúc CISC (Complex
instruction set computer -CISC), lệnh này có thể được biên
dịch thành 1 lệnh sau trong bộ xử lý
add mem(B), mem(C), mem (A)
Trên một máy RISC điển hình, phần biên dịch sẽ như sau:
load mem(B), reg(1);
load mem(C), reg(2);
add reg(1), reg(2), reg(3);
store reg(3), mem (A)
+ Đặc tính mong muốn của chuẩn so sánh
Viết bằng ngôn ngữ bậc cao, có thể
chạy trên các thiết bị khác nhau
Đại diện cho một kiểu lập trình riêng,
ví dụ lập trình hệ thống, lập trình số
học hoặc lập trình thương mại
Có thể so sánh dễ dàng
Được sử dụng rộng rãi
+
System Performance Evaluation
Corporation (SPEC)
Bộ tiêu chuẩn
Một tập hợp các chương trình, được định nghĩa trong một
ngôn ngữ bậc cao
Kiểm thử một máy tính trong một ứng dụng cụ thể hoặc khu
vực lập trình hệ thống
SPEC
Một tập đoàn công nghiệp
Xác định và duy trì các bộ tiêu chuẩn nổi tiếng
Các phép đo hiệu suất được sử dụng rộng rãi cho mục đích
so sánh và nghiên cứu
+
SPEC
CPU2006
Bộ tiêu chuẩn SPEC nổi tiếng nhất
Bộ tiêu chuẩn công nghiệp cho các
ứng dụng chuyên dụng bộ xử lý
Thích hợp để đo hiệu suất cho các
ứng dụng dành phần nhiều thời
gian để tính toán hơn là I/O
Bao gồm 17 chương trình dấu
phẩy động được viết bằng C, C ++,
và Fortran; 12 chương trình số
nguyên viết bằng C và C ++
Chứa hơn 3 triệu dòng mã
Thế hệ bộ vi xử lý thứ năm của
SPEC
+
6.3 Luật
Amdahl
Gene Amdahl [AMDA67]
Giải quyết sự tăng tốc của
chương trình sử dụng nhiều bộ
xử lý so với sử dụng 1 bộ xử lý
Mô tả các vấn đề mà nền công
nghiệp phải đối mặt khi phát
triển bộ xử lý đa lõi
Phần mềm phải thích hợp với
môi trường thi hành lệnh song
song để tận dụng sức mạnh
của xử lý song song.
Có thể khái quát hoá để đánh
giá và thiết kế các nâng cấp về
kĩ thuật trong hệ thống máy tính
+
6.4 Luật Little
Có mối liên hệ cơ bản và đơn giản với nhiều ứng dụng
Có thể áp dụng tới hầu hết các hệ thống thoả mãn điều kiện ổn
định và không có rò rỉ
Hệ thống hàng đợi
Nếu máy chủ (server) đang rỗi, mọi đối tượng được xử lý ngay lập
tức, nếu không thì các đối tượng đươc chuyển đến hàng đợi
Có thể có một hàng đợi cho một server hoặc nhiều server, hay
cũng có thể có nhiều hàng đợi với mỗi hàng đợi cung cấp cho
nhiều server
Số đối tượng trung bình trong một hàng đợi bằng tốc độ đến trung
bình nhân với thời gian mà một đối tượng ở trong hệ thống.
Mối quan hệ yêu cầu rất ít giả thiết
Với tính đơn giản và tổng quát, hàng đợi là cực kì hữu dụng
+ Tổng kết
Máy tính thế hệ thứ nhất
Ống chân không
Máy tính thế hệ thứ hai
Transistor
Máy tính thế hệ thứ ba
Mạch tích hợp
Thiết kế hiệu suất
Tốc độ vi xử lý
Cân bằng hiệu năng
Kiến trúc và tổ chức chip
Đa lõi
MICs
GPGPUs
Sự phát triển của Intel x86
Hệ thống nhúng
Sự phát triển của ARM
Đánh giá hiệu suất máy
Tốc độ đồng hồ và số lệnh trên
giây
Tiêu chuẩn đánh giá
Luật Amdahl
Luật Little
Chương 2
Lịch sử phát triển và
hiệu suất máy tính
+
Câu hỏi chương 2
1. Máy tính chương trình lưu trữ là gì?
2. Bốn thành phần chính của máy tính đa năng?
3. Ba yếu tố chính khi thiết kế hiệu suất của hệ thống máy
tính là gì?
4. Giải thích luật Moore.
Các file đính kèm theo tài liệu này:
- nguyen_hang_phuongch02_su_phat_trien_va_hieu_nang_may_tinh_1104_2053833.pdf