Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

--- temata:07-princip_cinnosti_pocitace:main [2011/04/12 12:39]
george [Obecné informace]
+++ temata:07-princip_cinnosti_pocitace:main [2013/02/20 13:35] (aktuální)
marho [CISC architektura]
@@ Řádek 1: / Řádek 1: @@
+~~ODT~~
 ====== 07 - Princip činnosti počítače ======
@@ Řádek 34: / Řádek 36: @@
     - __instrukční registr__ - IR
       * uchovává právě zpracovávanou instrukci
+      * //neviditelný registr//, v podstatě se jedná o aktuální stav konečného automatu
     - __řadič__
       * řídí činnost procesoru  - vykonává instrukce
@@ Řádek 42: / Řádek 45: @@
     - __I/O jednotka__
       * umožňuje vstup a výstup dat do/z procesoru (obvykle do jeho registrů) i jinak než pouze skrz paměť
+      * TODO
     - __registry__
       * klopné obvody, které ochovávají informace po dobu napájení
@@ Řádek 49: / Řádek 53: @@
     - __Von Neumannova (princetonská) koncepce procesoru__
       * společná paměť pro data a programy
+<note>
+**Ještě tu dodávám tuto poznámku:**
+{{ :temata:07-princip_cinnosti_pocitace:usporadani_bytu.jpeg?600 |Uspořádání bytů}}
+</note>
   * **rozhraní procesoru**
     - __RESET__ - definuje obsah PC a inicializuje procesor
@@ Řádek 74: / Řádek 84: @@
   * **obvodová realizace procesoru**
     * při návrhu procesoru se vychází ze specifikace, která obsahuje požadavky na instrukční soubor, architekturu, šířku dat a adres, výkonnost, plochu na čipu, spotřebu atd.
-    * používali jsme (na příkladech, v projektu) tzv. __střádačovou architekturu__ - speciální registr střádač (acumulator) - do něj se ukládají výsledku z ALU
+    * používali jsme (na příkladech, v projektu) tzv. __střádačovou architekturu__ - speciální registr střádač (acumulator) - do něj se ukládají výsledku z ALU (existuje i zásobníková, registrová a smíšená)
+      - __zásobníková__ - má zásobník a registr SP (Stack pointer) a používají se operace PUSH m_a, POP m_a, nejsou registry
+      - __registrová__
+        * sada registrů - připojeny k ALU + sada FP (plovoucí řádová čárka) registrů - připojeny k FPU (operace v plovoucí řádové čárce)
+        * ADD R1, R2, R3
+{{ :temata:07-princip_cinnosti_pocitace:architektury.jpeg?600 |Architektury procesoru}}
 <note tip>
@@ Řádek 91: / Řádek 108: @@
       - vstup z datové sběrnice => přijde mu obsah z paměti daný adresou 123 => adresa obsahu, který chceme nahrát do akumulátoru
+{{ :temata:07-princip_cinnosti_pocitace:schema_procesoru.jpeg?600 |Schéma procesoru}}
+  * **klasifikace moderních procesorů**
+    * __parametr V__ - počet instrukcí, které se v jednom okamžiku vydají ke zpracování
+    * __parametr P__ - počet současně prováděných (rozpracovaných) instrukcí
+    - **subskalární procesory** - P = 1, V = 1 (286, 383) (bez zřetězeného zpracovaní)
+    - **skalární procesory** - P > 1, V = 1 - využívá řetězené zpracování (Pentium) (s zřetězeným zpracováním)
+    - **superskalární procesory** - P > 1, V > 1 (s zřetězeným zpracováním + multithreading/multicore)
+  * **Flynnova klasifikace procesorů**
+    * je založena na sledování počtu instrukčních a datových proudů v počítači
+    - jeden (single) instrukční resp. datový proud označujeme symboly SI resp. SD
+    - více než jeden proud (multiple) označujeme analogicky zkratkami MI resp. MD
+    * příklady:
+      * __SISD__ - von Neumannův počítač
+      * __SIMD__ - vektorový procesor - dva vektory (více čísel) sčítá jedna instrukce (např. grafická karta vykonává 1 instrukci na více datech[napr. pixelech])
+      * __MISD__ - více počítačů zpracovává stejná data (řídicí počítač Space Shuttle) - stehný problém řeší více počítačů => bezpečnost (výsledek všech počítačů se porovnává a vybírá výsledná hodnota [např. většina počítačů musí mít stejný výsledek])
+      * __MIMD__ - multiprocesorový systém (více instrukcí zpracovává více dat)
+  * **Současné kategorie procesorů**
+    * Univerzální (Intel, AMD, HP, IBM, ...)
+    * Grafické (Nvidia, ATI, Matrox, ...)
+    * Signálové (TI, Fujitsu, ...)
+    * Aplikační, např. pro mobilní telefony (Intel PXA250, ...)
+    * Multimediální (TI, Mpact, ...)
+    * Speciální (šifrovací, kompresní, např. pro MPEG-2, I/O, šachové, hrací, ...)
 ===== Urychlování činnosti procesoru =====
@@ Řádek 139: / Řádek 180: @@
   * princip zřetězení se značně překrývá s principy procesorů RISC
   * základní myšlenka:
-<note>"V procesorech CIS používají složité strojové instrukce (CPI>>1) pouze špičkový programátoři, ale standartí rutiny kompilátoru je nepoužívají."</note>
+<note>"V procesorech CISC používají složité strojové instrukce (CPI>>1) pouze špičkový programátoři, ale standartí rutiny kompilátoru je nepoužívají."</note>
 <note tip>**CPI** = průměrný počet taktů na jednu instrukci</note>
   * výhodnější by bylo implementovat pouze jednoduché, ale rychlé instrukce
@@ Řádek 175: / Řádek 216: @@
     * když jsou zapotřebí data z předcházející instrukce, která ještě není dokončena
     * {{:temata:07-princip_cinnosti_pocitace:datovy_konflikt.png|}}
-    * klasifikace
+    * klasifikace (nechť máme dve instrukce v pořadí (i, j)), Pozn. k významu (AAB: operace A se začne vykonávat před dokončením operace B)
-      * //RAW// - Read After Write
+      * //RAW// - Read After Write (j se snaží o přečtení registru předtím, než do něj i zapíše, j pak dostává starou hodnotu)
-      * //WAW// - Write After Write
+      * //WAW// - Write After Write (j se snaží zapsat do registru předtím, než do něj zapíše i, takže dojde k přepisu instrukcí i a instrukce j jakoby se nevykonala)
-      * //WAR// - Write After Read
+      * //WAR// - Write After Read (j zapisuje do registru předtím, než ho i přečtě)
     * **Bypassing**
       * poskytnutí mezivýsledku dřív než bude zapsán do registru
@@ Řádek 193: / Řádek 234: @@
   * experimenty bylo zjištěno, že četnost skoků v programech je značná - z toho se asi 83% povede
   * u skoků je třeba zrychlit zjištění cílové adresy (kam skočit), proto se používá malá cache pamět pro uložení cílových adres (//BTB// - Branch Target Buffer)
-  * u podmíněných skoků jsou navíc ještě vyhodnocovány podmínky, o jejich splnění je možné spelukovat **predikce skoků** - ta může být statická (kompilátor nastaví bit predikce) nebo dynamická (pomocí speciálního HW)
+  * u podmíněných skoků jsou navíc ještě vyhodnocovány podmínky, o jejich splnění je možné spekulovat **predikce skoků** - ta může být statická (kompilátor nastaví bit predikce) nebo dynamická (pomocí speciálního HW)
   * predikce (spekulace) probíhá podle předchozích směrů skoku (historii lze popsat binárním řetězcem několika bitů)
   * nejjednodušší prediktor = **Jednobitový prediktor**
     * použí 1 bit z historie (tj. předchozí skok) a předpovídá následující
     * {{:temata:07-princip_cinnosti_pocitace:jednobitovy_prediktor.png|}}
-    * stav 0 = skok se minule neprovedl, předpověd je neskoč (-)
+    * stav 0 = skok se minule neprovedl, předpověď je neskoč (-)
-    * stav 1 = skok se minile provedl => předpověd je skoč (+)
+    * stav 1 = skok se minile provedl => předpověď je skoč (+)
     * pokud je předpověd špatná musí být špatná větev programu ukončena a musí začít načítání instrukcí ze správné větve (je třeba aktualizovat BTB, to stojí několik taktů zřetězené linky)
 Zřetězené zpracování přináší urychlení výpočtu nejen v procesorech, ale i jiných číslicových obvodech (např. pro zpracování obrazu, bioinformatických dat apod.).
-Pokud použijeme zřetězené zpracování, musíme dodat řadu podpůrných oibvodů a řešit řadu nových problémů.
+Pokud použijeme zřetězené zpracování, musíme dodat řadu podpůrných obvodů a řešit řadu nových problémů.
 Moderní procesory používají kromě zřetězení i další koncepty:
   * superskalární architektury
-  * VLIW procesory
+  * VLIW procesory - má více ALU - tzn. může zároveň dělat více operací => k tomu slouží dlouhé instrukce
   * vektorové procesory
-  * multivlákonové procesory
+  * multivláknové procesory
 ==== CISC architektura ====
@@ Řádek 216: / Řádek 257: @@
   * vysoká složitost instrukcí => nutný systematický návrh řadiče procesoru
   * vykonání strojové instrukce probíhá posloupností mikrooperací (předpepsána mikroinstrukcí v řídící paměti)
-  * řidící paměti byly pevné (Read-Only Memory = ROM) a mnohem rychlejší než RAM
+  * řidící paměti byly pevné (Read-Only Memory = ROM) a mnohem rychlejší než RAM (je rychlejší načíst 1 složitou instrukci z RAM, která "obsahuje" 10 obyčených instrukcí, které se už načítají z napr. EEPROM než všech 10 instrukcí načítat z RAM)
   * díky vývoji mikrotechniky se řídící pamět přesuna na cache; to umožnilo držet krok s RISC architekturou
   * patří mezi nejvíce rozšířené (486, Pentium)

temata/07-princip_cinnosti_pocitace/main.1302604792.txt.gz · Poslední úprava: 2011/04/12 12:39 autor: george

Zobrazit stránku Starší verze

Zpětné odkazy Nahoru