电脑硬件基本名词解释-------cpu

独步人 · 发表于 2004-10-9 20:23:00

RISC技术

相信大家在日常电脑使用或CPU的广告介绍中时常听到见到“RISC”这个词，什么Pentium Ⅱ/Pro采用先进RISC技术……K6采用RISC86结构，从而……总之大凡稍高档点的中央处理器都称采用RISC技术。

　　那么RISC究竟是什么东西呢?(如果你是电脑初学爱好者，并想从事电脑的开发、学习，那你应认真读一读，因为它是计算机技术中一个相当重要的环节)。

　　首先，要了解RISC技术就该从计算机的指令谈起，我们都知道计算机的工作就是取指令、执行指令，一条指令一般给出的是操作码和地址码，这是基本的结构。

　　然而指令又涉及以下几个问题。首先指令字长有多少位，是定字长还是变字长；其次，操作码结构需几位，位数是定量还是浮动量；再次，地址的结构和寻址方式如何。

　　这种种因素使计算机指令产生了“简单指令”和“复杂指令”之分。70年代以前的计算机均用传统的CISC指令结构，即完全采用复杂指令来支持高级语言、应用程序和操作系统。这种PC不但成本高且效率较低，速度受限。

　　后来人们发现机器执行的指令中85％左右的都是简单指令，复杂指令甚少，因此开始研制精简指令系统计算机(RISC)。自从Intel的Pentium问世以来(92年末)，RISC技术更是得到了广泛的应用，并开始渗透到小、中、大型机领域，可谓发展前景一片光明。

　　下面具体谈谈RISC技术。CPU执行运算速度受三个因素的影响(1)程序中指令数I，(2)每条指令执行所用周期数CPI，(3)周期时间T。这三者又有：程序执行时间=I＊CPI＊T，因此，从这个等式可看出减小其中任一个都可提高CPU的速度，因此RISC技术就从这三方面下手，对I、CPI、T进行优化改良，其措施如下：

　　1、采用多级指令流水线结构

　　采用流水线技术可使每一时刻都有多条指令重叠执行，以减小CPI的值，使CPU不浪费空周期。实例：Pentium Ⅱ/Pro/Celeron可同时发出执行五条指令，AMD－K6/K6－2可同时发出六条指令。

　　2、选取机器中使用频率最高的简单指令及部分复杂指令

　　这样可减小时钟周期数量，提高CPU速度，其实质是减小CPI下的值实现。实例：选取运算指令、加载、存储指令和转移指令作主指令集。

　　3、采用加载(Load)、存储(Store)结构

　　只允许Load和Store指令执行存储器操作，其余指令均对寄存器操作。实例：Amd－K6/K6－2、PⅡ/Celeron/Pro均支持对寄存器的直接操作和重新命名，并大大增加通用寄存器的数量。

　　4、延迟加载指令和转移指令

　　由于数据从存储器到寄存器存在二者速度差、转移指令要进行入口地址的计算，这使CPU执行速度大大受限，因此，RISC技术为保证流水线高速运行，在它们之间允许加一条不相关的可立即执行的指令，以提高速度。

　　实例：主要体现于预测执行、非顺序执行和数据传输等方面，除Intel P54/55C不支持，像K6－2、PⅡ均支持。

　　5、采用高速缓存(cache)结构

　　为保证指令不间断地传送给CPU运算器，CPU设置了一定大小的Cache以扩展存储器的带宽，满足CPU频繁取指需求，一般有两个独立Cache，分别存放“指令＋数据”。

　　实例：PⅡ/Celeron:16K＋16K，AMD－K6/K6－2为32K＋32K，Cyrix MⅡ:64K(实也为2个32K Cache，此作共享Cache)，PⅡ还加了L2 Cache，更是大幅提高了CPU速度。

　　以上简谈了RISC的精髓，望对计算机爱好者有所帮助，希望你能在通向计算机宝库的大道上迈进一步!

独步人 · 发表于 2004-10-9 20:24:00

CPU术语解释

从上个世纪到现在，我一直写了多篇关于新千年CPU的文章，限于文章的篇幅问题，我没有对那些专业的术语进行解释，可能导致阅读时出现“知其然，不知其所以然”的情况，下文专门用来补充以往的不足，这些术语按0~9和A~Z的方式来排序。

3DNow!(3D no waiting)

　　AMD公司开发的SIMD指令集，可以增强浮点和多媒体运算的速度，它的指令数为21条。

ALU(Arithmetic Logic Unit，算术逻辑单元)

　　在处理器之中用于计算的那一部分，与其同级的有数据传输单元和分支单元。

BGA(Ball Grid Array，球状矩阵排列)

　　一种芯片封装形式，例：82443BX。

BHT(branch prediction table，分支预测表)

　　处理器用于决定分支行动方向的数值表。

BPU(Branch Processing Unit，分支处理单元)

　　CPU中用来做分支处理的那一个区域。

Brach Pediction（分支预测）

　　从P5时代开始的一种先进的数据处理方法，由CPU来判断程序分支的进行方向，能够更快运算速度。

CMOS（Complementary Metal Oxide Semiconductor，互补金属氧化物半导体）

　　它是一类特殊的芯片，最常见的用途是主板的BIOS（Basic Input/Output System，基本输入/输出系统）。

CISC(Complex Instruction Set Computing，复杂指令集计算机)

　　相对于RISC而言，它的指令位数较长，所以称为复杂指令。如：x86指令长度为87位。

COB(Cache on board，板上集成缓存)

　　在处理器卡上集成的缓存，通常指的是二级缓存，例：奔腾II

COD(Cache on Die，芯片内集成缓存)

　　在处理器芯片内部集成的缓存，通常指的是二级缓存，例：PGA赛扬370

CPGA(Ceramic Pin Grid Array，陶瓷针型栅格阵列)

　　一种芯片封装形式。

CPU(Center Processing Unit，中央处理器)

　　计算机系统的大脑，用于控制和管理整个机器的运作，并执行计算任务。

Data Forwarding（数据前送）

　　CPU在一个时钟周期内，把一个单元的输出值内容拷贝到另一个单元的输入值中。

Decode（指令解码）

　　由于X86指令的长度不一致，必须用一个单元进行“翻译”，真正的内核按翻译后要求来工作。

EC(Embedded Controller，嵌入式控制器)

　　在一组特定系统中，新增到固定位置，完成一定任务的控制装置就称为嵌入式控制器。

Embedded Chips(嵌入式)

　　一种特殊用途的CPU，通常放在非计算机系统，如：家用电器。

EPIC(explicitly parallel instruction code，并行指令代码)

　　英特尔的64位芯片架构，本身不能执行x86指令，但能通过译码器来兼容旧有的x86指令，只是运算速度比真正的32位芯片有所下降。

FADD（Floationg Point Addition，浮点加）

FCPGA(Flip Chip Pin Grid Array，反转芯片针脚栅格阵列)

　　一种芯片封装形式，例：奔腾III 370。

FDIV（Floationg Point Divide，浮点除）

FEMMS（Fast Entry/Exit Multimedia State，快速进入/退出多媒体状态）

　　在多能奔腾之中，MMX和浮点单元是不能同时运行的。新的芯片加快了两者之间的切换，这就是FEMMS。 FFT（fast Fourier transform，快速热欧姆转换）

　　一种复杂的算法，可以测试CPU的浮点能力。

FID(FID：Frequency identify，频率鉴别号码)

　　奔腾III通过ID号来检查CPU频率的方法，能够有效防止Remark。

FIFO(First Input First Output，先入先出队列)

　　这是一种传统的按序执行方法，先进入的指令先完成并引退，跟着才执行第二条指令。

FLOP(Floating Point Operations Per Second，浮点操作/秒)

　　计算CPU浮点能力的一个单位。

FMUL(Floationg Point Multiplication，浮点乘）

FPU(Float Point Unit，浮点运算单元)

　　FPU是专用于浮点运算的处理器，以前的FPU是一种单独芯片，在486之后，英特尔把FPU与集成在CPU之内。

FSUB(Floationg Point Subtraction，浮点减）

HL-PBGA（表面黏著、高耐热、轻薄型塑胶球状矩阵封装）

　　一种芯片封装形式。

IA(Intel Architecture，英特尔架构)

　　英特尔公司开发的x86芯片结构。

ID（identify，鉴别号码）

　　用于判断不同芯片的识别代码。

IMM（Intel Mobile Module, 英特尔移动模块）

　　英特尔开发用于笔记本电脑的处理器模块，集成了CPU和其它控制设备。

Instructions Cache（指令缓存）

　　由于系统主内存的速度较慢，当CPU读取指令的时候，会导致CPU停下来等待内存传输的情况。指令缓存就是在主内存与CPU之间增加一个快速的存储区域，即使CPU未要求到指令，主内存也会自动把指令预先送到指令缓存，当CPU要求到指令时，可以直接从指令缓存中读出，无须再存取主内存，减少了CPU的等待时间。

Instruction Coloring（指令分类）

　　一种制造预测执行指令的技术，一旦预测判断被相应的指令决定以后，处理器就会相同的指令处理同类的判断。

Instruction Issue（指令发送）

　　它是第一个CPU管道，用于接收内存送到的指令，并把它发到执行单元。

IPC（Instructions Per Clock Cycle，指令/时钟周期）

　　表示在一个时钟周期用可以完成的指令数目。

KNI(Katmai New Instructions，Katmai新指令集，即SSE)

Latency（潜伏期）

　　从字面上了解其含义是比较困难的，实际上，它表示完全执行一个指令所需的时钟周期，潜伏期越少越好。严格来说，潜伏期包括一个指令从接收到发送的全过程。现今的大多数x86指令都需要约5个时钟周期，但这些周期之中有部分是与其它指令交迭在一起的（并行处理），因此CPU制造商宣传的潜伏期要比实际的时间长。

LDT(Lightning Data Transport，闪电数据传输总线)

　　K8采用的新型数据总线，外频在200MHz以上。

MMX（MultiMedia Extensions，多媒体扩展指令集）

　　英特尔开发的最早期SIMD指令集，可以增强浮点和多媒体运算的速度。

MFLOPS(Million Floationg Point/Second，每秒百万个浮点操作)

　　计算CPU浮点能力的一个单位，以百万条指令为基准。

NI（Non－Intel，非英特尔架构）

　　除了英特尔之外，还有许多其它生产兼容x86体系的厂商，由于专利权的问题，它们的产品和英特尔系不一样，但仍然能运行x86指令。

OLGA(Organic Land Grid Array，基板栅格阵列)

　　一种芯片封装形式。

OoO(Out of Order，乱序执行)

　　Post-RISC芯片的特性之一，能够不按照程序提供的顺序完成计算任务，是一种加快处理器运算速度的架构。

PGA（Pin-Grid Array，引脚网格阵列）

　　一种芯片封装形式，缺点是耗电量大。

Post-RISC

　　一种新型的处理器架构，它的内核是RISC，而外围是CISC，结合了两种架构的优点，拥有预测执行、处理器重命名等先进特性，如：Athlon。

PSN(Processor Serial numbers，处理器序列号)

　　标识处理器特性的一组号码，包括主频、生产日期、生产编号等。

PIB（Processor In a Box，盒装处理器）

　　CPU厂商正式在市面上发售的产品，通常要比OEM（Original Equipment Manufacturer，原始设备制造商）厂商流通到市场的散装芯片贵，但只有PIB拥有厂商正式的保修权利。

PPGA(Plastic Pin Grid Array，塑胶针状矩阵封装)

　　一种芯片封装形式，缺点是耗电量大。

PQFP(Plastic Quad Flat Package，塑料方块平面封装)

　　一种芯片封装形式。

RAW(Read after Write，写后读)

　　这是CPU乱序执行造成的错误，即在必要条件未成立之前，已经先写下结论，导致最终结果出错。

Register Contention（抢占寄存器）

　　当寄存器的上一个写回任务未完成时，另一个指令征用此寄存器时出现的冲突。

Register Pressure（寄存器不足）

　　软件算法执行时所需的寄存器数目受到限制。对于X86处理器来说，寄存器不足已经成为了它的最大特点，因此AMD才想在下一代芯片K8之中，增加寄存器的数量。

Register Renaming（寄存器重命名）

　　把一个指令的输出值重新定位到一个任意的内部寄存器。在x86架构中，这类情况是常常出现的，如：一个fld或fxch或mov指令需要同一个目标寄存器时，就要动用到寄存器重命名。

Remark（芯片频率重标识）

　　芯片制造商为了方便自己的产品定级，把大部分CPU都设置为可以自由调节倍频和外频，它在同一批CPU中选出好的定为较高的一级，性能不足的定位较低的一级，这些都在工厂内部完成，是合法的频率定位方法。但出厂以后，经销商把低档的CPU超频后，贴上新的标签，当成高档CPU卖的非法频率定位则称为Remark。因为生产商有权力改变自己的产品，而经销商这样做就是侵犯版权，不要以为只有软件才有版权，硬件也有版权呢。

Resource contention（资源冲突）

　　当一个指令需要寄存器或管道时，它们被其它指令所用，处理器不能即时作出回应，这就是资源冲突。

Reti

独步人 · 发表于 2004-10-9 20:25:00

二级缓存简介

CPU缓存（Cache Memoney）位于CPU与内存之间的临时存储器，它的容量比内存小但交换速度快。在缓存中的数据是内存中的一小部分，但这一小部分是短时间内CPU即将访问的，当CPU调用大量数据时，就可避开内存直接从缓存中调用，从而加快读取速度。由此可见，在CPU中加入缓存是一种高效的解决方案，这样整个内存储器（缓存+内存）就变成了既有缓存的高速度，又有内存的大容量的存储系统了。缓存对CPU的性能影响很大，主要是因为CPU的数据交换顺序和CPU与缓存间的带宽引起的。　

缓存的工作原理是当CPU要读取一个数据时，首先从缓存中查找，如果找到就立即读取并送给CPU处理；如果没有找到，就用相对慢的速度从内存中读取并送给CPU处理，同时把这个数据所在的数据块调入缓存中，可以使得以后对整块数据的读取都从缓存中进行，不必再调用内存。

正是这样的读取机制使CPU读取缓存的命中率非常高（大多数CPU可达90%左右），也就是说CPU下一次要读取的数据90%都在缓存中，只有大约10%需要从内存读取。这大大节省了CPU直接读取内存的时间，也使CPU读取数据时基本无需等待。总的来说，CPU读取数据的顺序是先缓存后内存。

最早先的CPU缓存是个整体的，而且容量很低，英特尔公司从Pentium时代开始把缓存进行了分类。当时集成在CPU内核中的缓存已不足以满足CPU的需求，而制造工艺上的限制又不能大幅度提高缓存的容量。因此出现了集成在与CPU同一块电路板上或主板上的缓存，此时就把 CPU内核集成的缓存称为一级缓存，而外部的称为二级缓存。一级缓存中还分数据缓存（I-Cache）和指令缓存（D-Cache）。二者分别用来存放数据和执行这些数据的指令，而且两者可以同时被CPU访问，减少了争用Cache所造成的冲突，提高了处理器效能。英特尔公司在推出Pentium 4处理器时，还新增了一种一级追踪缓存，容量为12KB.

随着CPU制造工艺的发展，二级缓存也能轻易的集成在CPU内核中，容量也在逐年提升。现在再用集成在CPU内部与否来定义一、二级缓存，已不确切。而且随着二级缓存被集成入CPU内核中，以往二级缓存与CPU大差距分频的情况也被改变，此时其以相同于主频的速度工作，可以为CPU提供更高的传输速度。

二级缓存是CPU性能表现的关键之一，在CPU核心不变化的情况下，增加二级缓存容量能使性能大幅度提高。而同一核心的CPU高低端之分往往也是在二级缓存上有差异，由此可见二级缓存对于CPU的重要性。

CPU在缓存中找到有用的数据被称为命中，当缓存中没有CPU所需的数据时（这时称为未命中），CPU才访问内存。从理论上讲，在一颗拥有二级缓存的CPU中，读取一级缓存的命中率为80%。也就是说CPU一级缓存中找到的有用数据占数据总量的80%，剩下的20%从二级缓存中读取。由于不能准确预测将要执行的数据，读取二级缓存的命中率也在80%左右（从二级缓存读到有用的数据占总数据的16%）。那么还有的数据就不得不从内存调用，但这已经是一个相当小的比例了。目前的较高端的CPU中，还会带有三级缓存，它是为读取二级缓存后未命中的数据设计的—种缓存，在拥有三级缓存的CPU中，只有约5%的数据需要从内存中调用，这进一步提高了CPU的效率。

为了保证CPU访问时有较高的命中率，缓存中的内容应该按一定的算法替换。一种较常用的算法是“最近最少使用算法”（LRU算法），它是将最近一段时间内最少被访问过的行淘汰出局。因此需要为每行设置一个计数器，LRU算法是把命中行的计数器清零，其他各行计数器加1。当需要替换时淘汰行计数器计数值最大的数据行出局。这是一种高效、科学的算法，其计数器清零过程可以把一些频繁调用后再不需要的数据淘汰出缓存，提高缓存的利用率。

CPU产品中，一级缓存的容量基本在4KB到18KB之间，二级缓存的容量则分为128KB、256KB、512KB、1MB等。一级缓存容量各产品之间相差不大，而二级缓存容量则是提高CPU性能的关键。二级缓存容量的提升是由CPU制造工艺所决定的，容量增大必然导致CPU内部晶体管数的增加，要在有限的CPU面积上集成更大的缓存，对制造工艺的要求也就越高。

独步人 · 发表于 2004-10-9 20:27:00

LGA775简介

LGA（Land Grid Array，栅格阵列封装）也就是Socket T，它是一种全新的处理器封装接口，和现时我们所见的Pentium 4处理器的Socket 478接口完全不一样，其特征是没有了以往的针状插脚，而是采用的金属触点式的封装方式。采用LGA775接口的处理器在安装方式上与现时的产品也有很大的不同，它并不能利用针脚固定接触，而是需要一个安装扣架固定，令CPU可以正确压在Socket露出来的具弹性的触须上，其原理就像BGA封装一样，只不过BGA是用锡焊死，而LGA则是可以随是解开扣架而更换芯片。LGA的封装接口支持底层和主板之间的直接连接，而且可以均衡分担信号，对频率的提升很有益处，能够使CPU在不提高成本的情况下加大针脚的密度，将为处理器和主板的发展提供更大的空间，处理器的频率、性能（别忘了还有耗电量）将在这个新架构上继续提升，突破Socket478的瓶颈。

前面说过LGA775封装的处理器最大特点就是没有针脚，不用担心针脚受损伤，由于核心也有坚固的金属顶盖保护，所以新一代的Pentium 4是相当坚固的。不过，相对的，针脚其实是做到了主板的CPU插槽内，这也使得LGA775的插座构造变得更为复杂，而且插槽内柔软而富弹性的触须很容易弄断，千万不能用手指去触碰，就算没有弄断也可能会做成短路及接触不良，不单主板报销，CPU也可能魂归天国。据多家主板的厂商的报告指出，LGA775的处理器插座的实在太脆弱了，竟然在运输过程中就有不少主板因Socket损坏而报销，更有甚者称它的使用寿命只有5次，实在令人担心。

不过实际情况要比传闻中乐观得多，Intel和众多主板厂商早已经注意到LGA775插座的问题，并且着手进行改善。虽然LGA775插座依然脆弱，不过情况已经大有改观，至少并不会像传闻中那样使用5次就魂归天国，我们在测试中拔插CPU不下十多次也未见损坏。

独步人 · 发表于 2004-10-9 20:28:00

流水线

在INTEL486中开始使用，它的工作方式就象工业生产上的装配流水线，由5-6个不同功能的电路单元（指令、译码、发生地址、执行指令和数据回写等单元）组成一条指令处理流水线，将一条X86指令分为几段由这些电路单元分别执行，这样在一个时钟周期内完成一条指令，可以提高CPU的运算速度。进入奔腾，在CPU内设置两条各自独立电路单元的流水线，可通过这两条流水线来同时执行两条命令，达到在一个时钟周期内完成两条指令。

		自动登录	找回密码
密码			立即注册