中国台湾的X86芯片往事

2020-04-27 18:56:55 来源: Sophie

来源:内容来自「 technews 」,谢谢。


1998年10月,曾有一间很小的x86处理器厂商,很低调的推出低功耗的低价位产品,但在1999年底,就闪电退出市场,转战嵌入式应用。某个晚上,笔者被某位在竹科工作的友人敲讯息:「你知道这颗CPU是靠台湾资金做出来的吗,听说老板还是台湾人」。

什么,真的还假的?

和台湾颇有渊源的Rise


Rise Technology(华巨资讯)成立于1993年,由曾在NEC负责RISC处理器产品行销的林廷隆(David T.Lin)成立,位于美国加州圣塔克拉拉(Sata Clara,因为英特尔总部也在那边,时常昵称为「Satan Clara」)。

Rise募集到的3,000万美元创业资金,主要来自投资银行(BT Alex Brown,Needham&Company)、风险创投(Draper Fisher Associates),以及包含个人电脑制造商(宏碁电脑)、芯片厂商(威盛电子)与晶圆代工业者(联华电子)等15个台湾投资者。

1993~1998年,历经5年,Rise美国总部累积了将近100名工程与行销团队,成员大都来自Amdahl、HP、IBM、LSI Logic、MIPS、NEC、Sun 及其他业界知名电脑厂商,并在台湾新竹设立业务办公室。

这算是联电功败垂成的x86处理器产品线之后,以及威盛电子(VIA)购并Centaur与Cyrix之前,最具台湾色彩的x86处理器厂商。

有趣的是,根据1998年底的微处理器报导(Microprocessor Report),关于Rise mP6交由哪间晶圆代工厂商生产,那时IBM、意法半导体(STM)和德州仪器(TI)都是榜上有名的候选人,最后还是统统交给台积电搞定了。

暗藏目标笔电市场的野心


与晚两年登场的Transmeta Crusoe相似,低功耗的Rise iDragon mP6打从一开始就寄望攻入英特尔垄断的笔电市场。这从两个地方可清楚看出端倪:原生BGA封装(称为Turbo Thermal BGA,或简写T2BGA),以及支援系统管理模式(SMM,System Management Mode),尤其后者对笔电厂商来说,特别举足轻重。

那么BGA封装的Rise mP6要相容Socket 7脚座的方法就是把处理器打在一片提供PGA 296 针脚的载板(Interposer)上,这也让Rise mP6 的外观相当与众不同。


英特尔在80386SL和80486SL处理器制定SMM的初衷,在于让笔电OEM厂商可自行定义必备的电源管理与周边装置管理,例如为了省电,动态关闭用不到的周边设备,需要时再重新启动等。英特尔在Pentium 时代将SMM 从「笔电专属的特殊武器」提拔成「所有产品的制式装备」,暗示英特尔认定笔电即将普及化的未来。

但反过来讲,既然Rise丝毫不考虑进军伺服器市场,所以多处理器环境必备的先进可程式化中断控制器(APIC,Advanced Programable Interrupt Controller)就跟着付之阙如了。

顺道一提,相对于x86指令集在节区定址定义的Ring 0到Ring 3四层权限(数字越小权力越大),SMM 的权限经常戏称为Ring -2,因SMM独立于真实模式和保护模式,干了哪些好事,连作业系统都不知情。那Ring-1跑到哪里去了呢?答案是x86硬体虚拟化技术,用来拦截「在使用者模式,仍会更动系统底层的危险指令」的那一层。


追求极致的架构性效率


论「追求每个时脉周期可完成的最大指令数」的「架构性效率」,相较于稍早的Cyrix 和AMD,Rise直接提供和英特尔P6(Pentium Pro、Pentium II、Pentium III)同等级的3个指令解码器,可谓有过之而无不及。Rise mP6 的内部执行单元规模亦不含糊,总计配置了3个整数逻辑运算器(ALU)、7个MMX 单元、与一个管线化的x87浮点运算器。

但大概为了控制成本,第一阶资料快取记忆体的总容量才区区16kB,显得未免太吝啬了,只等于早期Pentium的水准,远不如同期对手。


Rise mP6并不像AMD K5/ K6和Cyrix M1/M2,并未采取非循序指令执行,不禁让人联想起坚持「暂存器更名是魔鬼的工作」而拒而远之的Centaur。
此外,Rise mP6也不像AMD K5/ K6会将「将复杂的x86指令,转译为固定长度的RISC 型态微指令」。8阶指令管线中,也只有一个阶段用于x86指令解码,形同明显的瓶颈,讲白了就是对「激增时脉」这档事不感兴趣,这点极神似Transmeta的风格。

Rise mP6设定的对手并非英特尔,而是同时期的其他x86小厂。从这个角度来看,Rise mP6的晶粒面积有点大得夸张,也难以像英特尔,可让产品以高单价销售,获取丰厚利润。这也是除AMD外,英特尔的竞争者一间一间被迫退出市场的远因。


不过,Rise mP6却有不少令人惊喜、今天看来还是让人觉得非常厉害的巧思。
以「自动撷取分支目标」(Automomous Prefetch)为例,无关现正执行的指令流,Rise mP6 可根据分支预测得到的指令流程,预先撷取最多横跨4条指令流的指令序列,只要预测正确,可大幅缩短撷取分支目标指令的延迟。这技术几乎是英特尔NetBurst(Pentium 4)的「执行追踪微指令快取」(Trace Cache)和AMD 推土机的「解藕式分支预测」(Decoupled Branch Prediction)概念雏型。


英特尔 NetBurst透过「分支预测判断的实际指令流」,存放解码后的微指令(uOP)。如处理器重复执行相同的程式区段,无需重新从记忆体撷取指令并解码之。图中的案例,也恰巧是4 个分支目标(T1-T4)。


AMD推土机的分支预测机制与指令撷取单元「脱钩」,可锁定分支预测目标的相对位址,假使不存在指令快取内,就「主动出击」预先撷取,可掩盖发生快取误失时的延迟。并在Zen 2世代,替更耗时的机械学习分支预测器TAGE「争取训练的时间」,大幅强化AMD处理器的分支预测精准度。


可能基于消费性市场的行销诉求,Rise极度重视MMX指令集和浮点运算的执行效能,7个MMX 单元,最多可每个时脉周期执行3个MMX指令。管线化的x87 浮点运算单元,可一并执行交换x87 浮点暂存器堆叠的FXCH指令,这刚好是Cyrix AMD难以抗衡英特尔的大弱点。


Rise mP6最有趣的特色,莫过于可将其中一个ALU的资料,同时传送到另一个3 输入的ALU。


功能非常简单易懂,假如要同时执行这两个指令,第二个指令需要第一个指令的AX结果,会导致管线停滞。
AX ← AX+BX
DX ← DX+AX

但藉由将原先的BX暂存器「转送」到3输入的ALU,即可同时执行。
AX ← AX+BX
DX ← DX+AX+BX

简而言之,Rise经由简单的手段,解决单纯的资料相依性麻烦,或多或少弥补缺乏非循序指令执行的不足。

至于难搞到极点、连英特尔自己都承认「研发x86 处理器的最高门槛」的「确保x86 指令集相容性没有问题」,Rise 则外包给独立实验室XXCAL。

还没开始就结束的第二代mP6


1998年8月24日发表内建128kB第二阶快取的Celeron 300A(应该不少人还记得300 超450 的传奇故事),象征英特尔正式启动P6 体系(Pentium Pro、Pentium II)彻底取代P5 家族(Pentium)的转移战略。

所有对抗英特尔的x86 处理器厂商,势必设法提高产品竞争力,毕竟在AMD K7 出现前,没有任何一款长期依附在Socket 7脚座的x86处理器微架构,可正面迎击由内到外、每个环节都面面俱到的P6。也因此,从Socket 7 的AMD K6-III 到Socket 370的VIA Cyrix III,无不「加装」256kB第二阶快取记忆体,Rise 当然也不能免俗。

按照Rise的原订产品时程表,预定1999年中发表的mP6 II,将新增256kB第二阶快取记忆体,资料和指令存取延迟,仅分别4 与3 个时脉周期,只有Celeron A(128kB)的一半。

唯一的隐患是:0.25um(250 纳米)制程时,预期中的Rise mP6 II晶粒面积,将高达170mm²,与同样256kB 的Pentium II不分轩轾,转进0.18um(180 纳米)制程势在必行。Rise乐观的预估,核心电压可压低到2V 的mP6 II,功耗可低于10瓦,整合式第二阶快取将减少对外记忆体存取频率,也间接让系统更省电。

但别说mP6 II了,1999年5月6日公开的0.18um制程mP6 PR333 / PR366,仅停留工程于样品阶段,Rise就决定转变经营路线,改为专注于视讯机上盒与资讯家电,也在当年被矽统(SiS)购买所有处理器技术及相关智慧财产权。SiS寄望在低价电脑市场,找出一条击败英特尔的途径。

Rise mP6在1999年12月前退市,在x86桌上型处理器市场,昙花一现,如流星稍纵即逝。接着就如我们熟知的,1999年6月23日降临,性能空前出色的AMD K7,与接连爆发的1GHz时脉争夺战,注定了x86处理器市场,终究只会剩下两间大厂互殴的结局,最起码在伺服器、工作站、桌机、笔电等领域,确实如此。

逃跑并不可耻且很有用


Rise mP6并未就此消失,Rise在2001年COMPUTEX,展示iDragon mP6-500MIPS IA处理器,供电仅采用一般市售三号电池,即可播放VCD 电影达数小时之久。在2001年10月4日问世的SiS 550 系统单芯片系列,即整合了mP6 核心,与源自Cyrix MediaGX 的国家半导体(National Semiconductor)Geode 正面竞争。

随后DM&P(瞻营全电子)将SiS 551重新命名为M6127D,并以mP6为开端,发展了一系列Vortex86系统单芯片,也授权泰国的Xcore 重塑成Xcore86品牌。


总之,这些厂商之间「互通有无」的细节,与错综复杂的关系,其实我们管不着,况且这部分可以考证的资料真的很有限,就别为难笔者了。但可以肯定的是:逃跑并不可耻且很有用。很难想像,假若Rise像Transmeta那样「硬撑」5年,一直烧钱(如果还有得烧),会沦为何等悲惨的下场。

讲了这么多,Rise mP6的性能表现,究竟是好是坏?坦白讲,有很重要吗?还不如瞧瞧谣传中藏在mP6里的「彩蛋」。谁说彩蛋只限于软体?

当初出身于纽西兰的Rise主任工程师Chris Norrie,据他所称,只要将代表纽西兰(New Zealand)的国码简写NZ,以ASCII码写入EAX暂存器,并执行CPUID指令,从EAX到EDX暂存器的内容就会出现他的姓名。最让他感到骄傲的时刻是:他写个几行组合语言做这件事,将暂存器的内容复制到记忆体,再呼叫BIOS将字串印出到萤幕。

可以瞒过整个工程研发团队和产品验证部门,将这个「硬体彩蛋」深藏不露的埋在处理器微码内,看起来好像满了不起的,哪位大恩大德能否测试看看这彩蛋是否属实?顺便看看CPUID的制造商代码,是否如微处理器报导所言,叫做「RiseRiseRise」?

*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。


今天是《半导体行业观察》为您分享的第2292期内容,欢迎关注。

推荐阅读


浦东芯片三十年

国内半导体进入收购扩张期

苹果最具野心的芯片计划

半导体行业观察

半导体第一垂直媒体

实时 专业 原创 深度


识别二维码 ,回复下方关键词,阅读更多

中国半导体|苹果 |封测 蓝牙 |设备 |晶圆|英伟达|射频|台积电



回复 投稿 ,看《如何成为“半导体行业观察”的一员 》

回复 搜索 ,还能轻松找到其他你感兴趣的文章!

责任编辑:Sophie
半导体行业观察
摩尔芯闻

热门评论