6月25号,龙芯CPU设计者胡伟武博士在ISCA上的报告概观 ![图片已更新!!!] 原文出自:
http://bbs.chinaunix.net/thread-1171601-3-1.html6月25日
今天是ISCA的最好一天了,毕竟是在中国召开,所以组织者邀请了Weiwu Hu做了一个Invi
ted Talk——“Research and Development of Godson Processors”。
Weiwu Hu的这个Talk主要包含两部分内容:
1.龙芯的过去几年的发展路线与未来几年的目标;
2.用龙芯研制过程中经历8个经验与教训来批判“Paper to Paper”工作
龙芯的成长在这里我就不展开介绍了,而对于未来,龙芯要集成多核、x86兼容、通用+专
用异构的等功能。Hu抛出两个承诺:一是今年第三季度4核的龙芯3要流片回来;二是龙芯多
核时钟级模拟器将在今年第四季度公开源码,供学术界研究。
Hu报告言辞最激动的还是在他的第二部分,也是以批判当前体系结构研究作为出发点。他
认为:(有些有些遗忘,大家知道的补充吧)
[1] 现在研究是“P2P”(Paper to Paper),而有价值的应该是“Paper to Silicon”
;
[2] 学术研究只关注“Best Case”,而工程则关注“Worst Case”;
[3] Simulator cheat you; FPGA cheat you; Textbook cheat you; 他举了若干个例子
来说明这些“cheat”,如,用10MHz的FPGA仿真时未考虑到100MHz Memory导致仿真结果比
实际芯片好20~30%;一个4-way Cache替换算法使用的计数器频率是Core频率的1/2或者1/4
时导致只替换even way;又如David Patterson的Textbook中说indirect branch instruct
ions只占到了所有条件转移的不到10%,所以他们便没有做这些指令的Prediction,导致Br
anch prediction Miss Rate很高,所以后来还是把Branch Target Buffer实现了一把,获
得了11%的性能提高;再如未考虑到SPEC CPU执行时TLB Miss带来的OS开销,导致有些应用
OS执行占到了30%,于是对大页面进行了研究……
更多的例子,大家可以去看这篇文章
http://jcst.ict.ac.cn/ptafile%5C3942.pdf。其
实,从我掌握的知识来看,Prof. Hu提出的有些例子在以往一些Paper中已经有研究过或者
说明过了。当然,从他的这些例子中可以,还是看出龙芯团队在调试与优化方面花了不少的
心血,也许这些经验与教训的确只有亲身经历后才有深刻体会。
Hu报告正到语调高昂的时候,忽然投影仪黑了,当时我们都以为龙芯笔记本出问题了。Pr
of. Hu也换了一个准备好的其他笔记本,可以投影仪还是没有显示,现场不安起来……
David Patterson这位大牛真是特别善解人意,站起来率先提问,安定现场民心。 他问道
,龙芯团队现在有多少人,Hu说有100人研发,然后又补充还有200人做产业化,David Pat
terson笑着说了一句话,“中国还是市场大啊”(大意),现场又笑了起来。此时工作人员
把投影仪弄好,还好不是龙芯笔记本的问题。David Patterson回到了座位,Hu继续后面的
报告。
报告结束后,国外的研究人员提了2个问题,他们似乎对这些经验与教训并不是很关心,反
而对初见雏形的龙芯很赶感兴趣。Stanford的Christos Kozyraki关心的是龙芯的功耗为何
那么低,而另一个则问了一个关于流水线级数的问题。
总的来说,这也是第一次龙芯在国际体系结构研究人员的亮相,算是在学术圈里也做了一
次宣传。
预告:龙芯还会在今年的HotChip上再次亮相。
====================================
最后,还有2个Track,4个Session。我听了Application Acceleration和Performance Ev
aluation
Application Acceleration Session
前面两个报告和我方向还是有一些差别,听完以后也没有什么印象。第三个报告就是今年
大陆唯一的一篇ISCA,来自Haibo Chen的SHIFT。我听得比较认真,相比与之前听得那么多
的报告,我觉得他的工作要做更漂亮扎实,报告内容也很翔实精彩。不禁感叹,大陆的土鳖
们要在ISCA这样的Top Conference上发表,没有牛人署名撑腰的话,只有靠比别人更出彩的
工作。好在这几年的发展趋势越来越好,相信未来若干年后,这些会议的PC中定会出现越来
越多大陆学者的名字。
Performance Evaluation Session
第一篇文章是“Software-Controlled Priority Characterization of POWER5 Processo
r”,就是用软件利用POWER5自身提供的设置线程priority功能,取得了比原来Linux傻调度
策略更好的效果,类似于一篇实验分析技术报告。
今年ISCA最后一篇是“Learning and Leveraging the Relationship between Architect
ure-Level Measurements and Individual User Satisfaction”,很有创意,研究用户的
满意程度。他们首先分析用户对应用程序的满意度随着机器性能变化有不同表现曲线。比如
随着性能由低到高,用于满意度有的是平的,有的是线性,有的是突变型,有的是阶梯形。
因此他们就设计了一个算法,能尽量满足用户的同时降低功耗,效果较好。
现在的会议好像很鼓励这种有创意的文章,我看过SC05有一篇研究非专业人员学习并行编
程的文章,ISCA05有一篇是利用P4处理器的降频功能,在一台4路的SMP上模拟异构多核机器
,分析对应用性能的影响,都很有意思。
======================================
至此,ISCA08终于结束了,下午还有安排去长城旅游。
第一次亲历ISCA,这里留下了很多让我细细回味的收获……

胡伟武研究员在ISCA-35 2008大会上发表演讲

UC berkeley大学的David A. Patterson教授进行现场提问

胡伟武研究员现场演讲所使用的龙芯小笔记本

龙芯2F盒子, 6003型主板谍照

龙芯2F 7英寸屏便携笔记本,就是会议上用的笔记本


为了节约成本,采用了9英寸屏的外型,其他都还好


售价2000左右
============================
下面是2F盒子


龙芯2F盒子与外置光驱盒在一起

龙芯2F盒子与PC机箱相比好小哦
