海归网首页   海归宣言   导航   博客   广告位价格  
海归论坛首页 会员列表 
收 藏 夹 
论坛帮助 
登录 | 登录并检查站内短信 | 个人设置 论坛首页 |  排行榜  |  在线私聊 |  专题 | 版规 | 搜索  | RSS  | 注册 | 活动日历
主题: 我为什么支持绽铃子的CPU缓存项目在海归网的讨论?
回复主题   printer-friendly view    海归论坛首页 -> 海归商务 -> 项目找投资与合作           焦点讨论 | 精华区 | 嘉宾沙龙 | 白领丽人沙龙
  阅读上一个主题 :: 阅读下一个主题
作者 我为什么支持绽铃子的CPU缓存项目在海归网的讨论?   
所跟贴 我为什么支持绽铃子的CPU缓存项目在海归网的讨论? -- 狼协 - (3043 Byte) 2010-10-30 周六, 23:25 (4853 reads)
网客JT
[博客]




头衔: 海归上校

头衔: 海归上校
声望: 博导

加入时间: 2008/01/11
文章: 1021

海归分: 97014





文章标题: [CPU cache 问题技术讨论] 自称外行的请勿入,勿语。 (1960 reads)      时间: 2010-10-31 周日, 09:52
  

作者:网客JT项目找投资与合作 发贴, 来自【海归网】 http://www.haiguinet.com

老狼说: 
引用:

尚没有内行出手,以专业、逻辑和事实,将绽铃子的理论驳倒的。反而有不止一个内行,对绽铃子的理论很感兴趣,想跟他继续切磋。所以至少我们可以判断,绽铃子的理论,至少不至于是太不靠谱的大忽悠。


为了表示支持,我开一技术thread, 希望大牛们跳出来挑战一番,最起码活跃了论坛。


Start with Cache 101:

T0=T
T1=(1-a)*T + a*Th + Tm

随着a增大, T1<T0

其中:
T: memory access 的时间。
a:  cache hit rate, 即所取数据在cache里而不需要access memory的百分比。
Th:  cache access的时间, Th<<T (远远小于的意思)
Tm: cache management 带来的overhead, 包括dirty entry write back, 即cache里被改变的数据,要在适当时间写回memory; 包括cache algorithm本身需要耗费的时间.

T0: 没有cache的平均memory access 时间, 
T1: 有cache后的平均memory access 时间。

注: 上面所有的“时间”,都是以CPU cycle来计量,是细节问题,就理解为“操作要耗费的时间”即可。

cache 101 的基本问题:

Th<<T, 所以, T1<T0, 即cache带来的overhead 远低于其带来的好处。 所以CPU 都用cache.

cache 102的基本问题:

什么样的cache algorithm (& corresponding design)更有效?
CPU 业界数十年积累,采用的是LRU, 所有算法里最简单的算法。 为什么? 先不提。

改善cache algorithm, 会提高a, 即hit rate, 从而会改善T1。 Wang Qufei 博士的发现,就是
1) 如果采用Weighted LRU, 对特定的application (如web server), 会大幅度提高a,
2) 并且对其它的application, a 也不降低。

其1) 肯定是对的, 因为。。。那没有办法不对。 LRU 是几乎最差的算法(因为是最简单的算法)。

其2) 。。。权当也是对的。


王博士继续宣布:

3) 如果采用该WLRU 算法, intel 的CPU performance 会radically improve.
4) radically improve的程度,是可以完全解决"内存墙" 的问题。
5) 。。。。

请支持或反对WLRU 具有革命性后果的内行同学,批判或反对一下上述的综述。 (按论坛规矩, 没有反对的就是赞成 Smile


hint: 上述1) 和 2) 如果代表了王博士“发现”的主要内容, 那么: 这个发现discovery 一定是valid, at least partially, 所以大家不必存疑。


《未完待续》


有CS 、EE 背景的同学,可以瞄一眼这里罗列的cache algorithm的laundry list, 可以了解在众多的算法中, 王同学的算法归于哪类。
https://en.wikipedia.org/wiki/Cache_algorithm


也可以看看这篇论文:Outperforming LRU with an Adaptive Replacement Cache Algorithm, 2004 年发表在IEEE Computer。
导读: 1) 看看其introduction对该领域背景的概括(不要骂人家一句愚蠢就完了),尤其是:

Discarding the least-recently-used page is the policy of choice in cache management. Until recently, attempts to outperform LRU in practice had not
succeeded because of overhead issues and the need to pretune parameters. 。。。 the need for the workload-
specific pretuning that plagued many previous proposals to improve LRU.


2) 看看对improve cache algorithm的科研成果能带来的dramatic 行业冲击的预估(which is none, nil, zero...)

https://www.almaden.ibm.com/cs/people/dmodha/ARC.pdf

作者:网客JT项目找投资与合作 发贴, 来自【海归网】 http://www.haiguinet.com






上一次由网客JT于2010-10-31 周日, 10:23修改,总共修改了1次





相关主题
[绽铃子兄] 现阶段回回还是要支持的 海归论坛 2007-2-21 周三, 13:43
见到绽铃子了 海归商务 2011-6-22 周三, 22:08
[问题]求教。。绽铃子大师,我要不要改个名字? 海归酒吧 2011-4-07 周四, 14:37
“龙芯之父”胡伟武:“国产超级计算机2011年底将告别国外芯片,使用‘中国... 海归商务 2011-3-07 周一, 05:43
绽铃子,你的芯片以后可以运行Windows了,Wintel 联盟已经分化 海归商务 2011-1-06 周四, 14:07
这个东东和绽铃子有关吗? 海归商务 2010-12-21 周二, 12:08
再晒一个与绽铃子的CPU项目有关的:“基于硬盘快速硬读写的低成本海量视频存... 创业项目评点 2010-12-20 周一, 22:20
[转帖]英特尔该如何和ARM竞争?绽铃子的 高性能、低功耗 CPU 机会在哪里? 海归商务 2010-12-16 周四, 21:43

返回顶端
阅读会员资料 网客JT离线  发送站内短信
显示文章:     
回复主题   printer-friendly view    海归论坛首页 -> 海归商务 -> 项目找投资与合作           焦点讨论 | 精华区 | 嘉宾沙龙 | 白领丽人沙龙 所有的时间均为 北京时间


 
论坛转跳:   
不能在本论坛发表新主题, 不能回复主题, 不能编辑自己的文章, 不能删除自己的文章, 不能发表投票, 您 不可以 发表活动帖子在本论坛, 不能添加附件可以下载文件, 
   热门标签 更多...
   论坛精华荟萃 更多...
   博客热门文章 更多...


海归网二次开发,based on phpbb
Copyright © 2005-2024 Haiguinet.com. All rights reserved.