循环缓存命中率分析方法的研究与实现

循环缓存命中率分析方法的研究与实现

一、循环Cache命中率分析方法的研究与实现(论文文献综述)

黄阳,周旭,杨志邦,余婷,张吉,曾源远,李肯立[1](2022)在《基于缓存的时变道路网最短路径查询算法》文中研究说明作为图论中的基本操作之一,最短路径查询已被广泛应用于路径规划、GPS导航和个性化推荐等基于道路网的相关应用中.针对道路网中在线最短路径查询所面临的计算成本高、查询速度慢等问题,现有方案通常采用缓存技术来优化其性能.考虑到道路网的边权重具有频繁变化的特性,现有工作未能有效地实现缓存数据的快速更新,忽略了缓存数据的时效性,从而导致缓存命中率不高.鉴于此,首先提出一种新的缓存存储结构,能够有效平衡最短路径的整体查询速度与缓存数据更新速度之间的关系;其次,结合路径共享能力及路径多样性设计了新的缓存存储策略,优化缓存收益,继而提高缓存命中率;最后,提出基于缓存的时变最短路径查询(cache-based time-varying shortest path query, CTSPQ)算法.在真实数据集上的实验结果验证了CTSPQ算法的有效性和可扩展性.

刘文峰,张宇,张宏莉,方滨兴[2](2022)在《域名系统测量研究综述》文中指出域名系统(domain name system, DNS)测量研究是深入理解DNS的重要研究方式.从组件、结构、流量、安全4个方面对近30年(1992–2019)的DNS测量研究工作梳理出18个主题.首先,介绍组件测量,组件有解析器和权威服务器两种,解析器测量包括公共解析器、开放解析器、解析器缓存、解析器选择策略4个主题,权威服务器包括性能、任播部署、托管、误配置4个主题.其次,阐述结构测量,包括桩解析器与解析器的依赖结构、解析器间依赖结构、域名解析依赖结构3个主题.然后,描述流量测量,包括查询流量特征、异常根查询流量、流量拦截共3个主题.最后综述了安全测量,包括DNSSEC代价与隐患、DNSSEC部署进展、加密DNS部署、恶意域名检测4个主题.

吕小敬,刘钊,蔡蕙伊,李锦薇[3](2022)在《面向国产神威众核架构的区域气候模式CWRF性能优化技术》文中进行了进一步梳理区域气候模式CWRF(Climate-Weather Research and Forecasting model)是国家气候中心区域气候预测系统的重要组成部分,也是系统最耗时的程序。高性能计算是提高CWRF数值预报计算性能的关键技术,开展CWRF模式在国产神威众核架构上的移植和优化,提高模式的模拟效率,对模式的扩展、开发能力和可持续发展具有重要意义。基于国产众核SW26010处理器,完成了CWRF区域气候模式的移植、性能分析和深入性能优化,采用访存优化、Cache命中率优化及众核加速优化等方法,对CWRF模式动力过程、物理过程和I/O过程计算代码进行重构及众核加速。结果表明:优化技术可使CWRF动力过程平均加速2倍,最高加速6.4倍,物理过程平均加速1.7倍,最高加速5.4倍,I/O过程加速1.2倍,程序整体最高加速1.4倍,计算误差在合理范围内。

万良易[4](2021)在《数据渗透迁移流水线化及其监控方法研究》文中研究指明长期以来,处理器日益增长的数据需求与低效的数据供应之间的矛盾是限制处理器计算性能发挥的主要影响因素,学术界、工业界将注意力投射到如何缓和这一矛盾上,并在不同的方向上进行了尝试,渗透数据迁移就是这些尝试之一。与传统的预取方案不同,渗透数据迁移更加强调迁移行为的目的性与阶段性,主张根据数据的时空特征实时调整存储空间的数据排布,营造出数据向处理器主动汇聚的态势。但对数据渗透迁移过程的研究还处于一个初步的探索阶段,对迁移数据的内部规律性有待进一步研究探讨。本文的研究成果如下:1.对渗透过程等进行了分析与总结,指出数据渗透迁移过程与指令执行间的关联关系,提出了实现数据渗透迁移流水线化的解决方案——渗透流水线;2.设计了具备校验功能的复合流水线,两条指令流水耦合执行、交织校验为保证渗透过程的顺利展开创造了条件;3.利用Model Sim仿真工具对渗透流水线、具备校验功能的复合流水线进行了仿真模拟。仿真实验证明本文所提出的渗透流水线结构能够有效实现数据渗透迁移过程的流水线化并保证数据渗透迁移过程执行的正确性。

张宇明[5](2021)在《面向边缘计算的智慧标识网络资源协同与适配机制研究》文中研究表明随着网络设备数量与流量规模的持续增长,边缘计算已成为当今网络环境下提升服务质量、增强用户体验的关键技术。然而,传统网络技术“静态、僵化”的原始设计弊端,导致其在跨网资源利用、差异化服务保障等方面的能力不足,进而难以为边缘计算提供高效的支撑。为此,设计基于新型网络架构与技术的边缘计算网络已成为国内外相关研究领域的共识。智慧标识网络作为新型网络架构的一种,在资源适配、网络管控等方面具有显着优势,为边缘计算的高效运行提供了良好的架构基础。为此,本文依托于智慧标识网络的设计理念,就网络资源的协同与适配开展研究,重点解决边缘计算所面临的任务卸载性能评估、传输与存储资源协同、差异化服务资源提供等问题。本文的主要工作和创新点如下:(1)针对终端设备与边缘服务器之间的任务卸载问题,设计了基于智慧标识网络的管控框架,构建了基于端-边协同的任务卸载性能评估模型。首先,将任务卸载问题描述为一个多队列系统;随后,使用马尔可夫链对两种卸载策略(本地优先策略和基于概率的策略)进行分析,并推导出任务平均响应时间与系统平均能耗的闭式解;在此基础上,构建了一个基于优化的资源适配方法,同时考虑终端需求、计算资源与传输资源;最后,实验结果显示,所提评估模型能够准确反映卸载策略的性能,所提资源适配方法可以动态调整资源的适配策略,满足不同终端的需求。(2)针对边缘网络之间的传输资源协同问题,设计了基于智慧标识网络的传输组件功能模型,提出了基于随机优化的边缘资源协同传输调度机制。首先,使用队列调度模型对基于资源协同的传输调度问题进行描述,并构建了一个随机优化问题;随后,将上述问题进行转化和分解,提出了一种低复杂度的控制算法,可以实现基于即时网络状态的传输策略制定;最后,通过仿真实验,验证了所提算法能够在不损失吞吐量的前提下,有效降低数据包的队列等待时间。(3)针对边缘网络之间的存储资源协作问题,设计了基于智慧标识网络的缓存组件功能模型,提出了基于多代理强化学习的边缘协作缓存方法。首先,构建了协作缓存的优化问题,并证明该问题是NP-hard;随后,将强化学习与所提缓存组件相结合,设计了一个协作缓存框架;在此基础上,提出了一种基于多代理强化学习的协作缓存算法,并将其输出定义为低复杂度的缓存策略,在降低学习模型复杂度的同时,为每个缓存节点提供一定的性能保障;最后,通过仿真实验,验证了所提算法能够从全局的角度出发,牺牲单个节点的本地命中率,提升整体的命中率。(4)针对边缘服务器与云服务器之间的任务卸载和服务资源适配问题,设计了基于智慧标识网络的资源适配框架,提出了基于服务功能切换的云-边资源协同适配机制。首先,构建了一个随机优化模型,对基于服务功能切换的资源适配问题进行描述,旨在最大化任务处理收益与最小化服务切换代价;随后,利用虚拟队列技术,将任务需求与服务资源进行关联,并提出了一个低复杂度的任务卸载与资源适配算法;在此基础上,引入任务的主动拒绝机制,对上述算法进行改进,使其能够提供确定的时延保障;最后,通过仿真实验,验证了所提算法均能有效降低任务的等待时间,并且可以提供基于服务功能切换的差异化资源适配策略。

蔡雨,孙成国,杜朝晖,刘子行,康梦博,李双双[6](2021)在《异构HPL算法中CPU端高性能BLAS库优化全文替换》文中研究指明异构HPL(high-performanceLinpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的计算,通用CPU负责任务调度的同时也参与计算.在合理划分任务、平衡负载的前提下,优化CPU端计算性能对整体效率的提升尤为重要.针对具体平台体系结构特点对BLAS(basic linear algebra subprograms)函数进行优化往往可以更加充分地利用通用CPU计算能力,提高系统整体效率.BLIS(BLAS-like libraryinstantiationsoftware)算法库是开源的BLAS函数框架,具有易开发、易移植和模块化等优点.基于异构系统平台体系结构以及HPL算法特点,充分利用三级缓存、向量化指令和多线程并行等技术手段优化CPU端调用的各级BLAS函数,应用auto-tuning技术优化矩阵分块参数,从而形成了异构环境下优化的BLIS算法库HBLIS.与MKL相比,HPL整体性能提高了11.8%.

汪杰[7](2021)在《基于程序中数据流访存模式的硬件预取技术的研究》文中认为

杨孟达[8](2021)在《Spark计算框架下RDD缓存机制优化》文中提出

陈玉明[9](2021)在《移动边缘网络缓存策略研究》文中研究指明

郭嘉琪[10](2021)在《动态兴趣捕获的边缘服务增强策略研究》文中认为

二、循环Cache命中率分析方法的研究与实现(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、循环Cache命中率分析方法的研究与实现(论文提纲范文)

(1)基于缓存的时变道路网最短路径查询算法(论文提纲范文)

1 相关工作
    1.1 最短路径查询
    1.2 缓存管理
    1.3 基于差异多样性的路径规划
2 定 义
    2.1 基本定义
    2.2 问题定义
3 基于缓存的时变最短路径缓存查询算法
    3.1 缓存管理模块
        3.1.1 缓存存储结构
        1) 邻接点索引ANI.
        2) 位图索引BMI.
        3) 路径信息索引PII.
        3.1.2 缓存收益模型
        3.1.3 改进存储策略
    3.2 查询请求检测模块
    3.3 最短路径评估模块
4 实验分析
    4.1 实验设置
    4.2 数据集
    4.3 实验结果
        4.3.1 映射
        4.3.2 缓存大小
        4.3.3 参数θ分析
        4.3.4 参数τ分析
5 总 结

(3)面向国产神威众核架构的区域气候模式CWRF性能优化技术(论文提纲范文)

0 引言
1 神威·太湖之光系统介绍
    1.1 神威·太湖之光系统简介
        1.1.1 SW26010处理器
        1.1.2 神威·太湖之光系统语言环境
2 CWRF区域气候模式
    2.1 计算框架
    2.2 移植策略
3 CWRF优化方案
    3.1 CWRF性能分析
    3.2 CWRF并行优化方案
        3.2.1 CWRF动力过程优化
        3.2.2 CWRF物理过程优化
        3.2.3 并行支撑技术优化
4 优化效果
    4.1 主从核结果对比
    4.2 加速效果测试
5 结论

(4)数据渗透迁移流水线化及其监控方法研究(论文提纲范文)

致谢
摘要
ABSTRACT
1 引言
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 线程渗透
        1.2.2 渗透延迟容忍模型及其发展
        1.2.3 渗透缓存
        1.2.4 前人工作总结
    1.3 主要研究工作
        1.3.1 渗透流水线
        1.3.2 复合流水线
    1.4 论文结构
2 数据渗透迁移
    2.1 数据渗透迁移行为分析
    2.2 及时局部组
    2.3 数据渗透迁移中的数据流动
    2.4 指令执行过程分析
    2.5 渗透流水线
    2.6 流水线设计
        2.6.1 指令流水线主要数据通路
        2.6.2 渗透流水线设计
        2.6.3 复合流水线
3 仿真平台搭建
    3.1 设计方案
        3.1.1 工具与语言
        3.1.2 需求分析
        3.1.3 渗透流水线仿真平台总体设计
    3.2 渗透流水线仿真平台流水线模块功能设计
        3.2.1 复合流水线模块
        3.2.2 渗透流水线模块
    3.3 渗透流水线仿真平台主要功能模块设计
        3.3.1 取指阶段
        3.3.2 译码阶段
        3.3.3 执行阶段
        3.3.4 访存阶段
        3.3.5 写回阶段
        3.3.6 渗透控制模块
    3.4 本章小结
4 仿真实验
    4.1 测试指令及测试数据
    4.2 功能验证
        4.2.1 复合流水线的功能验证
        4.2.2 渗透流水线的功能验证
    4.3 访存轨迹分析
        4.3.1 GEM5 测试集及其实验结果
        4.3.2 Splash测试集及其实验结果
    4.4 实验总结
5 总结与展望
    5.1 总结
    5.2 展望
参考文献
索引
作者简历及攻读硕士学位期间取得的研究成果
学位论文数据集

(5)面向边缘计算的智慧标识网络资源协同与适配机制研究(论文提纲范文)

致谢
摘要
ABSTRACT
主要缩略语对照表
1 绪论
    1.1 引言
    1.2 研究背景与现状
        1.2.1 边缘计算架构
        1.2.2 资源适配架构
        1.2.3 相关研究工作
    1.3 面向边缘计算的SINET架构
    1.4 主要问题及意义
    1.5 主要工作与创新点
    1.6 论文组织架构
2 基于端-边协同的任务卸载性能评估模型
    2.1 引言
        2.1.1 研究背景
        2.1.2 相关工作
    2.2 任务卸载模型描述
        2.2.1 应用场景简介
        2.2.2 队列模型描述
        2.2.3 卸载策略分析
    2.3 平均响应时间分析
        2.3.1 终端平均响应时间
        2.3.2 服务器平均响应时间
        2.3.3 整体平均响应时间
    2.4 任务卸载能耗分析
        2.4.1 终端设备能耗
        2.4.2 边缘服务器能耗
    2.5 多终端资源适配方法
    2.6 性能评估
        2.6.1 实验场景与参数
        2.6.2 实验结果与分析
    2.7 本章小结
3 基于随机优化的边缘资源协同传输调度机制
    3.1 引言
        3.1.1 背景介绍
        3.1.2 相关工作
    3.2 协同传输模型描述
        3.2.1 应用场景简介
        3.2.2 队列模型描述
    3.3 动态传输调度方法
        3.3.1 辅助变量与问题转化
        3.3.2 问题解耦与子问题求解
        3.3.3 动态传输调度算法描述
        3.3.4 算法性能与复杂度分析
    3.4 算法性能评估
        3.4.1 实验场景与参数
        3.4.2 实验结果与分析
    3.5 本章小结
4 基于多代理强化学习的边缘协作缓存方法
    4.1 引言
        4.1.1 背景介绍
        4.1.2 相关工作
    4.2 协作缓存模型描述
        4.2.1 应用场景简介
        4.2.2 缓存优化模型
    4.3 基于强化学习的协作缓存方法
        4.3.1 强化学习协作缓存框架
        4.3.2 特征定义与动作选择
        4.3.3 边缘协作缓存算法描述
    4.4 算法性能评估
        4.4.1 实验场景与参数
        4.4.2 实验结果与分析
    4.5 本章小结
5 基于服务功能切换的云-边资源协同适配机制
    5.1 引言
        5.1.1 背景介绍
        5.1.2 相关工作
    5.2 服务切换模型描述
        5.2.1 应用场景简介
        5.2.2 队列模型描述
    5.3 资源适配算法设计
        5.3.1 虚拟队列与问题解耦
        5.3.2 资源适配算法的描述
        5.3.3 算法性能与复杂度分析
    5.4 基于任务拒绝的算法改进
        5.4.1 拒绝机制与时延队列
        5.4.2 改进后的算法描述
        5.4.3 改进算法的性能分析
    5.5 算法性能评估
        5.5.1 实验场景与参数
        5.5.2 实验结果与分析
    5.6 本章小结
6 总结与展望
    6.1 工作总结
    6.2 未来工作展望
附录 A
附录 B
参考文献
作者简历
学位论文数据集

(6)异构HPL算法中CPU端高性能BLAS库优化全文替换(论文提纲范文)

1算法分析和CPU微体系结构
    1.1 HPL算法与BLAS函数
    1.2异构单元处理器概述
2访存优化
    2.1矩阵分块
    2.2 Auto-tuning自适应分块参数调优
    2.3矩阵打包
    2.4数据预取
3指令集优化
    3.1 X86向量指令
    3.2循环展开
4多线程并行
    4.1 Control-tree优化
    4.2 Level-1和Level-2级BLAS并行优化
    4.3并行化问题
5性能测试与分析
    5.1 Cache性能分析
    5.2 DGEMM效率
    5.3异构HPL测试
6总结与展望

四、循环Cache命中率分析方法的研究与实现(论文参考文献)

  • [1]基于缓存的时变道路网最短路径查询算法[J]. 黄阳,周旭,杨志邦,余婷,张吉,曾源远,李肯立. 计算机研究与发展, 2022
  • [2]域名系统测量研究综述[J]. 刘文峰,张宇,张宏莉,方滨兴. 软件学报, 2022(01)
  • [3]面向国产神威众核架构的区域气候模式CWRF性能优化技术[J]. 吕小敬,刘钊,蔡蕙伊,李锦薇. 电子技术应用, 2022(01)
  • [4]数据渗透迁移流水线化及其监控方法研究[D]. 万良易. 北京交通大学, 2021
  • [5]面向边缘计算的智慧标识网络资源协同与适配机制研究[D]. 张宇明. 北京交通大学, 2021
  • [6]异构HPL算法中CPU端高性能BLAS库优化全文替换[J]. 蔡雨,孙成国,杜朝晖,刘子行,康梦博,李双双. 软件学报, 2021(08)
  • [7]基于程序中数据流访存模式的硬件预取技术的研究[D]. 汪杰. 安徽大学, 2021
  • [8]Spark计算框架下RDD缓存机制优化[D]. 杨孟达. 重庆邮电大学, 2021
  • [9]移动边缘网络缓存策略研究[D]. 陈玉明. 重庆邮电大学, 2021
  • [10]动态兴趣捕获的边缘服务增强策略研究[D]. 郭嘉琪. 重庆邮电大学, 2021

标签:;  ;  ;  ;  ;  

循环缓存命中率分析方法的研究与实现
下载Doc文档

猜你喜欢