一、基于信息论网络的时序数据库挖掘(论文文献综述)
吴蓉[1](2021)在《金融审计防范和化解金融风险研究 ——以A商业银行为例》文中指出
孟超[2](2021)在《多元时间序列复杂网络重构方法研究》文中进行了进一步梳理当今时代随着大数据技术的不断发展,各种复杂网络无处不在。虽然新技术的发展给人类和社会带来了极大的便利,但是也在一定程度上加剧了社会的动荡和不安,因此如何更好的控制这些网络让其更好的为人类服务具有重要意义。然而大多情况下由于复杂系统的未知性和抽象性,复杂网络的拓扑结构往往是未知的。基于此问题,相关研究人员根据系统产生的多元时间序列数据,对复杂网络拓扑结构展开重构工作。本文通过对目前现有的各种网络重构算法进行研究,在考虑复杂系统正常运行与异常运行的基础上,率先将复杂系统分为正常运行状态与异常运行状态两种情况,并分别进行分析。并在此基础上通过研究多元时间序列的网络重构算法,提出了基于斯皮尔曼相关系数的网络重构方法。主要工作和研究内容如下:1.考虑到系统正常与异常运行两种状态,提出了一种适用于多元时间序列数据的异常检测算法(MOTCN-AE)。该算法首先将范数,范数差引入到滑动窗口技术,使用范数来捕捉时间窗内数据之间的时间相关性,范数差来捕两个时间窗口之间的相关性。随后利用基于统计学的时间序列特征提取方法,将原始时间序列进行特征丰富,并以此来提高检测的精度。最后结合深度学习中具有更好的记忆能力的时间卷积网络和自动编码器技术,提出了基于时间卷积网络的自动编码器(TCNAE)。数据方面则使用网上公开的真实数据集(UAH-Drive Set,NAB)对模型进行校验,实验结果显示本文提出的方法要优于以往的算法。2.提出了一种多元时间序列复杂网络构建方法(SCRN),在SCRN方法中我们选择现实世界中存在的实体作为网络的节点,通过计算节点间的斯皮尔曼相关系数来构建网络边的连接权重。数据方面本文选取了基因调控网络,股票网络以及火力发电系统中的锅炉传感器网络来进行实验,并成功构建了三个复杂网络模型。通过实验结果可知,本文提出的算法在大数据集上取得了不错的效果,并且本文成功将该算法应用于了制造业领域。3.本文也在数据存储方面做了一定的尝试。在以往复杂网络的研究中,研究人员大多关注于对未知网络进行重构或者根据已有网络拓扑结构进行分析挖掘,而对于网络模型的存储,则没有一个统一的标准。通过综合分析几种常用的数据存储机制后,本文选用最近比较流行的图数据库进行模型存储,并成功将重构后的模型存储到了Neo4j数据库。
洪应迪[3](2021)在《面向铁道供电监控信息大数据的列压缩方法研究》文中研究说明铁路运输设备是铁路重要的生产性资产,其健康持续稳定的运作是铁路运输生产活动的重要基础,是铁路运输组织活动正常进行的保证。铁路供电监控系统将收集到的线程电流、电压、有功功率、无功功率、功率因素、电力极值等运输设备技术状态数据作为铁路运输设备的高效管控和决策的重要依据。面对不断增长的技术状态数据,现有的监控信息存储方式主要依赖基于磁盘阵列的硬件设备(RAID,redundant array of independent disks),利用传统的关系型数据库进行管理,存在着存储能力差、结构固定、读写效率低等问题,无法满足各应用系统之间共享数据中心业务的需求。如果无法即时获取到的时间序列准实时海量数据中快速搜索出铁道供电杆塔信息、刀闸信息,与健康安全档案信息进行综合分析,可能引起调度监控信息的交互困难、通信拥塞,影响铁路供电生产运维效率,不利于缩短故障排查时间和降低列车晚点率。由于传统的以行式存储为主的关系型数据管理技术存在数据库扩容瓶颈,学术界的研究转向基于列式存储的数据处理技术。列式数据存储具有比行式存储更高的压缩比率,通过获取指定列数据可以减少更多IO操作,这些优势对于存储海量数据来说具有更大的吸引力,使用列式存储更能体现出优势,性价比也更高。以HBase列式数据库为例的云集群处理技术在某些关键领域已经得到重要应用,本文在铁道供电调度监控系统海量监控信息的高效处理这个热点问题上,重点研究基于HBase列式云集群的压缩及优化处理技术,并基于列存储研究监控信息的大比率压缩。本文在理论研究基础上,以工程数据为算例,首先为解决列式数据库之间传输吞吐量低,转存耗时长的问题,设计实现分布式数据集群的内存扁平压缩模型。然后成功构建基于HBase云集群的供电调度监控信息处理平台,并将扁平压缩模型集成到HBase集群实现共享内存折叠压缩,考虑内存折叠后的优化性能,以某动车段的SCADA系统工程数据为算例,进行数据载入延时、数据读取延时以及内存占用率的变化等多组数据测试,验证了该方案对监控信息存取的优化效果。研究并设计列存储模式的监控信息神经网络大比率压缩存储模型,通过工程算例数据验证了其压缩效果。研究结果为提升铁道供电监控大数据集群读写能力与缩短处理延时及大比率压缩存储提供新的解决方案。
陈瑾[4](2021)在《时序数据无损压缩算法研究》文中研究说明时序数据是按照时间顺序观测某个或某些物理量得到的一串值,其反映了事物属性随着时间变化的特征。时序数据压缩是一个基础且重要的工作。时序数据的压缩不但能够减少空间存储,而且降低了数据传输的成本。本文对时序数据无损压缩展开研究,设计了一种针对时间戳的无损压缩算法以及两种针对时序数据值的无损压缩算法,实现了数据信息无失真情况下的高压缩率压缩。主要工作及创新点如下:(1)提出了e-DoD时间戳压缩算法。该算法首先对UNIX时间戳进行二阶差分,然后固定变长编码对二阶差分值绝对值较小者进行编码,使用位掩码法、尾零法以及偏置法三种编码方法分别对二阶差分值绝对值较大者进行编码,选择编码最短的编码方法编码该二阶差分值,使用变长控制位对所有编码进行变长控制存储。e-DoD算法有效减少了时间戳的存储空间开销。(2)提出了Pred Zip时序数据值压缩算法。该算法分为两个部分:概率预测模块和算术编码模块,概率预测模块对时序数据中的每一个字符,利用该字符的前k个字符预测其条件概率值,算术编码模块使用该字符的条件概率值进行算术编码压缩。Pred Zip算法在实验数据集中压缩率最高达到9.2。通过分别使用了基于逻辑回归、LSTM以及XGBoost的三种概率预测模型的Pred Zip压缩算法进行实验对比,发现概率预测模型的预测精度越高,算法的压缩率就越高。(3)提出了CS-Zip时序数据压缩算法。该算法分为训练过程和数据压缩过程。在训练过程中,首先使用遍历择优标注算法标注定长数据段的最优数据压缩的数据转换方法,形成训练集;依据该数据集训练数据转换方法分类器。数据转换方法包括一阶差分、一阶逆差分、二阶差分、二阶逆差分、异或和差分异或6种方法。在数据压缩过程中,时序数据均匀分成数据段,根据数据转换方法分类器得到该数据段的数据转换方法;然后根据该方法对该数据段进行转换,再对转换后的数据段中的每一个数据选择压缩率最高的编码方法进行编码。数据编码方法包括位掩码法、尾零法、偏置法和右向偏置法。CS-Zip算法为时序数据的每个分段选择压缩率更高的压缩方法,从而提高实现整个时序数据的压缩率。
张望[5](2021)在《基于云边协同微服务架构的志愿服务平台设计与实现》文中认为近十年来,我国志愿服务事业蓬勃发展,超过1.2亿的志愿者、73万志愿团体和232万志愿项目每年产生大量志愿服务数据。然而志愿服务事业智能化、信息化发展却相对滞后。海量数据仅通过云中心集中存储而缺乏进一步的大数据处理、计算与分析,志愿者没有享受到大数据带来的智能与便利,大量隐藏在数据背后的结论与发现亟待研究与挖掘;同时,随着大数据时代的数据源、数据量不断膨胀及智能化的需求日益增长,传统云平台架构难以满足现状,实时性、网络制约、资源开销、计算负载和隐私保护等方面的缺陷逐渐暴露,亟需更替成边缘计算和云计算协同的云边协同微服务架构。另一方面,随着互联网应用功能业务不断复杂,种类繁多的设备需要得到适配支持,不同业务逻辑的相互调用、业务交叉情况愈发普遍,传统单一应用架构存在不灵活、不可靠、不易扩展、迭代速度慢、阻塞持续集成的问题。微服务作为新一代软件架构设计思想,旨在解决此类问题,是传统应用架构改进的趋势。志愿服务由于其自身特点,通常以行政区域划分系统权限,存在本地个性化、差异化服务的需求,天然支持且高度适合云边协同及微服务设计思想的革新。本文基于云边协同微服务架构,完成志愿服务平台设计与实现,是我国志愿服务事业发展的迫切需要,推进了我国智能化、信息化社会建设的进度,为边缘计算和云边协同架构的实现提供了参考案例,同时也为物联网多协议设备接入通用架构的探索提供了可行性解决方案。本文主要工作包括:一、志愿大数据算法与服务研究。本文提出了基于TF-IDF和标签幂集策略决策树模型的志愿标签智能补全算法。通过创建自定义语料库、停用词列表,使用jieba分词和TF-IDF算法提取相关短文本关键词作为特征向量,将标签补全问题转化成中文文本多标签分类问题,利用标签幂集策略决策树模型完成文本分类,多标签分类准确率达88.92%,比传统二元关联策略高斯贝叶斯分类算法高67.11%。利用补全后的志愿服务标签,筛选并结合其他字段进行数据向量化,描述用户画像,实现了基于重载运算符的混合加权志愿服务推荐算法。该算法中,基于重载运算符的方法,重新定义了传统协同过滤算法中相似度的计算,具有更友好的解释性,将在线推荐的时间复杂度由O(N+M)降至O(1)(总项目数N,总团体数M)。算法加权结合用户标签、时间戳、所属地区等字段和历史记录,推荐志愿团体和项目的准确率达到18.51%/27.50%,比只考虑历史记录的传统算法在准确率上也有了 16.44%/24.93%的提高。二、云边协同微服务架构研究。本文基于Docker及EdgeX框架等关键技术,提出并搭建云边协同微服务架构,为传统大数据环境应用提供兼容多协议设备的通用架构,取代传统云平台和单一应用架构,具有高可靠、松耦合、迭代速度快、跨平台兼容性好等优点,并提供了多个通用功能模块。其中泛化设备接入与处理模块为MQTT、SNMP、HTTP、ModBus等不同协议设备提供通用支持;云边节点自我感知模块用多叉树结构抽象云边结构,使云边节点能动态自我感知,体现了相较于传统单层或双层云边协同架构,拓展便捷性上的优势;资源监控与服务动态升降级模块为节点提供自我监控、动态调节的能力;负载均衡模块利用Docker Swarm容器集群分摊网络请求,使请求平均耗时减少59.49%以上。三、云边协同微服务架构下志愿服务平台实现。本文基于提出的云边协同微服务架构,搭建了新一代志愿服务平台。本平台将全国的志愿服务系统划分为全国、行政区域、边缘设备的多层云边结构,融入本文提出的志愿标签智能补全算法、加权多标签推荐算法和数据可视化,进一步赋能志愿服务平台,分层次为志愿者、组织者和决策者提供智能服务。最后,本文将云边协同微服务架构下志愿服务平台与传统平台进行了对比。
施佳呈[6](2020)在《交叉口交通状态识别与拥堵传播规律挖掘方法研究》文中进行了进一步梳理交通拥堵是现代化城市亟待解决的重大难题,交叉口作为道路网络的节点,容易成为交通拥堵的诱发点,对交叉口交通流数据的研究具有重要的理论价值和实践意义。智能化、数据化的交通系统成为解决交通拥堵问题的重要手段之一,如何高效地从海量交通流数据库中获取更多有价值的信息成为学者们探讨的热点内容。因此,在实测数据的基础上,研究交叉口交通状态识别方法和拥堵传播规律对实现拥堵预警和早期干预具有指导性的意义。本文以交叉口交通流量为数据基础,对交叉口交通状态识别和以拥堵传播规律挖掘为基础的交通状态预测进行建模和挖掘,分析城市道路系统中的交通流运行特征。主要研究内容和成果如下:(1)将车辆检测器数据的错误问题分成两类:数据异常和数据缺失。采用阈值法对异常数据进行处理,根据时间序列流量数据的相关性和周期性对缺失数据进行修复。针对无检测器交叉口,考虑与交叉口相关路段沿线两侧用地出入口交通流量的影响,将有检测器交叉口的数据转化为交叉口进口道需求数据,提出了改进相似聚类算法的无检测器交叉口流量数据研究框架,发现改进前后皮尔逊相关系数最大的提高了 37.29%,最低的提高了 10.8%,平均提高了 20.58%。(2)基于交叉口流量数据,对饱和度、排队长度、延误时间三种常见的交叉口交通状态参数的计算方法进行了有效地探索。提出了改进的需求-容量法对交叉口饱和度进行计算:在需求方面考虑路段上流入量和流出量在早晚高峰期对交叉口需求量的影响,在容量方面考虑下游交叉口排队蔓延导致上游交叉口的折损。在估算排队长度、延误时间的过程中确定了以饱和度等于0.8为界限的2种不同计算方法。(3)应用数据挖掘技术直接识别分析海量数据,以获取道路网络中交叉口拥堵扩散的演变规律。构造了交叉口各车道的交通状态历史数据库,并结合交通拥堵预测的特点对数据库进行适应性调整,提出一种基于路网拓扑结构约束的Apriori算法,建立区域交叉口拥堵传播规律挖掘模型。利用苏州市吴中区交叉口实例数据验证了模型的有效性和正确性。根据模型实证结果,从时间维度分析可知拥堵具有相似性和反复性;从空间维度研究发现“回溢”和“流出”两种拥堵传播的模式。基于上述拥堵传播规律获取该区域中各个交叉口拥堵发生的时间顺序,当某一规律中拥堵源交叉口发生拥堵时,根据拥堵传播规律中拥堵传播的趋势,可预测该规律中其他交叉口后续的交通状况。
黄子豪[7](2020)在《基于深度学习的快速路交通事故数据生成及事故识别方法》文中研究表明在城市道路交通出行过程中,跟车追尾、会车碰撞等突发的交通事故会对交通流产生极大的扰动,增加周围车辆碰撞的风险,易导致二次事故的产生,进而威胁出行者的生命安全,其危害程度不言而喻。快速识别交通事故并预警是降低二次事件发生机率的重要手段。然而受到交通事故场景下数据资源稀缺、数据采集成本巨大等问题的限制,很少能直接通过大量数据分析交通事故的具体特征。为此,本文以网约车数据为基础展开了基于车辆行为特征的交通事故数据生成研究,旨在提升交通事故识别准确率。具体研究内容如下:首先,根据网约车数据特点,研究数据预处理方法,设计网约车数据预处理流程,对数据进行清洗,完成异常数据剔除和缺省值插补等工作,并对预处理效果进行量化评价。其次,采用事故车辆轨迹数据提取运动学特征,制作不同交通状态下车辆行为特征数据集,基于信息熵理论进行特征选择实验,筛选出与交通事故高度相关的特征。实验以车辆运动特征与交通状态特征之间的互信息为评价标准,设置特征之间相关性、冗余性与互补性的理论下界约束,最终在30个特征中筛选出6个车辆运动学特征。该方案与其它特征选择方案的对比结果表明:考虑特征间互信息下限的特征选择算法在同一分类器上的平均分类准确率最高。再次,根据特征选择算法筛选出的重要特征,研究基于生成对抗神经网络的数据生成模型,改进模型的生成器网络结构用以适应非图形化数据,完成神经网络训练工作,并对生成模型重新采样获得全新的交通事故数据。最后验证生成数据的多样性与可靠性。实验结果显示:数据生成模型能学习到不同交通状态下车辆的运动特征,生成数据与原始数据的分布不存在显着性差异。最后,将生成模型产生的大量样本应用于交通事故识别,构建混合神经网络模型进行模式识别实验。采用包含大量生成数据的增强样本与未增强的原始稀缺样本对分类模型进行训练,对比数据增强前后不同分类模型事故识别的准确率,验证生成数据的有效性。对比实验结果表明:混合神经网络识别交通事故的平均准确率最高为95.25%,使用生成数据能提升各识别模型的准确率,其中混合神经网络的平均识别准确率提升最大为5.05%。本文研究结果显示:通过构建对抗神经网络模型,生成与原始交通事故数据相似的数据样本,可以扩充交通事故样本的容量;同时,运用生成的数据样本可以增强原始数据集的质量,提高分类器对交通事故识别的准确率,保障道路交通出行安全。
施佳呈,吴戈,俄文娟[8](2020)在《区域交叉口交通拥堵传播规律挖掘方法研究》文中研究表明为了准确识别和预测区域交叉口的交通状态,研究道路网络中的拥堵传播规律,以交叉口流量数据为研究基础,提出了一种改进型需求-容量的交叉口交通状态判别方法。结合交通领域的具体特点,对算法数据库进行适应性调整,采用一种基于路网拓扑结构约束的Aprior算法,建立区域交叉口拥堵传播规律挖掘模型,并以苏州市某区域的交叉口数据为实例进行验证,从时间维度分析发现拥堵具有相似性和反复性,从空间维度研究获取"回溢"和"流出"2种拥堵传播模式,与现实情况相符。结果表明,模型能够有效挖掘区域交叉口拥堵传播规律,并根据传播规律中各个交叉口拥堵发生的时序特性进行交通状态预测。所得结论对实现拥堵预警和交通拥堵的早期干预具有一定的借鉴意义。
顾艺[9](2019)在《面向时序数据库的时间序列数据有损压缩算法研究》文中研究表明随着大数据时代的来临,无数的设备需要采集不同指标的数据,其记录的数据量非常之大。如果将采集到的数据直接存储到传统的关系型数据库中,不仅会消耗大量的存储空间,同时也会降低数据的传输、查询、分析、处理效率。现有的传统数据库系统对于时间序列数据的存储效率不高,因此需要针对时间序列数据的特性,设计专门的时序数据库。目前的时序数据库允许用户创建、更新和销毁各种数据并对其进行一定的图形化展示及分析,但并没有对海量历史数据进行过多操作就直接将其存储到磁盘中。这极大制约了时序数据库的发展,容易引起存储空间消耗过大、磁盘读写过多及系统性能降低等问题。因此,将高效的数据压缩技术引入到时序数据库中,对时序数据库的发展有着尤其重要的意义。基于以上问题,针对时间序列数据的特点,本文提出了一种新型高效的时间序列数据有损压缩算法。该算法可以保证在一定的精度前提下,通过去除数据中的冗余部分、缩短数据编码长度,节省了时间序列数据占用的存储空间,提高数据传输速度。具体工作如下:1)提出了基于差值法的时间戳压缩算法。本文基于差值法对传统的时间戳压缩算法进行了优化。该算法对每个时间戳的差值计算了二次差值,根据设定好的压缩规则对二次差值进行编码,以实现对时间戳的压缩。此外,针对时间序列数据采集过程中普遍存在的时间点遗漏问题,本文提出的压缩算法也可以减少时间戳的存储开销。2)提出了时间序列数据有损压缩算法。在数据存储过程中,浮点数采用的是IEEE规定的编码标准。这会出现两个浮点数值差异很小而编码转换得到的二进制却相差甚远的情况。针对这一问题,本文结合浮点数的组成特性提出了有损压缩算法。首先,对数据进行矢量量化预处理。然后,在可接受的精度损失范围内,将原始数据转成结构相近的二进制编码字节。最后,进行异或操作并对结果中的冗余部分进行编码压缩。该有损压缩算法可以实现时间序列中数据值的高效压缩。最后,通过模拟仿真实验对本文提出的算法进行了验证。实验结果表明,在选取适当的损失因子后,本文提出的有损压缩算法,能够在损失精度与压缩率之间取得较好的平衡,同时数据值的压缩率高达5.274倍,90%以上的时间戳可以用1bit进行存储,平均损失率趋近于0。
李贺[10](2019)在《紫晟煤矿风险预警与防控系统研发及应用》文中研究说明煤炭是我国国民经济的主要能源,煤矿安全已成为影响我国经济可持续发展的重要因素。近几年,我国煤炭安全生产形势不断好转,但重特大事故时有发生,针对煤炭企业生产现状,开展煤矿风险预警与防控体系研究,对于提高矿井防灾减灾能力和减少灾害事故的发生都具有重要的实用价值。本文在综合指标权重确立的基础上,构建基于层次分析法(AHP)与模糊综合评价相结合的煤矿生产安全风险预测模型,将计算机信息技术与安全评价模型相结合,对煤矿安全预警系统的功能需求和模块设计进行详细论述,建立了煤矿风险预警与防控系统。针对煤矿安全生产的随机性、动态变化性、复杂性以及灾害事故的关联性等特点,依据风险评价指标体系的设计原则,以“人、机、环、管、固”为理论框架,构建了煤矿安全生产风险二级评价指标体系。通过多算法对比分析确定层次分析法,并以此为理论基础构建基于层次分析法(AHP)与模糊综合评价相结合的煤矿安全风险预测模型。利用层次分析法对各个安全风险指标进行权重确定。通过模糊数学方法确定指标体系中各级指标的隶属度函数,量化指标体系,实现煤矿安全风险预警预测。采用J2EE体系构架Jsp+Javabean,完成了煤矿风险预警与防控系统的开发。设计开发出煤矿基础信息管理子系统、煤矿风险研判与处置子系统、煤矿风险防控管理子系统等,煤矿风险预警与防控系统基于统一数据标准(联网备查),依托云计算、物联网、大数据技术,对煤矿海量数据进行采集,构建指标及模型,实现在线巡查、风险智能研判、风险预警提醒等功能。将所研发的煤矿风险预警与防控系统应用于紫晟煤业有限公司,评价得出紫晟煤矿的安全风险指数为88,风险等级评价标准为Ⅱ级,属较安全型煤矿,评价结果与现场实际相符;同时针对矿井风险预警与防控系统中的薄弱环节,提出相应的改进措施,进一步提高了矿井的生产安全性。研究成果具有推广应用价值。该文有图23幅,表23个,参考文献86篇。
二、基于信息论网络的时序数据库挖掘(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于信息论网络的时序数据库挖掘(论文提纲范文)
(2)多元时间序列复杂网络重构方法研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 国内外主要研究现状 |
1.2.1 复杂网络重构 |
1.2.2 时间序列异常检测 |
1.3 本文创新点 |
1.4 本文工作与安排 |
第2章 基础理论知识 |
2.1 复杂网络的概念 |
2.2 斯皮尔曼相关性系数 |
2.3 支持向量回归 |
2.4 社区挖掘算法 |
2.5 时间卷积网络 |
2.6 自动编码器 |
2.7 评价指标 |
2.8 数学符号 |
2.9 本章小结 |
第3章 基于特征丰富与时间卷积网络的异常检测框架 |
3.1 引言 |
3.2 模型介绍及算法描述 |
3.2.1 时间序列特征丰富 |
3.2.2 时间卷积网络自动编码器(TCN-AE) |
3.2.3 算法伪代码 |
3.3 实验结果及分析 |
3.3.1 数据集 |
3.3.2 对比算法 |
3.3.3 其他设置 |
3.3.4 实验结果 |
3.4 本章小结 |
第4章 基于斯皮尔曼相关系数的网络重构 |
4.1 引言 |
4.2 模型介绍及算法描述 |
4.2.1 模型介绍 |
4.2.2 算法伪代码 |
4.3 实验结果及分析 |
4.3.1 数据集 |
4.3.2 实验结果 |
4.4 本章小结 |
第5章 完整网络模型构建及数据高效存储 |
5.1 引言 |
5.2 完整网络模型重构 |
5.3 图数据库及网络模型高效存储 |
5.4 时间序列数据库及时序数据高效存储 |
5.5 本章小结 |
第6章 总结与展望 |
6.1 全文总结 |
6.2 研究展望 |
参考文献 |
致谢 |
在学期间主要科研成果 |
一、发表学术论文 |
二、软件着作权 |
三、申请专利 |
四、其他科研成果 |
(3)面向铁道供电监控信息大数据的列压缩方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 课题研究的背景和意义 |
1.2 国内外研究现状与趋势 |
1.2.1 国内外常用的数据预处理技术 |
1.2.2 国内外常用的数据压缩算法 |
1.3 本文的主要内容及结构 |
第二章 铁道供电监控系统大数据压缩技术 |
2.1 铁路供电调度监控系统 |
2.2 铁路供电调度监控数据 |
2.3 监控信息的无损压缩方法 |
2.3.1 数据压缩的主要性能指标 |
2.3.2 LZ系列压缩算法介绍 |
2.3.3 LZ4 压缩算法介绍 |
2.3.4 Snappy压缩算法介绍 |
2.3.5 Bzip2压缩算法介绍 |
2.4 本章小结 |
第三章 基于大数据组件的调度监控信息列式数据库 |
3.1 列式数据库系统架构 |
3.2 列式数据库存储模型 |
3.2.1 列式数据库写模型 |
3.2.2 列式数据库读模型 |
3.3 列式数据库内存组织形式 |
3.3.1 BucketCache内存组织形式 |
3.3.2 MemStore内存组织形式 |
3.4 列式数据库部署 |
3.4.1 Hadoop云集群搭建 |
3.4.2 Hbase列式数据库搭建 |
3.4.3 Hbase列式数据库内存配置 |
3.5 基于YCSB的压力测试 |
3.6 本章小结 |
第四章 列式数据库的内存压缩模型的设计及测试结果分析 |
4.1 基于列式数据库内存的扁平化设计 |
4.1.1 监测数据内存中的性能分析 |
4.1.2 内存数据的折叠压缩方法 |
4.1.3 折叠压缩方法中的冗余处理策略 |
4.1.4 折叠压缩方法的处理流程 |
4.2 内存压缩性能增益模型 |
4.3 集群测试情况 |
4.3.1 压缩对导入数据的影响 |
4.3.2 压缩对集群磁盘I/O读写速率的影响 |
4.3.3 压缩对集群运行内存占用性能影响 |
4.3.4 压缩对集群查询性能影响 |
4.3.5 压缩耗时对比 |
4.4 本章小结 |
第五章 基于神经网络融合上下文匹配的列压缩方法及实现 |
5.1 列压缩处理模型 |
5.2 基于神经网络驱动上下文匹配的列压缩方法介绍 |
5.2.1 上下文匹配算法建模结构 |
5.2.2 模型混合器结构 |
5.2.4 算术编码模块的设计 |
5.3 压缩流程 |
5.4 关键部分代码 |
5.4.1 神经网络混合概率关键部分代码 |
5.4.2 上下文匹配算法关键部分代码 |
5.5 神经网络动态压缩机制 |
5.6 列式压缩实验 |
5.6.1 压缩对比分析 |
5.6.2 上下文阶数参数调优 |
5.6.3 压缩文件数据完整性测试 |
5.7 本章小节 |
第六章 总结 |
6.1 主要工作回顾 |
6.2 本课题需进一步研究的地方 |
参考文献 |
个人简历 在读期间发表的学术论文 |
致谢 |
(4)时序数据无损压缩算法研究(论文提纲范文)
致谢 |
摘要 |
ABSTRACT |
1 引言 |
1.1 课题研究背景与意义 |
1.2 国内外研究现状 |
1.3 课题研究内容与目标 |
1.4 论文组织结构 |
2 相关理论介绍 |
2.1 时序数据与数据编码 |
2.1.1 算术编码 |
2.1.2 基于预测误差的编码模型 |
2.2 机器学习基础 |
2.2.1 决策树与CART回归树 |
2.2.2 时间序列森林分类器 |
2.2.3 循环神经网络模型 |
2.3 时序数据无损压缩技术 |
2.3.1 Gorilla数据库压缩技术 |
2.3.2 InfluxDB数据库压缩技术 |
2.4 本章小结 |
3 e-DoD时间戳压缩算法 |
3.1 问题描述 |
3.2 二阶差分编码 |
3.3 e-DoD时间戳压缩算法介绍 |
3.3.1 e-DoD压缩算法中的位掩码法、尾零法与偏置法编码 |
3.3.2 e-DoD压缩算法编码过程 |
3.3.3 e-DoD压缩算法解码过程 |
3.4 实验与分析 |
3.4.1 实验数据集与评价指标 |
3.4.2 数据压缩算法测试及结果分析 |
3.5 本章小结 |
4 PredZip时序数据值压缩算法 |
4.1 问题描述 |
4.2 PredZip算法介绍 |
4.3 PredZip算法概率预测模块 |
4.3.1 独热编码 |
4.3.2 FC预测模型 |
4.3.3 LSTM预测模型 |
4.3.4 XGBoost预测模型 |
4.4 PredZip算法的编码与解码过程 |
4.4.1 PredZip算法编码过程 |
4.4.2 PredZip算法解码过程 |
4.5 实验与分析 |
4.5.1 实验数据集与评价指标 |
4.5.2 实验结果与分析 |
4.6 本章小结 |
5 CS-Zip时序数据压缩算法 |
5.1 问题描述 |
5.2 CS-Zip时序数据压缩算法 |
5.2.1 遍历择优标注法与时序数据分类 |
5.2.2 两阶段压缩 |
5.2.3 CS-Zip算法编码过程 |
5.2.4 CS-Zip算法解码过程 |
5.3 实验与分析 |
5.3.1 实验数据集与评价指标 |
5.3.3 实验结果与分析 |
5.4 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
作者简历及攻读硕士学位期间取得的研究成果 |
学位论文数据集 |
(5)基于云边协同微服务架构的志愿服务平台设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景与意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 国内外研究现状 |
1.3 研究内容和创新点 |
1.4 论文结构安排 |
第二章 志愿大数据标签补全与推荐算法研究 |
2.1 志愿服务领域概况 |
2.2 志愿服务数据源介绍 |
2.2.1 数据源综述 |
2.2.2 数据源分析与清洗 |
2.3 志愿标签智能补全算法研究 |
2.3.1 数据筛选与数据处理 |
2.3.2 数据向量化 |
2.3.3 用户画像描述 |
2.3.4 基于标签幂集策略决策树的多标签分类 |
2.3.5 标签补全结果分析 |
2.4 志愿服务推荐算法研究 |
2.4.1 数据筛选与数据处理 |
2.4.2 基于重载运算符的相似度算法 |
2.4.3 基于重载运算符的混合加权推荐算法 |
2.4.4 推荐结果分析 |
2.5 本章小结 |
第三章 云边协同微服务架构研究 |
3.1 志愿服务网络架构现状 |
3.2 基于Docker的微服务框架实现 |
3.3 泛化设备接入与处理 |
3.3.1 基于EdgeX的设备接入 |
3.3.2 构建通用SDK |
3.4 云边节点自我感知 |
3.4.1 基于多叉树的网络拓扑抽象 |
3.4.2 自我感知设计实现 |
3.5 资源监控与服务动态升降级 |
3.5.1 资源监控微服务 |
3.5.2 服务动态升降级的实现 |
3.6 基于Docker Swarm的负载均衡 |
3.6.1 Docker Swarm容器集群部署 |
3.6.2 容器集群负载均衡实现与验证 |
3.7 结果分析 |
3.8 本章小结 |
第四章 云边协同微服务架构下志愿服务平台搭建 |
4.1 志愿服务平台设计 |
4.1.1 平台应用场景 |
4.1.2 平台架构设计 |
4.1.3 平台搭建环境 |
4.2 边缘设备端设计与实现 |
4.2.1 前端展示页面 |
4.2.2 智能标签补全微服务 |
4.2.3 后端实现 |
4.3 边缘服务器设计与实现 |
4.3.1 个性化推荐微服务 |
4.3.2 后端实现 |
4.4 总云端设计与实现 |
4.4.1 前端数据可视化 |
4.4.2 后端实现 |
4.5 微服务容器化设计与实现 |
4.5.1 微服务容器构建 |
4.5.2 微服务容器部署 |
4.6 与传统平台对比 |
4.6.1 与传统单一应用架构对比 |
4.6.2 与传统云服务架构对比 |
4.6.3 与传统单层或双层云边协同架构对比 |
4.6.4 本章小结 |
第五章 总结与展望 |
5.1 研究工作总结 |
5.2 问题和展望 |
参考文献 |
致谢 |
(6)交叉口交通状态识别与拥堵传播规律挖掘方法研究(论文提纲范文)
中文摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的及意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 国内外研究现状 |
1.3.1 研究概述 |
1.3.2 交通数据预处理研究 |
1.3.3 交通状态的识别研究 |
1.3.4 交通状态预测研究 |
1.3.5 既有研究评述 |
1.4 研究内容及技术路线 |
1.4.1 研究内容 |
1.4.2 论文结构和技术路线 |
第二章 基础数据描述及预处理 |
2.1 数据描述 |
2.1.1 数据采集方式介绍 |
2.1.2 交叉口区位概述 |
2.1.3 数据格式描述 |
2.2 数据问题产生的原因 |
2.3 数据异常和缺失的识别与修复 |
2.3.1 数据异常 |
2.3.2 数据缺失 |
2.4 无检测器交叉口数据的计算 |
2.4.1 相似聚类原理介绍 |
2.4.2 模型依据 |
2.4.3 改进模型的原因及效果分析 |
2.5 数据的平滑处理 |
第三章 基于流量的交叉口交通状态参数估计 |
3.1 交叉口交通状态参数概述 |
3.1.1 交叉口交通状态定义及影响因素 |
3.1.2 交通状态分类及特征 |
3.2 交通状态参数介绍 |
3.2.1 交通状态参数选取原则 |
3.2.2 常用交叉口交通状态参数 |
3.3 饱和度计算 |
3.3.1 方法概述 |
3.3.2 分析验证 |
3.4 排队长度估算 |
3.4.1 方法概述 |
3.4.2 分析验证 |
3.5 延误时间估计 |
3.5.1 方法概述 |
3.5.2 分析验证 |
第四章 区域交叉口拥堵传播规律挖掘 |
4.1 区域交叉口拥堵传播机理 |
4.2 Apriori数据挖掘算法概述 |
4.2.1 数据挖掘技术介绍 |
4.2.2 Apriori算法的应用 |
4.2.3 Apriori算法中的相关定义 |
4.2.4 Apriori算法的具体步骤 |
4.3 拥堵传播规律挖掘模型建立 |
4.3.1 基本原理 |
4.3.2 时序数据库建立 |
4.3.3 路网拓扑约束 |
4.3.4 参数设置 |
4.4 案例分析 |
4.4.1 模型结果 |
4.4.2 时间特征分析 |
4.4.3 空间特征分析 |
4.4.4 在拥堵预测系统中的应用 |
第五章 总结与展望 |
5.1 研究成果总结 |
5.2 创新点总结 |
5.3 研究展望 |
参考文献 |
攻读硕士期间取得的成果 |
致谢 |
附录 |
(7)基于深度学习的快速路交通事故数据生成及事故识别方法(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 数据预处理 |
1.2.2 特征选择 |
1.2.3 数据生成 |
1.2.4 交通事故识别 |
1.3 主要研究内容 |
1.4 技术路线与方法 |
1.5 论文组织结构 |
第二章 网约车数据预处理 |
2.1 数据预处理 |
2.1.1 数据预处理方式 |
2.1.2 数据预处理流程 |
2.2 网约车数据预处理 |
2.2.1 数据简介 |
2.2.2 数据质量分析 |
2.2.3 数据清洗方案 |
2.3 预处理效果分析 |
2.3.1 总体清洗效果分析 |
2.3.2 具体案例分析 |
2.3.3 清洗结果验证 |
2.4 本章小结 |
第三章 基于网约车数据的事故特征选择 |
3.1 交通事故数据整理 |
3.1.1 交通事故界定 |
3.1.2 特征提取 |
3.1.3 交通事故数据集 |
3.2 特征选择过程与度量标准 |
3.2.1 特征选择过程 |
3.2.2 信息论度量方法 |
3.2.3 相关性、冗余性、互补性分析 |
3.3 基于优化互信息下限的交通事故特征选择方法 |
3.3.1 特征内部相关性下限分析 |
3.3.2 基于优化互信息下限的交通事故特征选择方法 |
3.4 实验结果分析 |
3.4.1 实验设置 |
3.4.2 实验结果 |
3.5 本章小结 |
第四章 基于改进生成对抗神经网络的交通事故数据生成 |
4.1 深度学习模型 |
4.1.1 神经元模型 |
4.1.2 激活函数 |
4.1.3 神经网络 |
4.1.4 训练过程 |
4.2 基于改进生成对抗神经网络的交通事故数据生成 |
4.2.1 生成对抗神经网络 |
4.2.2 交通数据生成对抗神经网络 |
4.2.3 实验设计及过程 |
4.3 实验结果分析 |
4.3.1 多样性分析 |
4.3.2 可靠性分析 |
4.3.3 显着性差异分析 |
4.3.4 离群值分析 |
4.4 本章小结 |
第五章 基于混合神经网络的交通事故识别 |
5.1 交通事故识别 |
5.1.1 交通状态参数选择 |
5.1.2 交通事故识别方法 |
5.2 基于混合神经网络的交通事故识别 |
5.2.1 混合神经网络模型结构 |
5.2.2 实验设计及过程 |
5.3 实验结果分析 |
5.3.1 识别准确率分析 |
5.3.2 ROC曲线分析 |
5.3.3 增强效果分析 |
5.3.4 误报率分析 |
5.4 本章小结 |
第六章 结论与展望 |
6.1 总结 |
6.2 创新点 |
6.3 展望 |
参考文献 |
致谢 |
攻读学位期间发表学术成果 |
(8)区域交叉口交通拥堵传播规律挖掘方法研究(论文提纲范文)
1 交通状态判别 |
1.1 模型基本原理 |
1.2 交叉口需求流量 |
1.3 交叉口通行能力计算 |
1.4 模型必要性验证 |
1.5 拥堵程度划分 |
2 拥堵传播规律挖掘 |
2.1 基本原理 |
2.2 时序数据库建立 |
1)交通状态基础数据库 |
2)交通状态合并数据库 |
①多元时间序列合并集数据库 |
②滑动时间窗口事务集数据库 |
2.3 添加路网拓扑约束 |
2.4 参数设置 |
3 实证与分析 |
3.1 模型结果 |
3.2 拥堵传播规律分析 |
1)回溢模式 |
2)流出模式 |
3.3 在拥堵预测系统的应用 |
4 结 语 |
(9)面向时序数据库的时间序列数据有损压缩算法研究(论文提纲范文)
中文摘要 |
英文摘要 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文主要研究内容 |
1.4 论文组织结构 |
2 相关背景技术介绍 |
2.1 引言 |
2.2 时间序列数据特性 |
2.2.1 时间戳类型 |
2.2.2 数据点类型 |
2.3 时间序列数据库 |
2.4 现有的时间序列数据点压缩技术 |
2.4.1 分段线性技术 |
2.4.2 矢量量化技术 |
2.4.3 信号变换技术 |
2.4.4 旋转门数据压缩技术 |
2.5 本章小结 |
3 面向时序数据库的时间序列数据有损压缩算法 |
3.1 引言 |
3.2 基于差值法的时间戳压缩算法 |
3.2.1 压缩算法 |
3.2.2 解压算法 |
3.3 时间序列数据值有损压缩算法 |
3.3.1 矢量量化预处理 |
3.3.2 压缩算法 |
3.3.3 解压算法 |
3.4 本章小结 |
4 实验测试与分析 |
4.1 引言 |
4.2 测试环境 |
4.3 时间戳压缩算法测试结果及分析 |
4.4 数据值有损压缩算法测试结果及分析 |
4.4.1 性能测试 |
4.4.2 整体测试 |
4.5 本章小结 |
5 总结与展望 |
5.1 本文总结 |
5.2 展望 |
参考文献 |
附录 |
A 作者在攻读学位期间发表的论文目录 |
B 作者在攻读学位期间发表的专利目录 |
C 作者在攻读学位期间参加的科研项目目录 |
D 学位论文数据集 |
致谢 |
(10)紫晟煤矿风险预警与防控系统研发及应用(论文提纲范文)
致谢 |
摘要 |
abstract |
变量注释表 |
1 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 研究内容及方法 |
2 煤矿风险预警系统总体设计 |
2.1 设计原则 |
2.2 系统总体架构 |
2.3 数据库设计 |
2.4 系统开发环境 |
2.5 本章小结 |
3 煤矿风险预警与防控系统体系建立 |
3.1 煤矿风险预警指标体系的建立 |
3.2 煤矿风险预警体系模型建立 |
3.3 本章小结 |
4 煤矿风险预警与防控系统开发 |
4.1 煤矿基础信息管理子系统 |
4.2 煤矿风险研判与处置子系统 |
4.3 风险指标与模型管理子系统 |
4.4 煤矿风险防控管理子系统 |
4.5 风险预警数据展现子系统 |
4.6 本章小结 |
5 煤矿风险预警与防控系统应用 |
5.1 紫晟煤矿概况 |
5.2 紫晟煤矿风险预警模型 |
5.3 紫晟煤矿风险预警与防控系统 |
5.4 本章小结 |
6 结论与展望 |
6.1 结论 |
6.2 展望 |
参考文献 |
附录1 |
作者简历 |
学位论文数据集 |
四、基于信息论网络的时序数据库挖掘(论文参考文献)
- [1]金融审计防范和化解金融风险研究 ——以A商业银行为例[D]. 吴蓉. 哈尔滨商业大学, 2021
- [2]多元时间序列复杂网络重构方法研究[D]. 孟超. 齐鲁工业大学, 2021(09)
- [3]面向铁道供电监控信息大数据的列压缩方法研究[D]. 洪应迪. 华东交通大学, 2021(01)
- [4]时序数据无损压缩算法研究[D]. 陈瑾. 北京交通大学, 2021
- [5]基于云边协同微服务架构的志愿服务平台设计与实现[D]. 张望. 北京邮电大学, 2021(01)
- [6]交叉口交通状态识别与拥堵传播规律挖掘方法研究[D]. 施佳呈. 苏州大学, 2020(02)
- [7]基于深度学习的快速路交通事故数据生成及事故识别方法[D]. 黄子豪. 武汉理工大学, 2020(08)
- [8]区域交叉口交通拥堵传播规律挖掘方法研究[J]. 施佳呈,吴戈,俄文娟. 河北工业科技, 2020(03)
- [9]面向时序数据库的时间序列数据有损压缩算法研究[D]. 顾艺. 重庆大学, 2019(01)
- [10]紫晟煤矿风险预警与防控系统研发及应用[D]. 李贺. 辽宁工程技术大学, 2019(07)