BI和真正数据信息剖析处理云储存成本费难题

2021-01-20 05:46

近年来来,紧紧围绕云计算技术的全部运用正在逐渐增多,但现阶段公共性云服务中的运用只意味着了IT总开支的1小一部分,而公共性云运用的最大短板好像是昂贵的云计算技术储存成本费。与Web有关的云运用将会会储存数以百兆的数据信息,而重要每日任务运用则将会会储存TB级的数据信息,按现阶段的价钱看来,其储存成本费是绝大多数客户所无法承担的。

除非流行的、占公司费用预算大头的重要每日任务运用可以迁往公共性云,不然这1态势将不容易产生转变。可是值得庆幸的是,大家有两种对策能够来处理这1云储存成本费难题:数据信息抽象性和遍布查寻式数据信息浏览。

将数据信息抽象性方式用于商业服务智能化和成本费剖析运用

现阶段,商业服务智能化(BI)与剖析是云计算技术最有发展前途的两个运用。这些运用都集聚在关键IT管理决策上,且遍及在整体规划者和管理决策者中。这使得它们变成理想化的云计算技术运用,创建真正而但是分巨大的绝大多数据是大家以前提出的两个数据信息成本费管理方法方式中第1个,即数据信息抽象性的1个实际执行。数据信息抽象性是从初始企业信息内容中造成1个或好几个引言数据信息库的体制,其数据信息库经营规模应保证它(们)可以被经济发展地储存在云计算技术中。

BI和真正数据信息剖析处理云储存成本费难题

在诊疗制造行业中的某1个顾客曾表明,根据确诊编码、医治编码和年纪/性別的方式,建立1组病人信息内容引言数据信息库,将降低3百倍以上的信息内容量,这代表着其云数据信息储存和浏览成本费仅为未经数据信息抽象性解决的3百分之1。假如期待数据信息抽象性方式变成1种高效率的成本费管理方法方式,那末就务必对怎样开展剖析和剖析的目标开展深层次科学研究。大多数数BI运作的目地其实不是以便发现细节信息内容;它们是以便找寻某种规律性或某种发展趋势发展趋势。针对大多数数的制造行业来讲,有确立的自变量十分关键。

根据对这些自变量建立引言数据信息库,可以根据加速浏览速率来减少成本费开支,另外也不容易危害剖析工作中自身。1旦界定好自变量的特殊组成,那末以后如有必须从未抽象性的数据信息中提取该组成的详尽信息内容也是是非非常非常容易完成。这样1来,根据数据信息抽象性的剖析就变成了1个云运用,能够用于数据信息管理中心的详尽剖析实际操作。

对非构造化数据信息应用遍布查寻式浏览方式

数据信息抽象性方式可用于对具备小量关键自变量主要参数构造化买卖数据信息的剖析运用。但它不可用于非构造化文件格式的传统式绝大多数据,这是由于非构造化数据信息的抽象性较为无法完成。一些企业在建立电子器件电子邮件特殊单词或单词组成高鉴别率数据信息库的运用中有过很多取得成功实例,可是其前提条件标准是这样的重要词/词组成是能够预圣人道的。针对大多数数运用来讲,還是必须有1个更加通用性的方式的。这个方式便是大家所提出的第2个数据信息成本费管理方法对策——遍布查寻式数据信息浏览方式。

一般来讲,数据信息解决每日任务能够分成3个一部分:对数据信息的具体解决、用于精准定位数据信息部位的数据信息库管理方法浏览,和从大量储存机器设备中获得信息内容的储存浏览。假如因为成本费缘故而没法把很多的信息内容迁往云,那末也就没法在云中完成信息内容的逐条浏览。最好是的处理方式便是在云之外的某地代管数据信息和查寻逻辑性,高并发送数据信息库管理方法系统软件(DBMS)查寻指令以提取数据信息的1个非空子集,从而完成在云中的数据信息解决。在公司內部保证DBMS模块作用并只把查寻和結果迁入/出云可以明显地减少数据信息储存和浏览成本费。

对于这类作用区划对运用程序流程开展构造设计方案是相对性简易的,客观事实上,正有愈来愈多的厂商出示了包括储存/查寻作用的DBMS模块或机器设备。可是,搭建对于运用程序流程的查验防止止有难题的查寻构造出示全部的数据信息信息内容是是非非常必要的对策。在这里,试点检测是不足的;在交货前,查寻逻辑性理应检测結果的尺寸。

尽管当今有许多人对怎样建立混和云十分关心,可是对将来云中重要每日任务运用程序流程来讲,建立“混和数据信息”将是更加关键的每日任务。假如缺乏1种最佳化应用物美价廉当地储存資源和高宽比灵便云计算技术解决的方式,那末客户们将会会发现她们的大中型数据信息将驱使她们维持传统式的IT构架。



扫描二维码分享到微信

在线咨询
联系电话

020-66889888