仓库建设范文(精选12篇)
仓库建设 第1篇
近年来,计算机信息技术的发展日新月异,医疗信息化建设得到快速发展,医疗服务信息手段越来越先进和便捷,医疗信息化的巨大社会价值和经济潜力也日益显现。作为临床教学医院,在日常科研活动中,病历资料是我们极其珍贵的科研素材,无论是在论文撰写还是在临床科研项目申报过程中均占据主导地位。此外,临床教学医院目前承担的很多科研课题,其数据提取、统计、挖掘和分析能力也亟待提高。我们希望通过将医院分散的临床数据整合起来,建立一个独立的、完整的医学科研数据仓库来更好地为医院的科研服务。为此,我院与加拿大福安易数据技术有限公司合作开展医学科研数据仓库的研发与应用项目。项目的目标是要充分整合我院各信息系统宝贵的临床数据资源,挖掘和共享临床科研数据,帮助提高各级医学技术人员的科研能力和效率。
1 医学科研数据仓库建设的技术方法
1.1 医学数据仓库概念
医学数据仓库是将医院的事物性数据经过提炼、加工,集成为对医院有用的信息,是面向主题的、集成的、相对稳定的、随时间变化的用于决策支持和数据分析的数据库系统。数据仓库是定期更新的、存放大量的有用数据,应用智能报表工具、数据挖掘工具,结合专业人员的专业知识,从数据中获得有用的信息,为医疗、科研、管理和决策提供宝贵的信息支持和辅助手段,从而大幅度提升医院医疗、科研和经营管理水平。
1.2 面向主题的数据仓库技术
数据仓库技术按规模和用途可划分为企业级数据仓库和部门级数据仓库。其中企业级医院数据仓库能为整个医院各个部门的运行提供决策支持手段;而部门级医院数据仓库,也称数据集市,是部门级的或面向医院中某一主题的,一般只为某个局部范围内的人员服务。建立医学科研数据仓库,就是在医院层面上建立面向医学科研主题的数据仓库。
1.3 数据仓库技术在医学科研中的应用
我们将面向主题的数据仓库技术应用于我院的实例项目实施上,就是将医院现有的电子化业务数据中有关临床医学的海量数据进行整合,以集成的电子化数据形成医学科研的专用数据仓库。以数据仓库技术为核心的医学数据整合系统,独立于已有的医院业务系统,以全新的设计将分散的业务系统产生的不一致的数据进行整理、变换、集成,整合得到全面、高效、一致的信息。数据仓库技术实现对历史的全部海量数据进行在线的、实时的、深入的分析,并使其变得很轻松[1]。
1.4 医学科研数据仓库设计方法
数据仓库的用途决定了其设计、实施都与传统的交易型数据库不同。一个成功的数据仓库的创造和实施,不仅需要良好的数据模型和优化的实现技术,而且需要把众多相关的因素很好地进行集成和组织,形成一套有效的设计方法和实施规则。医学科研数据仓库的设计分多个阶段来实施,其中每一个阶段的开发通常采用瀑布模式。数据仓库的设计一般都采用范式技术设计数据的层次,运用逆范式技术、星型模型设计方法设计多维的数据库[2]。其中有效地进行数据的采集、传送、装载在开发过程中非常关键。应用商务智能工具、数据挖掘工具分析数据仓库中的信息,为用户提供分析结果和依据,体现数据仓库建设的价值。最后,高效的数据仓库还少不了数据优化处理,如应用数据分区、数据索引等技术优化查询的速度[3]。医学科研数据仓库的建设是一个不断完善的过程,但目的只有一个,就是从数据中获得有用的信息,挖掘和共享临床科研数据,帮助提高科研者的科研能力和效率,多、快、好、省地获取科研成果。
2 医学科研数据仓库的建设过程
2.1 分散的业务数据源分析
我院的临床业务信息系统主要包括住院信息系统(HIS)、实验室信息系统(LIS)、病案管理信息系统、放射科信息管理系统(RIS)以及健康管理信息系统等。这些信息系统涵盖了我院大部分临床业务,分散在5个不同的数据库,数据库环境全部为SQL Server,版本从2000到2005。这5个数据库的历史数据不尽相同,最长的积累了约10年数据,最短的积累了约5年数据。按照数据集成的完整性,约有5年的完整临床数据,包含了临床业务的各主要环节,可为临床科研提供完整的研究资料。
2.2 医学科研数据仓库的技术设计
数据仓库系统往往基于超大数据集,而且需要配备强大的数据分析工具,因此我们选用了Oracle 10g数据库系统做为我们的科研数据库平台。采用异种数据库连接的架构设计实现各业务数据库与科研数据仓库的数据通信。鉴于业务数据库所应用的SQLServer基于Windows环境,因此本项目选用的Oracle10g也基于Windows环境。异种数据库连接采用Windows的开放式数据库互联(ODBC)。
2.3 医学科研数据仓库的数据整合
数据整合即数据的提取、转换和加载(Extraction-Transformation-Loading,ETL),负责将分散的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础[4]。在我们的项目中,应用了很多整合的方法,如源数据导出、数据导入、“脏”字段数据清洗、数据约束性清洗(除去重复记录)、数据类型转换、数据格式映射,数据追加、数据更新等。由于篇幅所限,在此只给出数据整合的一个实例。
在本例项目中需要整合来自2个异种数据源的数据:病案数据库和住院HIS数据库。在异种数据源的匹配分析中发现,直接将住院HIS数据库中住院病人表的主键INPATIENT_NO与病案数据库中病人和病案表的主键BAID进行连接时,它们的交集较少、匹配度不高,按照业务数据设计的规则,因此需要建立一个数据变换的映射。我们按照姓名、性别、出生日期、入院日期、出院日期和住院号进行匹配连接,经过数据变换的映射后得到了较为满意的整合结果。首次匹配果,见表1。
为了进一步增加住院病人表与病人和病案表的交集,我们按照姓名、性别、出生日期、入院日期和出院日期进行匹配连接,结果使得两表的匹配度进一步提高。在住院病人表中,有124374条记录与病案相匹配,占住院记录(143357条)的86.76%。剩余18983条与病案不匹配的住院记录中,有11046条记录源自出院的产科婴儿(婴儿与母亲共用同一个住院号,在病案数据库中未单独建立住院记录);2254条记录是短时间多次出入院,并已在病案数据库中进行了合并;5683条属于其他特殊情况。调整条件后匹配结果,见表2。
3 医学科研数据仓库的数据安全
临床科研项目的目标始终是研究群体的医学规律,极少涉及个案医患双方的私密信息。因此,智能医学科研系统中严格屏蔽与病人隐私有关的任何信息,如姓名、身份证号、住院号、家庭住址、单位名称、联系电话等,更没有与临床工作人员和科室有关的任何信息。基于对业务系统和临床数据安全的要求,我们在医学科研数据仓库系统中增加了诸多安全技术措施,如:
(1)将医学科研数据仓库系统建在医院外网,与内网业务系统物理隔离。
(2)对所有涉及追踪索引的信息均予以剔除,在应用系统中看不到任何病人和工作人员的个人信息。
(3)封闭了所有源数据的下载功能,普通用户只能导出科研统计分析结果数据。
(4)对应用系统的用户进行分级授权管理,不同的用户拥有不同的数据访问权限。
4 医学科研数据仓库的应用
基于我院医学科研数据仓库,与加拿大福安易数据技术有限公司进一步合作搭建了面向科研探索、分析和研究的应用平台。采用数据挖掘技术、智能统计学技术和智能报表技术,使医学科研数据仓库的应用得以充分的发挥。
4.1 科研样本种类多、样本量大、样本数据收集快
由于建立了真正历史性的医学科研数据仓库,使科研工作者可以轻易地获取积累10年的大量临床样本数据,利用智能样本筛选工具,可以广泛获取各类科研设计所需的样本数据,基于大样本的高水平科研更加容易了[5,6]。利用基于数据仓库的智能化自定义样本筛选工具,使样本数据收集速度大大加快,从通常的几周至几个月的周期加快为几分钟至几小时。
4.2 支持多课题的并发研究
由于医学科研数据仓库系统提供了全在线共享式(院内局域网)的智能科研平台,可以支持多课题的并发研究,因此医院开题可能成倍地增长,最终获得的成果和论文也会成倍地增加[7,8]。
4.3 科研成功率高,获得成果快
由于我们搭建了基于数据仓库的智能医学数据挖掘工具,这一基于大量数据的主动式分析工具可以直接有效地获取科研靶向和科研成果,可以使基于数据挖掘成果的科研设计和统计试验获得非常高的成功率,从而极大地缩短了获得科研成果的周期。
经过我院多个科研部门对智能医学科研系统的实际应用,获得了良好的应用效果,使得我院的科研工作得以多快好省地发展,从而也证实了医学科研数据仓库的建设取得了成功。
参考文献
[1]黄德全,刘海燕,施蕴渝,等.生物信息学中的智能计算理论与方法研究[M].安徽:中国科学技术大学出版社,2006.
[2]Ralph Kimhall.Margy Ross.The data warehouse toolkit:the complete guide to dimensional modeling[M].New York:Wiley,2002.
[3]Patil Preeti S.Srikantha Rao.Suryakant B Patil.Optimization of data warehousing system:simplification in reporting and analysis[J].International Journal of Computer Applicarions,2011,9(6):33—37.
[4]Shantakumar B Patil.Y S Kumaraswamy.Extraction of signiGcant patterns from heart disease warehouses for heart attack prediction[J].International Journal of Computer Science and Network Security.2009,9(2):228-234.
[5]郭中正.基于数据仓库的医院决策支持系统的研究与设计[J].中国医疗设备,2013,28(8):45-46.
[6]仲晓伟.医院管理决策数据仓库建设的研究[J].医疗卫生装备,2012,33(8):80-83.
[7]孔林.基于HIS的数据仓库构建及多维分析[J].医学信息学杂志,2011,32(11):6-9.
仓库建设工程方案 第2篇
编制内容
本方案根据建设单位提供的招标文件及现场实勘,专门针对招标文件要求的仓库工程而编制。
本施工方案针对该工程的特点,结合实际,本着确保工程质量优良、方便施工、经济合理的原则,选择合理的施工机械。
本施工方案是为本次投标而作的投标方案,若我公司中标,我们将在施工过程中随时根据甲方要求和施工现场实际情况作相应调整。
工程概况
工程位于**农场木丁堂坡,建筑面积为2240㎡,层数为5层。
施工总体安排
整个工程施工原则为:先地下后地上,先基础后主体,充分利用平面、空间和时间,组织平面立体流水交叉作业,为及早插入下道工序和各专业施工创造条件,做到科学管理均衡施工。
本工程地梁、柱、屋架、等采用现场预制;大型屋面板、天沟板、钢支撑等采用场外委托生产;吊装采用先将柱子、地梁吊装就位并校正固定后,再采用两台吊车同时从轴分别起吊屋架、支撑及屋面板、天沟板。
第二榀屋架吊装固定完毕后即可开始砌筑围护墙。
施工办法
土方开挖
土方开挖采用机械开挖至设计标高以上200高处,采用人工修边拣底。当挖至设计标高后应对基坑进行钎探,发现软弱土层应予以清除至好土层超挖部分应用二八灰土分层夯实回填至设计标高。
基底验槽
当挖至设计标高后,请质监站、建设单位、设计单位、勘测单位检查验收,经多方签字认可后立即浇筑混凝土垫层。在地基验槽合格后,立即浇筑混凝土垫层。垫层施工完毕再进行杯基施工。杯型基础钢筋在现场钢筋房中制作完成后,在浇筑现场绑扎。除杯芯部分配制工具式定型木模外,其它均采用组合钢模板拼装,钢架管支撑。杯芯模板采用木模外包镀锌铁皮,芯模大样及杯基模板支撑详见附图。
基础浇筑时按台阶分层一次浇筑完毕,不设施工缝,每层砼一次浇足,按先边角后中间的顺序。为防止垂直交角处可能出现吊脚现象,可采取如下措施:
a)、在第一级砼捣固下沉2~3cm后暂不填平,继续浇筑第二级,先用铁锹沿第二级模板底圈做成内外坡,然后再分层浇筑,外圈边坡的砼于第二级振捣蛋过程中自动摊平,待第二级砼浇筑后,再将第一级砼齐模板顶边拍实抹平。
b)、捣完第一级后拍平表面,在第二级模板外先压以20cm×10cm的压角砼并加以捣实后,再继续浇筑第二级,待压角砼接近初凝时,将其铲平重新搅拌利用。
c)、砼浇筑时,采用流水作业方式,即顺序先浇一排杯基第一级砼,再回转依次浇第二级,这样对已浇好的第一级砼有个下沉的作用时间,但必须保证每个柱基砼在初凝之前连续施工。
d)、为保证杯形基础杯口底标高的正确性,宜先将杯口底砼振实并稍停片刻,再浇筑振捣杯口模四周的砼,振动时间尽可能缩短,同时还应特别注意杯口模板的位置,应在两侧对称浇筑,以免杯口模挤向一侧或由于砼泛起而使芯模上升。
e)、为提高杯口芯模的周转利用率,可在砼初凝后终凝前将芯模拔出,并将杯壁划毛。
杯基拆模后应及时回填夯实,以防基础浸水。标准结构层施工程序 弹墙、梁中心线及外边线,测水平标高,并做好标志--柱钢筋套筒冷挤压连接(或电渣压力焊连接)--绑扎柱、剪力墙钢筋——预埋件等隐蔽工程验收,安装管线及隐蔽工程验收——封剪力墙模板——浇筑柱、剪力墙砼——拆墙模板--搭设楼梯支撑梁、平台支撑排架--铺设楼梯楼层底模(包括连系梁底模)--弹线(轴线、标高尺寸验收)--绑扎连系梁钢筋--绑扎次梁、楼板、楼梯钢筋、管线安装--隐蔽工程验收(包括钢筋、管线、埋件、孔洞)--清理垃圾,浇水安装砼泵管--浇筑楼板砼、楼梯砼--养护--拆模(保证强度)每个楼层均按此顺序循环,施工工序不得颠倒。砼浇捣质量保证措施: 砼浇捣前,模板、支撑、钢筋、预埋件及管线等均应进行检查和签署“隐蔽工程验收单”“技术复核单”并由业主监理工程师现场代表认可,最后由公司主任工程师签发砼“浇捣令”,上述工程未结束,未签发“浇捣令”,不得为抢进度擅自施工。砼浇筑前,应将模板内的垃圾、杂物、油污清理干净,并浇水湿润模板,模板缝要堵严。深度较大的竖向结构中,浇砼时浇灌高度超过3米时,为防止砼离析,采用串筒溜槽等布料其间距为1.5米,窗框下边另行布料,以免砼在窗角形成空隙,砼的水灰比和坍落度,宜随浇筑高度的上升,酌予递减。柱、梁砼振捣采用插入式振动器,振动器移动间距不宜大于400厘米,振动时间≥15秒,一般至振实和表面露浆为止,尤其在钢筋埋件较密部位(节点)要多振,以防产生空洞,使用振动器要快插慢拔,振动棒应避免碰钢筋、模板、预埋管线等。砼浇捣应分层浇捣,每层厚度控制在50厘米以内,上下两层间歇时间不得超过2小时,振动捧插入下层砼应5厘米以上,确保两层的紧密结合。楼板砼采用平板振动器,平板振动器的移动间距应互相重合,覆盖已捣实砼的边缘。砼浇捣过程中,要保证砼保护层厚度及钢筋位置的正确性。不得踩踏钢筋,不得移动预埋件和预留孔洞的位置,如发现偏差和位移,应及时校正,特别要重视竖向结构的保护层和板及挑梁结构负弯矩部分钢筋的位置。在砼施工阶段应掌握天气的变化情况,特别在雷雨台风季节。以保证砼连续浇筑的顺利进行。砼浇捣完成终凝后,应视气温情况,冬季应履盖草包,薄膜,夏季应浇水养护。为了确保砼浇捣,在每一次砼浇捣前,对振动人员进行技术交底,并在施工中加强监督、指导,同时项目经理部对砼浇捣人员关于每个楼层砼质量进行奖罚,以加强施工人员的责任心和积极性。为确保砼构件不产生裂缝,模板的拆模必须符合下列规定: 不承重模板应在砼强度能保证其表面及棱角不受损坏时,方可拆除,强度R>1.2MPa(夏季在终凝后一天,冬季在终凝后二天)。梁:跨度L<8m时,强度R≥70% 跨度L≥8m时,强度R=100% 楼板强度R≥70%,悬臂梁R=100% 在拆模过程中,如发现砼有影响结构安全质量问题时,应停止拆除,并报技术负责人研究处理后再行拆除。已拆除模板及支架的结构应在砼达到设计强度后,才允许承受全部计算荷载,当施工荷载大于设计荷载时,应经研究加设临时支撑。平板砼的标高控制:在浇捣砼之前,将楼层标高用卷尺及水准仪由标高基准点引测至楼层各构造柱及受力柱的钢筋上,离楼板砼面50cm用红油漆涂红作标记,浇砼时,利用此标记,由砼工在各柱子间拉墙线控制楼板砼的厚度。平板砼浇捣完毕,在砼初凝之后,终凝之前,待平板砼有七、八成干时,用木抹进行两次抹面,有效控制楼板砼的微裂缝。梁、柱节点处的模板预先绘出大样图,并预先试拼,确保梁柱节点处的模板拼接严密,以免漏浆。梁柱节点部位若钢筋过密,此部位的砼则用同强度等级的细石砼分层浇捣,并用小直径振动棒认真振捣,精心操作。确保此处砼的密实度。
本工程砌体采用240标准粘土砖,砌体在工程中只起到隔断和部分围护的作用。
1)施工要点: a.砌块施工前,应先根据设计图纸和砌块尺寸,垂直灰缝的宽度,水平灰缝的厚度等计算砌块的皮数和排数,保证砌体的尺寸。
b.为保证砌体工程的质量,材料部门购进的砌块必须具备出厂合格证和检验报告,并对每批砌块进行外观质量和尺寸偏差检查。•砌块的长度偏差不超过3mm,且砌块不允许出现缺楞、掉角、裂缝等现象。严禁购进不合格的砌块。
c.砌体工程施工前,砌体必须浇水润湿,并应先将楼面标高找平,根据设计图纸放出墙体的轴线,立好皮数杆。d.砌体工程施工时,铺灰长度应控制在1.5m内,灰缝应横平竖直,砂浆饱满,砌块间应有良好的粘结力,其垂直灰缝的宽度不应大于20mm,水平灰缝的厚度不得大于15mm。
e.砌体施工至设计要求高度时,按设计要求浇筑细石砼带。f.砌体工程要严格按照施工规范和标准图集进行施工。2)质量标准及验收内容:
a.砌筑砂浆及细石混凝土强度不得低于设计强度等级。
b.砌体组砌、排列方式应正确,竖向不应有通缝,转角处和交接处的斜槎,应通顺、密实。
c.墙面应保持清洁,灰缝密实,深浅一致,横竖缝交接处应平整。d.砌体的允许偏差为:轴线位移5mm,表面平整度(用2m•长直尺和塞尺检查)6mm,水平灰缝平直(用长线拉直检查)。
3)注意事项:
a.砌体施工时,不能站在墙身上进行砌筑、划线、检查墙面平整度和垂直度、灰缝、清扫墙面等操作,也不能在墙身上行走。
b.砌块砌体上不能吊挂重物,也不能作其它施工临时设施支撑的支承点。c.砌体脚手架上,严禁集中堆放砌块等材料。
本方案所包含的砌体工程,设计上采用MU10标准粘土砖,砂浆为:±0.00标高以下采用M5水泥砂浆;±0.00标高以上采用M5混合砂浆。
砖在上墙前应派专人湿润,严禁干砖上墙,淋在雨中或浸泡在水里的砖不应立即使用。
砖砌体砌筑采用匹数杆,严格将灰缝厚度控制在8~12mm以内,砌筑时采用一顺一丁挤浆法,避免垂直通缝,以保证砂浆饱满度。
车间内地坪施工时,首先将地坪以下地基土夯实平整,将未经处理的软弱土层按设计要求全部挖除,分层夯实好素土。素土夯实层经检测符合设计要求后再进行300厚三七灰土的分层碾压工作。因软弱土层的范围具有较大的不可预见性,故在实际施工中该部分工程量按实计算。
地基除理完毕后紧接着施工下一道工序:300mm厚三七灰土分层碾压。所采用的消石灰应采用生石灰块,使用前34天予以消解,并加以过筛,其粒径不得大于5mm,不得夹有未熟化的生石灰,也不得含过多的水分。其次土料不得含有有机杂质,使用前应过筛,其粒径不得大于15mm。三七灰土分层夯实的施工要点如下:
(1)灰土拌合料应保证比例准确、拌合均匀,颜色一致。拌好后及时铺设夯实。
(2)灰土拌合料应适当控制含水量。工地检验方法为:用手将灰土紧握成团,两指轻捏即碎为宜;如拌合料水分过多应晾干,水分不足应洒水润湿。
(3)灰土拌合料应分层铺平夯实,每层虚铺厚度为150250mm,夯实至100150mm。
(4)上下两层灰土的接缝距离不得小于500mm,施工间歇后继续铺设前,接缝处应清扫干净,并应重叠夯实。
(5)夯实后的表面应平整,经适当晾干后,方可进行下道工序的施工。三七灰土分层碾压并符合设计要求后进行200mm厚C20混凝土层的施工。首先混凝土的配合比应通过计算和试配决定,混凝土浇筑时的坍落度宜为13cm。其次,混凝土应采用机械搅拌;捣实时采用平板振动器,平板振动器的移动间距,应能保证平板覆盖已振实部分的边缘,每一振处应使混凝土表面呈现浮浆和不再沉落。第三,混凝土应按设计要求纵横3m设缝分仓浇筑,且钢筋应断开。最后,混凝土浇筑完毕,应在12小时内用草帘等加以覆盖和浇水养护,浇水养护日期不少于7昼夜。
抹灰工程应在其墙体表面质量经检查合格后,在设备、预埋件安装完毕的前提下,经检查无误后方可施工。
室内墙面抹灰工艺流程:
基层表面处理→打巴出墙→抹底层砂浆→抹中层砂浆→抹罩面灰→质量自检。
涂料施工流程:基层清扫→填补缝隙、局部刮腻子→磨平→第一道满刮腻子→磨平→第二道满刮腻子→磨平→涂乳胶漆。
本工程屋面为氯化聚乙烯防水屋面,其作法为:①大型屋面板基层,②水泥聚苯隔热板100厚,③25mm厚1∶2.5水泥砂浆找平层,④氯化聚乙烯橡胶防水层。屋面施工中应注意:
1)找平层表面应压实平整;排水坡度应符合设计要求。水泥砂浆抹平收水后应二次压光,充分养护,不得有酥松、起砂、起皮现象。屋面通风器根部以及天沟处均应作成圆弧。
2)防水施工时,基层表面应干燥,否则施工后可能出现起鼓和粘接不良现象;且施工时特别注意水落口、管根和阴阳角等易渗部位的加强处理:先进行上述部位的防水施工,再在基层上作整体大面积防水层。
3)屋面防水施工必须按工序、分层次进行检查验收,彻底根除防水隐患。屋面施工应严格按照现行国家标准GB50207-94执行。
仓库建设 第3篇
关键字:大数据;数据仓库;教育决策
中图分类号:TP393 文献标志码:A 文章编号:1673-8454(2015)01-0014-02
一、教育的大数据时代
在大数据的时代,各行各业都在谈大数据,它的影响辐射各行各业,并且已经开始在信息产业、交通运输、医疗卫生、食品安全等领域中发挥出重要作用。与此同时,作为面向社会公众的教育行业,无论从教育数据资源的情况,还是对大数据的分析应用需求看,亦进入了大数据时代。
教育管理信息化是《国家中长期教育改革和发展规划纲要(2010-2020年)》和《教育信息化十年发展规划(2011-2020年)》所确定的教育信息化建设核心任务之一,对支持教育宏观决策、加强教育监管、提高各级教育行政部门和学校的管理水平、全面提升教育公共服务能力具有不可或缺的重要作用。教育改革发展涉及面广、难度大,越来越需要准确全面的数据分析和服务作为教育科学决策的支撑。建设国家教育管理信息系统,就是建立涵盖学生、教师、学校资产及办学条件的教育管理信息系统和基础数据库,并以此为基础建立数据分析与科学预测的教育决策服务系统,已成为支持教育改革与宏观决策的现实需求。国家教育管理信息系统的建设,也为教育大数据的积累奠定了基础。
二、教育大数据仓库与数据服务支撑平台
教育大数据仓库与数据服务支撑平台是基于教育服务与监管基本宗旨,统筹考虑教育事业全局,以适应大数据时代教育数据新特征和支撑教育监管和决策的数据分析为出发点,集成大数据思路和传统数据仓库架构,构建纵向覆盖各级教育机构,横向覆盖教育各业务领域的、统一的教育数据信息资源中心,将合适的教育数据资源及时、有效地提供给合适的教育管理、决策者进行教育主题研究分析、评价和预测,促进教育监管与决策更加合理性、准确性、科学化以及智能化,服务于教育事业的改革创新,支撑教育事业智慧化的发展趋势。
1.总体架构
平台的总体架构以教育系统全局为视角,以应用为驱动,基于SOA的理念,运用柔性架构设计思想和分层体系架构,以“满足当前应用、扩展未来需求”为目标,综合考虑大数据时代下新的技术思路和传统数据仓库的优势,采用组件化、服务化的方式,灵活适应功能、分析内容的动态追加和变更,满足系统未来变化的需要。架构的主要内容以及相互之间的逻辑关系如图1所示。
2.主要内容
(1)数据集成整合系统:是将各种数据源中的各种类型的数据按照教育数据资源中心的数据规范要求进行清洗、转换等操作,将符合教育数据资源标准体系要求的数据整合、加载到教育数据资源中心,为后续的统计、分析、挖掘业务提供高质量、规范化的数据资源;
(2)数据管控系统:是对数据资源的集中管控,保证数据的准确性、完备性和安全性。主要建设元数据管理、数据质量管理和数据安全管理,从而达到对教育数据资源中心中数据的管控;
(3)数据治理体系:是对教育数据资产管理行使权力和控制的活动集合,是建立教育数据管理制度、指导教育系统执行数据规划、数据环境建设、数据安全管理、元数据管理、数据质量管理等其他数据管理活动的持续改进过程和管控机制;
(4)数据服务调度管理系统:是整个平台的“发动机”,以教育管理各级行政单位、各级各类学校、科研院所以及社会公众等不同团体在监管、决策、研究分析以及公众数据服务等应用为驱动,将教育数据资源中心数据按照一定的规则,运用合适的智能分析技术,以组件化、模块化、服务性的方式及时、准确、合理地推送给数据分析应用中心,从而直观、友好地展现给不同的监管者、决策者、研究分析人员以及社会公众;
(5)智能分析系统:主要是利用教育数据资源中的数据,通过即席查询、统计报表、多维查询、数据挖掘等技术手段,进行多种教育主题的综合分析以及通过大量数据信息挖掘潜在信息,实现教育的评价与预测等,然后以一种合适的、直观可视化的、有好的方式及时、准确地提供给相关教育监管、决策、研究分析人员以及社会公众,从而实现教育监管、决策以及研究分析的科学化、智能化。
3.预期目标
(1)汇集不同来源的各种教育数据资源,建立起统一、规范的教育数据信息视图,形成覆盖教育各领域的、综合的、面向各种教育主题的教育数据资源中心,实现统一的教育数据管控、治理机制;
(2)形成面向不同主体的、特定领域的教育应用主题的数据集合,按照不同的教育主题进行组织、汇总、管理数据,满足政府(教育行政单位及国家其他行政单位)、学校、社会公众、国际教育团体等不同教育数据应用主体对数据进行分析解读、评价和预测的需求;
(3)建立柔性化的分析性数据应用服务的统一出口,通过灵活的组件化方式,将特定的数据集以合适的数据展示形式及时地、直观地提供给各种不同的教育数据应用领域,满足教育监管与决策的数据服务需求;
(4)建立国家、省两级教育大数据仓库与数据服务支撑平台体系,既实现不同教育级别不同类型教育数据资源的整合与集成,同时又能够满足国家和省级不同的应用需求;
(5)构建一套全面的、标准化的、可操作性的教育数据资源服务保障体系,形成一种长久有效的教育数据资源服务保障机制,可持续性地为教育监管与决策服务。
总之,国家教育大数据仓库和数据服务平台的建设实施,将全面、有效地支撑各级各类教育数据资源的分析,并且使教育监管与决策智能化的能力得到逐步提升。
三、结语
当今各行各业都在大谈大数据的时代,大数据的开发应用已经被许多国家提到国家战略的高度来进行研究。今年初李克强总理所做的政府工作报告中明确提出要设立新兴产业创业创新平台,在大数据等方面赶超先进,引领未来产业发展。作为国家公共管理部门,教育如何适应大数据时代,并利用大数据的开发应用推动教育事业的发展、改革与创新,支撑教育事业智慧化的发展趋势,是当前所有教育同仁共同思考的话题。并且随着国家教育信息化战略的实施,大数据的开发应用需求更加迫切,所以我们应当适应大数据潮流,把握机遇,充分利用大数据,结合教育信息化建设现状,构建教育大数据资源中心,有效支撑教育的监管和决策,推动教育的智慧化,从而实现教育的变革。
参考文献:
[1]张春艳.大数据时代的公共安全治理[J].国家行政学院学报,2014(9).
[2]沈菲飞.基于数据仓库的高校学生管理预警与支持系统[J].巢湖学院学报,2007,9(5).
[3](英)Viktor,Kenneth著,盛杨艳,周涛译.大数据时代-生活、工作与工作思维的大变革[M].浙江:浙江人民出版社,2013.
[4]韩蕊.大数据让数据仓库更具有价值[J].互联网周刊,2014(3).
[5]俞燕萍,丁荣涛.基于数据仓库技术的学生就业趋势分析系统设计[J].中国科技信息,2008(7).
浅谈税务系统数据仓库的建设 第4篇
数据仓库 (Date Warehouse) 是支持管理决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。它与数据库的区别:所谓面向主题即根据最终用户的观点组织和提供数据, 而数据库只能根据应用的观点组织数据;持久的数据集合是指除了当前数据外, 还包含大量的历史数据, 而这些数据在数据库中通常是被删除或更新的, 故数据仓库的容量比数据库大得多;其中的历史数据由于是在不同时间数据库模式的不同版本中, 所以需要集成和关联来自多个数据库和应用程序获得的、随时间变化的数据, 由此聚集并提供的信息比数据库提供的信息更概括、更本质、更全面。数据仓库不是现成的单一产品, 它的建立不是取代数据库, 而是建立在一个全面、完善的信息应用基础上的综合了多种技术的计算环境。
数据仓库系统 (DWS) 由数据仓库、仓库管理和分析工具组成。它的功能主要有两个:一是从各信息源提取需要的数据, 加工处理后存储到数据仓库;二是直接在数据仓库上处理用户的查询和决策分析请求, 尽量避免访问信息源。由此可知, 数据仓库的主要应用有两个方面:在数据仓库中寻找有用信息和支持高层决策分析。
二、数据仓库在税务管理中的应用
随着税务管理信息化建设的逐步完善, 各级税务部门积累了大量基于税收业务的、面向管理的、可信度高的数据, 这些数据是财富, 是进行科学决策并实施有效管理的关键, 同时这些分散在不同应用系统中的数据为数据仓库的建立提供了基本的数据来源。通过数据仓库将业务数据和管理信息进行重新设计、抽取、转换、加载等处理, 形成新的面向各种主题的数据库;通过数据库为决策者进行数据的深层挖掘、多维分析、动态查询等, 从而适应税务管理人员方便地分析税源、监控纳税户的需要, 为税务机关科学化管理和领导科学决策提供有效途径。
增加税收收入、提高工作效率、保证执法的一致性和公平性、降低对纳税人的负担和干扰, 是各级税务管理部门的重要目标。然而这些目标往往又是相互冲突的, 要在其间找到最适当的平衡点是非常困难的。通过应用数据仓库技术, 对税务部门的内部和外部数据进行综合分析处理, 将历史数据集中, 可以达到征管中的以下要求:一是方便领导查询与决策, 数据仓库是作为决策支持系统 (DSS) 服务基础的分析型数据库, 它可存放大容量的数据, 为领导制定决策提供详尽的信息;二是它能存放历史数据, 便于不同年度的相互比较及数据转换;三是通过将不同的业务子系统联结, 通过数据仓库功能可反映一个纳税人的全面征管信息。
如何为纳税人提供更好的服务, 是税务部门的一个主要任务, 通常情况下, 税务管理的应用系统是按业务分类的, 如登记、申报、征收、发票、稽查等, 特别是国税部门管理的范围广而全, 要掌握一个纳税人的全部信息需调用多个模块才能达到目的, 而通过建立数据仓库, 可以将分散在各个业务系统的数据集中成一个全面的视图, 这样就可以看到该纳税人各项活动的全貌, 而且可以从历史的角度对纳税人档案、财务数据、申报征收数据等进行分析, 以便向纳税人提供更好的服务。
三、税务管理数据仓库的建设原则
1、一致性原则
在构建数据仓库时, 应在税务管理信息一体化原则的基础上, 采取自上而下的方法, 统一对数据仓库的模式、格式、主题和数据进行定义, 以保证各个数据库之间数据集成、异构数据转换和数据标准的一致性。
2、实用性原则
应尽量从数据比较规范的业务入手, 可将第一个数据仓库的实现定位于会计统计部门的税源分析, 尽可能用简单、统一、易于使用和维护的方式来实现, 避免复杂和片面追求完美。
3、渐进性原则
数据仓库的建设是一个漫长的过程, 在建设数据仓库时应将其进行切分, 统一规划, 分步实施, 由简入繁, 分清主次, 边建设, 边应用, 边见效, 以应用促发展, 逐步提高决策管理人员的认识程度, 然后分步实施更复杂的开发主题, 这样既能减少投资, 又可以达到事半功倍的效果。
四、税务管理数据仓库的建设步骤
1、制定统一标准。
设计体系结构根据税务管理信息一体化建设总体方案要求, 对数据仓库的建设制定统一的标准, 各应用系统只承担数据采集和简单的数据分析, 不含跨平台任务, 所有比较复杂的数据分析工作都由数据仓库系统完成。设计数据仓库的体系结构是一个关键环节, 它由三部分组成:一是内部外部信息源的获取;二是数据仓库和数据集市的建立;三是信息展现方式。
2、确定开发主题。
制定业务需求数据仓库建设前期应确定一个简单而实用的开发主题, 然后技术人员同业务人员一起对业务需求进行详细分析, 并制定出可行的业务需求说明书。逐步进行各主题的设计和开发, 最终实现所有税务管理主题的完成。
3、功能结合应用。
实现决策支持分析把数据仓库、联机分析处理、数据挖掘和模型库结合起来即形成综合决策支持系统。其中的数据仓库用来实现对决策主题数据的存储和综合;联机分析处理用于多维数据分析;数据挖掘用以从数据库和数据仓库中提取知识;模型库实现多个广义模型的组合辅助决策。
五、税务管理数据仓库建设要点
1、主题鲜明
成功的数据仓库必须主题鲜明, 应围绕要解决的重要业务问题进行数据仓库系统设计。衡量的标准是:税务人员应该能从对象数据模型上看到相应的税收业务。
2、业务部门的支持和参与
数据仓库的价值在于提供决策支持能力, 服务的对象是各级税务管理人员, 因此, 业务和行政管理上的影响大于技术因素, 所以, 离不开业务部门的支持和参与。
3、详细的历史数据
历史数据不是包袱而是宝贵的战略资产, 数据仓库就是依靠大量的数据 (包括历史数据) 来解决业务问题的。因为对未来税务管理趋势的预计是通过基于过去的税收业务数据建立的预测模型来实现的, 这就需要非常专业的信息系统人员对每年由税收业务产生的数百兆的税收数据进行清洗、加载、访问、显示和存储。
税务管理数据仓库的建立不仅可以为各级领导提供决策分析, 将计算机技术在税务部门征管工作中的应用推上一个新的台阶, 而且可以保障依法治税、深化征管改革。加快税务管理数据仓库建设, 税收信息化建设必将迎来一个崭新的时代。
摘要:目前, 全国税务管理信息系统一体化建设正在加紧制定和实施, 统一的税收征管主体软件已试点运行并逐步推广, 国税“金税工程”开通运行取得了惊人的成绩, 软件不断改革创新……但是各应用系统自成体系, 数据集中程度低, 信息共享困难、综合利用率低等问题也随着信息技术的发展及其在税务管理中应用的深入而逐步暴露出来。此时将分散在税务部门内的各种跨平台的数据经过重新组合和加工, 构成面向决策支持的综合数据库, 从而构造适应税务管理需要的数据仓库, 已成为摆在国税部门面前的一个现实问题。
仓库建设项目工作总结 第5篇
现就工程有关情况总结如下:
一、项目立项
因本司发展,原仓库已经不敷使用,故本司于201X年成立了以熊少希同志为组长,傅咏梅、陈鹄、叶海战、龙少棠、陈天华、李旭鹏和王小坚为组员的新仓库建设项目小组,提请总公司同意立项建设新仓库。新仓库项目总建筑面积约为28500平方米,其中现代中药生产仓储大楼占地5600平方米,共五层,层高6。5米~7。8米,用途为1~3层作仓库,4~5层作车间;小仓库,占地165平方米,一层,暂时考虑用作五金仓;项目投资总预算为5000万。
二、项目前期工作
立项后,工作小组迅速启动相关工作,在201X年完成了项目的地质勘察工作,选定了设计单位并于当年完成方案设计工作;在完成了规划、环保、防雷和人防的报建工作,取得《项目建设规划许可证》,并在8月进行了土建、水电、监理项目的招标工作,12月12日正式开工建设。
三、工程施工管理
本项目由叶海战同志担任施工现场主管,由龙少棠和陈天华同志协助进行现场管理。
1、施工质量
从开工开始工作小组就制订了质量目标,建立了质量保证体系。除了现场管理人员严格把关外,质监站、监理也在现场严格监督质量,每周定期进行抽检1~2次。施工过程中严把工程材料质量关,主要材料采购均有质保书、合格证、检测报告,进场后会同现场监理,随机见证取样,检验合格后才用于工程中。工地实行“三检制”,班组自检、互检、交接检,在此基础上,由项目小组成员和监理员检查,组成一个完整的质量检查体系。在各种检查中实行“质量否决制”,在分项、分部工程施工前对施工班组进行技术交底,在工程隐蔽前,须由项目小组成员和监理人员检查验收合格后才进行隐蔽。在各方共同努力下,工程质量完全满足国家建筑规范要求。各附属工程也严格按合同和规范的要求进行施工质量监督,和主体工程一样抓质量,附属工程质量合格。
2、施工安全
从开工开始工作小组就制订了安全目标和各项规章制度,由叶海战、龙少棠和陈天华同志主持施工现场安全工作,制订专项安全防护措施。环球的安全管理人员李旭鹏和王小坚同志则从旁协助监督。建立定期巡查制度,在巡查中检查一旦发现安全隐患,立刻采取有效行动,针对安全隐患制订专项整改措施并整改到位。最终实现了在整个
施工过程中零安全事故的目标。
3、文明施工
加强综合治理,所有施工人员进场前必须接受工地纪律培训,并与各施工班组长签订文明施工责任书。在工作小组的严格管理下,新仓库项目施工过程中没有发生过一起违法乱纪事件、治安事件和火灾事件,生活区和施工区均秩序井然。生活区和办公区、施工区的环境卫生工作到位,施工全过程做到了文明施工。
四、工程竣工
工程施工过程顺利,在9月大楼封顶,工程进入外装修和设备安装阶段。现已完成外墙铺贴、道路、内部扇灰、消防、给排水等工程,将在201X年1月报请顺德国土城建局组织进行建筑物整体竣工验收。
五、资金管理
本项目总预算为5000万。工作小组聘请了专业的第三方造价咨询公司为本项目核定了拦标价。而在招标过程中,工作小组通过多次考察、谈判和咨询造价公司意见,最终选定了最具性价比的工程承包商,节省了大量建设资金,为本项目的资金管理工作开了个好头。在本项目施工过程中,我们继续严格实行资金预算管理,严控计划外增补,按现在情况来看,应该不会发生大幅度超预算的情况。
六、存在问题
由于项目小组管理人员的经验不足,项目实行过程中出现了一些问题。如对现代制药技术的发展估计不够充分,一开始大楼的设计层
高不足导致后续修改而延误了工期;与使用部门的联系不够紧密,导致使用部门到工程后期才提出修改意见,从而造成工程延误及费用增加;现场物料管理不够严格,造成物料堆放有时候有些混乱等。
七、剩余工作
现在新仓库项目已经进入工程收尾阶段,除了绿化外的全部工程项目应该可以在一个月内完成,并在3个月内完成办理房产证手续。
《人类的秘密仓库》 第6篇
海洋( )非常的辽阔,( )深得惊人。最深的地方,就是把世界上最高的珠穆朗玛峰放下去,它的山尖也会被海水完全淹没!
就在这浩瀚无边、深不可测的大海里面,蕴藏着无穷无尽的动物、植物、矿物和其他资源。仅仅是目前已经发现的海洋动物,从身长30多米、体重120吨以上的鲸到要用显微镜才能看到的浮游动物,就多达15万余种。那数不清的鱼、虾、蟹、蚌,含有丰富的脂肪、蛋白质和人体不可缺少的维生素,可做成营养丰富的食物或制成珍贵的药品。在海底深处,人们还找到了更重要的宝藏(cáng zàng),那就是丰富的石油!而所有这一切,只不过是这伟大的人类秘密仓库中的一部分财富,还有更多宝藏在海洋深处等待着人们去开发呢。
在弱者的眼里,那波涛汹涌的大海是可怕的,在强者的眼里,大海却是那么的神秘(bì mì)而又令人憧憬,它在召唤一大批才智出众的勇士,运用科学知识去寻找开启海洋宝库的金钥匙。少年朋友们,立下大志,勤奋学习,刻苦锻炼,准备做一个征服海洋的勇士吧!
(文/佚 名)
[挑战自我]
1.划去短文中括号内不正确的注音。
2.在文中括号里填上合适的关联词语。
3.写反义词。
开启——( )
波涛汹涌——( )
4.用横线画出文中具体描写海洋深不可测的句子。
5.“人类的秘密仓库”指的是_____。海洋里蕴藏着_____、_____、_____和其他资源。
证券公司经营管理数据仓库建设 第7篇
1 证券公司数据仓库结构模型
通过对证券公司经营模式的深入调研, 我们得出证券公司经营情况数据仓库的体系结构模型, 如图1所示。整个体系结构共分4层:数据层、数据转换层、数据仓库 (数据集市) 层、应用层。
数据层主要包括各种业务系统的数据, 主要业务系统有:柜台交易系统、证券清算系统、证券行情系统、客户营销系统等。
数据转换 (ETL) 层主要实现从数据层抽取 (Extraction) 、数据清洗 (Cleaning) 、数据转换 (Transformation) 、数据加载 (Loading) 。正是通过数据转换层, 实现了从细节级、轻度综合、中度综合直至高度综合的企业级全局数据仓库。
最终用户通过OLAP (联机分析) 和数据挖掘等的分析引擎, 可以围绕某个主题进行不同角度、不同层次的OLAP分析, 从而得到各类分析报告, 解决决策支持需要;还可以通过数据挖掘的各种功能实现经营业绩预测、客户交易行为预测、客户关系分析等。
我们选择SQL Server 2005作为数据库平台, ETL在DTS的基础进行二次开发, 多维分析引擎选择SQL Server Analysis Service。
2 设计数据仓库
证券经营数据仓库是在现有的各业务信息系统的基础上进行开发的, 它着眼于有效地提取、综合、集成和挖掘已有的数据库资源, 服务于决策分析的需要。数据仓库系统的开发是一个不断循环、反馈而使系统不断完善的过程, 在整个开发过程中自始至终都需要业务人员、分析人员、技术人员的共同参与和密切合作。根据证券公司的特点, 本数据仓库的开发包括以下几个步骤:
2.1 分析主题的确定
数据仓库是面向分析主题进行数据组织的。每个主题对应着某一个宏观分析领域所设计的分析对象, 是针对某一决策问题而设置的。
在对证券公司经营决策需求进行充分调研的基础上, 本数据仓库确定了交易佣金收入、客户组成情况、客户开发情况、客户交易量分析、客户保证金情况等几个分析主题。
2.2 维度模型设计
在确定分析主题之后, 需要对主题包含的信息进行详细的定义。利用维度建模的方法进行数据建模, 选择一种数据模型对相关主题的事实表和维度表的关系详细定义, 使其能够有效地组织数据仓库中的数据。
维度模型一般有两种不同性质的表:事实表和维度表。事实表是维度模型的基本表, 存放业务性能的度量值;维度表是进入事实表的入口, 提供观察度量值的角度。基于证券公司数据仓库系统的响应速度、复杂性和系统的维护工作量等方面的考虑, 在实施数据仓库系统的建设时, 采用星型模式来表达事实表和维度表之间的逻辑关系。
确定模式之后, 必须确定系统的分析粒度。粒度是维度划分的单位, 体现数据单元的详细程度和级别。数据越详细, 粒度越小, 级别越低, 数据量越大;数据综合程度越高, 粒度越大, 级别越高, 数据量越小。
证券公司经营情况数据仓库的维度模型 (部分) 如图2所示。
2.3 物理模型设计
物理数据模型主要解决如何组织和存储数据, 以满足系统处理的要求。建立物理模型是一个从逻辑模型向更加具体的、依赖于系统和数据库平台的物理形式转化的过程, 主要包括事实表设计、维度表设计、数据分区、索引排序设计、完整性约束设计、视图设计等方面。
由于证券客户交易数据量庞大, 所以我们采用按照时间进行分区存储。为了加快系统的响应速度, 对于访问频繁而记录少的维度表 (比如时间维表、客户类型等各种代码表) 设计为高速缓存表, 让数据在首次读取时驻留在系统内存中。
2.4 ETL系统设计
ETL是构建数据仓库的重要环节。ETL子系统由5个模块组成:系统调度模块、元数据管理模块、数据抽取模块、数据转换模块和数据装载模块。其中, 数据抽取模块负责将业务系统的原始数据进行抽取并保存到临时数据库中;数据转换模块负责对抽取出来的数据进行清洗、转换和计算汇总;数据装载模块负责将经过清洗、转换的、符合目标数据模型的数据装载到目标数据库中。以上3个模块的活动由系统调度模块统一调度, 结合元数据管理模块对整个ETL过程进行统一控制, 用以实现ETL各步骤的定时触发、正常执行和异常控制等过程。
3 总结
证券公司经营数据仓库提供了综合的、面向分析的环境, 为证券公司各个部门经营决策者的科学决策提供了信息基础。在本数据仓库的基础上, 可以运用OLAP联机分析处理工具支持用户进行多维的分析, 提供多角度的查询分析、预测和制作动态图表, 从而达到帮助用户轻松、有效完成信息分析的目的。同时依托本数据仓库, 通过数据挖掘, 还可以构建决策支持系统, 为决策者提供准确、完备的信息支持。
参考文献
[1]W H Inmon.Building the Data Warehouse[M].3rd Edition.New York:John Wiley&Sons Inc, 2002.
[2]王骏.构建数据仓库实例[J].计算机工程与设计, 2006 (10) .
[3]王海峰.一个数据仓库建模工具的设计与事项[J].计算机工程, 2005 (13) .
[4]袁然, 王诚梅.SQL Server2005中文版经典实例教程[M].北京:电子工业出版社, 2006.
电子文件中心的数据仓库建设与利用 第8篇
电子文件中心的价值在于收集和利用价值高的电子文件, 为其提供好的管理与技术手段基础, 确切地说是一个电子文件利用中心。理想的状态是, 在提高电子文件中心的利用效率的同时, 不降低甚至提高其信息的安全性, 同时拓展其决策服务功能, 由单纯的文件利用拓展到信息分析。因此, 在电子文件中心建立统一的、可发布的、社会化的可供查询及分析决策服务数据仓库成为必然的要求。
一、数据仓库简介
数据仓库是从多个数据源中收集的一个信息仓储系统, 是整合的、主题导向的、长期积累的, 且内容不频繁更改 (但可加入新信息) 的数据集合。本质上来说还是数据库, 但同时具有一定的特殊性, 通常情况下, 数据库系统主要应用于企事业单位的日常事务处理, 一般包括数据的录入、维护与管理、统计与查询、报表的形成等功能, 其主要目的在于使管理更加规范、科学与高效率。因此, 要求支持大量用户新建和修改数据的操作。在设计数据结构时为避免数据的冗余和提高处理效率以方便事务处理, 都力求符合一定的范式, 既以“正规化”的方式设计数据结构, 这样的结构适合于平时工作的事务处理的数据, 但不适合从数据中挖掘“知识”。而数据仓库不需要严格的符合设计范式, 它是为方便信息查询和分析而设计的, 其中的数据在同一个位置用唯一的模式存储。一旦收集完毕, 数据会存储很长一段时间, 允许用户对数据存取。特别是它可以提供给用户一个单独的统一的数据接口, 提高了安全性的同时, 易于信息的存取与分析。
二、电子文件中心的数据仓库建设
采用数据仓库技术能够在保证安全的前提下, 有效地实现电子文件中心的信息资源的共享。具体可以表现为将来源于不同类型或不同部门非保密的摘要信息资源, 集中到一个数据仓库中形成一个以一个或者多个分析主题的电子文件摘要信息中心, 并将该数据仓库的查询、浏览、分析功能对社会开放从而实现更广泛, 更有效率的基于电子文件中心的资源共享体系。从功能结构划分, 数据仓库系统至少应该包含数据获取、数据存储、数据访问三个关键部分。
数据源代表电子文件中心的信息存储系统, 不同的数据源表示不同类型或者不同部门的电子文件数据信息, 它们在空间上可以是处于分布状态的, DTS是DataTransformationService的简称, 表示数据库的数据转换服务, 其作用是可以将数据在不同的数据库之间导入导出, 并可以进行数据格式转换, 具体为删除对应用没有意义的数据段;转换到统一的数据名称和定义;计算统计和衍生数据;给缺值数据赋给缺省值;把不同的数据定义成统一格式及具有一致命名规范的模式。基于网络的查询与分析工具是数据仓库提供的对外利用接口, 通过该接口可以对确定的主题域进行查询、分析等操作而不影响电子文件中心的核心信息, 整体形成了单向数据流向。
三、数据仓库中信息的组织模型
不同于关系数据库的“物理-关联模型” (E-R Model) , 建立数据仓库所用的是“纬度模型” (DimensionsModel) , 纬度模型是从信息的利用者的观点来组织数据, 当需要从不同的主题进行信息分析时应该有不同的纬度, 这种数据组织结构通常为星型结构。
事实表中存放的数据通常为要分析的信息, 用于保存、利用和分析信息的直接数据, 是最终要查看和分析的内容, 在针对电子文件中心的数据仓库中, 可以存放文件的信息摘要或者针对某一主题的关键字、关键词, 或者为了进行统计而可以量化的属性, 它是数据仓库中最大的表, 由于数据仓库通常不进行事务处理, 因此它不考虑数据容量所带来的效率问题, 维度则用来存放事实表中数据的描述信息, 如我们可以存放文件形成时间、来源、密级等元数据信息, 每个维度的数据都存放在单独的表中。纬度的组合形成了展示事实表中信息的空间, 形成了多维环境下的不同的访问主题。
四、基于数据仓库思想的电子文件中心服务功能特点
基于数据仓库的信息服务系统具有以下优势:
1. 实现电子文件中心的分级利用与管理, 提供不同的服务模式, 如通过建立不同主题域的数据仓库, 将一些正常的利用业务与对外社会化的查询与提供决策分析的服务分开, 后者可由数据仓库提供, 因此不会影响到平时电子文件中心其他的业务管理工作, 既扩展了电子文件中心的服务功能又提高了其安全性。
2. 统一的、整合的数据, 保持了信息数据的一致性。通过DTS提供的服务将来源于不同类型、不同部门的信息数据按照统一规范的格式及相同的主题存储到数据仓库中, 一方面提高了数据的可靠性与查询的效率, 另一方面保证了各种信息分析时聚集运算的正确性。
3. 数据的单向流动保证了数据的安全性, 分布于电子文件中心各个数据载体的数据单向地转储到数据仓库中可以在两方面保证数据的安全性, 一是社会用户所操作的数据库只能是数据仓库, 二是对数据仓库用户角色的设置简单明了, 本质上只有只读权限, 堵塞了数据的安全漏洞。
4. 相对于电子文件中心的其他数据载体, 数据仓库是一个独立的数据环境, 可以根据具体需要提供主题导向的服务。电子文件的一个重要属性之一就是其保密性, 转储到数据仓库中的数据并不是所有的电子文件信息数据或者需要保密的数据, 而是只与社会需要主题相关的信息摘要。
5. 支持多维分析的查询模式, 可以对数据仓库从不同的维度或者若干维度的组合来进行信息的抽取与分析, 从而进一步实现电子文件中心信息资源的多角度分析。
以上所列的只是单纯从信息利用的角度来分析数据仓库的特点, 若从较宏观的角度来看, 完整信息数据仓库系统还要包括从数据库中过滤及提取可发布数据的网络化解决方案、提供分析决策的前台工具, 同时需要一定的建设与设计规范。
电子文件中心的建立为电子文件资源的管理和高效率的利用提供了新的契机, 除了有利于科学管理以及便于查询、统计外, 同时电子文件的集中管理有利于数据仓库的建设, 这样能够进一步为提供决策服务、数据挖掘等更高级的资源利用提供技术和管理的支持。但是要实现数据仓库还有很多问题需要解决, 如文件格式的标准化及安全机制的建立、管理的进一步优化、数据分析的主题等。
设计出科学、合理、安全、高效的电子文件中心信息管理与服务体系是电子文件利用的当务之急, 利用数据库技术将分布于各个不同部门及不同文件类型的电子文件信息进一步整合, 从而提高其利用价值, 这将会是电子文件新的利用方向。
摘要:本文介绍了用于信息分析的数据仓库技术, 探讨了电子文件中心的服务扩展模式, 提出了建设基于电子文件中心的数据仓库的构想并对其实现策略及功能特点进行了分析。
关键词:电子文件中心,数据仓库,数据转换,扩展服务
参考文献
[1]蒋海文.浅谈人事档案网络化管理[J].档案时空, 2006 (4) .
[2]伊恒.文件转化为档案的三个条件[J].档案学, 2006 (1) .
[3]陈芙蓉.档案信息化建设数据描述标准的研究[J].档案学研究, 2005 (3) .
建设知识仓库提高图书馆服务层次 第9篇
1 知识仓库是图书馆文献信息资源开发利用模式的发展方向
21世纪是以广泛地利用巨量信息为主要目标, 以信息的快速传播和交流日益频繁为基本特征的信息化社会, 深入到我们生活的每个角落, 面对如此浩淼的知识信息海洋, 究竟应该如何有效地运作, 实现知识管理, 达到资源共享的目的。知识仓库是图书馆文献信息网络化发展的方向。通过分析未来文献信息资源网络化发展的趋势, 我们有理由相信知识仓库是文献信息资源开发利用模式的发展方向。
知识仓库是一种特殊的信息库, 不仅存储着知识的条目, 而且存储着与之相关的事件和知识的使用记录、来源线索等相关信息。知识仓库是按某种特定的知识结构将无序信息组织整合而成, 并具有规定的使用功能的数据仓库。知识仓库不同于一般的数据仓库, 不是信息的简单数字化和有序化, 而是根据一个机构各个部门各类工作人员的知识需要, 按照使用的目的创建的新的知识体系。是一种知识的创新过程, 在帮助人们利用知识上, 知识仓库要比数据库更有效率。目前, 已有许多人用知识仓库这个术语代替数据库或数据仓库的概念, 因为它们都有具体的数据库作支持, 知识仓库是比另两者层次更高的概念, 也是未来的发展方向。
数据库和数据仓库是与知识仓库最为相关的个概念。广义地讲, 数据库是一种信息组织的方式;狭义地理解, 它是利用计算机技术对各种数据进行存储的技术手段或者是一种产品。数据仓库是一种面向主题, 进行复杂数据分析, 支持高层决策的技术, 通常会包含多个具体的数据库作为信息资源基础。数据仓库 (Data warehouse) 技术是指从大量的事务型数据库中抽取数据, 并将其整理, 转换为新的存储和组织格式, 用以支持管理中的决策制定过程。该过程以历史的角度组织和存储数据, 并能集成地进行数据分析。数据仓库除具有传统DBMS的完整性、共享性、数据独立性外, 还有面向主题而集成、数据的历史性和稳定性等特征。但数据仓库不是一种产品, 而是一个综合解决方案, 是对原始的操作数据进行各种处理并转换成有用信息的处理过程。传统数据库主要是面向业务处理, 而数据仓库则是面向复杂数据分析、高层决策支持。
构建文献知识仓库是指把文献内容根据各学科, 专业的知识结构进行分类整合, 使大量的信息有序化、知识化, 建立知识之间的联系, 同时对这些信息的被利用情况不断地进行分析, 形成应用价值性判断;经综合评估后再对知识进行精化, 文献数字化是构建文献知识库的基础;它将有助于发掘和增值文献的知识资本, 变革和创新文献出版模式, 促进信息资源管理向知识管理发展。
2 适应知识经济发展开展知识服务
知识服务就是为了适应知识经济发展和知识创新的需要, 根据用户问题解决方案的目标, 通过用户知识需求和问题环境分析, 对用户的整个解决问题过程而提供的经过信息的析取、重组、创新、集成而形成恰好符合用户需要的知识产品的服务。
知识服务与信息服务一样, 都属于智力型服务的范畴。所谓知识服务, 就是采取多种途径和方法, 从大量文献资源的宝库中开发、加工出有用的知识资源, 包括那些能被沟通、共享的认识和经验, 以及3所组织起来的信息等, 通过对事物本身及内在联系的有序揭示, 提高知识的可见度, 以便用户的吸收、利用和从中获得启迪。而信息服务是基于音信、消息、体验、数据等的服务, 主要是通过对这些信息资源的开发, 揭示出事物的外在特征及表层联系, 便于用户去进一步觅取所需要的具体知识, 进而触发自己的创造意念。
在现代信息环境下, 随着信息网络的普及、信息资源的数字化、信息系统的虚拟化, 打破了信息资源的不均衡分布, 使信息获取变得日益方便、普遍和简单化, 信息检索与传递走向非中介化、非专业化和非智力化, 传统信息服务在用户活动中的影响逐渐淡化, 信息技术的发展为知识服务提供了物质技术保障。这时, 用户关注的是如何捕获和析取解决所面临问题的知识内容, 并将这些知识内容创新、集成为相应的解决方案, 进而将这些知识固化在新的产品、服务和管理机制中。为此, 需要更直接地融入用户解决问题的全过程、更针对具体问题和个性化环境、更直接地帮助用户解决问题的知识服务。
传统信息服务的核心能力主要体现在信息组织、检索与传递。这种服务难以让人接受其服务的有效知识含量, 难以适应知识经济发展和知识创新的信息需求, 它的相对重要性及其竞争力已受到了知识经济的极大挑战, 即便是现代网络化信息服务也不能从本质上改变我们在竞争中的态势, 难以有效切入用户知识应用和知识创新的核心过程。知识服务是协助或是促使用户课题向更广、更深发展的服务。知识服务根据用户的要求, 对涉及到的知识进行收集、整理、分析、选用, 它是贯穿于用户问题研究的全部过程的服务。知识服务是对用户需求进行全方位组织的服务。知识服务是要帮助用户解决问题, 要对用户问题进行全过程的动态服务。
知识服务是利用现代化的设备对用户提供快捷、准确的知识创新服务。传统的以图书馆为中心对用户提供的服务会转为以用户知识需求为中心的知识服务。随着图书馆服务方式的改变, 馆员的服务观念也要转变, 要根据用户的需求, 充分利用数字化、网络化等现代化手段, 建设现代知识仓库, 为用户提供高效的知识服务。
3 目前我国知识仓库建设的启示
现在的知识仓库及其技术主要用于现有纸本出版物的处理及现有各种纸本资料的处理。而知识仓库及其技术最重要的特点是:即时在线处理, 即知识仓库并不只是收集过期期刊或是其它过期收藏品, 而是目前最新的有针对性的、能解决读者问题的知识。
我国的CNKI工程, 即中国国家知识基础设施工程, 就是一个以期刊为主体的文献知识仓库, 目前已初见成效。CNKI工程, 是建设适于我国的可以进行知识整合生产、网络化传播扩散和互动式交流合作的一种社会化知识基础设施。它是在《中国学术期刊》 (光盘版) (CAJ-CD) 和中国期刊网 (CJN) 超大规模全文数据仓库建设的基础上发展起来的一项规模更大、内容更广、结构更系统的知识信息化建设项目。
CNKI汇集了全国6600种期刊, 并以统一的数据规范存储成全文数据库, 文献累积量达450万篇, 信息量达500G。另外还有中国重要报纸全文数据库 (480种) 、中国优秀博/硕士论文数据库 (50000本) 、中国重要会议论文数据库 (2000本) 。从CNKI工程网站目前的构架来看, 主要分为国内通用知识仓库 (源数据库) 、海外知识仓库、政府知识仓库、企业知识仓库、网上研究院 (未开通) 、中国期刊网和知识产品与服务等。这几大部分实际是在CNKI源数据库基础上二次整合形成了面向主题和领域的知识仓库。
CNKI工程在知识库建设方面是超前的。其起点高, 具有超前的理念和思路, 并以先进的知识采掘技术为支撑, 已经在我国文献信息业从数字化向知识化管理的进程中走在了前列, 为构建图书或其它类型文献的知识仓库提供了宝贵的经验。
图书馆应开发个性化知识库以满足特定类型的机构和群体需要的各种层次和范围的知识信息, 同时开发网络化知识元数据库, 从全文数据库中提炼出能够明确表述一个知识内容的元数据, 为检索网络信息资源奠定基础。从概念和语义上来检索知识单元, 实现知识管理, 提供知识服务, 从而大大推进人类对知识的利用, 促进对新知识的创造。图书馆的服务通过搭建一个网络知识平台和基础知识库, 来实现个性化服务。
责任编辑:魏玉新
摘要:在知识经济时代, 为了适应读者的需要, 对各种外部和内部的知识与信息进行数字化改造和有效的管理, 并建设有利于知识传播、共享和交流的知识仓库, 是图书馆信息化、知识化建设的当务之急。
浅谈舰船器材仓库区域一体化建设 第10篇
关键词:器材仓库,区域一体化,保障能力
1区域一体化建设目标
仓库区域一体化建设最终形成以我库为中心, 对保障区域内编队仓库实施业务指导和管理的新器材保障模式;建立以信息化管理为基础, 对保障区域内库存器材和随舰器材实施统一管理的新机制;建立以军队物流体系为主和地方物流资源为辅助的军地一体化物流保障体系, 对舰艇部队进行靠前保障的新模式。规范库存器材入库、存储、供应、回收等环节的“闭环”管理;规范仓库功能设置、分区划线和编号标示等方面的库房业务管理;规范仓储设施设备配套管理。深入挖掘保障区域仓库文化底蕴, 努力打造区域仓库品牌文化, 逐步形成富有特色的器材保障文化。
2仓库区域一体化建设具体方法
充分发挥区域中心仓库的优势, 按照“一个形成”、“两个建立”、“三个规范”的建设目标, 坚持“突出重点, 以点带面, 分步实施”的原则, 结合本区域器材保障实际, 坚持在实践中创新, 在创新中发展, 在发展中提高, 最终建立仓库区域一体化保障新模式。
(一) 健全完善机制, 理顺组织管理关系。 (1) 成立一体化领导小组。成立以我库为主体, 编 (大) 队仓库参与的区域一体化建设管理工作领导小组, 明确领导小组职责、分工和权限, 确定我库与编 (大) 队仓库、舰艇之间在区域一体化建设管理过程中的组织管理相互关系。 (2) 建立一体化保障机制。针对我库与编队仓库没有隶属关系的实际, 了解掌握编 (大) 队仓库器材储存的种类型号及数量基本情况, 建立符合区域舰船器材保障要求的一体化机制。以《海军舰船器材仓库业务管理规则》为依据, 进一步规范我库与编 (大) 队仓库的器材收发管理的作业流程, 统一仓库规章制度及各类标识, 理清两者的保障职能关系, 推动器材保障快捷高效。
(二) 加强信息化建设, 实现器材管理精确化。 (1) 加快信息化网络建设。充分利用现代信息网络技术, 构建信息化网络平台, 组建区域仓库局域网, 安装使用《海军舰艇装备维修器材信息管理系统》, 实现上级机关、区域中心仓库、编 (大) 队仓库、保管队互联互通, 信息资源共享和反馈, 确保上级机关能够实时掌握区域中心仓库和编队仓库器材库存信息, 提高工作效率。同时加大射频识别技术在器材管理中的应用, 采用二维条形码技术, 实现器材信息采集自动化, 提高器材保障效益。 (2) 实现器材“闭环”管理。加大对器材入库、调拨、使用、交旧回收和修复等环节的管控力度, 实现器材的“闭环”管理。 (3) 建立器材质量和消耗数据库。将舰艇器材使用、损耗和需求及时传送给上级业务主管部门, 使上级业务主管部门在器材筹措时更具针对性, 为仓库器材存储提供最准确信息, 从而提高器材保障和管理的实效性。 (4) 优化器材存储结构。着眼军民融合装备器材保障体系, 以舰艇部队为中心, 创新保障模式, 以器材“零库存”概念优化器材存储策略, 以动态的物资流动代替静态的物资储备。
(三) 主动靠前保障, 提高器材保障反应能力。 (1) 简化器材保障程序。打破现有器材保障格局, 采取由仓库直达舰艇部队的主动保障方式, 在舰艇部队提出申领需求后, 将器材主动配送至舰船部队, 实施点对点保障, 提高装备器材保障反应速度和工作效率, 同时能够满足战时装备器材应急保障要求。 (2) 建立器材保障前送机制。依托中心仓库, 抽组业务骨干, 成立器材前送保障分队, 对部队实施前送保障。同时发挥军地物流一体化保障的优势, 借助地方物流资源优势, 选取实力雄厚、具有资质、信誉好的物流、快递公司, 签订合作协议, 对较远地区舰艇实施物流配送保障, 形成军地一体化的器材配送机制。
(四) 完善制度建设, 提高仓库业务管理水平。我库基础设施比较薄弱, 其传统保障模式和库容量与新的形势发展任务不大相适应。为此, 结合区域实际, 按照《海军舰船器材仓库业务管理规则》等规定, 组织制定《区域一体化管理办法》、《区域信息管理系统使用办法》、《仓库业务经费使用管理办法》;规范区域仓库《库房管理制度》、《器材管理制度》、《配套设施设备管理制度》、《业务量化检查评比制度》和《文化建设标准》等, 形成《区域仓库一体化管理实施细则》。逐步建立综合器材信息管理、安防监控、温湿度自动检测、视频监控、门禁、红外报警以及烟感报警等系统的信息管控中心, 形成“中心仓库管控中心-区域仓库管控平台-库房电脑终端”三级网络管控体系。
(五) 紧贴使命任务, 打造区域保障文化。结合仓库使命任务, 创作符合区域特色的库徽、库歌、库训, 制作战斗精神宣传牌, 通过宣传海洋文化、宣示海洋主权, 张贴安全警示标语等, 增强官兵保障舰艇、服务战舰的意识和保卫海疆的使命感、责任感。
3区域一体化建设取得的成效
(一) 提高仓库器材保障能力。通过前期试点建设, 建立了区域内库存器材统一管理机制, 加强了中心仓库与编 (大) 队仓库之间的业务指导以及区域内器材保障人员业务培训和技术交流。提高了后方仓库直接向舰艇提供器材保障的能力, 进一步深化了后方仓库的保障职能, 破解了长期制约舰船器材仓库器材保障能力提升的难题。
(二) 健全了法规制度。以《海军舰船器材仓库业务管理规则》为依据, 通过试点建设, 对以往的业务管理制度进行全面梳理, 修订完善了《库房管理制度》、《器材管理制度》、《配套设施设备管理制度》、《业务量化检查评比制度》等制度, 形成了具有针对性、操作性较强、较为完备的制度管理体系, 为进一步规范仓库业务建设提供制度依据。
(三) 简化了保障流程。从简化保障程序入手, 打破现有器材保障格局, 优化保障流程, 简化业务办理手续, 按照高效、快捷原则, 改变传统器材保障模式, 建立了贴近舰艇部队需求的器材保障平台。
(四) 规范了器材管理。通过研究制定统一的仓库业务建设标准, 建立了“样板库”、“标准间”, 实现了库房布局、标识、配套设备、货架摆放的统一, 解决了器材存储、收发、维护保养、信息系统使用管理等方面长期存在的问题, 实现了器材管理规范化、制度化、正规化。
(五) 提高了保障效率。通过组建器材前送保障分队, 建立器材前送、配送机制, 实现了器材保障由过去的被动补给模式向舰艇主动前送配送模式的转变。建立军地一体化保障模式, 充分发挥地方物流资源优势, 将地方物流纳入仓库保障体系建设之中, 满足了器材保障快速反应的要求, 促使器材整体保障能力得到进一步提升。
参考文献
人体的三个“仓库” 第11篇
脾脏是人体中最大的淋巴器官,位于左下腹部。脾脏是一个富于血流的实质性脏器,质软而脆。一般认为生理脾长10~12cm,宽6~8cm,厚3~4cm,重110~200g。脾的主要功能是过滤和储存血液。脾的组织中有许多称为“血窦”的结构,平时一部分血液滞留在血窦中,当人体失血时,血窦收缩,脾脏就会把“库存”释放到外周以补充血容量。血窦的壁上附着大量巨噬细胞,可以吞噬衰老的红细胞、病原体和异物。
营养库:肝脏
肝脏是人体消化系统中最大的消化腺,成人肝脏平均重达1.5公斤(在1~2.5公斤之间;另一说在1~1.6公斤),为一红棕色的V字形器官。肝脏是新陈代谢的重要器官。体内的物质,包括摄入的食物,在肝脏内进行重要的化学变化:有的物质经受化学结构的改造,有的物质在肝脏内被加工,有的物质经转变而排泄体外,有的物质如蛋白质、胆固醇等在肝脏内合成。肝脏可以说是人体内一座化工厂。
肝脏还能促使一些有毒物质的转化,再排泄出体外,从而起到解毒作用。寄生在肠道内的细菌腐败分解时,可释放出氨气。肝脏将氨转变为尿素排泄,便避免了中毒。如果饮酒,酒精到体内产生乙醛,可与体内物质结合,产生毒性反应,产生醉酒的症状;但肝脏又可将乙醛氧化为醋酸而祛除。如果酗酒过度,超出肝脏的解毒能力,便会酒精中毒,严重危及生命。人们服用药品,药物除能治病,往往还有一定毒性,这时肝脏又能将药物改造,变为水溶性物质,从尿或粪中排出。
燃料库:脂肪
脂肪是产热量最高的营养物质,1克脂肪可以产生9千卡的热量,它比蛋白质或糖类氧化时所产生的热量要高出1.25倍。当人体从食物中摄入热量过多时,可以在体内转化为脂肪,并且以脂肪组织的形式贮存起来,成为体脂。
可以这样说,脂肪组织是贮存能量的“燃料库”,在人体营养物质供应不足或需要突然增加时,就可以随时动用它,以保证对机体热量的供给。脂肪组织还有保暖作用,皮下脂肪层可以防止体温的散失,维持人体的正常体温。脂肪组织还具有保护组织和器官的功能,例如心脏的周围、肾脏的周围、肠管之间都有较多脂肪组织,它可以缓冲这些器官受到外界的震动和损害。脂肪还是一种良好的溶剂,促使人体吸收脂溶性维生素,如维生素A、维生素D、维生素E等。
仓库建设 第12篇
有线电视网络在产业运行过程中产生海量数据,这些数据具有天然的大数据4V特征:规模(Volume)、多样(Variety)、高速(Velocity)、价值(Value),理顺这些数据并使其发挥商业效用需要借助数据仓库。
数据仓库是有线电视网络数据建设体系的重要一环,是在原来不同业务软件系统基础上重建网络数据流和信息流的过程,是监测和应用有线电视网络产业运行数据的基本手段。
1 广电网络的数据体系和功能
有线电视网络数据体系从数据源上可分为产业运行数据和用户行为数据,整个产业的运行数据由一个个有线电视网络公司的运行数据共同构成,整个产业的用户行为数据由一个个有线电视网络公司的用户行为数据共同构成(图1)。
有线电视网络数据体系又可分为宏观部分和微观部分。从宏观上讲,针对整个有线电视网络产业,有产业产值和社会贡献数据,有产业结构和发展变化数据等;从微观上讲,具体到某一个有线电视网络公司,有公司经营投入和产出的数据,有网络线路建设和运行的数据,有节目内容编排和播出的数据,有终端用户发展和收视的数据,有资本层面的营收和运作数据等。
宏观层面和微观层面的数据体系建设目标不同。宏观层面的目标体现在两个方面,一是面向有线电视产业内部,科学衡量产业实际发展水平,量化产业发展对社会的贡献,为产业决策提供支撑;二是面向有线电视产业外部,向产业外部提供大数据服务,参与整个社会多样性的大数据工作。微观层面的目标基本都面向有线电视网络公司企业内部,主要是提高企业内部的经营决策水平和经营效率,提高服务质量和水平,把服务做到更精细,更精准,让客户更满意。
2 广电网络数据仓库技术架构和建设过程
2.1 数据仓库认知和技术架构
有线电视网络数据仓库建设包括整个产业的数据仓库建设和单个有线电视网络公司的数据仓库建设,是个庞杂浩大的工程。在本文中,我们仅探讨企业层面的数据仓库建设,但即使对单个有线电视网络公司而言,企业级数据仓库建设亦是一项繁重的工作。
我们可以从四个方面予以理解有线电视网络公司的企业级数据仓库建设。首先,数据仓库是对多个异构数据源的有效集成,是在原来不同业务软件系统基础上重建企业数据流和信息流的过程;其次,数据仓库面向分析型数据,存放在数据仓库中的数据将用于各种复杂聚集和统计分析;其三,产经分析在数据仓库的建设中发挥着非常重要的作用,同产经分析相结合的有线电视网络数据仓库相当于有线电视网络公司的智库,可以用于支撑经营决策;其四,数据仓库的某一个具体的主题区域被称为数据集市或数据市场,有时也被认为是一种微型的数据仓库。
企业级数据仓库建设是为了满足有线电视网络公司长期信息化管理需要,技术架构应包括业务数据源层、数据处理层、数据应用层等(图2)。
2.2 数据仓库的建设阶段
具体而言,企业级数据仓库建设过程通常分为四个阶段:
1.第一个阶段是数据仓库系统分析阶段
首先是对有线电视网络公司的业务体系进行细致梳理,分析不同业务部门对数据分析的要求和频率。
其次按照业务部门对数据分析的要求,按不同主题分别设计概念模型、分析模型、逻辑模型、物理模型(图3)。目前有线电视网络各种软件系统产生的原始业务数据量非常大,逻辑模型汇总何种数据需要在分析模型的指导下进行,应只抽取同分析模型相联系的数据,而不是所有数据。至于逻辑模型抽取数据的广度和深度,一般而言,广度比深度更为重要,广度涉及到经营决策分析的方方面面,而深度并不是越深越好,有一些深度的数据挖掘非常有意义,而有一些深度的数据挖掘不仅意义不大,而且浪费很多成本,因此在数据设定时,应采取广度优先的原则,先设计广度,后设计深度。数据仓库设计表结构亦要根据数据存储的深度和广度进行设置,一般情况下,企业级数据仓库可采用星座模式,数据集市(数据仓库的子集)面向某个特定主题,可采用星形模型或雪花模式。
2.第二个阶段是数据采集与数据存储工作
采集的数据须要既是可得的,又是可用的,数据的可得性是实现数据价值的前提,数据的可用性是实现数据价值的条件。
将源数据存入数据仓库一般采用ETL技术,包含extract(抽取)、transform (转换)、load (加载)三步。目前ETL技术相对成熟,难点在于有线电视网络公司的数据源来自于多个具有不同属性的软件系统,存在许多冗余的、重复建设的数据或报表系统,又归口于不同部门的管理,缺乏公共数据源,在不同的数据源上做统计查询工作既复杂又低效,统一规划分析的难度非常大,且源数据没有时间点,不仅不能对历史数据进行回溯查询,而且可能导致数据可信度下降。因此,必须将有线电视网络公司多个数据源的数据以统一模式存储到单个公共站点上,构建以集中式数据存储为核心的体系结构,既方便不同使用部门查询,也不影响数据源系统的工作(图4)。
3. 第三个阶段是数据处理、数据清洗工作
被采集数据的质量优劣是决定数据应用效果的关键,数据质量由三个因素决定:源数据质量、数据清洗水平、数据转换程度。源数据质量是整个数据仓库数据质量的基础,要确保源数据不被污染,数据一经污染必须确认其“脏”度和可用度,作为源数据流入数据仓库的数据应该具有原始准确性。数据清洗工作异常重要,如更正简单拼写错误的数据,剔除重复性数据和虚假性数据,标注不合逻辑的数据(互相冲突、不合常理、不正确等),寻找缺失性数据,避免欺诈性数据等等。数据转换,如改变数据度量单位,改变数据属性,替换原有概念等(图5)。
4.第四个阶段是数据应用和数据展现工作
数据应用和数据展现工作是有线电视网络企业级数据仓库建设的核心,数据仓库的建设价值并不仅仅体现在数据仓库中所存储的数据量的多少,而更在于有线电视网络公司可以从数据仓库中能够获得的信息和分析结果的质量。
数据应用的方向之一是数据挖掘,主要应用于内容关联推荐,用户发展预测等。
数据应用的方向之二是数据分析,主要应用于业务管理和提高公司的经营治理水平。
数据应用的方向之三是数据支持,主要是为操作系统提供实时数据支持。有线电视网络公司营业厅的一线服务人员很容易就可以通过操作系统访问历史数据,得知用户的收视喜好和使用习惯,从而可以为用户更好地推荐服务产品。
3 广电网结行业数据仓库建设的难点和应对策略
3.1 数据集市和数据仓库建设顺序
有线电视网络公司在建设企业级数据仓库时,会面临企业级数据仓库和部门级的数据集市建设顺序的问题,比较理想的方式是自上而下先建立一个企业级数据仓库,再建立各个数据集市,但这种方式通常实现难度大且建设时间长。部分有线电视网络公司会考虑建设独立型数据集市,这种方式通常简单易实现且建设价格相对低廉,但在现实中往往得不偿失,当独立型数据集市支持多主题区域时,会导致多个部门数据不一致,使得各个数据集市成为信息孤岛从而无法兼容。比较合适的方式以部门需求和数据应用为导向,通过业务视角对数据仓库建设提出技术要求,优先建立一个或几个主要的数据集市,迅速试错并快速迭代,同时考虑企业级数据仓库的结构、内容。
3.2 数据概念定义及其推广使用
在有线电视网络公司企业级数据仓库的建设中,清晰统一的数据概念定义是最为基础的工作。
由于数据概念定义的不同,导致数据与数据之间无法进行整合分析或比较分析的例子比比皆是。以“用户”这个概念为例,同行交流的时候通常会被问起“用户”数量多少?这里由“用户”而引来的歧义就很多,这“用户”指的是“有线电视覆盖用户”,还是“有线电视收看用户”,还是“有线电视缴费用户”,抑或还是“有线电视离网用户”。即使是“有线电视离网用户”,到底哪些情况算是离网,很多有线电视网络公司的定义又都不一样。如果不把这些概念明确下来,那么进行统计时,就会驴唇不对马嘴,此用户非彼用户,简单在一起加总,就失去了统计意义。
由于数据概念定义的不同,导致数据计算方式不同而产生错误判定或无法判断的例子也比比皆是。例如近年来社会上出现的对开机率大幅下降的误判就是由不同的计算方式所引起的,开机率指的是某时间段平均每分钟看电视的家庭户数占全部拥有电视机的家庭户数的百分比,不同时间间距的开机率自然不一样,且一定有较大的差异,例如凌晨时间段的开机率一定大大低于黄金时间段的开机率,“平均每分钟”的开机率一定大大低于“平均每天”的开机率,不同时间段的开机率没有意义在一起做比较。又例如,当我们看到“网络视频的用户使用率为69.1%"“电信IPTV用户活跃度达到70%以上”等之类的数据时,通常会感觉比较糊涂,需要看到“用户使用率”和“用户活跃度”数值背后计算方式的区别,才可以判断哪种方式更优。
科学的数据概念定义是个非常繁杂的工作,需要在理顺业务体系和管理体系的基础上对各名词概念和数据的上下级关系进行细致定义,对计算数据列明公式和含义,以便在以后的业务工作中采用统一的统计口径,科学看待数值本身以及数值含义。
3.3 分析模型的建立和应用
数据的价值挖掘由方法论来保证,分析模型正是方法论,是数据仓库的黑匣子。
分析模型在整个数据仓库建设中具有“纲”的作用,是逻辑模型之前的一步,指导逻辑模型都需要搜集哪些数据(图6)。如果没有分析模型的指导,逻辑模型就会成为无本之木,后期有可能需要不停地打补丁或者瘦身,从小的方面而言会导致分析工作不流畅,从大的方面而言会导致无法有效整合数据资源,最终使数据仓库建设工作失去目标。
分析模型的建立一方面要借鉴/参考国际/国内已经比较成熟的传统研究方法/理论,另一方面要根据国内有线电视网络行业情况做调整/修正和创新,将其转化为行业分析方法/理论,后一部分比前一部分更为重要。
3.4 行业分析模型的建立应以用户需求为导向
满足用户需求是有线电视网络公司的经营根本,挖掘用户需求则是有线电视网络公司的经营目标,最终公司治理水平也由满足用户需求的水平而决定,因此有线电视网络公司应着手建立以用户需求为导向的行业分析模块(图7)。只有分析并理解用户需求,才能进行产品管理、客户管理、营销管理、服务管理,以及属于支撑系统的终端管理和网络管理。
产品管理和客户管理是企业经营管理的核心。通过数据挖掘,可以将产品特征与用户特征做比对,从而根据用户需求对产品服务进行推荐。产品管理和客户管理的水平、产品服务推荐的准确性很大程度上都依赖于对用户需求把握的准确性,因此行业分析模型在建立时,也要以用户需求为出发点并贯穿始终(图8)。
4 结束语
有线电视网络数据仓库建设意义重大,对于正在产业转型升级期的有线电视网络公司而言,其产品重塑、商业模式创新、经营模式转变都需要借助数据仓库的建设。
有线电视网络数据仓库建设工程艰巨,对于经营方式原本粗放且条块分割严重的有线电视网络公司而言,不亚于凤凰涅槃,需要企业一把手有大决心和大动作。
有线电视网络数据仓库建设方兴未艾,目前还停留在比较粗浅的频次统计阶段,需要系统规划分步落实。格兰研究作为从事视频行业市场研究工作的专业公司,希望能抛砖引玉,和业界同仁共同探讨有线电视网络数据仓库建设的相关问题。
参考文献
[1]William H.Inmon,数据仓库[M],王志海译,第四版,北京,机械工业出版社,2006.
[2]Abraham Silberschatz,数据库系统理论[M],杨冬青译,第六版,北京,机械工业出版社,2012.
[3]覃雄派,王会举,杜小勇等,大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报.2012(01).
[4]谭晓玲,王丽珍,构建大型企业的数据仓库[J],云南大学学报(自然科学版),2004(05).