【案例】集算器在用友加速大数据报表
创始人
2025-02-12 09:01:24
0

随着业务的发展,用友公司某项目的数据量越来越大。有些查询需要等待的时间也越来越长。我们针对其中一个比较典型场景,用集算器做了查询优化,查询等待时间从90秒缩短到1-2秒,充分体现了集算器的运算效率,使实际项目的查询性能得到大幅提升。

具体的技术方案如下:

原始SQL

查询涉及到的数据存储在Oracle数据库中,数据量有百万条。原有对应的sql如下:

selecta.paytime 支付时间,

c.parent_party_name 上级公司,

c.child_party_name 公司名称,

b.BANK_TYPE_SNAME 银行类别,

a.outacctname 付款户名,

a.dbtacc 付方账号,

a.crtnam 收方户名,

a.crtacc 收方账号,

a.buss_type 业务类型,

a.trsamt 支付金额

from ebank_log a

left join BD_BANK_TYPE b

on a.BANKTYPECODE = b.BANK_TYPE_CODE

left join RM_PARTY_RELATION c

on a.PK_CORP = c.CHILD_PARTY_ID

AND c.PARTY_VIEW_ID = ‘1000200700000000003’

where a.TRSAMT >= 50000

and (length(a.CRTNAM) <= 4 or proxy =’1′)–对私支付

and instr(c.child_party_code, ‘C00100S’) =1–某省内机构

and a.paytime >= to_date(‘2016-01-01′,’yyyy-mm-dd’)

and a.paytime < to_date(‘2017-02-25′,’yyyy-mm-dd’)

其中ebank_log表100万条数据,BD_BANK_TYPE23条,RM_PARTY_RELATION 43万。SQL执行的时间非常慢,后来项目组采用用友内部的BI工具做了优化,仍然需要等待一分半钟。

集算器优化

采用集算器优化的思路是:将数据从数据库中导出成二进制的文件,采用润乾报表5.0+集算器的大报表功能,流式加载数据。

集算器的脚本如下:

 

0509al-1

 

A2:采用游标的方式加载较大的表ebank_log。

B1、B2:采用全内存方式加载两个比较小的表。

A3:把游标的关联字段切换成两个较小表的引用记录。

A4:对游标重新构建成需要的字段。

B4:按照条件过滤游标。

A5:返回游标。

报表制作

对应的报表模板如下图:

 

0509al-2

 

ds1调用上述集算器脚本,并且设置为大数据集:

***的查询结果网页如下图:

 

优化总结

大数据报表之所以能做到快速的响应,是因为采用了集算器的流式异步加载数据的机制:

 

从上图可以看出,用户请求大报表之后,集算器(大报表引擎)只加载少量数据,形成最初的几页展现给用户。在用户查看这几页数据的时候,集算器同时会加载剩余的数据到二进制文件中,等到用户翻页的时候再从本地二进制文件中读取数据展现。这样既能保证快速的响应,又能避免加载大量数据造成内存溢出。

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
P2P的自白|我不生产内容,我... 现在一提起P2P,人们就会联想到正在被有关部门“围剿”的互联网理财服务。×租宝事件使得劳...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
范例解读VB.NET获取环境变... VB.NET编程语言的使用范围非常广泛,可以帮助开发人员处理各种程序中的需求,而且还能对移动设备进行...