如何使用Hash分区优化Oracle分析函数
创始人
2024-06-28 13:00:46
0

原理:数据表的hash分区字段与分析函数中的partition by 字段一致的时候,每个分区上的数据可以单独进行运算,互不干涉。所以可以很快的提高Oracle分析函数的运行效率。具体测试步骤如下:

***步:创建一个分区表和普通表,表结构与DBA_OBJECTS一致:

  1. create table t_partition_hash(  
  2. object_name varchar2(128),  
  3. subobject_name varchar2(30),  
  4. object_id number,  
  5. data_object_id number,  
  6. object_type varchar2(19),  
  7. created date,  
  8. last_ddl_time date,  
  9. timestamp varchar2(19),  
  10. status varchar2(7),  
  11. temporary varchar2(1),  
  12. generated varchar2(1),  
  13. secondary varchar2(1)  
  14. )  
  15. partition by hash(object_type)(  
  16. partition t_hash_p1 tablespace USERS,  
  17. partition t_hash_p2 tablespace USERS,  
  18. partition t_hash_p3 tablespace USERS,  
  19. partition t_hash_p4 tablespace USERS,  
  20. partition t_hash_p5 tablespace USERS,  
  21. partition t_hash_p6 tablespace USERS,  
  22. partition t_hash_p7 tablespace USERS,  
  23. partition t_hash_p8 tablespace USERS  
  24. );  
  25. create table t_big_hash(  
  26. object_name varchar2(128),  
  27. subobject_name varchar2(30),  
  28. object_id number,  
  29. data_object_id number,  
  30. object_type varchar2(19),  
  31. created date,  
  32. last_ddl_time date,  
  33. timestamp varchar2(19),  
  34. status varchar2(7),  
  35. temporary varchar2(1),  
  36. generated varchar2(1),  
  37. secondary varchar2(1)  
  38. );  
  39.  

#p#

第二步:准备数据,从dba_object中把数据插入到两个表。总共插入数据1610880。

  1. insert into t_partition_hash select * from dba_objects;  
  2. insert into t_partition_hash select * from dba_objects;  
  3.  

第三步:本采用RANK函数对两个表进行查询。

  1. begin  
  2. insert into t_rank  
  3. select object_id,  
  4. rank() over (partition by object_type order by object_id) r_object_id,  
  5. rank() over (partition by object_type order by subobject_name) r_subobject_name ,  
  6. rank() over (partition by object_type order by created) r_created,  
  7. rank() over (partition by object_type order by last_ddl_time) r_last_ddl_time ,  
  8. rank() over (partition by object_type order by status) r_object_type  
  9. from t_partition_hash;  
  10. end;  
  11.  

使用hash分区表总共执行5次的运行时间分别为:46.156s,33.39s,40.516s 34.875s 38.938s.

  1. begin  
  2. insert into t_rank  
  3. select object_id,  
  4. rank() over (partition by object_type order by object_id) r_object_id,  
  5. rank() over (partition by object_type order by subobject_name) r_subobject_name ,  
  6. rank() over (partition by object_type order by created) r_created,  
  7. rank() over (partition by object_type order by last_ddl_time) r_last_ddl_time ,  
  8. rank() over (partition by object_type order by status) r_object_type  
  9. from t_big_table;  
  10. end;  
  11.  

使用非分区表执行5次的执行时间分别为:141.954s,89.656s,77.906s,98.5s,75.906s.

由此可见采用有效的HASH分区表可以有效提升Oracle分析函数中的执行效率。我相信随着数据量的增加,将会有更明显的效果,回头再测试一个项目中遇到的类似问题。

善用Oracle表空间设计提升数据库性能

优化数据库大幅度提高Oracle分析函数的性能

Oracle设置系统参数进行性能优化
 

【编辑推荐】

  1. 修改Oracle存储过程所需代码
  2. 对Oracle存储过程的总结
  3. 实现Oracle存储过程的实际应用的代码 
  4. 深入高性能的Oracle动态SQL开发 
  5. Oracle SQL的优化规则解析 

相关内容

热门资讯

PHP新手之PHP入门 PHP是一种易于学习和使用的服务器端脚本语言。只需要很少的编程知识你就能使用PHP建立一个真正交互的...
网络中立的未来 网络中立性是什... 《牛津词典》中对“网络中立”的解释是“电信运营商应秉持的一种原则,即不考虑来源地提供所有内容和应用的...
各种千兆交换机的数据接口类型详... 千兆交换机有很多值得学习的地方,这里我们主要介绍各种千兆交换机的数据接口类型,作为局域网的主要连接设...
粉嫩如何诠释霸道 东芝M805... “霸道粉”是个什么玩意东芝M805拿过来的时候,笔者扑哧笑了,不是笑这款笔记本,而是笑这款产品的颜色...
什么是大数据安全 什么是大数据... 在《为什么需要大数据安全分析》一文中,我们已经阐述了一个重要观点,即:安全要素信息呈现出大数据的特征...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
全面诠释网络负载均衡 负载均衡的出现大大缓解了服务器的压力,更是有效的利用了资源,提高了效率。那么我们现在来说一下网络负载...
如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
30分钟搞定iOS自定义相机 最近公司的项目中用到了相机,由于不用系统的相机,UI给的相机切图,必须自定义才可以。就花时间简单研究...
Intel将Moblin社区控... 本周二,非营利机构Linux基金会宣布,他们将担负起Moblin社区的管理工作,而这之前,Mobli...