news 2026/6/18 9:26:59

HGDB如何提升批量导入数据的速度

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
HGDB如何提升批量导入数据的速度

文章目录

  • 文档用途
  • 详细信息

文档用途

本文档用于提供几个提升瀚高数据库批量导入数据速度的方向,需要根据实际情况具体分析及选择。

详细信息

关闭自动提交

在批量插入数据时,如果每条数据都被自动提交,当中途出现系统故障时,不仅不能保障本次批量插入的数据一致性,而且由于有多次提交操作的发生,整个插入效率也会受到很大的打击。解决方法是,关闭系统的自动提交(SET AUTOCOMMIT = OFF),并且在插入开始之前,显式的执行 BEGIN TRANSACTION 命令,在全部插入操作完成之后再执行 COMMIT 命令提交所有的插入操作。

使用 COPY 命令

使用 COPY 在一条命令里装载所有记录,而不是一系列的 INSERT 命令。COPY 命令是为装载数量巨大的数据行优化过的,它不像 INSERT 命令那样灵活,但是在装载大量数据时,系统开销也要少很多。

注:因为 COPY 是单条命令,因此在填充表的时候就没有必要关闭自动提交了。

删除索引

如果你正在装载一个新创建的表,最快的方法是创建表,用 COPY 批量装载,然后创建表需要的任何索引。因为在已存在数据的表上创建索引比维护逐行增加要快。当然在缺少索引期间,其它有关该表的查询操作的性能将会受到一定的影响,唯一性约束也有可能遭到破坏。

删除外键约束

和索引一样,"批量地"检查外键约束比一行行检查更加高效。因此,我们可以先删除外键约束,装载数据,然后再重建约束。

临时增大 MAINTENANCE_WORK_MEM

在装载大量数据时,临时增大 maintenance_work_mem 系统变量的值可以改进性能。这个系统参数可以提高CREATE INDEX 命令和 ALTER TABLE ADD FOREIGN KEY 命令的执行效率,但是它不会对 COPY 操作本身产生多大的影响。

临时增大 CHECKPOINT_SEGMENTS

临时增大 checkpoint_segments 系统变量的值也可以提高大量数据装载的效率。这是因为在向 PostgreSQL 装载大量数据时,将会导致检查点操作(由系统变量 checkpoint_timeout 声明)比平时更加频繁的发生。在每次检查点发生时,所有的脏数据都必须 flush 到磁盘上。通过提高 checkpoint_segments 变量的值,可以有效的减少检查点的数目。

设置为 UNLOGGED 表

PostgreSQL 的 unlogged table 是不记录 xlog 的,因此批量导入的时候 unlogged 表速度比 logged 表性能要快上一倍。但是, unlogged 表不是异常安全的:数据库崩溃或者异常关闭后, unlogged 表中的数据会被自动删减;另外, unlogged 表中的数据也不会备份到从服务器。任何 unlogged 表上创建的索引也是 unlogged 的。对于批量数据导入,我们可以临时设置表为 unlogged(ALTER TABLE tb SET UNLOGGED),之后再将表重新设置为 logged(ALTER TABLE tb SET LOGGED)。

事后运行 VACUUM ANALYZE

在增加或者更新了大量数据之后,应该立即运行 VACUUM ANALYZE 命令,这样可以保证规划器得到基于该表的最新数据统计。换句话说,如果没有统计数据或者统计数据太过陈旧,那么规划器很可能会选择一个较差的查询规划,从而导致查询效率过于低下。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 9:19:57

4、海外房地产投资指南:南非与法国的投资攻略

海外房地产投资指南:南非与法国的投资攻略 1. 南非房地产投资 1.1 背景与动机 Aleet 成长于南非的葡萄酒产区,但随父亲前往美国旧金山。成年后,她成为美国公民并积累了一定财富。看到南非的积极变化,尤其是种族隔离政策结束后国家的发展,她决定将房地产投资经验应用到南…

作者头像 李华
网站建设 2026/6/18 2:57:32

16、国际金融与商业术语解析

国际金融与商业术语解析 1. 基础概念介绍 1.1 税务相关概念 外国来源收入 :指来自美国境外的收入,包括在外国工作所得、外国企业或房地产收入、外国公司股息以及其他外国投资收入。 外国税收抵免 :针对在美国缴纳所得税的纳税人,可将在外国就同一收入缴纳的所得税金额…

作者头像 李华
网站建设 2026/6/16 0:13:44

40、太赫兹通信的进展

太赫兹通信的进展 太赫兹(THz)频段具有超宽带宽(BW)的特性,能够提供数十Gbps以上的高数据速率,在纳米级和宏观级通信等多个领域展现出巨大的应用潜力。不过,要实现太赫兹通信系统的实际应用,还面临着诸多挑战。 1. 太赫兹通信的应用场景 太赫兹频段的超宽带宽特性使…

作者头像 李华
网站建设 2026/6/10 15:42:27

53、5G及未来的灵活认知无线电接入技术:频谱感知与动态接入策略

5G及未来的灵活认知无线电接入技术:频谱感知与动态接入策略 1. 频谱感知方法概述 在5G及未来网络中,有效利用频谱资源至关重要。频谱感知是认知无线电(CR)网络中的关键环节,目前存在多种频谱感知技术,可分为窄带频谱感知、宽带频谱感知和预测性频谱感知。 窄带频谱感知…

作者头像 李华
网站建设 2026/6/17 13:05:05

FaceFusion支持DALI数据加载吗?I/O效率提升

FaceFusion 支持 DALI 数据加载吗?I/O 效率提升在深度学习驱动的人脸融合系统中,模型训练的瓶颈往往不在于 GPU 算力本身,而隐藏在数据供给链条的最前端——图像读取、解码与预处理。当你投入高端 A100 显卡、精心设计网络结构时,…

作者头像 李华
网站建设 2026/6/15 2:17:42

FaceFusion镜像内置多种预训练模型,开箱即用

FaceFusion镜像内置多种预训练模型,开箱即用 在数字内容创作日益智能化的今天,AI驱动的人脸编辑技术正以前所未有的速度渗透进影视制作、虚拟主播、社交娱乐等领域。无论是将演员的脸“无缝”移植到替身身上,还是让一张静态照片演绎出丰富表情…

作者头像 李华