跳到主要内容
版本:6.0.2

术语表

DeepSeek V3 中英对照 Glossary

Spring Batch 术语表

批处理

随着时间的推移积累的业务交易。

批处理应用风格

术语,用于将批处理本身指定为一种应用风格,类似于在线、Web 或 SOA。它具有输入、验证、信息到业务模型的转换、业务处理和输出的标准元素。此外,它还需要在宏观层面进行监控。

批处理

对一段时间内(例如一小时、一天、一周、一个月或一年)累积的大量业务交易进行批量处理。这是以重复且可预测的方式,将某个流程或一组流程应用于多个数据实体或对象的过程,其中不包含人工环节,或仅包含用于错误处理的独立人工环节。

批处理窗口

批处理作业必须完成的时间范围。这可能受到其他系统上线、其他依赖作业需要执行或批处理环境特有的其他因素的限制。

步骤

主要的批处理任务或工作单元。它初始化业务逻辑并控制事务环境,基于提交间隔设置和其他因素。

Tasklet

由应用程序开发者创建的组件,用于处理步骤的业务逻辑。

批处理作业类型

作业类型描述了针对特定处理类型的作业应用。常见领域包括接口处理(通常是平面文件)、表单处理(用于在线PDF生成或打印格式)以及报表处理。

驱动查询

驱动查询用于确定一个作业需要处理的工作集合。随后,该作业将这些工作分解为独立的工作单元。例如,一个驱动查询可能是识别所有状态为“待传输”的金融交易,并将它们发送给合作伙伴系统。驱动查询会返回一组待处理的记录ID,每个记录ID随后成为一个工作单元。驱动查询可能涉及连接操作(如果选择标准跨越两个或更多表),也可能仅针对单个表进行操作。

Item

一个项目代表用于处理的最小完整数据单元。简单来说,它可以是文件中的一行、数据库表中的一行,或是 XML 文件中的特定元素。

逻辑工作单元 (LUW)

批处理作业通过遍历驱动查询(或其他输入源,如文件)来执行作业必须完成的工作集。每次执行的工作迭代就是一个工作单元。

提交间隔

在单个事务内处理的一组逻辑工作单元。

分区

将作业拆分为多个线程,每个线程负责处理整体数据的一个子集。这些执行线程可以位于同一个JVM内,也可以分布在支持工作负载均衡的集群环境中的多个JVM之间。

暂存表

一个在处理期间存储临时数据的表。

可重启

一个可以重新执行且身份与初次运行时相同的作业。换句话说,它具有相同的作业实例ID。

可重新运行

一种可重启的作业,它根据前一次运行的记录处理来管理自身状态。一个可重新运行的步骤示例是基于驱动查询的步骤。如果驱动查询的构建方式能够在作业重启时限制处理的行数,那么它就是可重新运行的。这由应用程序逻辑管理。通常,会在 where 语句中添加一个条件,通过类似于 and processedFlag != true 的逻辑来限制驱动查询返回的行数。

重复

批处理最基本的单元之一,它通过重复调用一部分代码直到完成且没有错误来定义。通常,只要有输入,批处理过程就是可重复的。

重试

简化了具有重试语义的操作执行,这类操作最常见于处理事务性输出异常。重试与重复略有不同。重试不是持续调用代码块,而是具有状态性,会持续使用相同的输入调用同一代码块,直到操作成功或超出某种类型的重试限制。通常,仅当后续调用可能因环境中的某些条件改善而成功时,重试才有用。

恢复

恢复操作以这样一种方式处理异常,使得重复过程能够继续。

跳过

Skip 是一种恢复策略,常用于文件输入源,作为忽略验证失败的坏输入记录的策略。