跳到主要内容

术语表

QWen Plus 中英对照 Glossary

Spring Batch 术语表

批处理

随着时间推移的业务交易累积。

批处理应用风格

用于指代批处理作为一种独立的应用风格的术语,类似于在线、Web 或 SOA。它具有输入、验证、信息转换为业务模型、业务处理和输出的标准元素。此外,它还需要在宏观层面进行监控。

批处理

批处理是指对一段时间内(例如一小时、一天、一周、一个月或一年)累积的大量业务事务进行处理。它是以重复且可预测的方式将一个过程或一组过程应用于许多数据实体或对象的应用,可能没有任何人工元素,或者仅在错误处理时有一个单独的人工元素。

批处理窗口

批处理作业必须完成的时间范围。这可能受到其他系统上线、其他依赖作业需要执行或其他特定于批处理环境的因素的限制。

步骤

主要的批处理任务或工作单元。它根据提交间隔设置和其他因素初始化业务逻辑并控制事务环境。

Tasklet

由应用程序开发人员创建的组件,用于处理步骤的业务逻辑。

批处理作业类型

作业类型描述了针对特定类型处理的作业应用。常见的领域包括接口处理(通常是平面文件)、表单处理(无论是在线生成 PDF 还是打印格式)以及报表处理。

驱动查询

一个驱动查询确定了某个任务需要执行的工作集。然后,该任务会将这些工作拆分为单独的工作单元。例如,驱动查询可能是识别所有状态为“待传输”的财务交易,并将它们发送到合作伙伴系统。驱动查询返回一组要处理的记录 ID。每个记录 ID 都成为一个工作单元。驱动查询可能涉及联接(如果选择条件跨越两个或多个表),也可能只与单个表一起工作。

Item

一个项表示可用于处理的最小完整数据单位。 用最简单的说法,这可能是文件中的一行、数据库表中的一行或 XML 文件中的特定元素。

逻辑工作单元 (LUW)

批处理作业通过驱动查询(或其他输入源,例如文件)进行迭代,以执行作业必须完成的一组工作。每次执行的工作迭代是一个工作单元。

提交间隔

在单个事务中处理的一组逻辑单元OfWork(LUW)。

分区

将一个任务拆分为多个线程,每个线程负责要处理的总体数据的一部分。这些执行线程可能位于同一个 JVM 中,也可能跨越集群环境中的多个 JVM,该环境支持工作负载平衡。

Staging Table

一个在数据处理过程中保存临时数据的表。

可重启的

可以再次执行且假设与最初运行时具有相同身份的任务。 换句话说,它具有相同的任务实例 ID。

可重跑的

一个可重启的作业,并且根据上一次运行的记录处理情况管理自身的状态。可重新运行的步骤的一个例子是基于驱动查询的步骤。如果在作业重启时,驱动查询可以被构造为限制已处理的行数,那么它就是可重新运行的。这是由应用程序逻辑来管理的。通常,会在 where 语句中添加一个条件,以限制驱动查询返回的行数,逻辑类似于 and processedFlag != true

Repeat

批处理最基本的单元之一,它通过反复调用一段代码直到完成且没有错误为止来定义。通常,只要有输入,批处理过程是可以重复的。

重试

简化了与处理事务性输出异常最常相关的操作执行的重试语义。重试与重复稍有不同。重试是有状态的,而不是持续调用一段代码,它会使用相同的输入持续调用同一段代码,直到成功或超出某种重试限制。 当后续操作调用可能会因环境中的某些因素改善而成功时,重试通常才有意义。

恢复

恢复操作以能够继续重复进程的方式处理异常。

跳过

跳过(Skip)是一种恢复策略,通常在文件输入源中用作忽略未通过验证的不良输入记录的策略。