TPCC是一个测试数据库性能的benchmark,是一个标准。很多transaction相关的论文都是以这个标准来评测性能的。

介绍

TPCC模拟了一种生活中电商的场景。这是一个全国性的电商,有若干个仓库中心,warehouse,每个仓库负责10个区域,distinct,每个区域有3000个客户,customer。规模的变化就在于仓库的数量变化。整个公司有100000个货物(items),每个仓库单独的库存(stocks)。
构架图

Customer做的事情就是下新的订单,或者查询之前的订单。订单由若干个(平均10个)order line构成,每一个line表示该订单里的一个货物。正常情况下,货物由customer所在地所属的仓库中心提供,但是也有1%的概率由远程仓库提供。

同时从公司的角度来说还有付款、推迟订单、测试货存的操作。

一般这个benchmark都是架在数据库上的。所以会有一些数据库的表。表的结构如下:
表的关系

New Order

数据产生:

  1. 对于任意一个给定的终端,warehouse是固定的。W_ID
  2. distinct 是从warehouse中随机取一个。[1..10]。然后从该区域中随机取一个customer,[1..3000]
  3. 随机选出需要下单的商品的数量,5-15,并随机产生每个item具体的数量。这些都是由终端产生的。
  4. 1%的new order操作会失败。所以需要随机一个rbk的数[1..100],为1的话就表示要失败。
  5. 对于第3步选出来的商品数量:
    5.1 随机选出一个商品id,如果这是最后一个要买的商品且rbk值为1,设置该商品的数量为unused number,导致一个not found的结果。
    5.2 选取一个供货仓库。99%由本地仓库,即W_ID,1%概率是远程仓库,也可以产生一个随机[1..100]的数。
    5.3 随机产生一个[1..10]的数量
  6. 根据系统当前时间产生日期
  7. 设置order-line,根据是否本地仓库供货,设置为home或者remote