1次订单事故,扣了我3个月绩效!


专注开源技术,共建鸿蒙生态



图片来自 Pexels

这个事故的表象是这样的:系统出现了两个一模一样的订单号,订单的内容却不是不一样的,而且系统在按照订单号查询的时候一直抛错,也没法正常回调,而且事情发生的不止一次,所以 这次系统升级一定要解决掉。


经手的同事之前也改过几次,不过效果始终不好:总会出现订单号重复的问题, 所以趁着这次问题我好好的理了一下我同事写的代码。


这里简要展示下当时的代码:

/**
*OD单号生成
*订单号生成规则:OD + yyMMddHHmmssSSS + 5位数(商户ID3位+随机数2位) 22位
*/

publicstaticStringgetYYMMDDHHNumber(StringmerchId){
StringBufferorderNo=newStringBuffer(newSimpleDateFormat("yyMMddHHmmssSSS").format(newDate()));
if(StringUtils.isNotBlank(merchId)){
if(merchId.length()3){
orderNo.append(merchId.substring(0,3));
}else{
orderNo.append(merchId);
}
}
intorderLength=orderNo.toString().length();
StringrandomNum=getRandomByLength(20-orderLength);
orderNo.append(randomNum);
returnorderNo.toString();
}


/**生成指定位数的随机数**/
publicstaticStringgetRandomByLength(intsize){
if(size8||size1){
return"";
}
Randomne=newRandom();
StringBufferendNumStr=newStringBuffer("1");
StringBufferstaNumStr=newStringBuffer("9");
for(inti=1;isize;i++){
endNumStr.append("0");
staNumStr.append("0");
}
intrandomNum=ne.nextInt(Integer.valueOf(staNumStr.toString()))+Integer.valueOf(endNumStr.toString());
returnString.valueOf(randomNum);
}


可以看到,这段代码写的其实不怎么好,代码部分暂且不议,代码中使订单号不重复的主要因素点是随机数和毫秒,可是这里的随机数只有两位。


在高并发环境下极容易出现重复问题,同时毫秒这一选择也不是很好,在多核 CPU 多线程下,一定时间内(极小的)这个毫秒可以说是固定不变的(测试验证过)。


所以这里我先以 100 个并发测试下这个订单号生成,关注微信订阅号码匠笔记,回复架构获取一些列的架构知识。


测试代码如下:

publicstaticvoidmain(String[]args){
finalStringmerchId="12334";
ListStringorderNos=Collections.synchronizedList(newArrayListString());
IntStream.range(0,100).parallel().forEach(i-{
orderNos.add(getYYMMDDHHNumber(merchId));
});

ListStringfilterOrderNos=orderNos.stream().distinct().collect(Collectors.toList());

System.out.println("生成订单数:"+orderNos.size());
System.out.println("过滤重复后订单数:"+filterOrderNos.size());
System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));
}


果然,测试的结果如下:

生成订单数:100
过滤重复后订单数:87
重复订单数:13


当时我就震惊了,一百个并发里面竟然有 13 个重复的!!!我赶紧让同事先不要发版,这活儿我接了!


对这一烫手的山竽拿到手里没有一个清晰的解决方案可是不行的,我大概花了 6 分多钟和同事商量了下业务场景。


最后决定做如下更改:

去掉商户 ID 的传入(按同事的说法,传入商户 ID 也是为了防止重复订单的,事实证明并没有叼用)

毫秒仅保留三位(缩减长度同时保证应用切换不存在重复的可能)

使用线程安全的计数器做数字递增(三位数最低保证并发 800 不重复,代码中我给了 4 位)

更换日期转换为 java8 的日期类以格式化(线程安全及代码简洁性考量)


经过以上思考后我的最终代码是:

/**订单号生成(NEW)**/
privatestaticfinalAtomicIntegerSEQ=newAtomicInteger(1000);
privatestaticfinalDateTimeFormatterDF_FMT_PREFIX=DateTimeFormatter.ofPattern("yyMMddHHmmssSS");
privatestaticZoneIdZONE_ID=ZoneId.of("Asia/Shanghai");
publicstaticStringgenerateOrderNo(){
LocalDateTimedataTime=LocalDateTime.now(ZONE_ID);
if(SEQ.intValue()9990){
SEQ.getAndSet(1000);
}
returndataTime.format(DF_FMT_PREFIX)+SEQ.getAndIncrement();
}


当然代码写完成了可不能这么随随便便结束了,现在得走一个测试 main 函数看看:

publicstaticvoidmain(String[]args){

ListStringorderNos=Collections.synchronizedList(newArrayListString());
IntStream.range(0,8000).parallel().forEach(i-{
orderNos.add(generateOrderNo());
});

ListStringfilterOrderNos=orderNos.stream().distinct().collect(Collectors.toList());

System.out.println("生成订单数:"+orderNos.size());
System.out.println("过滤重复后订单数:"+filterOrderNos.size());
System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));
}

/**
测试结果:
生成订单数:8000
过滤重复后订单数:8000
重复订单数:0
**/


真好,一次就成功了,可以直接上线了。。。


然而,我回过头来看以上代码,虽然最大程度解决了并发单号重复的问题,不过对于我们的系统架构还是有一个潜在的隐患。


如果当前应用有多个实例(集群)难道就没有重复的可能了?鉴于此问题就必然需要一个有效的解决方案,所以这时我就思考:多个实例应用订单号如何区分开呢?


以下为我思考的大致方向:

使用 UUID(在第一次生成订单号时初始化一个)

使用 Redis 记录一个增长 ID

使用数据库表维护一个增长 ID

应用所在的网络 IP

应用所在的端口号

使用第三方算法(雪花算法等等)

使用进程 ID(某种程度下是一个可行的方案)


在此我想了下,我们的应用是跑在 Docker 里面,而且每个 Docker 容器内的应用端口都一样,不过网路 IP 不会存在重复的问题,至于进程也有存在重复的可能,对于 UUID 的方式之前吃过亏。


总之吧,Redis 或 DB 也算是一种比较好的方式,不过独立性较差。。。


同时还有一个因素也很重要,就是所有涉及到订单号生成的应用都是在同一台宿主机(Linux 实体服务器)上, 所以就目前的系统架构我选用了 IP 的方式。


以下是我的代码:

importorg.apache.commons.lang3.RandomUtils;

importjava.net.InetAddress;
importjava.time.LocalDateTime;
importjava.time.ZoneId;
importjava.time.format.DateTimeFormatter;
importjava.util.ArrayList;
importjava.util.Collections;
importjava.util.List;
importjava.util.concurrent.atomic.AtomicInteger;
importjava.util.stream.Collectors;
importjava.util.stream.IntStream;

publicclassOrderGen2Test{

/**订单号生成**/
privatestaticZoneIdZONE_ID=ZoneId.of("Asia/Shanghai");
privatestaticfinalAtomicIntegerSEQ=newAtomicInteger(1000);
privatestaticfinalDateTimeFormatterDF_FMT_PREFIX=DateTimeFormatter.ofPattern("yyMMddHHmmssSS");
publicstaticStringgenerateOrderNo(){
LocalDateTimedataTime=LocalDateTime.now(ZONE_ID);
if(SEQ.intValue()9990){
SEQ.getAndSet(1000);
}
returndataTime.format(DF_FMT_PREFIX)+getLocalIpSuffix()+SEQ.getAndIncrement();
}

privatevolatilestaticStringIP_SUFFIX=null;
privatestaticStringgetLocalIpSuffix(){
if(null!=IP_SUFFIX){
returnIP_SUFFIX;
}
try{
synchronized(OrderGen2Test.class){
if(null!=IP_SUFFIX){
returnIP_SUFFIX;
}
InetAddressaddr=InetAddress.getLocalHost();
//172.17.0.4172.17.0.199,
StringhostAddress=addr.getHostAddress();
if(null!=hostAddresshostAddress.length()4){
StringipSuffix=hostAddress.trim().split("\\.")[3];
if(ipSuffix.length()==2){
IP_SUFFIX=ipSuffix;
returnIP_SUFFIX;
}
ipSuffix="0"+ipSuffix;
IP_SUFFIX=ipSuffix.substring(ipSuffix.length()-2);
returnIP_SUFFIX;
}
IP_SUFFIX=RandomUtils.nextInt(10,20)+"";
returnIP_SUFFIX;
}
}catch(Exceptione){
System.out.println("获取IP失败:"+e.getMessage());
IP_SUFFIX=RandomUtils.nextInt(10,20)+"";
returnIP_SUFFIX;
}
}


publicstaticvoidmain(String[]args){
ListStringorderNos=Collections.synchronizedList(newArrayListString());
IntStream.range(0,8000).parallel().forEach(i-{
orderNos.add(generateOrderNo());
});

ListStringfilterOrderNos=orderNos.stream().distinct().collect(Collectors.toList());

System.out.println("订单样例:"+orderNos.get(22));
System.out.println("生成订单数:"+orderNos.size());
System.out.println("过滤重复后订单数:"+filterOrderNos.size());
System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size()));
}
}

/**
订单样例:20082115575546011022
生成订单数:8000
过滤重复后订单数:8000
重复订单数:0
**/


最后,代码说明及几点建议:

generateOrderNo() 方法内不需要加锁,因为 AtomicInteger 内使用的是 CAS 自旋转锁(保证可见性的同时也保证原子性,具体的请自行了解)

getLocalIpSuffix() 方法内不需要对不为 null 的逻辑加同步锁(双向校验锁,整体是一种安全的单例模式)

本人实现的方式并不是解决问题的唯一方式,具体解决问题需要视当前系统架构具体而论

任何测试都是必要的,我同事在前几次尝试解决这个问题后都没有自测,不测试有损开发专业性!


作者:funnyZpC

编辑:陶家龙

出处:cnblogs.com/funnyzpc/p/13541713.html

精彩文章推荐:

如何给前端女朋友解释“微服务”?
考不上本科是智商有问题?网友炸了!
线上jar包里,竟然藏有小电影...

IT之家 3 月 31 日消息,天风国际分析师郭明錤今日晚间在推特发布消息,中国主要安卓手机品牌今年已削减约 1.7 亿部订单,占原 2022&n..

IT之家 3 月 31 日消息,天风国际分析师郭明錤今日晚间在推特发布消息,中国主要安卓手机品牌今年已削减约 1.7 亿部订单,占原 2022&n..

来源:环球网微信公众号据韩联社报道,当地时间4月1日下午1时36分许,韩国两架空军KT-1教练机在庆尚南道泗川市相撞并坠毁。截至目前,事故已经造成机上人员3人死亡1人重伤..

3月31日,据红星资本局报道,柔性屏生产厂商柔宇科技已经拖欠员工薪资长达半年时间,在6个月里发过5次欠薪邮件。甚至有人调侃柔宇的员工每个月等来的不是工资,而是一封欠..

3月31日,据红星资本局报道,柔性屏生产厂商柔宇科技已经拖欠员工薪资长达半年时间,在6个月里发过5次欠薪邮件。甚至有人调侃柔宇的员工每个月等来的不是工资,而是一封欠..

3月31日,据红星资本局报道,柔性屏生产厂商柔宇科技已经拖欠员工薪资长达半年时间,在6个月里发过5次欠薪邮件。甚至有人调侃柔宇的员工每个月等来的不是工资,而是一封欠..

3月31日,据红星资本局报道,柔性屏生产厂商柔宇科技已经拖欠员工薪资长达半年时间,在6个月里发过5次欠薪邮件。甚至有人调侃柔宇的员工每个月等来的不是工资,而是一封欠..

3月31日,据红星资本局报道,柔性屏生产厂商柔宇科技已经拖欠员工薪资长达半年时间,在6个月里发过5次欠薪邮件。甚至有人调侃柔宇的员工每个月等来的不是工资,而是一封欠..

3月29日,东航MU5735航空器飞行事故发生后的第九天,藤县阴,不时有小雨。东航客机坠毁地的村口, 带着全国各地同胞哀思的花束汇聚成花海,诉说着无言的思念。“再见..

本文由 51CTO技术栈 来源发布

1次订单事故,扣了我3个月绩效!

评论问答