|
|
|
|
公众号矩阵

1次订单事故,扣了我3个月绩效!

去年年底的时候,我们线上出了一次事故。

作者:funnyZpC来源:博客园|2021-03-19 09:04

 

图片来自 Pexels

这个事故的表象是这样的:系统出现了两个一模一样的订单号,订单的内容却不是不一样的,而且系统在按照订单号查询的时候一直抛错,也没法正常回调,而且事情发生的不止一次,所以 这次系统升级一定要解决掉。

经手的同事之前也改过几次,不过效果始终不好:总会出现订单号重复的问题, 所以趁着这次问题我好好的理了一下我同事写的代码。

这里简要展示下当时的代码:

  1. /** 
  2.      * OD单号生成 
  3.      * 订单号生成规则:OD + yyMMddHHmmssSSS + 5位数(商户ID3位+随机数2位) 22位 
  4.      */ 
  5.     public static String getYYMMDDHHNumber(String merchId){ 
  6.         StringBuffer orderNo = new StringBuffer(new SimpleDateFormat("yyMMddHHmmssSSS").format(new Date())); 
  7.         if(StringUtils.isNotBlank(merchId)){ 
  8.             if(merchId.length()>3){ 
  9.                 orderNo.append(merchId.substring(0,3)); 
  10.             }else { 
  11.                 orderNo.append(merchId); 
  12.             } 
  13.         } 
  14.         int orderLength = orderNo.toString().length(); 
  15.         String randomNum = getRandomByLength(20-orderLength); 
  16.         orderNo.append(randomNum); 
  17.         return orderNo.toString(); 
  18.     } 
  19.  
  20.  
  21.     /** 生成指定位数的随机数 **/ 
  22.     public static String getRandomByLength(int size){ 
  23.         if(size>8 || size<1){ 
  24.             return ""
  25.         } 
  26.         Random ne = new Random(); 
  27.         StringBuffer endNumStr = new StringBuffer("1"); 
  28.         StringBuffer staNumStr = new StringBuffer("9"); 
  29.         for(int i=1;i<size;i++){ 
  30.             endNumStr.append("0"); 
  31.             staNumStr.append("0"); 
  32.         } 
  33.         int randomNum = ne.nextInt(Integer.valueOf(staNumStr.toString()))+Integer.valueOf(endNumStr.toString()); 
  34.         return String.valueOf(randomNum); 
  35.     } 

可以看到,这段代码写的其实不怎么好,代码部分暂且不议,代码中使订单号不重复的主要因素点是随机数和毫秒,可是这里的随机数只有两位。

在高并发环境下极容易出现重复问题,同时毫秒这一选择也不是很好,在多核 CPU 多线程下,一定时间内(极小的)这个毫秒可以说是固定不变的(测试验证过)。

所以这里我先以 100 个并发测试下这个订单号生成,关注微信订阅号码匠笔记,回复架构获取一些列的架构知识。

测试代码如下:

  1. public static void main(String[] args) { 
  2.         final String merchId = "12334"
  3.         List<String> orderNos = Collections.synchronizedList(new ArrayList<String>()); 
  4.         IntStream.range(0,100).parallel().forEach(i->{ 
  5.             orderNos.add(getYYMMDDHHNumber(merchId)); 
  6.         }); 
  7.  
  8.         List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList()); 
  9.  
  10.         System.out.println("生成订单数:"+orderNos.size()); 
  11.         System.out.println("过滤重复后订单数:"+filterOrderNos.size()); 
  12.         System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size())); 
  13.     } 

果然,测试的结果如下:

  1. 生成订单数:100 
  2. 过滤重复后订单数:87 
  3. 重复订单数:13 

生成订单数:100过滤重复后订单数:87重复订单数:13

当时我就震惊了,一百个并发里面竟然有 13 个重复的!!!我赶紧让同事先不要发版,这活儿我接了!

对这一烫手的山竽拿到手里没有一个清晰的解决方案可是不行的,我大概花了 6 分多钟和同事商量了下业务场景。

最后决定做如下更改:

  • 去掉商户 ID 的传入(按同事的说法,传入商户 ID 也是为了防止重复订单的,事实证明并没有叼用)
  • 毫秒仅保留三位(缩减长度同时保证应用切换不存在重复的可能)
  • 使用线程安全的计数器做数字递增(三位数最低保证并发 800 不重复,代码中我给了 4 位)
  • 更换日期转换为 java8 的日期类以格式化(线程安全及代码简洁性考量)

经过以上思考后我的最终代码是:

  1. /** 订单号生成(NEW) **/ 
  2.    private static final AtomicInteger SEQ = new AtomicInteger(1000); 
  3.    private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS"); 
  4.    private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai"); 
  5.    public static String generateOrderNo(){ 
  6.        LocalDateTime dataTime = LocalDateTime.now(ZONE_ID); 
  7.        if(SEQ.intValue()>9990){ 
  8.            SEQ.getAndSet(1000); 
  9.        } 
  10.        return  dataTime.format(DF_FMT_PREFIX)+SEQ.getAndIncrement(); 
  11.    } 

当然代码写完成了可不能这么随随便便结束了,现在得走一个测试 main 函数看看:

  1. public static void main(String[] args) { 
  2.  
  3.     List<String> orderNos = Collections.synchronizedList(new ArrayList<String>()); 
  4.     IntStream.range(0,8000).parallel().forEach(i->{ 
  5.         orderNos.add(generateOrderNo()); 
  6.     }); 
  7.  
  8.     List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList()); 
  9.  
  10.     System.out.println("生成订单数:"+orderNos.size()); 
  11.     System.out.println("过滤重复后订单数:"+filterOrderNos.size()); 
  12.     System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size())); 
  13.  
  14. /** 
  15.     测试结果:  
  16.     生成订单数:8000 
  17.     过滤重复后订单数:8000 
  18.     重复订单数:0 
  19. **/ 

真好,一次就成功了,可以直接上线了。。。

然而,我回过头来看以上代码,虽然最大程度解决了并发单号重复的问题,不过对于我们的系统架构还是有一个潜在的隐患。

如果当前应用有多个实例(集群)难道就没有重复的可能了?鉴于此问题就必然需要一个有效的解决方案,所以这时我就思考:多个实例应用订单号如何区分开呢?

以下为我思考的大致方向:

  • 使用 UUID(在第一次生成订单号时初始化一个)
  • 使用 Redis 记录一个增长 ID
  • 使用数据库表维护一个增长 ID
  • 应用所在的网络 IP
  • 应用所在的端口号
  • 使用第三方算法(雪花算法等等)
  • 使用进程 ID(某种程度下是一个可行的方案)

在此我想了下,我们的应用是跑在 Docker 里面,而且每个 Docker 容器内的应用端口都一样,不过网路 IP 不会存在重复的问题,至于进程也有存在重复的可能,对于 UUID 的方式之前吃过亏。

总之吧,Redis 或 DB 也算是一种比较好的方式,不过独立性较差。。。

同时还有一个因素也很重要,就是所有涉及到订单号生成的应用都是在同一台宿主机(Linux 实体服务器)上, 所以就目前的系统架构我选用了 IP 的方式。

以下是我的代码:

  1. import org.apache.commons.lang3.RandomUtils; 
  2.  
  3. import java.net.InetAddress; 
  4. import java.time.LocalDateTime; 
  5. import java.time.ZoneId; 
  6. import java.time.format.DateTimeFormatter; 
  7. import java.util.ArrayList; 
  8. import java.util.Collections; 
  9. import java.util.List; 
  10. import java.util.concurrent.atomic.AtomicInteger; 
  11. import java.util.stream.Collectors; 
  12. import java.util.stream.IntStream; 
  13.  
  14. public class OrderGen2Test { 
  15.  
  16.     /** 订单号生成 **/ 
  17.     private static ZoneId ZONE_ID = ZoneId.of("Asia/Shanghai"); 
  18.     private static final AtomicInteger SEQ = new AtomicInteger(1000); 
  19.     private static final DateTimeFormatter DF_FMT_PREFIX = DateTimeFormatter.ofPattern("yyMMddHHmmssSS"); 
  20.     public static String generateOrderNo(){ 
  21.         LocalDateTime dataTime = LocalDateTime.now(ZONE_ID); 
  22.         if(SEQ.intValue()>9990){ 
  23.             SEQ.getAndSet(1000); 
  24.         } 
  25.         return  dataTime.format(DF_FMT_PREFIX)+ getLocalIpSuffix()+SEQ.getAndIncrement(); 
  26.     } 
  27.  
  28.     private volatile static String IP_SUFFIX = null
  29.     private static String getLocalIpSuffix (){ 
  30.         if(null != IP_SUFFIX){ 
  31.             return IP_SUFFIX; 
  32.         } 
  33.         try { 
  34.             synchronized (OrderGen2Test.class){ 
  35.                 if(null != IP_SUFFIX){ 
  36.                     return IP_SUFFIX; 
  37.                 } 
  38.                 InetAddress addr = InetAddress.getLocalHost(); 
  39.                 //  172.17.0.4  172.17.0.199 , 
  40.                 String hostAddress = addr.getHostAddress(); 
  41.                 if (null != hostAddress && hostAddress.length() > 4) { 
  42.                     String ipSuffix = hostAddress.trim().split("\\.")[3]; 
  43.                     if (ipSuffix.length() == 2) { 
  44.                         IP_SUFFIX = ipSuffix; 
  45.                         return IP_SUFFIX; 
  46.                     } 
  47.                     ipSuffix = "0" + ipSuffix; 
  48.                     IP_SUFFIX = ipSuffix.substring(ipSuffix.length() - 2); 
  49.                     return IP_SUFFIX; 
  50.                 } 
  51.                 IP_SUFFIX = RandomUtils.nextInt(10, 20) + ""
  52.                 return IP_SUFFIX; 
  53.             } 
  54.         }catch (Exception e){ 
  55.             System.out.println("获取IP失败:"+e.getMessage()); 
  56.             IP_SUFFIX =  RandomUtils.nextInt(10,20)+""
  57.             return IP_SUFFIX; 
  58.         } 
  59.     } 
  60.  
  61.  
  62.     public static void main(String[] args) { 
  63.         List<String> orderNos = Collections.synchronizedList(new ArrayList<String>()); 
  64.         IntStream.range(0,8000).parallel().forEach(i->{ 
  65.             orderNos.add(generateOrderNo()); 
  66.         }); 
  67.  
  68.         List<String> filterOrderNos = orderNos.stream().distinct().collect(Collectors.toList()); 
  69.  
  70.         System.out.println("订单样例:"+ orderNos.get(22)); 
  71.         System.out.println("生成订单数:"+orderNos.size()); 
  72.         System.out.println("过滤重复后订单数:"+filterOrderNos.size()); 
  73.         System.out.println("重复订单数:"+(orderNos.size()-filterOrderNos.size())); 
  74.     } 
  75.  
  76. /** 
  77.   订单样例:20082115575546011022 
  78.   生成订单数:8000 
  79.   过滤重复后订单数:8000 
  80.   重复订单数:0 
  81. **/ 

最后,代码说明及几点建议:

  • generateOrderNo() 方法内不需要加锁,因为 AtomicInteger 内使用的是 CAS 自旋转锁(保证可见性的同时也保证原子性,具体的请自行了解)
  • getLocalIpSuffix() 方法内不需要对不为 null 的逻辑加同步锁(双向校验锁,整体是一种安全的单例模式)
  • 本人实现的方式并不是解决问题的唯一方式,具体解决问题需要视当前系统架构具体而论
  • 任何测试都是必要的,我同事在前几次尝试解决这个问题后都没有自测,不测试有损开发专业性!

作者:funnyZpC

编辑:陶家龙

出处:cnblogs.com/funnyzpc/p/13541713.html

【编辑推荐】

  1. 适用于Linux的高级实时系统监控工具
  2. 智慧城市:不断发展的生态系统
  3. Redis,一步一台阶(系统化学习)之 Redis
  4. 项目实战视频教程:汽车租赁系统
  5. Linux与云计算—第一阶段Linux基础(系统入门到管理)视频课程
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

数据湖与数据仓库的分析实践攻略

数据湖与数据仓库的分析实践攻略

助力现代化数据管理:数据湖与数据仓库的分析实践攻略
共3章 | 创世达人

7人订阅学习

云原生架构实践

云原生架构实践

新技术引领移动互联网进入急速赛道
共3章 | KaliArch

36人订阅学习

数据中心和VPDN网络建设案例

数据中心和VPDN网络建设案例

漫画+案例
共20章 | 捷哥CCIE

228人订阅学习

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微