doris从1.2到2.1.11升级的坑


前言最近公司终于肯将万恶的doris 1.2升级到2.1.11了,然而碰到了非常多的坑。精度表达问题2.1比1.2最大的提升是精度改进和效率提升。但是为了改进这一块,舍弃了大量1.2的兼容性。特别是出现以varchar存储的大数与普通bigint存储的大数进行关联时。两者会被隐式转换成double,

ahocorasick文本匹配算法


文本匹配算法最近一直在搞数据血缘相关的功能,对于纯粹的sql的代码其实是不需要搞得这么麻烦。但是后面由于是需要拉通下游应用,包括下游的magicapi,和帆软报表标本之类的。但是下面这些的代码呢,是无法通过druid或者别的sql代码来进行解析的。因为这些脚本本身就不是正常sql代码。因此还是得回到

树莓派4b的风扇设置


树莓派是一个很经典的小主机,实际上现在这个博客现在也是跑在树莓派上的。而树莓派本身是一个被动散热的机器。虽然本身树莓派的CPU有温控限制,但是毕竟也是热得发飙。因此需要重新弄下树莓派的散热方案。被动散热网上其实很多被动散热的外壳,直接装上就可以的,有点就是几乎没有任何噪音,但是问题就是其实被动散热的

简易数据血缘实现


前言公司购买的数语科技的商业服务的血缘分析系统,然而由于对产品定位的原因,导致其对简单的类似于select * 的语法并不兼容。而且其功能始终有点小问题如鲠在喉。因此起了自研的心思。然后和之前专门负责技术模块的人讨论一下,之前也确认是有这样的想法,但是由于难度过大就没有搞了。正好这边也实现一下。目标

HADOOP完全搭建指南


搭建方式hadoop非真实物理机搭建的方式主要有单机部署伪集群式部署单机部署更适合构建纯粹的开发环境,伪集群式更适合于进行学习和测试使用,因此本文主要是居于伪集群式部署来进行讲解。另外,本文的搭建环境是基于虚拟机的方式,使用docker的方式可以寻找别的文章来查看。搭建流程构建虚拟机基础linux环

高端ROG C8HW主板组装过程


前言最近旧电脑老是莫名其妙的蓝屏,之前还一直没太在意,最近已经严重到连系统都正常进不去了。然后排查了一下主要是因为系统在读主程序的M2的时候发生了错误。但是我使用diskcheck显示那个m2本身是好的,那只可能是主板的M2口出现问题了。升级那还能怎么办,换呗。之前电脑清灰的时候不小心搞坏过cpu针

python的json处理


JSON处理现在json已经作为前后交互的一种非常重要的数据格式,几乎一统江湖。而python关于json处理也有一个非常好用的原生包。import jsonaaa=['123']print(json..dumps(aaa))上述简单的代码即可将一个python对象转换成一个json

Python 如何进行urlencoder


背景最近在基于dolphinscheduler(海豚调度器,以下简称DS)做二次开发。由于是个纯ETL团队,技术栈中并没有关于java的储备。因此需要是python实现相关的接口开发。关于x-www-form-urlencoded这是一种神奇数据格式,我在这里并不纠结其背后的使用规范,只需要知道使用

讨论一次apple music以及衍生的相关的问题


背景清明时间去广州看了may’n的live,确实是太强了。虽然我对may’n的主要歌曲的印象是停留在macrossF的雪莉露女王,但是有一说一may’n的个人专辑也很棒。又说回来,由于本人也算是退烧hifi玩家,于是就职业病般想找may’n的无损专辑。但是may’n的无损专辑确实不好找,主要是时代有

记ForkJoinPool的用法


前言在传统的java开发中,说到线程池往往我会想到ThreadPoolExecutor这个方法,但是在工作中发现有大佬使用了ForkJoinPool这个方法,然后在内部的学习发现在高性能的多线程编程中推荐用这个线程池来实现高性能编程。