python3的内部编码是unicode,转utf8很容易,却发现想知道某个汉字的unicode编码(二进制hex码)倒是有点麻烦。查了一番,发现有个codec叫unicode_escape可以用,这下就容易了,unicode转hex编码:
>>> '乱'.encode('unicode_escape') >>> b'\\u4e71'
hex编码转unicode字:
>>> b'\\u4e71'.decode('unicode_escape') >>> '乱'