Java8新特性-Base64

Base64 编码由来

为什么会有Base64编码呢?因为有些网络传送渠道并不支持所有的字节,例如传统的邮件只支持可见字符的传送,像ASCII码的控制字符就不能通过邮件传送。这样用途就受到了很大的限制,比如图片二进制流的每个字节不可能全部是可见字符,所以就传送不了。最好的方法就是在不改变传统协议的情况下,做一种扩展方案来支持二进制文件的传送。把不可打印的字符也能用可打印字符来表示,问题就解决了。Base64编码应运而生,Base64就是一种基于64个可打印字符来表示二进制数据的表示方法。

什么是 Base64 和 Base64 的使用场景

什么是 Base64

Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法。由于 2⁶ = 64 ,所以每 6 个比特为一个单元,对应某个可打印字符。3 个字节有 24 个比特,对应于 4 个 base64 单元,即 3 个字节可由 4 个可打印字符来表示。相应的转换过程如下图所示:

base64-convert

Base64 的使用场景

Base64 常用于在处理文本数据的场合,表示、传输、存储一些二进制数据,包括 MIME 的电子邮件及 XML 的一些复杂数据。在 MIME 格式的电子邮件中,base64 可以用来将二进制的字节序列数据编码成 ASCII 字符序列构成的文本。使用时,在传输编码方式中指定 base64。使用的字符包括大小写拉丁字母各 26 个、数字 10 个、加号 + 和斜杠 /,共 64 个字符,等号 = 用来作为后缀用途。Base64 相应的索引表如下:

base64-encode-table

Base64 编码原理

看一下Base64的索引表,字符选用了"A-Z、a-z、0-9、+、/" 64个可打印字符。数值代表字符的索引,这个是标准Base64协议规定的,不能更改。64个字符用6个bit位就可以全部表示,一个字节有8个bit位,剩下两个bit就浪费掉了,这样就不得不牺牲一部分空间了。这里需要弄明白的就是一个Base64字符是8个bit,但是有效部分只有右边的6个bit,左边两个永远是0。

那么怎么用6个有效bit来表示传统字符的8个bit呢?8和6的最小公倍数是24,也就是说3个传统字节可以由4个Base64字符来表示,保证有效位数是一样的,这样就多了1/3的字节数来弥补Base64只有6个有效bit的不足。

Base64 编码过程

  1. 按照从左往右的规则,每三个字节作为一组,一共就是24个二进制位。
  2. 将这24个二进制位分为四组,每组6个二进制位。
  3. 之后在每组数据前面添加00,组成每个组8个二进制位,此时变成了32个二进制位,即四个字节
  4. 四个字节在Base64 索引表查找得到的对应符号,base64编码完成

Base64 解码原理

解码原理是将4个字节转换成3个字节,先读入4个6位(用或运算),每次左移6位,再右移3次,每次8位,这样就还原了。

Base64 编码字符串实例

了解了 Base64 编码原理,我们以编码 Man 字符串为例,来直观的感受一下编码过程。Man 由 M、a 和 n 3 个字符组成,它们对应的 ASCII 码为 77、97 和 110。

char-m-ascii

接着我们以每 6 个比特为一个单元,进行 base64 编码操作,具体如下图所示:

base64-encode-demo

由图可知,Man (3字节)编码的结果为 TWFu(4字节),很明显经过 base64 编码后体积会增加 1/3。Man 这个字符串的长度刚好是 3,我们可以用 4 个 base64 单元来表示。但如果待编码的字符串长度不是 3 的整数倍时,应该如何处理呢?

如果要编码的字节数不能被 3 整除,最后会多出 1 个或 2 个字节,那么可以使用下面的方法进行处理:先使用 0 字节值在末尾补足,使其能够被 3 整除,然后再进行 base64 的编码

以编码字符 A 为例,其所占的字节数为 1,不能被 3 整除,需要补 2 个字节,具体如下图所示:

base64-encode-a

由上图可知,字符 A 经过 base64 编码后的结果是 QQ==,该结果后面的两个 = 代表补足的字节数。而最后个 1 个 base64 字节块有 4 位是 0 值。

接着我们来看另一个示例,假设需编码的字符串为 BC,其所占字节数为 2,不能被 3 整除,需要补 1 个字节,具体如下图所示:

base64-encode-bc

由上图可知,字符串 BC 经过 base64 编码后的结果是 QkM=,该结果后面的 1 个 = 代表补足的字节数。而最后个 1 个 base64 字节块有 2 位是 0 值。

Base64 具体实现

对字符串进行 Base64 编解码

Encoder方式
@Test
public void testEncoder() {
    String str = "thinkwon";
    // 使用基本编码
    String base64encodedString = Base64.getEncoder().encodeToString(str.getBytes(StandardCharsets.UTF_8));
    System.out.println("Base64 编码字符串 (基本) :" + base64encodedString);

    // 解码
    byte[] base64decodedBytes = Base64.getDecoder().decode(base64encodedString);
    System.out.println("原始字符串: " + new String(base64decodedBytes, StandardCharsets.UTF_8));
}

输出结果

Base64 编码字符串 (基本) :dGhpbmt3b24=
原始字符串: thinkwon
UrlEncoder方式
@Test
public void testUrlEncoder() {
    String str = "thinkwon";
    // 使用基本编码
    String base64encodedString = Base64.getUrlEncoder().encodeToString(str.getBytes(StandardCharsets.UTF_8));
    System.out.println("Base64 编码字符串 (URL) :" + base64encodedString);

    // 解码
    byte[] base64decodedBytes = Base64.getUrlDecoder().decode(base64encodedString);
    System.out.println("原始字符串: " + new String(base64decodedBytes, StandardCharsets.UTF_8));
}

输出结果

Base64 编码字符串 (URL) :dGhpbmt3b24=
原始字符串: thinkwon
MimeEncoder方式
@Test
public void testMimeEncoder() {
    StringBuilder stringBuilder = new StringBuilder();
    for (int i = 0; i < 2; ++i) {
        stringBuilder.append(UUID.randomUUID().toString());
    }
    System.out.println("原始字符串: " + stringBuilder.toString());

    byte[] mimeBytes = stringBuilder.toString().getBytes(StandardCharsets.UTF_8);
    String mimeEncodedString = Base64.getMimeEncoder().encodeToString(mimeBytes);
    System.out.println("Base64 编码字符串 (MIME) :");
    System.out.println(mimeEncodedString);

    byte[] decode = Base64.getMimeDecoder().decode(mimeEncodedString);
    System.out.println("解码字符串: " + new String(decode, StandardCharsets.UTF_8));
}

输出结果

原始字符串: fb51e7aa-2303-4ffc-be8c-44de37b1417e783f2921-1a68-462e-a5e1-32d1ad6cc51a
Base64 编码字符串 (MIME) :
ZmI1MWU3YWEtMjMwMy00ZmZjLWJlOGMtNDRkZTM3YjE0MTdlNzgzZjI5MjEtMWE2OC00NjJlLWE1
ZTEtMzJkMWFkNmNjNTFh
解码字符串: fb51e7aa-2303-4ffc-be8c-44de37b1417e783f2921-1a68-462e-a5e1-32d1ad6cc51a

对文件进行 Base64 编解码

文件与 Base64 字符串转换工具类
/**
 * 文件转化成base64字符串
 *
 * @param path 文件路径
 * @return String base64字符串
 */
public static String fileToBase64Str(String path) {
    InputStream in = null;
    byte[] data = null;
    try {
        in = new FileInputStream(new File(path));
        data = new byte[in.available()];
        in.read(data);
    } catch (Exception e) {
        e.printStackTrace();
    } finally {
        if (in != null) {
            try {
                in.close();
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
    // 对字节数组Base64编码
    return Base64.getMimeEncoder().encodeToString(data);
}

/**
 * 将base64字符串转换为文件并存储到指定位置
 *
 * @param base64Str base64字符串
 * @param filePath  文件路径
 * @return boolean true表示转换成功,false表示转换失败
 */
public static boolean base64StrToFile(String base64Str, String filePath) {
    if (base64Str == null && filePath == null) {
        return false;
    }
    try {
        Files.write(Paths.get(filePath), Base64.getMimeDecoder().decode(base64Str), StandardOpenOption.CREATE);
    } catch (IOException e) {
        e.printStackTrace();
    }
    return true;
}
文件转 Base64 字符串
@Test
public void testFileToBase64() {
    String base64 = fileToBase64Str("C:\\Users\\JourWon\\Desktop\\优秀.jpg");
    System.out.println(base64);
}

输出结果

/9j/4AAQSkZJRgABAQAAAQABAAD/4S/vRXhpZgAATU0AKgAAAAgABgESAAMAAAABAAEAAAEaAAUA后面还有很长的字符串...
Base64 字符串转文件
@Test
public void testBase64ToFile() {
    boolean b = base64StrToFile("/9j/4AAQSkZJRgABAQAAAQABAAD/4S/vRXhpZgAATU0AKgAAAAgABgESAAMAAAABAAEAAAEaAAUA后面还有很长的字符串...", "C:\\Users\\JourWon\\Desktop\\base64转图片.jpg");
    System.out.println(b);
}

转换过程中可能存在的问题:

1.运行出现错误为:“常量字符串过长”

File >> Settings >> Build,Execution,Deployment >> Compiler >>Java Compiler,将 Use compiler 改为 Eclipse 即可

2.运行出现错误为:java.lang.IllegalArgumentException: Illegal base64 character a

注意base64StrToFile方法的decoder是Base64.getMimeDecoder(),不是Base64.getDecoder()

输出结果

在这里插入图片描述

  • 25
    点赞
  • 101
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值