浅谈Base64编码原理

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于 2的6次方是64,所以每6个比特为一个单元,对应某个可打印字符。3个字节有24个比特,对应于4个Base64单元,即3个字节可由4个可打印字符来表示。它可用来作为电子邮件的传输编码。在Base64中的可打印字符包括字母A-Z、a-z、数字0-9,这样共有62个字符,此外两个可打印符号在不同的系统中而不同。在MIME格式中,剩余两个字符是加号+和斜杠/,等号=用来作为后缀用途。UTF-7是一个修改版Base64,主要的区别在于不用等号=补余,因为该字符通常需要大量的转译。在IRCu等软件所使用的P10 IRC服务器间协议中,将+/改成了[]。Base64编码可用于在HTTP环境下传递,不在末尾填充=号,并将标准Base64中的+和/分别改成了-和_。

base64的原理

base64编码后的数据比原始数据略长,比原来长1/3。为什么会长1/3?我们学习下原理,之后工作中base64就再也不会挡道了。转换的时候,将3字节的数据,先后放入一个24位的缓冲区中,先来的字节占高位。数据不足3字节的话,于缓冲器中剩下的比特用0补足。每次取出6比特,按照其值选择ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/中的字符作为编码后的输出,直到全部输入数据转换完成。若原数据长度不是3的倍数时且剩下1个输入数据,则在编码结果后加2个=;若剩下2个输入数据,则在编码结果后加1个=。换句话,本来3个字节,base64经过自己的编码成为4个字节。比原理多了1/3。来,举个例子

文本 h e l
ascii 编码 104 101 108
二进制 01101000 01100101 01101100
base64 6位 011010 00 0110 010101 101100
base64 10进制编号 26 6 21 44
base64 结果 a G V s

hel的base64编码结果就是aGVs

base64码表

base64的应用

base64的应用特别广泛,个人在开发中遇到最多的两个方面,第一个是URL的base64,另一个是图片base64。先说第一种,已经有urlencode了,为什么还需要base64 的URL。各有用途。urlencode是将-_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。如果一个URL里面有+ 有空格,是不是urlencode就搞不定,使用base64就会迎刃而解。带来的代价就URL比原理长了1/3

图片编码的问题,经常跟客户端开发的时候,客户端使用二进制流上传图片的时候比较复杂,就可以使用base64将图片的二进制编码转成base64,服务端接到数据之后再basedecode之后就是图片的二进制流。特别方便,带来的结果就是,传输的数据多了1/3。

遇到的问题

根据RFC 822规定,每76个字符,还需要加上一个回车换行。出问题的一般都是822规定,有的语言,对base64decode的时候,发现有换行符就decode失败了,究其原因基本都市822规定,有很多换行,decode的时候解码失败,知道原因了就特别简单,将换行符\r|\r\n 替换成 空,再base64decode就可以了。

原创文章,作者:晴川运维,如若转载,请注明出处:https://baike.qcidc.com/9479.html

(0)
晴川运维晴川运维
上一篇 2025年6月17日
下一篇 2025年6月17日

相关推荐

  • 开源日志库Logger进阶使用方法

    日志对于开发来说是非常重要的,不管是调试数据查看、bug问题追踪定位、数据信息收集统计,日常工作运行维护等等,都大量的使用到。今天介绍著名开源日志库Logger的使用,库的地址:h…

    Linux系统 2025年6月15日
  • Linux下使用Helix具体使用方法

    Helix 是一个后现代的模态文本编辑器。受 kakoune/neovim 启发的编辑器,用 Rust 编写;编辑模型在很大程度上是基于 kakoune,下面为大家分享一下Linu…

    Linux系统 2025年6月8日
  • Linux中安装 supervisor 具体步骤

    Supervisor是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启,下面为大家分享一下在Linux…

    Linux系统 2025年6月9日
  • 详解Go中JSON处理

    Go语言内建对JSON的支持。使用Go语言内置的encoding/json标准库,开发者可以轻松使用Go程序生成和解析JSON格式的数据。在Go语言实现JSON的编码和解码时,遵循…

    Linux系统 2025年6月8日
  • AWK读取标准输入具体方法

    在 awk 系列中,我们将会看到几个例子,你可以筛选其他命令的输出代替从一个文件读取输入作为 awk 的输入。我们首先从使用 dir 命令开始,它类似于 ls 命令。 在第一个例子…

    Linux系统 2025年6月4日
  • 详解SQLite关键字AUTOINCREMENT

    autoincrement的中文意思就是自动递增的意思,在SQLite 中T是一个关键字,用于表中的字段值自动递增。可以在创建表时在特定的列表名称上使用AUTOINCREMENT关…

    Linux系统 2025年7月4日
  • Windows上面挂载NFS共享具体方法

    Windows上面如何挂载NFS共享?NFS普遍用于unix之间共享,windows默认是不支持这种文件系统的。如果我们要用windows访问NFS的话,而windows系统自身又…

    Linux系统 2025年6月4日
  • 使用WebFlux集成 Redis,Spring Boot 2

    Spring WebFlux 是 Spring Framework 5.0中引入的新的响应式web框架。与Spring MVC不同,它不需要Servlet API,是完全异步且非阻…

    Linux系统 2025年6月8日
  • Linux umount命令:卸载文件系统

    前面介绍了如何将光盘和 U 盘挂载在系统中,而在使用完成后,需要先将其与挂载点取消关联,然后才能成功卸载。不过,硬盘分区是否需要卸载,取决于你下次是否还需要使用,一般不对硬盘分区执…

    Linux系统 2025年7月7日
  • 详解Ruby的五种变量

    Ruby支持的有五种类型的变量,分别是全局变量、实例变量、类变量、局部变量、常量、伪变量,下面为大家详细的讲解一下Ruby的五种变量。 Ruby 全局变量 全局变量以 $ 开头。未…

    Linux系统 2025年6月11日

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注