浅谈Base64编码原理

Base64是一种基于64个可打印字符来表示二进制数据的表示方法。由于 2的6次方是64,所以每6个比特为一个单元,对应某个可打印字符。3个字节有24个比特,对应于4个Base64单元,即3个字节可由4个可打印字符来表示。它可用来作为电子邮件的传输编码。在Base64中的可打印字符包括字母A-Z、a-z、数字0-9,这样共有62个字符,此外两个可打印符号在不同的系统中而不同。在MIME格式中,剩余两个字符是加号+和斜杠/,等号=用来作为后缀用途。UTF-7是一个修改版Base64,主要的区别在于不用等号=补余,因为该字符通常需要大量的转译。在IRCu等软件所使用的P10 IRC服务器间协议中,将+/改成了[]。Base64编码可用于在HTTP环境下传递,不在末尾填充=号,并将标准Base64中的+和/分别改成了-和_。

base64的原理

base64编码后的数据比原始数据略长,比原来长1/3。为什么会长1/3?我们学习下原理,之后工作中base64就再也不会挡道了。转换的时候,将3字节的数据,先后放入一个24位的缓冲区中,先来的字节占高位。数据不足3字节的话,于缓冲器中剩下的比特用0补足。每次取出6比特,按照其值选择ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/中的字符作为编码后的输出,直到全部输入数据转换完成。若原数据长度不是3的倍数时且剩下1个输入数据,则在编码结果后加2个=;若剩下2个输入数据,则在编码结果后加1个=。换句话,本来3个字节,base64经过自己的编码成为4个字节。比原理多了1/3。来,举个例子

文本 h e l
ascii 编码 104 101 108
二进制 01101000 01100101 01101100
base64 6位 011010 00 0110 010101 101100
base64 10进制编号 26 6 21 44
base64 结果 a G V s

hel的base64编码结果就是aGVs

base64码表

base64的应用

base64的应用特别广泛,个人在开发中遇到最多的两个方面,第一个是URL的base64,另一个是图片base64。先说第一种,已经有urlencode了,为什么还需要base64 的URL。各有用途。urlencode是将-_. 之外的所有非字母数字字符都将被替换成百分号(%)后跟两位十六进制数,空格则编码为加号(+)。如果一个URL里面有+ 有空格,是不是urlencode就搞不定,使用base64就会迎刃而解。带来的代价就URL比原理长了1/3

图片编码的问题,经常跟客户端开发的时候,客户端使用二进制流上传图片的时候比较复杂,就可以使用base64将图片的二进制编码转成base64,服务端接到数据之后再basedecode之后就是图片的二进制流。特别方便,带来的结果就是,传输的数据多了1/3。

遇到的问题

根据RFC 822规定,每76个字符,还需要加上一个回车换行。出问题的一般都是822规定,有的语言,对base64decode的时候,发现有换行符就decode失败了,究其原因基本都市822规定,有很多换行,decode的时候解码失败,知道原因了就特别简单,将换行符\r|\r\n 替换成 空,再base64decode就可以了。

原创文章,作者:晴川运维,如若转载,请注明出处:https://baike.qcidc.com/9479.html

(0)
晴川运维晴川运维
上一篇 2025年6月17日
下一篇 2025年6月17日

相关推荐

  • FreeBSD中安装VMware Tools

    VMware Tools 中包含一系列服务和组件,可在各种 VMware 产品中实现多种功能,从而使用户能够更好地管理客户机操作系统,以及与客户机操作系统进行无缝交互,下面为大家讲…

    Linux系统 2025年10月24日
  • 通过命令行的方式查找公网动态 IP 地址

    公网IP是运行商给你的IP,是互联网上的一个“门牌号”。内网IP一般是你的局域网IP,比如你家有路由器,就必须有一个内网IP,是内网的一个“门牌号”。“门牌号”是“唯一”的,使别人…

    Linux系统 2025年6月24日
  • Linux下查看网卡流量具体方法

    Linux如何查看网卡流量?在工作中,我们经常需要查看服务器的实时网卡流量,本篇文章将重点为大家讲解一下Linux下查看网卡流量具体方法, 有需要的小伙伴可以参考一下。 img 方…

    Linux系统 2025年6月8日
  • Linux二进制文件查看工具hexdump

    hexdump是Linux下的一个二进制文件查看工具,它可以将二进制文件转换为ASCII、八进制、十进制、十六进制格式进行查看。 参数:  hexdump [-…

    Linux系统 2025年10月26日
  • Linux下ulimit具体使用方法

    ulimit 是一个计算机命令,用于shell启动进程所占用的资源,可用于修改系统资源限制,本篇文章重点为大家分享一下Linux下ulimit具体使用方法,有需要的小伙伴可以参考一…

    Linux系统 2025年7月3日
  • Linux下搭建LAMP具体方法

    LAMP(Linux-Apache-MySQL-PHP)网站架构是目前国际流行的Web框架,该框架包括:Linux操作系统,Apache网络服务器,MySQL数据库,Perl、PH…

    Linux系统 2025年10月5日
  • 详解Android root原理

    0x00 关于root linux和类Unix系统的最初设计都是针对多用户的操作系统,对于用户权限的管理很非常严格的,而root用户(超级用户)就是整个系统的唯一管理员,拥有等同于…

    Linux系统 2025年10月4日
  • static关键字的使用方法

    static,即静态声明。它在 作用域、存储方式、生命周期 等各方面影响一个变量或函数。文章将从 局部变量、全局变量、普通函数、类的static成员(包括数据成员与成员函数)来总结…

    Linux系统 2025年10月9日
  • 通过https访问www服务

    Web服务器在默认情况下使用HTTP,这是一个纯文本的协议。正如其名称所暗示的,纯文本协议不会对传输中的数据进行任何形式的加密。而基于HTTP的Web服务器是非常容易配置,它在安全…

    Linux系统 2025年10月23日
  • 详解Bash提取子字符串具体方法

    所谓“子字符串”就是出现在其它字符串内的字符串。 比如 “3382” 就是 “this is a 3382 test” 的子字符串。 我们有多种方法可以从中把数字或指定部分字符串抽…

    Linux系统 2025年10月21日

发表回复

登录后才能评论