目录
- 一、Base64诞生背景
- 二、Base64的前缀
- 三、Base64定义
- 四、Base64原理
- 1.ASCII码转Base64(字节数 % 3 == 0)
- 2.ASCII码转Base64(字节数 % 3 == 2)
- 3.ASCII码转Base64(字节数 % 3 == 1)
- 4.UTF-8转Base64
- 五、Java实现Base64编解码
- 1.方法一:DatatypeConverter(JDK6)
- 2.方法二:Base64(JDK8)
- 3.方法三:commons工具包
- 六、总结
- 七、补充:JS实现Base64编解码
- 八、推荐:在线Base64编解码工具网站
Base64 在线编码/解码:https://base64.us/
一、Base64诞生背景
- 互联网发展早期,电子邮件是最有效的应用。
- 电子邮件的
SMTP传输协议在早期,只能用于传送 7 位的ASCII码,而ASCII码就是基于英语设计的,对于非英语国家的文字等资源就无法发送。 - 为了解决这个问题,后来有了通用互联网邮件扩充协议
MIME,这是一种用于在互联网上传输数据的标准,增加了邮件主题结构,定义了邮件、文本、音频、图像和多媒体文件等非ASCII码的编码传输规则。 Base64是MIME的一种编码方式。MIME规范中定义了Base64编码作为一种可靠的方式,用于在文本协议中表示二进制数据。通过使用Base64编码,可以将二进制数据转换为可打印字符,从而保证数据在传输过程中不受损失,并且能够被各种文本协议(如SMTP、HTTP)正确处理。- 在
MIME中,当需要在文本协议中传输二进制数据(如邮件附件或图片数据)时,通常会将数据先进行Base64编码,然后将编码后的数据作为文本内容进行传输。
二、Base64的前缀
文件转换为Base64编码时,通常会包含一个前缀,用来指示数据的MIME类型以及可能的文件名。这个前缀遵循特定的格式,一般形如:
data:[][;charset=][;base64],。
其中,各部分释义如下:
<mime-type>表示文件的媒体类型;<charset>(可选)指定字符集;<base64-data>是文件内容经过Base64编码后的字符串。
以下是一些常见的文件类型及其对应的MIME类型前缀示例,用于构造Base64编码的字符串:
- PDF文件:
data:application/pdf;base64,<base64-encoded-data>- 图像文件 - JPEG:
data:image/jpeg;base64,<base64-encoded-data>- 图像文件 - PNG:
data:image/png;base64,<base64-encoded-data>- 文本文件 - TXT:
data:text/plain;charset=utf-8;base64,<base64-encoded-data>- HTML文件:
data:text/html;charset=utf-8;base64,<base64-encoded-data>- SVG矢量图:
data:image/svg+xml;base64,<base64-encoded-data>- 音频文件 - MP3:
data:audio/mpeg;base64,<base64-encoded-data>- 视频文件 - MP4:
data:video/mp4;base64,<base64-encoded-data>注意:在上述示例中,<base64-encoded-data>部分是文件内容经过Base64编码后的字符串。此外,filename=参数可以在某些情况下附加到数据URI中以指定建议的文件名,但这不是标准Base64编码格式的一部分,且浏览器可能不会直接使用此参数保存文件时。例如:
data:application/pdf;filename=generated.pdf;base64,<base64-encoded-data>这个格式常用于将文件内容直接嵌入HTML、CSS或JavaScript中,以便在网络传输时无需额外的HTTP请求,或者在某些API交互中作为文件内容的携带形式。
三、Base64定义
Base64是一种用64个字符(a-z, A-Z, 0-9, +, /)来表示任意二进制数据的方法。
Base64是一种索引编码,由于 2^6=64,所以每 6 个比特为一个单元,对应某个可打印字符,每个字符都对应一个索引。
索引和打印字符的对应关系如下:
| 索引 | 对应字符 | 索引 | 对应字符 | 索引 | 对应字符 | 索引 | 对应字符 |
|---|---|---|---|---|---|---|---|
| 0 | A | 16 | Q | 32 | g | 48 | w |
| 1 | B | 17 | R | 33 | h | 49 | x |
| 2 | C | 18 | S | 34 | i | 50 | y |
| 3 | D | 19 | T | 35 | j | 51 | z |
| 4 | E | 20 | U | 36 | k | 52 | 0 |
| 5 | F | 21 | V | 37 | l | 53 | 1 |
| 6 | G | 22 | W | 38 | m | 54 | 2 |
| 7 | H | 23 | X | 39 | n | 55 | 3 |
| 8 | I | 24 | Y | 40 | o | 56 | 4 |
| 9 | J | 25 | Z | 41 | p | 57 | 5 |
| 10 | K | 26 | a | 42 | q | 58 | 6 |
| 11 | L | 27 | b | 43 | r | 59 | 7 |
| 12 | M | 28 | c | 44 | s | 60 | 8 |
| 13 | N | 29 | d | 45 | t | 61 | 9 |
| 14 | O | 30 | e | 46 | u | 62 | + |
| 15 | P | 31 | f | 47 | v | 63 | / |
四、Base64原理
Base64编码要求把 3 个 8 位的字节(3*8=24)转化为 4 个 6 位的字节(4*6=24),之后在 6 位的前面补两个 0,形成 8 位一个字节的形式。 如果剩下的字符不足 3 个字节,则用 0 填充,输出字符使用=,因此编码后输出的文本末尾可能会出现 1 或 2 个 =。
为了保证所输出的编码位可读字符,Base64制定了一个编码表,以便进行统一转换。编码表的大小为2^6=64,这也是Base64名称的由来。
1.ASCII码转Base64(字节数 % 3 == 0)
ASCII是8位一个字节,Base64是6位一个字节,
3个字节的ASCII编码刚好等于4个字节的Base64编码,3 * 8 = 4 * 6 = 24
示例:
- ASCII编码:
you - Base64编码:
eW91
2.ASCII码转Base64(字节数 % 3 == 2)
ASCII是8位一个字节,Base64是6位一个字节,
2个字节的ASCII编码补2位零等于3个字节的Base64编码,不足4个字节的Base64编码使用 = 代替一个字节来补齐,2 * 8 + 2 = 3 * 6 = 18
示例:
- ASCII编码:
yo - Base64编码:
eW8=
3.ASCII码转Base64(字节数 % 3 == 1)
ASCII是8位一个字节,Base64是6位一个字节,
1个字节的ASCII编码补4位零等于2个字节的Base64编码,不足4个字节的Base64编码使用 = 代替一个字节来补齐,1 * 8 + 4 = 2 * 6 = 12
示例:
- UTF8编码:
y - Base64编码:
eQ==
4.UTF-8转Base64
UTF-8是8位一个字节,Base64是6位一个字节,
UTF-8里中文是三个字节,所以一个UTF-8编码的中文刚好可以转换为4个字节的Base64编码。3 * 8 = 4 * 6 = 24
示例:
- ASCII编码:
中 - Base64编码:
5Lit
首先,由于系统中默认字符串的编码格式为unicode,需要将字符串中转换为utf-8格式的二进制数组:
/** * 字节数组 转 二进制字符串 * @param bytes 高位 到 低位 * @return 二进制字符串 */ public static String byteToBinStr2(byte[] bytes) { StringBuilder s1 = new StringBuilder(); for (byte aByte : bytes) { s1.append(Long.toBinaryString((aByte & 0xFF) + 0x100).substring(1)); } return s1.toString(); } public static void main(String[] args) { System.out.println(byteToBinStr2("中".getBytes(StandardCharsets.UTF_8))); }执行结果:
每8位1字节分隔得到:
11100100 10111000 10101101Base64编码:
五、Java实现Base64编解码
1.方法一:DatatypeConverter(JDK6)
使用 jdk 自带的DatatypeConverter.java类实现,但是 jdk 版本必须 >=1.6。
import java.io.UnsupportedEncodingException; import javax.xml.bind.DatatypeConverter;编码:
/** * base64 编码(方法一) * @explain DatatypeConverter.java实现 * @param str 待编码字符串 * @return 编码字符串 */ public static String encode(String str) { // base64字符串 String base64Str = ""; try { // 非字符串才进行编码 if (str != null && str.length() > 0) { // String 转 byte[] byte[] bytes = str.getBytes("utf-8"); // 编码 base64Str = DatatypeConverter.printBase64Binary(bytes); } } catch (UnsupportedEncodingException e) { e.printStackTrace(); } return base64Str; }解码:
/** * base解码(方法一) * @explain DatatypeConverter.java实现 * @param base64Str 待解码字符串 * @return 解码字符串 */ public static String decode(String base64Str) { // 解码后的字符串 String str = ""; // 非空字符串才进行解码 if (base64Str != null && base64Str.length() > 0) { // 解码 byte[] base64Bytes = DatatypeConverter.parseBase64Binary(base64Str); try { // byte[] 转 String str = new String(base64Bytes, "utf-8"); } catch (UnsupportedEncodingException e) { e.printStackTrace(); } } return str; }测试代码:
public static void main(String[] args) { String s = "y"; String base64Str = encode2(s); System.out.println("原文:" + s); System.out.println("base64编码后(方法一):" + base64Str); System.out.println("base64解码后(方法一):" + decode2(base64Str)); }执行结果:
2.方法二:Base64(JDK8)
使用 jdk 自带的Base64.java类实现,但是 jdk 版本必须 >=1.8。
import java.util.Base64; import java.nio.charset.StandardCharsets;编码:
/** * base64编码(方法二) * @explain Base64.java实现 * @param str 待编码字符串 * @return 编码字符串 */ public static String encode2(String str) { // 非空字符串才进行编码 if (str != null && str.length() > 0) { // String 转 byte[] byte[] bytes = str.getBytes(StandardCharsets.UTF_8); // 编码(base64字符串) return Base64.getEncoder().encodeToString(bytes); } return ""; }解码:
/** * base64解码(方法二) * @explain Base64.java实现 * @param base64Str 待解码字符串 * @return 解码字符串 */ public static String decode2(String base64Str) { // 非空字符串才进行解码 if (base64Str != null && base64Str.length() > 0) { // 编码 byte[] base64Bytes = Base64.getDecoder().decode(base64Str); // byte[] 转 String(解码后的字符串) return new String(base64Bytes, StandardCharsets.UTF_8); } return ""; }测试代码:
public static void main(String[] args) { String s = "y"; String base64Str = encode2(s); System.out.println("原文:" + s); System.out.println("base64编码后(方法二):" + base64Str); System.out.println("base64解码后(方法二):" + decode2(base64Str)); }执行结果:
3.方法三:commons工具包
<dependency> <groupId>commons-codec</groupId> <artifactId>commons-codec</artifactId> <version>1.15</version> </dependency>import org.apache.commons.codec.binary.Base64; import java.nio.charset.StandardCharsets;编码:
/** * base64编码(方法三) * @explain commons工具包实现 * @param str 待编码字符串 * @return 编码字符串 */ public static String encode3(String str) { // 非空字符串才进行编码 if (str != null && str.length() > 0) { // String 转 byte[] byte[] bytes = str.getBytes(StandardCharsets.UTF_8); // 编码(base64字符串) return Base64.encodeBase64String(bytes).replaceAll(" \r\n", ""); } return ""; }解码:
/** * base64解码(方法三) * @explain commons工具包实现 * @param base64Str 待解码字符串 * @return 解码字符串 */ public static String decode3(String base64Str) { // 非空字符串才进行解码 if (base64Str != null && base64Str.length() > 0) { // 解码 byte[] base64Bytes = Base64.decodeBase64(base64Str); // byte[] 转 String(解码后的字符串) return new String(base64Bytes, StandardCharsets.UTF_8); } return ""; }测试代码:
public static void main(String[] args) { String s = "y"; String base64Str = encode3(s); System.out.println("原文:" + s); System.out.println("base64编码后(方法三):" + base64Str); System.out.println("base64解码后(方法三):" + decode3(base64Str)); }执行结果:
六、总结
执行结果:方法一、方法二、方法三一致
效率:快–>慢:方法二 > 方法一 > 方法三
因此,如果项目用的是jdk1.8,最佳选择是方法二;jdk1.6,最佳选择是方法一。
七、补充:JS实现Base64编解码
JavaScript 提供了两个原生的方法,用来处理Base64编码:btoa()和atob()
btoa():Base64编码。atob():Base64解码。
以上两个方法如果操作的字符串不是 ASCII 编码会报错:
例如:btoa('中')
VM707:1 Uncaught DOMException: Failed to execute ‘btoa’ on ‘Window’: The string to be encoded contains characters outside of the Latin1 range.
可以使用这两个方法,将非ASCII码的字符作为URI组件进行编码,然后再进行Base64编码。
encodeURIComponent():作为URI组件进行编码。decodeURIComponent():作为URI组件进行解码。
综上所述,适用于所有情况(ASCII码+非ASCII码)的Base64编解码方法如下:
btoa(encodeURIComponent(待编码内容)):Base64 编码。decodeURIComponent(atob(待解码内容)):Base64 解码。
注意:这种方法和UTF-8格式的加密不能通用。
执行结果:
八、推荐:在线Base64编解码工具网站
- 1)十六进制编解码网址:https://base64.us/
- 2)文件字节流编解码网址:https://www.btool.cn/base64-file-converter
整理完毕,完结撒花~ 🌻
参考地址:
1.Base64编码知识详解,https://baijiahao.baidu.com/s?id=1735577033729027737&wfr=spider&for=pc
2.什么是base64,https://zhuanlan.zhihu.com/p/76666060
3.Base64 编码/解码 | 菜鸟工具,https://c.runoob.com/front-end/693/
4.java base64编码、解码的三种方式,https://blog.51cto.com/u_15964717/6093954
5.文件转base64有哪些前缀格式,https://blog.csdn.net/ivan5277/article/details/139649480
Java开发的就业市场正在经历结构性调整,竞争日益激烈
传统纯业务开发岗位(如仅完成增删改查业务的后端工程师)的需求,特别是入门级岗位,正显著萎缩。随着企业技术需求升级,市场对Java人才的要求已从通用技能转向了更深入的领域经验(如云原生、微服务)或前沿的AI集成能力。这也导致岗位竞争加剧,在一、二线城市,求职者不仅面临技术内卷,还需应对学历与项目经验的高门槛。
大模型为核心的AI领域正展现出前所未有的就业热度与人才红利
2025年,AI相关新发岗位数量同比激增543%,单月增幅最高超过11倍,大模型算法工程师位居热门岗位前列。行业顶尖人才的供需严重失衡,议价能力极强,跳槽薪资涨幅可达30%-50%。值得注意的是,市场并非单纯青睐算法研究员,而是急需能将大模型能力落地于复杂业务系统的工程人才。这使得具备企业级架构思维和复杂系统整合经验的Java工程师,在向“Java+大模型”复合人才转型时拥有独特优势,成为企业竞相争夺的对象,其薪资天花板也远高于传统Java岗位。
说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。
结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”
先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。
即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!
如何学习AGI大模型?
作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享**
一、2025最新大模型学习路线
一个明确的学习路线可以帮助新人了解从哪里开始,按照什么顺序学习,以及需要掌握哪些知识点。大模型领域涉及的知识点非常广泛,没有明确的学习路线可能会导致新人感到迷茫,不知道应该专注于哪些内容。
我们把学习路线分成L1到L4四个阶段,一步步带你从入门到进阶,从理论到实战。
L1级别:AI大模型时代的华丽登场
L1阶段:我们会去了解大模型的基础知识,以及大模型在各个行业的应用和分析;学习理解大模型的核心原理,关键技术,以及大模型应用场景;通过理论原理结合多个项目实战,从提示工程基础到提示工程进阶,掌握Prompt提示工程。
L2级别:AI大模型RAG应用开发工程
L2阶段是我们的AI大模型RAG应用开发工程,我们会去学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。
L3级别:大模型Agent应用架构进阶实践
L3阶段:大模型Agent应用架构进阶实现,我们会去学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造我们自己的Agent智能体;同时还可以学习到包括Coze、Dify在内的可视化工具的使用。
L4级别:大模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,我们会更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调;并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。
整个大模型学习路线L1主要是对大模型的理论基础、生态以及提示词他的一个学习掌握;而L3 L4更多的是通过项目实战来掌握大模型的应用开发,针对以上大模型的学习路线我们也整理了对应的学习视频教程,和配套的学习资料。
二、大模型经典PDF书籍
书籍和学习文档资料是学习大模型过程中必不可少的,我们精选了一系列深入探讨大模型技术的书籍和学习文档,它们由领域内的顶尖专家撰写,内容全面、深入、详尽,为你学习大模型提供坚实的理论基础。(书籍含电子版PDF)
三、大模型视频教程
对于很多自学或者没有基础的同学来说,书籍这些纯文字类的学习教材会觉得比较晦涩难以理解,因此,我们提供了丰富的大模型视频教程,以动态、形象的方式展示技术概念,帮助你更快、更轻松地掌握核心知识。
四、大模型项目实战
学以致用,当你的理论知识积累到一定程度,就需要通过项目实战,在实际操作中检验和巩固你所学到的知识,同时为你找工作和职业发展打下坚实的基础。
五、大模型面试题
面试不仅是技术的较量,更需要充分的准备。
在你已经掌握了大模型技术之后,就需要开始准备面试,我们将提供精心整理的大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。
因篇幅有限,仅展示部分资料,需要点击下方链接即可前往获取
2025最新版CSDN大礼包:《AGI大模型学习资源包》免费分享