网站首页 > 技术文章 正文
在使用pdf.js获取PDF文本时,发现有部分文件获取不到文本(另:vue-pdf依赖于pdf.js,所以也会出现这个问题)。
此时,控制台其实给出了警告提示信息,只不过是用console.log打印的,容易被忽视。
Warning: Error during font loading: CMap baseUrl must be specified, see "PDFJS.cMapUrl" (and also "PDFJS.cMapPacked").
警告:字体加载过程中发生错误:必须指定CMap的“baseUrl”参数,请确保提供了“cMapUrl”和“cMapPacked”API参数。
原因:PDF文档中包含有pdf.js不支持的字体格式。
解决方法:网上粗略搜了下,可能不同版本配置cMapUrl的方式不同,不容易找到适合自己的,不过在源码中稍加搜索还是可以很快找到的。
我这里控制台输出PDFJS.version得到的版本号是1.10.88,解决办法是:在引入完pdf.js以后,为其cMapUrl赋值即可。
PDFJS.cMapUrl='/lib/CMap/'; // CMap文件路径
设置完成后,再次刷新页面,可以发现文件已经正常显示了(pdf.js处理PDF文件时会自动从设置的CMap文件路径中获取所需的字体文件)。
附注1:字体文件的获取
1)官方在github上提供了一些:https://github.com/adobe-type-tools/cmap-resources
2)我在网上搜集了一些:https://download.csdn.net/download/xueshen1106/89220133
附注2:cMapPacked的配置
网上下载的字体文件有很多可能是带着bcmap后缀的,这意味着它是一个打包的cmap文件,那么在使用时可以将 PDFJS.cMapPacked 设置为 true。这时,pdf.js在获取字体文件时也会自动增加bcmap后缀。
但这里有个需要注意的地方:如果直接将带bcmap后缀的文件去掉后缀(同时不设置cMapPacked),这时字体文件仍然可以正常加载使用;但如果是将未打包的字体文件直接人为添加bcmap后缀(同时cMapPacked设置为true),经测试,这样字体文件不能被正确使用,是获取不到PDF文本的。
最后,对比下同一个字体打包和不打包的内容差异:
猜你喜欢
- 2024-10-25 文档在线预览新版(四)使用js前端组件实现文档在线预览
- 2024-10-25 细聊Vue 3 系列之 JSX 语法(vue中jsx语法)
- 2024-10-25 一篇文章教你并列比较React.js和Vue.js的语法【实践】
- 2024-10-25 带你了解 vue-next(Vue 3.0)之 初入茅庐【实践】
- 2024-10-25 10个Vue开发技巧「实践」(vue开发视频教程)
- 2024-10-25 Python开发打印服务(2)(python打印代码)
- 2024-10-25 Vue.js 项目实践——创建记忆卡片游戏
- 2024-10-25 让Jenkins自动部署你的Vue项目「实践」
- 2024-10-25 Java实战系列-前端VUE代码开发及接口流程设计(1)
- 2024-10-25 Vue高性能渲染大数据Tree组件「实践」
- 1507℃桌面软件开发新体验!用 Blazor Hybrid 打造简洁高效的视频处理工具
- 505℃Dify工具使用全场景:dify-sandbox沙盒的原理(源码篇·第2期)
- 484℃MySQL service启动脚本浅析(r12笔记第59天)
- 465℃服务器异常重启,导致mysql启动失败,问题解决过程记录
- 462℃启用MySQL查询缓存(mysql8.0查询缓存)
- 442℃「赵强老师」MySQL的闪回(赵强iso是哪个大学毕业的)
- 422℃mysql服务怎么启动和关闭?(mysql服务怎么启动和关闭)
- 418℃MySQL server PID file could not be found!失败
- 最近发表
-
- netty系列之:搭建HTTP上传文件服务器
- 让deepseek教我将deepseek接入word
- 前端大文件分片上传断点续传(前端大文件分片上传断点续传怎么操作)
- POST 为什么会发送两次请求?(post+为什么会发送两次请求?怎么回答)
- Jmeter之HTTP请求与响应(jmeter运行http请求没反应)
- WAF-Bypass之SQL注入绕过思路总结
- 用户疯狂点击上传按钮,如何确保只有一个上传任务在执行?
- 二 计算机网络 前端学习 物理层 链路层 网络层 传输层 应用层 HTTP
- HTTP请求的完全过程(http请求的基本过程)
- dart系列之:浏览器中的舞者,用dart发送HTTP请求
- 标签列表
-
- c++中::是什么意思 (83)
- 标签用于 (65)
- 主键只能有一个吗 (66)
- c#console.writeline不显示 (75)
- pythoncase语句 (81)
- es6includes (73)
- windowsscripthost (67)
- apt-getinstall-y (86)
- node_modules怎么生成 (76)
- chromepost (65)
- c++int转char (75)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- js判断是否是json字符串 (67)
- checkout-b (67)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- & (66)
- java (73)
- js数组插入 (83)
- linux删除一个文件夹 (65)
- mac安装java (72)
- eacces (67)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)