一、PDF提取文字/转图片 提取文字和转图片使用的是fitz模块,模块安装: 1 pip install PyMuPDF 提取文字 1 2 3 4 5 6 7 8 9 10 11 12 13 import fitz pdf = fitz.open(xxxx.pdf) # xxxx.pdf是pdf文件名或路径 pages = pdf.pag
一、PDF提取文字/转图片提取文字和转图片使用的是fitz模块,模块安装:
提取文字
转图片
二、分割、合并PDF文档2.1 使用PyPDF2模块模块安装:
分割、合并PDF
2.2 使用fitz模块模块安装:
示例:
分割跟合并PDF的原理是一样的,前者是打开一个PDF文档,创建并保存为多个PDF文档;后者是打开多个PDF文档,创建并保存为一个PDF文档。 使用PyPDF2模块合并pdf文件时常常遇到乱码问题,因此本人更推荐使用fitz模块。 |
2019-06-18
2019-07-04
2021-05-23
2021-05-27
2021-05-27