今天学习Django时,无意看到了pdf的报表类库Reportlab,使用该库可以很容易的生成pdf。其中介绍最多的是将图片转换为pdf,网上也有相关的介绍(Python Reportlab转换jpg为pdf),不过这些网上的介绍几乎全都是转自一篇博客的内容,代码是一模一样的。本来打算直接使用文章提供的代码,但发现改代码没有考虑图片尺寸与pdf只存之间的匹配,导致转换出来部分数据丢失。下面记录一下相应代码的修改过程:
一、基础知识
Reportlab是Python平台上优秀的报表类库,由于不属于python的标准类库,所以需要手动安装,下载地址:https://www.reportlab.com/software/downloads/。由于涉及到图片处理,还需要安装Python imaging library(PIL)类库。Reportlab库和PIL库下载完成后直接安装即可(建议先安装PIL库)。安装完成后,可以在python shell下执行import reportlab.pdfgen命令来测试是否安装正确。
python图像处理库——PIL,用于处理图像文件。PIL提供了功能丰富的方法,比如格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等等等,非常强大。
二、代码实现
代码使用图片如下:
1、网上版本:
#! /usr/bin/env python #coding=utf-8 from reportlab.pdfgen import canvas from reportlab.lib.pagesizes import A4,landscape def convert_to_pdf(filename): newname=filename[:filename.rindex('.')]+'.pdf' w,h=landscape(A4) c=canvas.Canvas(newname,pagesize=(w,h)) c.drawImage(filename,0,0,w,h) c.save() c.showPage() print "convert finish"
由于Reportlab的Canvas画布的大小默认是A4大小,所以网上程序代码只是从图片中截取了A4大小的部分来生成pdf,导致图片很长或很宽时生成的图片比例失调。因此我们需要修改代码来适应不同尺寸的图片。
ps:landscape()函数的作用是获取A4大小的宽和高,Canvas()中第二个参数是一个宽和高组成的元祖用来表明生成pdf的大小。drawImage()函数的后四个参数用来指明图片在pdf中所占的区域,因此由于上面示例代码将图片放到了A4大小的区域中所以比例失调。
现在改进有两种方法:一是pdf画布大小仍是A4,只是将图片按照相应比例进行缩放;二是修改pdf画布的尺寸为图片的尺寸,即根据图片的大小来调整pdf的大小。、
2、改进方法1:pdf仍是A4大小,图片按相应比例进行缩放
#! /usr/bin/env python #coding=utf-8 from reportlab.pdfgen import canvas from reportlab.lib.pagesizes import A4,landscape import Image def convert_to_pdf1(filename): im=Image.open(filename) im_w,im_h=im.size a4_w,a4_h=landscape(A4) newname=filename[:filename.rindex('.')]+'.pdf' c=canvas.Canvas(newname,pagesize=(a4_w,a4_h)) if a4_w/im_w<a4_h/im_h: ratio=a4_w/im_w else: ratio=a4_h/im_h c.drawImage(filename,0,0,im_w*ratio,im_h*ratio) c.save() c.showPage() print "convert finish"
结果:
可以看到这次没有失真,只是由于图片太长了导致显示非常小。那我们尝试一下第二种改进方法:按照图片的大小来生成pdf
3、改进方法2:按照图片的大小来生成pdf
ps:按照图片大小来生成pdf的意思是按照图片的大小来生成画布。
#! /usr/bin/env python #coding=utf-8 from reportlab.pdfgen import canvas from reportlab.lib.pagesizes import A4,landscape import Image def convert_to_pdf2(filename): im=Image.open(filename) im_w,im_h=im.size newname=filename[:filename.rindex('.')]+'.pdf' c=canvas.Canvas(newname,pagesize=(im_w,im_h)) c.drawImage(filename,0,0,im_w,im_h) c.save() c.showPage() print "convert finish" convert_to_pdf2('a.jpg')
可以看到按照图片尺寸生成的pdf展示图片非常清晰,但是非常长,看起来比第一种改进方法要好一点。不过,如果要打印的话两种改进方法应该是一样的。
所以,最好的改进方法是能够将图片生成为多页pdf,而不是将其写进一页pdf中。如何改进还没想好。
———————————————————————————————————————–
参考代码:
使用python进行图像处理-调整图片大小
python有一个图像处理库——PIL,可以处理图像文件。PIL提供了功能丰富的方法,比如格式转换、旋转、裁剪、改变尺寸、像素处理、图片合并等等等等,非常强大。
举个简单的例子,调整图片的大小:
infile = 'D:\\original_img.jpg' outfile = 'D:\\adjust_img.jpg' im = Image.open(infile) (x,y) = im.size #read image size x_s = 250 #define standard width y_s = y * x_s / x #calc height based on standard width out = im.resize((x_s,y_s),Image.ANTIALIAS) #resize image with high-quality out.save(outfile) print 'original size: ',x,y print 'adjust size: ',x_s,y_s ''' OUTPUT: original size: 500 358 adjust size: 250 179 '''
参考资料:
1、python reportlab教程 http://blog.chinaunix.net/attachment/attach/25/97/97/88259797882a1b4c7c30fac1709f934f9e6ceac4f5.pdf
3、Python Reportlab转换jpg为pdf http://www.2cto.com/kf/201303/194306.html
4、使用python进行图像处理-调整图片大小 http://robin.sh/html/750_python-image-pil.html