有时候,我们需要将文本转换为图片,比如发长微博,或者不想让人轻易复制我们的文本内容等时候。目前类似的工具已经有了不少,不过我觉得用得都不是很趁手,于是便自己尝试实现了一个。你可以先访问一下查看效果:txt2.im 。
在 Python 中,PIL (Python Imaging Library) 是最常用的绘图库,自然地,尝试从 PIL 开始。
使用 PIL 将文字转换为图片
说转换其实并不恰当,真实的过程是:先在内存中生成一张图片,将需要的文字绘制到这个图片上,再将图片保存到指定位置。代码如下:
# -*- coding: utf-8 -*-
import os
import Image, ImageFont, ImageDraw
text = u"这是一段测试文本,test 123。"
im = Image.new("RGB", (300, 50), (255, 255, 255))
dr = ImageDraw.Draw(im)
font = ImageFont.truetype(os.path.join("fonts", "msyh.ttf"), 14)
dr.text((10, 5), text, font=font, fill="#000000")
im.show()
im.save("t.png")
生成的图片如下:
杯具发生了,汉字没有正常显示!
网上搜索了一圈,发现这好像是 PIL 的一个 bug,PIL 目前的版本中,不能正确处理非 ASCII 字符的点阵字体的渲染。对于像宋体这样的字体来说,只有 >= 18px 时,才会被当作矢量字体处理,也就是说只有当字体 >= 18px 时,文字才能正常显示:
font = ImageFont.truetype(os.path.join("fonts", "simsun.ttc"), 18)
效果如下:
增大字体虽然解决了汉字不能正常显示的问题,但还是没有解决我们一开始的初衷:使用点阵字体进行渲染。但是,这个目标使用现阶段的 PIL 似乎有点难以实现了。
使用 pyGame 渲染点阵字体
Python 的第三方模块或组件非常多,可用来绘图的除了 PIL 之外,就还有 Pycairo、matplotlib、pyGame 等。在这儿,我使用 pyGame 来完成点阵字体的渲染工作。
代码如下:
# -*- coding: utf-8 -*-
import os
import pygame
pygame.init()
text = u"这是一段测试文本,test 123。"
font = pygame.font.Font(os.path.join("fonts", "simsun.ttc"), 14)
rtext = font.render(text, True, (0, 0, 0), (255, 255, 255))
pygame.image.save(rtext, "t.jpg")
效果如下:
可以看到,使用 pyGame ,点阵字体的问题终于搞定了。
结合 PIL 和 pyGame
pyGame 虽然可以解决点阵字体的渲染问题,但讲到对图片的处理,还是 PIL 更为强大。那么,我们为什么不把两者结合起来呢?用 pyGame 渲染点阵字体,然后用 PIL 生成整张图片。
代码如下:
# -*- coding: utf-8 -*-
import os
import StringIO
import Image, ImageFont, ImageDraw
import pygame
pygame.init()
text = u"这是一段测试文本,test 123。"
im = Image.new("RGB", (300, 50), (255, 255, 255))
#dr = ImageDraw.Draw(im)
#font = ImageFont.truetype(os.path.join("fonts", "simsun.ttc"), 18)
font = pygame.font.Font(os.path.join("fonts", "simsun.ttc"), 14)
#dr.text((10, 5), text, font=font, fill="#000000")
rtext = font.render(text, True, (0, 0, 0), (255, 255, 255))
#pygame.image.save(rtext, "t.gif")
sio = StringIO.StringIO()
pygame.image.save(rtext, sio)
sio.seek(0)
line = Image.open(sio)
im.paste(line, (10, 5))
im.show()
im.save("t.png")
原理很简单,先将文字用 pyGame 渲染为图片,将渲染结果保存在一个 StringIO 对象中,然后再用 PIL 加载它。使用 StringIO 的好处是,一切操作都是在内存中进行的,不需要先将它保存到硬盘再用 PIL 读取,因为硬盘 IO 的效率相对来说是比较低的。
最终效果如下:
到这儿,使用 Python 将文本转为图片的功能就基本实现了,用到了 PIL 和 pyGame。
当然,上面的代码还只解决了最基本的问题,一个真正可用的文本转图片工具,还应该解决以下问题:长文本换行问题、英文单词断字问题、标点符号换行问题等。关于这些问题的分析篇幅也不短,这一次就先略过了。下面是一个综合考虑了诸多因素之后生成的《荷塘月色》的效果图:
【2017-10-25 更新】
文字转图片的核心代码见 https://gist.github.com/oldj/9c4d012d6fff059ccea7。
评论:
有几点想问作者。你的站在在哪里架着。我用的sae python 结果没有pygame包。就想知道作者的站是在哪里架着的gae吗?
另外,我想知道后面的内容。就是标点。英文。换行方面的内容……希望可以给点指点……本人刚学python。还很菜。若是有些许demo 不胜感激。
77jh@sina.com 是我的邮箱。
我的站点在国外一个VPS上,可以自己随意安装软件或者包。关于换行等的内容邮件发你了。
raise ImportError("The _imagingft C module is not installed")
ImportError: The _imagingft C module is not installed 用XP运行的总是报这个错误,能告诉我是怎么回事吗谢谢
python脚本用记事本另存问utf-8格式,顶部也加上了#coding:utf-8,可是运行出错了:UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-5: ordinal not in range(128)
把text=u'测试'改为text='测试'就不会出错,可是会出来的文字是乱码~~~
最近在学习python,所以在sae python上做了一个图片分享小站:yesyouknow.sinaapp.com
想给图片做文字说明,可是读取网页上的中文也全部碰到了编码问题,照着网上说的方法都不行啊....楼主有木有什么方法给下提示......
另外,你是不是在中文版的Windows下运行的啊?中文版的Windows下终端的编码是GBK之类的,输出UTF-8编码的文字可能会是乱码,如果要在终端输出汉字可以转一下码,比如:
<code>
print u"汉字".encode("gbk")
</code>
或者也可以试试这样:
<code>
import locale
import codecs
print locale.getpreferredencoding();
取得系统默认编码
encoding = codecs.lookup(locale.getpreferredencoding()).name
print u"汉字".encode(encoding)
</code>
只是在换行等问题的处理上不是很明白,还望解答。谢谢
我使用的Python3.5.2,按照文中第4部分,执行到第22行pygame.image.save(rtext, sio),出现了编码方面的错误信息:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 12: invalid continuation byte
另外还有两种重复出现的错误信息,摘录如下。
第一种,出现于开始和结束部分循环了好几屏:
During handling of the above exception, another exception occurred:
SystemError: returned a result with an error set
第二种,在中间连续循环出现了好几屏:
During handling of the above exception, another exception occurred:
SystemError: returned a result with an error set
请问在 python3 中该如何使用 StringIO 实现文中第4部分的程序?
第一种:
During handling of the above exception, another exception occurred:
SystemError Traceback (most recent call last)
SystemError: returned a result with an error set
第二种:
During handling of the above exception, another exception occurred:
SystemError Traceback (most recent call last)
SystemError: returned a result with an error set
***@企鹅.com
多谢!
font = pygame.font.Font("simsun.ttc", 32)
rtext = font.render(x, True, (0, 0, 0), (255, 255, 255))
会生成32 33 3的图像。博主知道问题在哪吗
是不是要先下字体?