在FPDF(Python)中不正确显示阿拉伯单词

2022-04-05 00:00:00 python spyder pdf fpdf arabic

问题描述

问题：
我正在尝试生成一个包含阿拉伯语段落的PDF文件使用FPDF库。阿拉伯语单词显示不正确(应该是从右到左)，但它们从左到右显示为英语。

我尝试的方法：1-下载支持阿拉伯字母的字体2-对.txt文件进行编码，然后解码回pdf格式(使用UTF-8)

注意：运行后，txt变量(编码为‘utf-8’)正确地包含了.txt文件中的单词，问题仅存在于pdf：)中。

pdf = fpdf.FPDF(format='letter')

# Read text file
name = 'mqal.txt'
with open(name, 'r', encoding="utf-8") as f:
    txt = f.read()

pdf.add_page()
# freeserif because it support arabic letters
pdf.add_font('FreeSerif', '', 'FreeSerif.ttf', uni=True)
pdf.set_font('FreeSerif', '', 12)
pdf.multi_cell(0, 5, txt,0,'R')
pdf.ln()

pdf.cell(0, 5, 'End')
pdf.output("mqal8.pdf")

输出(PDF文件格式)：

ملعت نودو ،ةددحم تاوطخ وأ دعاوق يأ عبتت نأ نود لاقم ةباتكب أدبت نأ كنكمي ديكأتلابو معن
اهلوحتو كراكفأ رصعب أدبتو ،كبوساح مامأ سلجت نأ وه هلعف كيلع ام لك ،لاقملا ةباتك سسأ
،هتباتك تمت عومسم مالكب نوكت ام هبشأ ةجيتنلا نوكتس ام ابلاغ ،بوتكم صن ىلإ ةرشابم
اعبط اذه
لإ

它应该是这样的：

نعم وبالتأكيد يمكنك أن تبدأ بكتابة مقال دون أن تتبع أي قواعد أو خطوات محددة، ودون تعلم أسس كتابة المقال، كل ما عليك فعله هو أن تجلس أمام حاسوبك، وتبدأ بعصر أفكارك وتحولها مباشرة إلى نص مكتوب، غالبا ما ستكون النتيجة أشبه ما تكون بكلام مسموع تمت كتابته، هذا طبعا إلّا إن كنت خبيرا بكتابة المقالات

解决方案

使用此程序包重塑您的阿拉伯字符串

import arabic_reshaper # pip install arabic_reshaper

expression = r"^[a-b-c-d-e-f-g-h-i-j-k-l-m-n-o-p-q-r-s-t-u-v-w-x-y-z-A-B-C-D-E-F-G-H-I-J-K-L-M-N-O-P-Q-R-S-T-U-V-W-X-Y-Z]"
if (re.search(expression, yourstring) is None):
    pdf.add_font('DejaVu', '', 'DejaVuSans.ttf', uni=True)
    pdf.set_font('DejaVu', '', 10)
    arabic_string = arabic_reshaper.reshape(yourstring)
    arabic_string = arabic_string[::-1]
    w = pdf.get_string_width(arabic_string) + 6
    pdf.cell(w, 9, arabic_string, 0, 1, 'L', 0)

相关文章