• 欢迎访问搞代码网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站!
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏搞代码吧

python 从PDF中提取附件

python 搞java代码 3年前 (2022-05-21) 23次浏览 已收录 0个评论

下载 Pdftk server:https://www.pdflabs.com/tools/pdftk-server/

如果有密码,先把带密码的PDF的转成无密码的PDF

pdftk 有密码.pdf  input_pw 密码  output 无密码.pdf

如果不带密码,上一步可以跳过

提取附件(必须不带密码)

pdftk 无密码.pdf unpack_files 解压目录

如果python cmd命令时显示不存在命令,

加入 os.chdir(pdftk的bin目录)

 

完整代码:

<span>import</span><span> os
</span><span>def</span><span> get_attachment(pdf_path,psd,pdftk_bin_folder):

    pdf_folder_path</span>=pdf_path.strip(pdf_path.split(<span>"</span><span></span><span>"</span>)[-1<span>])
    tem_pdf_path</span>=pdf_folder_path+<span>"</span><span>temp.pdf</span><span>"</span><span>

    decrypt_command</span>=f<span>"</span><span>pdftk {pdf_path}  input_pw {psd}  output {tem_pdf_path}</span><span>"</span><span>
    extract_command</span>=f<span>"</span><span>pdftk {tem_pdf_path} unpack_files output {pdf_folder_path}</span><span>"</span><span>

    os.chdir(pdftk_bin_folder)
    os.system(decrypt_command)
    os.system(extract_command)
</span><span>if</span> <span>__name__</span> == <span>"</span><span>__main__</span><span>"</span><span>:
    </span><span>#</span><span> pdf_path = r"C:Users86173Desktop	estword2-protected.pdf"</span>
    <span>#</span><span> psd = "dfcver"</span>
    pdf_path = r<span>"</span><span>C:Users86173Desktop	estword无密码1.pdf</span><span>"</span><span>
    psd </span>= <span>""</span><span>
    pdftk_bin_folder </span>= r<span>"</span><span>C:Program Files (x86)PDFtk Serverin</span><span>"</span>
    <span>try</span><span>:
        get_attachment(pdf_path,psd,pdftk_bin_folder)
        </span><span>print</span>(<span>"</span><span>提取成功</span><span>"</span><span>)
    </span><span>except</span><span> Exception as e:
        </span><span>print</span>(<span>"</span><span>提取失败</span><span>"</span><span>)
        </span><span>print</span>(e)

www#gaodaima.com来源gaodai$ma#com搞$$代**码网搞代码

 

 

搞代码网(gaodaima.com)提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发送到邮箱[email protected],我们会在看到邮件的第一时间内为您处理,或直接联系QQ:872152909。本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python 从PDF中提取附件

喜欢 (0)
[搞代码]
分享 (0)
发表我的评论
取消评论

表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址