很多时候我们需要PDF文档中的插图,直接用pdf中的复制或者截屏软件只能提取位图格式的图片,放大缩小难免失真。

本文教大家一种一种从pdf中提取矢量图的方法。

工具软件:

1 adobe acrobat (可以选用福昕阅读器替代)

2 inkscape (选取该矢量作图软件因为安装包小,提供的常用功能住够应付日常办公,高端功能请选用adobe illustrator)

步骤:

1.使用adobe acrobat软件提取感兴趣区域

备注:若工具栏没有该按钮请参看下图设置

1.2从单页的pdf文档中 裁剪用户感兴趣的区域

使用adobe acrobat 软件裁剪工具,单击裁剪按钮后,拖动鼠标同时按下左键,选择感兴趣的区域,选择完成后双击选择区域框。

然后导出选择的区域

最后我们得到的文档中只有裁剪的区域

2使用inkscape 编辑提取的素材

把步骤1中得到的pdf用inkscape打开

此时我们就可以利用矢量图软件对字体大小进行调整,然后导出所需要的格式的图片

使用Python从PDF文件中提取数据

前言 数据是数据科学中任何分析的关键,大多数分析中最常用的数据集类型是存储在逗号分隔值(csv)表中的干净数据.然而,由于可移植文档格式(pdf)文件是最常用的文件格式之一,因此每个数据科学家都应该了 ...

另类爬虫:从PDF文件中爬取表格数据

简介   本文将展示一个稍微不一样点的爬虫.   以往我们的爬虫都是从网络上爬取数据,因为网页一般用HTML,CSS,JavaScript代码写成,因此,有大量成熟的技术来爬取网页中的各种数据.这次, ...

怎样把PDF文件中的一页提取出来

现在随着网络科技的发展在网上找资源找文件就像家常便饭一样,但是有很多文件下载完成之后只有几页是需要的这时候就很困惑了,这么多怎么才能看完啊.这样为了不浪费时间可以将有用的一页提取出来,进行使用,那怎样 ...

在 Xcode 6 中使用矢量图( iPhone 6 置配 UI)

在 Xcode 6 中使用矢量图( iPhone 6 置配 UI) (本文转载:http://iosdeveloper.diandian.com/post/2014-09-25/40063062789 ...

[转]【流媒體】H264—MP4格式及在MP4文件中提取H264的SPS、PPS及码流

[流媒體]H264—MP4格式及在MP4文件中提取H264的SPS.PPS及码流 SkySeraph Apr 1st 2012  Email:skyseraph00@163.com 一.MP4格式基本 ...

[数据科学] 从csv, xls文件中提取数据

在python语言中,用丰富的函数库来从文件中提取数据,这篇博客讲解怎么从csv, xls文件中得到想要的数据. 点击下载数据文件http://seanlahman.com/files/databas ...

[SimplePlayer] 4. 从视频文件中提取音频

提取音频,具体点来说就是提取音频帧.提取方法与从视频文件中提取图像的方法基本一样,这里仅列出其中的不同点: 1. 由于目的提取音频,因此在demux的时候需要指定的是提取audio stream Au ...

java 用PDFBox 删除 PDF文件中的某一页

依赖: org.apache.pdfboxpdfbox-app ...

利用ROS工具从bag文件中提取图片

bag文件是ROS常用的数据存储格式,因此要从bag文件中提取数据就需要了解一点ROS的背景知识. 1. 什么是ROS及其优势 ROS全称Robot Operating System,是BSD-lic ...

随机推荐

windows XP上实现python2.7.5和python3.4.3共存

windows XP上实现python2.7.5和python3.4.3共存过程记录: 1. 首先安装python2.7.5和python3.4.3,两个版本安装顺序不分前后; 2. 检查系统环境变量 ...

shared_ptr

省去对象指针的显示delete typedef tr1::shared_ptr IntPtr; IntPtr fun() { IntPtr p = new int(3); ret ...

CSS3盒子阴影box-shadow

来自W3CSchool的解释 语法: box-shadow: h-shadow v-shadow blur spread color inset; 注释:box-shadow 向框添加一个或多个阴影. ...

word 2013 没有控件菜单怎么办,添加控件菜单

方法/步骤   打开word软件,然后点击菜单栏中最左边的“文件”菜单项,如下图红色方框所示 2 点击文件后,就打开word的设置对话框,然后在左边的设置列表中点击“自定义功能区”,打开自定义功能区设 ...

小白偶遇Sublime Text 3

sublime text3号称神一样的编辑器,主要归功于它丰富的插件所带来的可扩展性.以前曾经抱着玩一玩的心态下载了sublime ,没有插件的sublime 很快被我扔到一边.在用过很多的编辑器后, ...

python时间处理

1.获取当前时间的两种方法: import datetime,time now = time.strftime("%Y-%m-%d %H:%M:%S") print now now ...

Prime Path(poj 3126)

Description The ministers of the cabinet were quite upset by the message from the Chief of Security ...

vimrc 配置支持backspace

在vimrc中添加: set nocompatible set backspace=indent,eol,start

用一条SQL语句取出第 m 条到第 n 条记录的方法

原文:用一条SQL语句取出第 m 条到第 n 条记录的方法   --从Table 表中取出第 m 条到第 n 条的记录:(Not In 版本)       *    FROM Table     id ...

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐