加入收藏 | 设为首页 | 会员中心 | 我要投稿 核心网 (https://www.hxwgxz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 创业 > 正文

Node.js实现PDF文件转HTML

发布时间:2018-10-03 02:20:43 所属栏目:创业 来源:站长网
导读:最近在做一个富媒体项目,希望将原有的PDF文件直接生成HTML数据流,方便进行排版编辑,研究了一下大家的解决方案,决定采用基于xpdf的Poppler进行处理。因为服务器端使用的是Node.js,没有现成的调用源码,所以使用express实现了上传转换输出。与大家共享!

最近在做一个富媒体项目,希望将原有的PDF文件直接生成HTML数据流,方便进行排版编辑,研究了一下大家的解决方案,决定采用基于xpdf的Poppler进行处理。因为服务器端使用的是Node.js,没有现成的调用源码,所以使用express实现了上传转换输出。与大家共享!

首先安装Poppler,我使用的上MacOS,Linux平台也大同小异,就是下载Poppler的源码进行编译,或者直接使用Mac下的Ports进行安装。

Poppler:http://poppler.freedesktop.org/

安装完成后在终端运行“pdftohtml”可以看到下面的提示:

Node.js实现PDF文件转HTML

这样就能在Node.js中利用子线程调用转换了,不多说,实现代码如下: 

function getData(file,callback){
var out="";
last = exec('pdftohtml -p -noframes '+file);
last.stdout.on('data', function (data) {
callback("OK!");
});
}

PDF文件上传处理部分:

jade: 
form(method="post", enctype="multipart/form-data", action="/upload")
fieldset
legend General
p
label(for="user[pdf]") Picture:
input(type="file", name="pdf")
p.buttons
input(type="submit", value="Save")

Node.js: 
app.post('/upload', function (req, res) {
// 获得文件的临时路径
var date = new Date();
var tmp_path = req.files.pdf.path;
console.log(tmp_path);
// 指定文件上传后的目录 - 示例为"images"目录。
var target_path = './pdf/' +req.files.pdf.name;
console.log(target_path);
// 移动文件
fs.rename(tmp_path, target_path, function (err) {
if (err) throw err;
// 删除临时文件夹文件,
fs.unlink(tmp_path, function () {
if (err) throw err;
//res.send('File uploaded to: ' + target_path + ' - ' + req.files.pdf.size + ' bytes');
getData(target_path,function call(data){
//res.send(data);
res.redirect("/"+req.files.pdf.name.replace("pdf","html"));
});
});
});
});

功能的实现大致就是这样,要什么问题欢迎大家一起交流!

(编辑:核心网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读