发信人: saynothing (止语), 信区: Programming
标 题: 问个nodejs服务器端调用爬虫的问题
发信站: 水木社区 (Thu Jan 10 17:58:55 2019), 站内
爬虫程序是python脚本写的,http请求的时候、nodejs服务器端路由 通过子进程调用python脚本(spawn,而非exec)
问题来了,和直接运行脚本的行为不一样。
我估计是因为v8引擎 改变了python模拟出来的浏览器行为。
var spawn = require('child_process').spawn;
var proc = spawn('python3', ["./query.py", '"张某 李某"']);
proc.stdout.pipe(process.stdout);
proc.stderr.pipe(process.stderr);
proc.on('exit', function(code, signal) {
if (code == 0) {
console.log("exit code is 0, list files..");
}
else {
console.log("执行未成功");
}
});
这段程序 和直接"python3 query.py '张某 李某'"结果总是不一样
--
修改:saynothing FROM 107.178.194.*
FROM 107.178.194.*