网页数据采集器下载,最新版本的Teleport Ultra v1.72

优采云 发布时间: 2020-08-08 17:47

  Teleport Ultra是一个Web数据 采集器,您可以将其用作 采集器软件. 它的功能非常强大,可以扫描数十万个地址并处理一个项目中的多台服务器,从而可以提高吞吐量,效果非常明显. 有兴趣的用户可以下载并尝试.

  

  Teleport Ultra安装教程

  1. 首先从小型下载站下载Teleport Ultra v1.72安装程序包,双击将其打开

  

  2,选择安装位置

  

  3. 完成安装并运行软件

  

  4. 进入软件主界面

  

  软件功能

  1. 将网站的全部或部分下载到您的计算机上,以便您可以直接从硬盘上浏览网站,其速度要比在线浏览网站快

  2,创建精确的副本或网站镜像,完成子目录结构和所有必需的文件

  3. 在网站上搜索特定类型和大小的文件

  4. 下载已知地址的文件列表

  5. 浏览从中央网站链接的每个网站

  6. 在网站上搜索关键字

  7. 列出网站上的所有页面和文件

  软件功能

  1. 使用正则表达式指定要收录的收录和排除区域

  2,指定用于对具有多个名称的服务器进行爬网的域别名

  3. 借用浏览器的cookie缓存,以使您可以使用浏览器执行复杂的身份验证,然后使用Teleport进行爬网

  4. 将自定义HTTP标头注入服务器请求

  5. 同步离线副本以自动删除旧文件和孤儿

  6. 重写未搜索文件的链接时,使用可自定义的消息

  7. 使用原创URL和检索日期/时间戳控制HTML标签并注入meta标签

  8,可以对HTTPS(安全)服务器进行爬网

  常见问题

  1. Teleport可以在Windows操作系统上运行吗?

  是的,它适用于所有Win32操作系统,包括Windows 95、98,Me,NT,2000,XP,2003,Vista,2008,Windows 7和Windows8. 不适用于Windows 3.1或更早版本.

  2. Teleport可以下载ASP,PHP或其他动态生成的网站吗?

  是的,Teleport可以处理ASP,PHP,CGI,Cold Fusion和所有其他类型的动态生成的网页. 服务器像其他页面一样,将这些页面作为HTML发送到Teleport,并且Teleport像HTML一样接收和处理它们. Teleport无法从这些页面获取服务器端代码-此信息无法通过Web服务器获得. 但是,它可以像处理其他任何网页一样处理这些类型的网页.

  3. Teleport可以处理诸如Javascript或“ onclick”事件之类的事件吗?

  是的,从URL版本1.29.1847开始,Teleport可以处理简单的脚本命令,例如window.open(...)和location.href = ...,只要URL参数只是带引号的string即可. 当Teleport出现在诸如onclick事件之类的事件中时,它甚至会处理这些命令. 但是,该程序无法处理更复杂的脚本,例如调用由脚本定义的功能的脚本或打开由计算或连接字符串创建的URL的脚本. 要启用脚本解析,必须在“项目属性”的“探索”页面中将用于处理脚本和事件代码的选项设置为“开”. (默认情况下启用此选项. )

  4. 瞬移可以处理“ cookie”吗?

  是的,从1.29.1847版本开始,Teleport可以处理cookie. 只要在“项目属性”的“探索”页面上启用了此选项,Teleport就会接受并返回cookie. (默认情况下启用此选项. )

  5. 瞬移可以处理Shockwave或Flash小程序吗?

  从1.29.1718版本开始,Teleport将加载明确标识为对象参数的Flash或Shockwave电影. 但是,Teleport不会读取Flash或Shockwave小程序(.swf文件)来查*敏*感*词*程序可能链接到的其他文件.

  6. Teleport可以处理NTLM身份验证吗?

  不简单. NTLM身份验证是Teleport不支持的Microsoft特定身份验证形式. 如果可以控制要复制的Web服务器,则可以对其进行更改以允许基本身份验证,这是Internet上使用的常规身份验证形式. 如果需要,可以将服务器设置为允许Basic和NTLM. 有时Web服务器确实接受基本身份验证,但会误解您的用户名. 您可以尝试使用以下格式之一指定用户名,其中一种可能有效: 用户名/域名,用户名\域名,域/用户名,域\用户名. 最后,另一种解决方案是使用Python NTLM身份验证代理服务器应用程序,该应用程序可在以下位置找到. 安装Python(免费下载),解压缩NTLMAPS zip文件,使用代理服务器详细信息(ip,端口,用户名,域名,密码)配置server.cfg文件. 然后将Teleport配置为使用127.0.0.1作为代理,并使用cfg文件中的LISTEN端口号.

  7. 如何将Teleport项目移动到另一个位置或其他硬盘上?

  移动项目,移动(或复制)项目文件(.tpp文件)和项目文件夹(与项目名称相同,并且位于相同位置). 只要项目文件及其文件夹位于同一位置,Teleport就会知道如何找到所需的一切.

  更新日志

  版本1.72

  1. 改进了解析器以更好地处理脚本中的字符串

  2. 从重写过程中删除已知的问题脚本(jquery,addthis)

  3. 更新公司联系信息

  版本1.71

  1. 改进了解析器,更好地处理了jQuery

  2. 修复了HTTPS系统中的错误,该错误会在某些服务器的早期中断连接

0
分享 2020-08-08
免费网页采集器

0 个评论

要回复文章请先 登录或 注册


官方客服QQ群

微信人工客服

QQ人工客服


线

PHP网站源码丹竹头SEO按天扣费民治网站推广系统坪地模板网站建设光明百度网站优化排名坪地阿里店铺运营盐田网站推广系统塘坑网站排名优化光明关键词按天收费坑梓百姓网标王推广宝安网站推广工具大运SEO按天收费龙岗百度爱采购大芬百姓网标王广州网站推广方案大芬关键词排名龙岗网站优化排名布吉百姓网标王推广光明SEO按天计费同乐SEO按效果付费大芬SEO按天扣费南山网络推广坪山外贸网站建设罗湖关键词按天计费西乡百度标王石岩网站seo优化大鹏百度竞价龙华百度网站优化永湖企业网站改版爱联网站优化推广西乡网页制作歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化