Posted by g089h515r806 on February 11, 2014 at 2:58am
我们经常遇到这样的需求:
1、定时采集新闻、文章等任何您想采集的内容,并自动发布到您的网站。
2、从指定网站抓取所需数据,通过分析和处理后保存到您的数据库。
3、通过自动采集,可以监控论坛等社区类网站,让您第一时间发现您所关注的内容。
4、可以批量下载PDF、RAR、图片等各种文件,并同时采集其相关信息。
这个讲座,将会简洁的介绍一下,我们在这方面的实践,
包括:
Feeds模块的基本概念
我们所使用的模块
大致功能介绍
演示抓取的效果
讲座的目标:
起到一个抛砖引玉的效果,让更多的人关注,Drupal的抓取功能,完全可以和火车头相媲美,而且直接构建在Drupal之上,具有自己独特的优势。
•发言人经验:
老葛
7年Drupal专职的开发经验,Drupal实战作者,多个知名模块的作者。
•参加者经验水平:初学者,中级或高级,皆可。
Comments
好啊,不错的主题
好啊,不错的主题
我们在Drupal网页数据采集方面做了比较多的研究和实践了
我们在Drupal网页数据采集方面做了比较多的研究和实践了,技术上已经相对成熟完善了。
我的drupal博客Think in Drupal
很感兴趣,drupal做这个的 感觉好少,老葛的
很感兴趣,drupal做这个的 感觉好少,老葛的 案例是哪个?
Z-Turn, Life is colorful based on changes - http://www.z-turn.org/
案例,抓取京东,当当的数据,抓取各式数据,好几个网站都在用
案例,抓取京东,当当的数据,抓取各式数据,好几个网站都在用。
我的drupal博客Think in Drupal
非常期待!
非常期待!
希望对大家有用。
希望对大家有用。
我的drupal博客Think in Drupal
Thank you for proposing to
Thank you for proposing to speak at DrupalCampChina 2014. Congratulations, we have selected your session, please see the schedule at https://groups.drupal.org/node/406128 .
感谢你向Drupal中国营2014建议的演讲话题。祝贺你,我们选择了你的话题,请在这里浏览时间表https://groups.drupal.org/node/406128
好,可惜我看到的时候,已经是过去了。
好,可惜我看到的时候,已经是过去了。